Windows環境安裝tesseract-ocr 4.00並配置環境變數

來源:互聯網
上載者:User

標籤:ash   .com   user   https   size   win7   開發   安裝路徑   系統變數   

最近要做文字識別,不讓直接用別人的介面,所以只能嘗試去用開源的類庫。tesseract-ocr是惠普公司開源的一個文字識別項目,通過它可以快速搭建圖文識別系統,協助我們開發出能識別圖片的ocr系統。因為Windows環境開發,我也就必須在windows環境安裝系統。

第一步:下載安裝包

根據https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安裝包,好像我只看到64位的安裝包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下載後直接安裝即可,但是要記得你的安裝目錄,我們等會配置環境變數要用。

如果不是做英文的圖文識別,還需要下載其他語言的識別包https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。

簡體字識別包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

繁體字識別包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata

 

第二步:安裝

直接執行下載好的tesseract-ocr-setup-4.00.00dev.exe,下一步、下一步安裝。

第三步:配置環境變數

注意:我的系統是win7,其他系統應該差不多,跟配置java變數一樣

複製你的安裝地址,我的是安裝在C:\Program Files (x86)\Tesseract-OCR,介面如下:

複製安裝路徑“C:\Program Files (x86)\Tesseract-OCR”,進入“控制台\系統和安全\系統”,點擊

“系統保護”

進入到以下介面:

點擊環境變數,進入配置以下介面:

把剛才的安裝路徑“C:\Program Files (x86)\Tesseract-OCR”添加到紅線劃的PATH和Path,注意,添加時候開頭用“;”跟之前的變數隔開,結尾以“;”結尾。下面是我的配置資訊樣本:

C:\Users\Administrator\AppData\Roaming\Composer\vendor\bin;C:\Users\Administrator\AppData\Roaming\npm;C:\Program Files (x86)\Tesseract-OCR;

配置好了點擊儲存。

 

開啟命令終端,輸入:tesseract -v,可以看到版本資訊

如果出現報錯,估計是環境變數沒配置好。

到這裡,我們就算安裝完成了,但是,我們的系統還是無法識別中文的,我們要去下載簡體漢字、繁體漢字語言套件(上文給了地址了),下載好之後放到安裝目錄的tessconfigs目錄下即可。

補充:因為沒有配置全域變數,無法跨盤執行資料轉換,這裡我們在環境變數那增加一個配置資訊

系統變數—->建立:

增加一個TESSDATA_PREFIX變數名,變數值還是我的安裝路徑C:\Program Files (x86)\Tesseract-OCR;

本人部落格:Windows環境安裝tesseract-ocr 4.00並配置環境變數

http://www.wangtuizhijia.com/archives/272

Windows環境安裝tesseract-ocr 4.00並配置環境變數

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.