python-tesseract下載安裝及使用
阿新 • • 發佈:2019-01-25
tesseract下載安裝
網上有多種辦法,這裡我只說我用的辦法了:
登入到github的官網,然後再搜尋欄裡輸入tesseract搜尋
選中下圖第一個
然後點選wiki選擇我們要下載的版本
這裡我安裝的是windows版本的,並且我是用python程式碼跑的
其他語言包下載好之後放在安裝目錄下的tessdata下就行了
下載好之後雙擊.exe檔案就可以安裝了。
安裝跟著安裝步驟預設點選就行了,不要忘了把安裝路徑放在path環境變數裡,這裡我推薦放在最前面,因為我就是放在了最後面導致在dos中死活識別不了這個環境變數。
安裝好之後再dos中輸如tesseract -v:
顯示如上圖則證明安裝好了。
tesseract使用
tesseract使用
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile…]
tesseract 圖片名 輸出檔名 -l 字型檔檔案 -psm pagesegmode 配置檔案
例如:
tesseract code.jpg result -l chi_sim -psm 7 nobatch
-l chi_sim 表示用簡體中文字型檔(需要下載中文字型檔檔案,解壓後,存放到tessdata目錄下去,字型檔副檔名為 .raineddata 簡體中文字型檔檔名為: chi_sim.traineddata)
-psm 7 表示告訴tesseract code.jpg圖片是一行文字 這個引數可以減少識別錯誤率. 預設為 3
configfile 引數值為tessdata\configs 和 tessdata\tessconfigs 目錄下的檔名.