1. 程式人生 > >python-tesseract下載安裝及使用

python-tesseract下載安裝及使用

tesseract下載安裝

網上有多種辦法,這裡我只說我用的辦法了:
登入到github的官網,然後再搜尋欄裡輸入tesseract搜尋
這裡寫圖片描述
選中下圖第一個
這裡寫圖片描述
然後點選wiki選擇我們要下載的版本
這裡寫圖片描述
這裡我安裝的是windows版本的,並且我是用python程式碼跑的
這裡寫圖片描述
其他語言包下載好之後放在安裝目錄下的tessdata下就行了
這裡寫圖片描述
下載好之後雙擊.exe檔案就可以安裝了。
這裡寫圖描述
安裝跟著安裝步驟預設點選就行了,不要忘了把安裝路徑放在path環境變數裡,這裡我推薦放在最前面,因為我就是放在了最後面導致在dos中死活識別不了這個環境變數。
安裝好之後再dos中輸如tesseract -v:
這裡寫圖片描述


顯示如上圖則證明安裝好了。

tesseract使用

tesseract使用
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile…]

tesseract 圖片名 輸出檔名 -l 字型檔檔案 -psm pagesegmode 配置檔案

例如:

tesseract code.jpg result -l chi_sim -psm 7 nobatch

-l chi_sim 表示用簡體中文字型檔(需要下載中文字型檔檔案,解壓後,存放到tessdata目錄下去,字型檔副檔名為 .raineddata 簡體中文字型檔檔名為: chi_sim.traineddata)

-psm 7 表示告訴tesseract code.jpg圖片是一行文字 這個引數可以減少識別錯誤率. 預設為 3

configfile 引數值為tessdata\configs 和 tessdata\tessconfigs 目錄下的檔名.