python-pytesseract安裝錯誤總結
阿新 • • 發佈:2018-12-26
環境準備
PIL
tesseract-ocr
pytesseract模組
pillow錯誤1:from . import VERSION, PILLOW_VERSION, _plugins
錯誤的指向是Image.py 具體原因還沒分析出來,最後解除安裝了上述所有的包後,再參照了https://www.cnblogs.com/hupeng1234/p/7136442.html這個安裝順序進行了安裝(pillow在pip install pytesseract的時候會自動安裝)
錯誤2:'NoneType' object has no attribute 'bands',參照了http://blog.csdn.net/ghost0620/article/details/50974958 說可能是image庫的一個bug,具體修改如下。
錯誤3:WindowsError: [Error 2]
上網找解決方法,說是pytesseract.py 裡面的
tesseract_cmd = 'tesseract' 改成 tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' 路徑前面加r防止轉義。最後試試執行程式碼
import pytesseract import Image a = Image.open('d:\yan1.png') vcode = pytesseract.image_to_string(a) print vcode
從網上下載的一個比較模糊的圖片進行識別,返回的是空,後來自己手寫了幾個數字儲存為圖片後,可以識別出來。感覺這個庫的識別成功率不是很高。