win10安裝tesserocr配置 Python使用tesserocr識別字母數字驗證碼
連結:https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw
提取碼:t3bq
win10安裝tesserocr
首先需要下載tesseract,它為tesserocr提供底層支援。具體下載官方路徑:https://github.com/UB-Mannheim/tesseract/wiki,選擇對應的系統版本,可以選擇一個相對不帶dev的穩定版本下載,如:tesseract-ocr-setup-3.05.02-20180621.exe。然後一路安裝,唯一記得勾選Additional language data(download),勾選可能會用到的語言tessdata,如簡體、繁體中文,數學模組等,不需要全選,下載tessdata的時間會比較長。
下載時間會比較長,耐心等待即可,有條件可以翻牆下載速度會快很多
安裝python對應的tesserocr庫
使用原始的whl檔案方式安裝。tesserocr 的whl官方檔案下載路徑:https://github.com/simonflueckiger/tesserocr-windows_build/releases,下載本地環境對應的whl檔案,如我的是window64位系統,python版本是3.5。下載完後,使用cd跳轉到whl檔案所在目錄,然後 執行 ”pip install tesserocr-2.2.2-cp35-cp35m-win_amd64.whl“,即可輕鬆完成安裝。
tesserocr 報錯 UnicodeDecodeError 系統問題 用下面的模組替代
pytesseract :pip install pytesseract
pip install pytesseract
首次執行總是不順利,相信我遇到的坑大多數人都會遇到,大抵錯誤類似:
Traceback (most recent call last): File "G:\pythonSources\my12306/obtain_message\test.py",line 4,in <module> print(tesserocr.image_to_text(image)) File "tesserocr.pyx",line 2400,in tesserocr._tesserocr.image_to_text RuntimeError: Failed to init API,possibly an invalid tessdata path: “本地某個路徑”
有個比較簡單粗暴的解決方法是把安裝好的Tesseract-OCR下的tessdata資料夾整個拷貝到提示的那個路徑中,親測有效。
測試程式碼
import tesserocr from PIL import Image image=Image.open('image.jpg') print(tesserocr.image_to_text(image))
總結
以上所述是小編給大家介紹的win10安裝tesserocr配置 Python使用tesserocr識別字母數字驗證碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回覆大家的。在此也非常感謝大家對我們網站的支援!
如果你覺得本文對你有幫助,歡迎轉載,煩請註明出處,謝謝!