Error opening data file Tesseract-OCR\tessdata/eng.traineddata問題 解決
阿新 • • 發佈:2018-11-19
在安裝完tesseract, pytesseract後執行測試命令,發現列印如下錯誤:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language 'eng' Tesseract couldn't load any languages! Could not initialize tesseract.
碰到這個問題後,我一個勁的百度,尼瑪,快讓人累死了。有的純粹是尼瑪的複製黨,沒有親身經歷,完全體會不到那種痛苦。
不過,費了大半天勁,終於找到了一個靠譜的解決方案。就是在環境變數中新增一個變數TESSDATA_PREFIX,使該變數的值為
D:\Profession\Tesseract-OCR\tessdata 該路徑值。我開始是在path變數下,把路徑值放在了該變數下,肯定失敗。另外,還要重啟一下,才能生效。
測試demo
# -*-encoding:utf-8-*- import pytesseract from PIL import Image image = Image.open("code.png") result = pytesseract.image_to_string(image) print(result)
解析結果為:02: pgthon
哈哈,有點不準確。
另外,要養成讀錯誤的習慣,不要一上來就百度,這樣進步很小。