1. 程式人生 > >識別圖片tesseract-ocr的配置

識別圖片tesseract-ocr的配置

1.下載 tesseract-ocr-setup-4.00.00dev.exe
在這裡插入圖片描述
百度網盤:(https://pan.baidu.com/s/1GnVjl7DsAJrWh2JfpwKbcA)
安裝步驟不難,也不需要改什麼東西,按著他的步驟來就ok。
2.安裝完事之後需要配置環境變數(PATH,TESSDATA_PREFIX)
新增一個名為TESSDATA_PREFIX的變數
然後寫上這個G:\Tesseract-OCR\tessdata(根據自己安裝位置更改)
在 PATH裡新增一個
G:\Tesseract-OCR(根據自己安裝位置更改)
在這裡插入圖片描述
在這裡插入圖片描述
3.cmd
下載python的 pytesseract 庫
pip install pytesseract

4.找到anaconda所在安裝位置(如果用的是anaconda的話)
找到Lib下的site-packages的pytesseract.py檔案,將第28行,改成 tesseract_cmd = r’G:/Tesseract-OCR/tesseract.exe’(此檔案所在路徑)
r 最好加上。
在這裡插入圖片描述
在這裡插入圖片描述
5.程式碼
注意PIL在python3需要pip install pilow這個記不太清而不是PIL

from PIL import Image
import pytesseract
im = Image.open('C:/Users/123/Desktop/0.png')
print(pytesseract.image_to_string(im))

趕快試一試吧!