1. 程式人生 > 其它 >Tesseract在Center OS7/8下環境搭建

Tesseract在Center OS7/8下環境搭建

技術標籤:圖片識別ocr

Tesseract在Center OS7/8下環境搭建

安裝相關依賴

Tesseract 環境的相關依賴庫涉及到的比較的多,並沒有做深入的研究,安裝的相關依賴如下:

yum install gcc-c++
yum install zlib-devel
yum install pkg-config
yum install libtool automake autoconf
yum install libjpeg-devel
yum install libpng-devel
yum install libtiff-devel

如果你涉及到字型檔的訓練,還需要安裝額外的工具

yum install pango pango-devel
yum install cairo cairo-devel

因為我不使用訓練,所以也就不安裝

1. 安裝Leptonica

原始碼下載,地址為

http://www.leptonica.org/source/leptonica-1.78.0.tar.gz

因為我們是在center OS上,可直接使用命令下載

wget -c -t 20 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz

下載對應依賴庫

yum install libjpeg-devel
yum install libpng-
devel yum install libtiff-devel

編譯與安裝

tar -zxvf leptonica-1.78.0.tar.gz
cd leptonica-1.78.0/
./configure --prefix=/usr/local/
make
make install 

配置環境變數

vi /etc/profile

export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

啟用環境變數

source /etc/profile

2. 安裝Tesseract-OCR

原始碼下載,地址為

https://github.com/tesseract-ocr/tesseract/releases/tag/4.1.1

下載命令為:

wget -c -t 20 https://github.com/tesseract-ocr/tesseract/archive/4.1.1.tar.gz

編譯與安裝

tar -zxvf 4.1.1.tar.gz
cd tesseract-4.1.1/
./autogen.sh
./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include
make
make install

檢視一下安裝結果

tesseract -v

檢測結果

3. 配置語言包

配置語言包位置並加入環境變數

# 先新建一個目錄儲存traineddata資料,這個目錄自己隨意定義
mkdir -p /opt/Tesseract/tessdata
# 編輯profile檔案
vi /etc/profile
# 注意這個路徑是你自己隨意定義的,但是要和上面的新建目錄一樣
export TESSDATA_PREFIX=/opt/Tesseract/tessdata

啟用配置檔案

source /etc/profile

以後將要使用的新的語言包放入此資料夾就行,下面就能安心的玩耍了