Tesseract在Center OS7/8下環境搭建
阿新 • • 發佈:2021-01-11
技術標籤:圖片識別ocr
Tesseract在Center OS7/8下環境搭建
安裝相關依賴
Tesseract 環境的相關依賴庫涉及到的比較的多,並沒有做深入的研究,安裝的相關依賴如下:
yum install gcc-c++
yum install zlib-devel
yum install pkg-config
yum install libtool automake autoconf
yum install libjpeg-devel
yum install libpng-devel
yum install libtiff-devel
如果你涉及到字型檔的訓練,還需要安裝額外的工具
yum install pango pango-devel
yum install cairo cairo-devel
因為我不使用訓練,所以也就不安裝
1. 安裝Leptonica
原始碼下載,地址為
因為我們是在center OS上,可直接使用命令下載
wget -c -t 20 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz
下載對應依賴庫
yum install libjpeg-devel
yum install libpng- devel
yum install libtiff-devel
編譯與安裝
tar -zxvf leptonica-1.78.0.tar.gz
cd leptonica-1.78.0/
./configure --prefix=/usr/local/
make
make install
配置環境變數
vi /etc/profile export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib export LIBLEPT_HEADERSDIR=/usr/local/include export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
啟用環境變數
source /etc/profile
2. 安裝Tesseract-OCR
原始碼下載,地址為
https://github.com/tesseract-ocr/tesseract/releases/tag/4.1.1
下載命令為:
wget -c -t 20 https://github.com/tesseract-ocr/tesseract/archive/4.1.1.tar.gz
編譯與安裝
tar -zxvf 4.1.1.tar.gz
cd tesseract-4.1.1/
./autogen.sh
./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include
make
make install
檢視一下安裝結果
tesseract -v
3. 配置語言包
配置語言包位置並加入環境變數
# 先新建一個目錄儲存traineddata資料,這個目錄自己隨意定義
mkdir -p /opt/Tesseract/tessdata
# 編輯profile檔案
vi /etc/profile
# 注意這個路徑是你自己隨意定義的,但是要和上面的新建目錄一樣
export TESSDATA_PREFIX=/opt/Tesseract/tessdata
啟用配置檔案
source /etc/profile
以後將要使用的新的語言包放入此資料夾就行,下面就能安心的玩耍了