python3使用ocr進行簡單的圖文識別

阿新 • • 發佈：2022-04-17

1、安裝

pip install pytesseract

pytesseract 的使用是 基於 後端Tesseract的，故需要安裝 Tesseract

2、安裝

Tesseract 

官方網站：https://github.com/tesseract-ocr/tesseract
官方文件：https://github.com/tesseract-ocr/tessdoc
語言包地址：https://github.com/tesseract-ocr/tessdata
下載地址：https://digi.bib.uni-mannheim.de/tesseract/

注：
1、並配置環境變數
2、安裝過程中，可以直接安裝簡體中文包，此步親測，沒有 那麼慢。 （安裝後 即可使用  
lang='chi_sim'）


參考  https://www.jianshu.com/p/f7cb0b3f337a

3、使用

# 圖文識字
import pytesseract
from PIL import Image


def imageToStr(image_url, lang):
    im = Image.open(image_url)
    im = im.convert('L')
    im_str = pytesseract.image_to_string(im, lang=lang)
    return im_str


img_url = r'C:\Users\peng\Desktop\50.png'

# img_str = imageToStr(img_url, 'eng')
# print('識別到的英文', img_str)

# print('識別到的中文')
cn_img_str = imageToStr(img_url, 'chi_sim')
print(cn_img_str)

4、結果

靜夜思
作者: 李

床前明月光，疑是地上入
舉頭望明月，低頭思故鄉

5、原圖

6、問題：

很顯然，
1、李白 的白沒打出來
2、霜 ，打成 入

機器學習不深入，可能是因為圖片解析度比較差吧

。。。

python3使用ocr進行簡單的圖文識別

1、安裝 pip install pytesseract pytesseract 的使用是基於後端Tesseract的，故需要安裝 Tesseract

opencv實現簡單人臉識別

對於opencv 它提供了許多已經練習好的模型可供使用，我們需要通過他們來進行人臉識別

Kears+Opencv實現簡單人臉識別

寫在前面：這篇文章也是借鑑了一些前輩的程式碼和思路寫的，程式碼有些也是複用了別人的。

idea中建立maven的Javaweb工程並進行配置(圖文教程)

學完maven後，可以建立maven的javaweb工程，在建立完成後還需要一些配置，下面來說下具體步驟，在這裡我建立的是一個模組，建立web專案的方式和建立模組一樣

python實現簡單顏色識別程式

本文例項為大家分享了python實現簡單顏色識別程式的具體程式碼，供大家參考，具體內容如下

Python利用FFT進行簡單濾波的實現

1、流程大體流程如下，無論影象、聲音、ADC資料都是如下流程：（1）將原訊號進行FFT;

使用pyecharts1.7進行簡單的視覺化大全

近期，又有接觸到pyecharts這個包的使用，後面發現這個曾經好用的包發生了一些變化，為了方便大家的使用，這裡整理如下：

18 使用 Pytesseract 進行簡單的驗證

在爬蟲開發中我們經常會遇到一種反爬蟲的手段就是驗證碼，那麼如何才能繞過驗證碼拿到我們想要的資料呢？這節課我給大家介紹一個破驗證碼的利器–Pytesseract。

Unity實現簡單手勢識別

本文例項為大家分享了Unity實現手勢識別的具體程式碼，供大家參考，具體內容如下

數學建模省賽小結：資料預處理（按照關鍵字提取行/列並進行簡單運算）

function []=datapro714()% 處理的資料截止7/14/20% [csvdata,~,rawcsvdata] = xlsread(\'who_covid_19_sit_rep_time_series.csv\');[~,~,rawconfirmed] = xlsread(\'time_series_covid_19_confirmed.csv\');[~,~,r