python3使用OCR識別圖片

阿新 • • 發佈：2022-04-03

放假三天，閒來無事，想學下python爬蟲。本想跟著網上教程操作一遍，奈何安裝使用過程中出現一堆問題，並且在網上搜了一堆複製黏貼的答案，關鍵都不能起作用，最後終於找到一篇生效，為了以後不至於再經歷這種痛苦，還是將多年未用的賬號給翻了出來，將安裝過程記錄下來，以免以後突然心血來潮又想搞一把。

環境：

win10
python 3.10.4
tesseract-ocr-w64-setup-v5.0.1.20220118

看網上教程，使用python識別圖片需要先安裝tesseract，然後再安裝python ocr庫，才能正常使用。這裡分為兩部分介紹：

tesseract

安裝

安裝包下載路徑https://digi.bib.uni-mannheim.de/tesseract/，從上面下載所需版本後，點選安裝：

需要注意的是此次將“Additional language data(download)”選中，然後一路點選Next，直至安裝即可。

配置環境變數

首先需要新建系統變數TESSDATA_PREFIX，設定成你的軟體安裝路徑：（注意加上tessdata，此處網上的坑極大，沒有加導致使用時報

Error opening data file C:\Program Files\Tesseract-OCR\eng.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.

）

然後需要在PATH變數中新增軟體的安裝路徑：

然後開啟CMD進入圖片存放路徑驗證是否能識別成功：（image.png可以換成帶有字母或數字的圖）

安裝Python的OCR識別庫

安裝

直接使用命令安裝：

pip install Pillow
pip install pytesseract

使用

在python腳步中新增如下程式碼，執行即可看到結果：

textPath = "C:\\Users\\umj\\Desktop\\image.jpg"
print(pytesseract.image_to_string(Image.open(textPath), lang=" 
eng"))

參考連結：https://www.jb51.net/article/183990.htm

如何利用Python識別圖片中的文字

一、前言不知道大家有沒有遇到過這樣的問題，就是在某個軟體或者某個網頁裡面有一篇文章，你非常喜歡，但是不能複製。或者像百度文件一樣，只能複製一部分，這個時候我們就會選擇截圖儲存。但是當我們想用到裡面的文

Python識別圖片中的文字

1 import os,glob 2 def photo_compression(original_imgage,tmp_image_path): 3\'\'\'圖片備份、壓縮；param original_imgage:原始圖片路徑；param tmp_imgage_path:臨時圖片路徑，備份路徑；return\'\'\'

用 Python 識別圖片中的文字

01_識別圖片&驗證碼登入

概述有些場景的自動化測試中，需要帶驗證碼登入，如下圖，這種情況就需要識別圖片中的驗證碼資訊，然後轉成文字進行登入

用python識別圖片中的文字，批量識別還有待研究

# incoding=gbk import os import pytesseract from PIL import Image # 讀取圖片 im = Image.open(r\'C:\\Users\\Administrator\\Desktop\\sentence.jpg\')

詳解利用python識別圖片中的條碼（pyzbar）及條碼圖片矯正和增強

前言這周和大家分享如何用python識別影象裡的條碼。用到的庫可以是zbar。希望西瓜6辛苦碼的程式碼不要被盜了。（zxing的話，我一直沒有裝好，等裝好之後再寫一篇）

python利用pytesseract 實現本地識別圖片文字【3】（多執行緒）

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import glob from os import path import os import pytesseract

python 利用百度API識別圖片文字【2】（多執行緒版）

#!/usr/bin/env python3 # -*- coding: utf-8 -*- \"\"\" Created on Tue Jun 12 09:37:38 2018 利用百度api實現圖片文字識別

python 利用百度API批量識別圖片文字【1】

#!/usr/bin/env python3 # -*- coding: utf-8 -*- \"\"\" Created on Tue Jun 12 09:37:38 2018 利用百度api實現圖片文字識別

python利用pytesseract 實現本地識別圖片文字

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import glob from os import path import os import pytesseract

python 利用百度API識別圖片文字（多執行緒版）

#!/usr/bin/env python3 # -*- coding: utf-8 -*- \"\"\" Created on Tue Jun 12 09:37:38 2018 利用百度api實現圖片文字識別

python呼叫騰訊雲識別圖片標籤 python呼叫騰訊優圖識別圖片

一、需求描述需要識別圖片給圖片打上標籤，比如：圖片裡面有楊冪，就是美女標籤

C#用百度OCR識別圖片文字

百度OCR識別圖片文字百度有直接的Nuget包引用非常的簡單呼叫：具體怎麼用看說明文件就夠了：

前端js解析識別圖片二維碼

前端js解析識別圖片二維碼 <!-- * author:wenqd * email:[email protected] * date:2019-09-18 09:34

呼叫百度ocr識別圖片

var https = require(\'https\'); var qs = require(\'querystring\'); const client_id=\'\'; const client_secret=\'\';

C# 掃描識別圖片中的文字（.NET Framework）

環境配置本文以C#及VB.NET程式碼為例，介紹如何掃描並讀取圖片中的文字。本次程式環境如下：

微信 Windows 版 3.6.0 測試版釋出：查詢微訊號並新增朋友，識別圖片二維碼和小程式碼

感謝網友樂樂醬的線索投遞！

windev20中文版呼叫zxing 。net dll來識別圖片裡多個條碼

windev20中文版裡有識別qr二維碼的內建函式，但是沒有識別條碼的函式，正好zxing現在有。net的介面

用Python模擬識別圖片驗證碼併發送手機驗證碼

1、導語大家好，好久不見。又到每日分享Python小技能的時候了。最近因為疫情影響，所以更新內容比較慢…今天週一，就來更新一波，心血來潮，是時候上線經營了。其實也沒想到有啥好分享的，不如分享一些乾貨給大家

微信 Mac 版 3.4.0 內測版更新：支援識別圖片中二維碼

感謝網友 SP_CE 的線索投遞！

python3使用OCR識別圖片

相關推薦