這款Python庫4行程式碼提取圖片中的文字

阿新 • • 發佈：2021-01-11

OCR是什麼？

有一款軟體叫掃描全能王，想必一些小夥伴聽過，這是一個OCR整合軟體，可以將影象內容掃描成文字。

所以說，OCR作用是對文字資料的影象檔案進行分析識別處理，獲取文字及版面資訊。

OCR的全稱叫作“Optical Character Recognition”，即光學字元識別。

這算是生活裡最常見、最有用的AI應用技術之一。

細心觀察便可發現，身邊到處都是OCR的身影，文件掃描、車牌識別、證件識別、銀行卡識別、票據識別等等。

OCR本質是影象識別，其包含兩大關鍵技術：文字檢測和文字識別。

先將影象中的特徵的提取並檢測目標區域，之後對目標區域的的字元進行分割和分類。

關於EasyOCR

Python中有一個不錯的OCR庫-EasyOCR，在GitHub已有9700star。它可以在python中呼叫，用來識別影象中的文字，並輸出為文字。

❝

https://github.com/JaidedAI/EasyOCR

❞

EasyOCR支援超過80種語言的識別，包括英語、中文（簡繁）、阿拉伯文、日文等，並且該庫在不斷更新中，未來會支援更多的語言。

安裝EasyOCR

安裝過程比較簡單，使用pip或者conda安裝。

pip install easyocr

如果用的PyPl源，安裝起來可能會耽誤些時間，建議大家用清華源安裝，幾十秒就能安裝好。

使用方法

EasyOCR的用法非常簡單，分為三步:

1.建立識別物件；
2.讀取並識別影象；
3.匯出文字。

我們先來舉個簡單的例子。

找一張路標圖片，儲存到電腦：

接著擼程式碼：

# 匯入easyocrimport easyocr# 建立reader物件reader = easyocr.Reader(['ch_sim','en']) # 讀取影象result = reader.readtext('test.jpg')# 結果result

輸出結果：

可以看到路標上的三個路名以及拼音都識別出來了！

識別的結果包含在元組裡，元組由三部分組成：邊框座標、文字、識別概率。

「關於語言：」

這段程式碼有一段引數['ch_sim','en']，這是要識別的語言列表，因為路牌裡有中文和英文，所以列表裡添加了ch_sim（簡體中文）、en（英文）。

可以一次傳遞多種語言，但並非所有語言都可以一起使用。英語與每種語言相容，共享公共字元的語言通常相互相容。

前文我們給出了EasyOCR支援的語言列表，並附有引數代號。

「關於影象檔案：」

上面傳入了相對路徑'test.jpg'，還可以傳遞OpenCV影象物件（numpy陣列）、影象位元組檔案、影象URL。

再讀取一張文字較多的新聞稿圖片：

# 匯入easyocrimport easyocr# 建立reader物件reader = easyocr.Reader(['ch_sim','en']) # 讀取影象result = reader.readtext('test1.jpg')# 結果result

識別文字的準確率還是很高的，接下來對文字部分進行抽取。

for i in result:    word = i[1]    print(word)

輸出：

小結

該開源庫是作者研究了幾篇論文，復現出來的成果，真是一位實幹家。

檢測部分使用了CRAFT演算法，識別模型為CRNN，它由3個主要元件組成：特徵提取，序列標記（LSTM）和解碼（CTC）。整個深度學習過程基於Pytorch實現。

作者一直在完善EasyOCR，後續計劃一方面擴充套件支援更多的語言，爭取覆蓋全球80%~90%的人口；另一方面支援手寫識別，並提高處理速度。

這款Python庫4行程式碼提取圖片中的文字

OCR是什麼？有一款軟體叫掃描全能王，想必一些小夥伴聽過，這是一個OCR整合軟體，可以將影象內容掃描成文字。

Python 用三行程式碼提取PDF表格資料

從 PDF 表格中獲取資料是一項痛苦的工作。不久前，一位開發者提供了一個名為 Camelot 的工具，使用三行程式碼就能從 PDF 檔案中提取表格資料。

Java 幾行程式碼提取圖片文字，過個厲害了。。

來源：blog.csdn.net/weixin_44671737/article/details/110000864 摘要近日瀏覽網上一些圖片提取文字的網站，覺得甚是有趣，花費半日也做了個線上圖片識別程式，完成了兩個技術方案的選擇，一是tesseract+python f

Python用5行程式碼實現批量摳圖的示例程式碼

前言對於會PhotoShop的人來說，摳圖是非常簡單的操作了，有時候幾秒鐘就能扣好一張圖。不過一些比較複雜的圖，有時候還是要畫點時間的，今天就給大家帶了一個非常快速簡單的辦法，用Python來批量摳取人像。

Python使用20行程式碼實現微信聊天機器人

近來，開啟微信群發訊息，就會秒收到一些活躍分子的回覆，有的時候感覺對方回答很在理，但是有的時候發現對方的回答其實是驢脣不對馬嘴，仔細深究發現，原來對方是機器人。今天，小編就帶大家用20行程式碼，帶你一起

用urllib庫幾行程式碼實現最簡單爬蟲

""" 使用urllib.request()請求一個網頁內容，並且把內容打印出來。 """

NBA投籃資料視覺化，4行程式碼就能實現！

36歲的老詹還沒有老，4座總冠軍+4次FMVP。湖人總冠軍， Kobe! this is for u！今天給大家介紹一個好東西~

crontab 週日_【Python】300行程式碼實現crontab定時器功能

技術標籤：crontab 週日python 定時器python定時器python每隔幾秒執行一次熟悉Linux的都知道在Linux下有一個crontab的定時任務，可以很方便的進行各種定時、計劃任務的執行。有時候寫程式碼也需要用到定時器業

python用700行程式碼實現http客戶端

本文用python在TCP的基礎上實現一個HTTP客戶端,該客戶端能夠複用TCP連線,使用HTTP1.1協議.

用Python寫幾行程式碼，一分鐘搞定一天工作量，同事直呼：好傢伙！

前幾天有一個讀者說最近要整理幾千份檔案，頭都要整禿了，不知道能不能用Python解決，我們來看一下，你也可以思考一下。

【Python】50行程式碼帶你背單詞，四六級沖沖衝

前言很快就要到六月份的英語四級考試了，你們都準備好了嗎?聽說很多小夥伴還在背單詞，在我看來，背單

Python Opencv提取圖片中某種顏色組成的圖形的方法

主要目標識別圖中紅色的裂縫，嘗試了幾種不同的方法，最後發現比較每一點的RGB差值可以很好的解決這個問題，也就是提取圖片中的紅色相關資訊。處理結果如下：

Pycharm中安裝wordcloud等庫失敗問題及終端通過pip安裝的Python庫如何新增到Pycharm直譯器中(推薦)

這裡介紹筆者在學習wordcloud庫時安裝過程中所遇到的問題和解決方案 1.在Pycharm中安裝wordcloud出現的問題如下圖所示

Python3使用騰訊雲文字識別(騰訊OCR)提取圖片中的文字內容例項詳解

百度OCR體驗地址： https://ai.baidu.com/tech/imagerecognition/general 騰訊OCR體驗地址： https://cloud.tencent.com/act/event/ocrdemo

手機便籤如何提取圖片中的文字？

對於很多上班族來說，經常要面臨這樣的工作任務，這就是領導發來了一張圖片，需要修改圖片中的一部分文案內容，這時候如果我們想要使用圖片中的文字內容，重新寫一份肯定是比較麻煩的，這時候如果能夠把文字提取出來

cv2 提取圖片中的對應顏色

# lower_yellow = np.array([12, 230, 230]) # 黃色閾值下界lower_yellow = np.array([12, 43, 43]) # 黃色閾值下界higher_yellow = np.array([35, 255, 255])# 黃色閾值上界lower_red = np.array([0, 127, 128]) #

4行Python程式碼生成影象驗證碼(2種)

最近無意看到網上有人使用Python編寫幾十行程式碼生成影象驗證碼，感覺很是繁瑣，這裡為各位朋友推薦兩種方法，使用4行Python程式碼即可生成驗證碼。

利用4行Python程式碼監測每一行程式的執行時間和空間消耗

Python是一個高層次的結合瞭解釋性、編譯性、互動性和麵向物件的指令碼語言，其具有高可擴充套件性和高可移植性，具有廣泛的標準庫，受到開發者的追捧，廣泛應用於開發運維（DevOps）、資料科學、網站開發和安全。然

這款神器，能把Python程式碼執行過程看地一清二楚

對於一些剛入門 Python 的朋友來說，程式碼稍微複雜些就難以搞懂程式碼內部到底是怎麼執行的了，而且有時一執行就報錯，難以一下發現錯誤，只會用 Print 去慢慢找異常的地方，效率很低下。

1 個人 70 萬行程式碼，20 年持續更新：這款遊戲號稱開發到死，永不停更

8 月 1 日訊息這是一款「開發到死」，「永不停更」的遊戲。兄弟兩人，一人開發，一人劇情，共同維持了這款遊戲近 20 年。現在的玩家剛剛開啟它，往往會發出“這啥玩意兒？”的疑問：

這款Python庫4行程式碼提取圖片中的文字

OCR是什麼？

關於EasyOCR

安裝EasyOCR

使用方法

小結

相關推薦