圖片文字識別：Tesseract OCR庫在Python中基本使用

阿新 • • 發佈：2018-11-16

圖片識別：Tesseract OCR庫在Python中基本使用

一.Tesseract - Xmind的筆記

二. 程式碼案例：

基本使用程式碼

import pytesseract
from PIL import Image

# 建立圖片物件
image = Image.open('test_image.png')

# 使用tesseract識別圖片中的文字
print(pytesseract.image_to_string(image, config='-psm 7'))

貓眼評分-案例程式碼

from io import BytesIO
import time
from PIL import Image
import pytesseract
import requests
from selenium import webdriver


class MaoYan(object):
    def __init__(self):
        self.url = 'http://maoyan.com/films/1200486'

    def run(self):
        # 建立chrome物件,傳送selenium請求,獲取全屏物件
        chrome = webdriver.Chrome('/home/python/Desktop/chromedriver')
        chrome.implicitly_wait(5)   # 設定瀏覽器隱式等待 頁面載入
        chrome.get(self.url)

        # 讓背景變白色和文字變黑色，更易識別
        chrome.execute_script('document.querySelector(".banner").style.background = "white"')
        chrome.execute_script('document.querySelector(".stonefont").style.color = "black"')

        screen_shot = chrome.get_screenshot_as_png()   # 獲取全屏截圖的物件
        screen_image = Image.open(BytesIO(screen_shot))  # 以IO的形式轉換為二進位制,建立圖片物件
        screen_image.save('15_screen_image.png')

        # 獲取評分元素物件,計算評分元素的位置區域資訊,擷取評分圖片
        el_score = chrome.find_element_by_xpath('//span[@class="index-left info-num "]/span[@class="stonefont"]')
        height = el_score.size['height']
        width = el_score.size['width']

        left = el_score.location['x']
        top = el_score.location['y']
        right = left + width
        bottom = top + height

        cut_info = (left, top, right, bottom)
        print(cut_info)

        cut_image = screen_image.crop(cut_info)
        cut_image.save('15_cut_image.png')

        # 使用tesseract庫,進行文字識別
        try:
            score = pytesseract.image_to_string('15_cut_image.png', config='-psm 7')
            print(score)
        except Exception as e:
            print(e)
            print('識別失敗')


if __name__ == '__main__':
    mao_yan = MaoYan()
    mao_yan.run()

----------------------------- END ---------------------------------------

圖片文字識別：Tesseract OCR庫在Python中基本使用

圖片識別：Tesseract OCR庫在Python中基本使用一.Tesseract - Xmind的筆記二. 程式碼案例：基本使用程式碼 import pytesseract from

提取圖片文字——linux下tesseract-ocr安裝編譯

注：以下安裝以ubuntu16.04為例，本例中用到的檔案是1.71版的leptonica和3.04版的tesseract。不同的作業系統用到的檔案不同，請勿亂用。一、Tesseract概述 Tesseract的OCR引擎最先由HP實驗室於1985年開始研發，

Tesseract-OCR-03-圖片文字識別

目錄名 sso 搜集命令發出維護結果 rac class Tesseract-OCR-03-圖片文字識別本篇介紹使用 Tesseract-OCR 做圖片文字識別，識別手寫文字的時候，正確率能達到 90%，當訓練後正確率是極高的。這裏介紹的圖片文字識別，可以識別英文

基於Eclipse下的 tesseract -OCR實現圖片文字識別過程簡單介紹

前言：最近忙於考研複習，好久沒有敲程式碼了，本人目前只是學生，寫部落格的目的只是為了記錄自己的學習過程，當然，如果能為他人提供一些幫助，那更好了。一.Tesseract 簡介 Tesseract 是Ray Smith 在1985 - 1995年間在惠普布里斯托實驗室開發的一個ocr引擎（O

Python影象處理之圖片文字識別（OCR）

OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學文字識別（Optical Character Recognition，OCR）。可以實現OCR 的底層庫並不多，目前很多庫都是使用共同的幾個底層OCR 庫，或者是在上面進行定製。 Tess

【專欄】- Tesseract-OCR 圖片文字識別

Tesseract-OCR 圖片文字識別從零開始介紹Tesseract-OCR 圖片文字識別引擎 1.針對Windows系統 2.Tesseract-OCR安裝與環境配置 3.Tesseract-OCR的簡單使用與訓練

【python 文字識別】利用pytesseract庫進行圖片文字識別

關於中文的識別，效果比較好而且開源的應該就是Tesseract-OCR了，python 裡面也有一個包去使用Tesseract-OCR。這個包叫pytesseract 。安裝pytesseract pip install pytesseract 除此之外

轉載-Python影象處理之圖片文字識別（OCR）

點選開啟連結 segmentFault_jclian91_Python影象處理之圖片文字識別（OCR）OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學文字識別（Optical Character Recognition，OCR）。可以實現OCR 的底層庫並

java 使用tess4J（Tesseract-OCR）進行圖片文字識別

java中識別文字使用的軟體是tesseractocr（使用的版本是3.02，3以後的版本才支援中文），這個軟體需要安裝在本地電腦中，安裝的過程中全部都按照預設進行安裝（以便於Java直接呼叫）中文訓練庫下載地址該軟體預設的識別的是英文，如果相要能識別中文，需要將中文的訓練

Andrew NG 機器學習筆記-week11-應用例項：圖片文字識別（Application Example：Photo OCR）

1、問題描述和流程圖（Problem Description and Pipeline） photo OCR：photo Optical Character Recognition 影象文字識別，要求從一張給定的圖片中識別文字。為了完成這樣的工作，需

Python配置圖片文字識別

ins 源代碼 logs 配置 mage pillow setup blog hub 以管理員權限打開cmd控制臺。 1.如何安裝PIL 輸入下面命令：pip install Pillow. 參考：https://www.cnblogs.com/mrgavin/

python學習----網頁圖片文字識別(簡單)

在接觸python後想對圖片進行一些處理 python實現的程式碼很簡單但是關鍵在於一些包的匯入我使用的python 軟體是 pycharm 可以在setting中去下載requests這個包在安裝包PIL 和pytesseract這兩個包的時候出

中國領跑全球OCR文字識別：福昕掃描王廣受歡迎

11月20日，有OCR領域奧斯卡之稱的國際文件分析與識別大會（ICDAR）資料集最新結果公佈，中國高校及企業包攬排行榜前五。截至目前，全球頂級的高校、科研機構及企業都參加過這項測試，包括Google、Microsoft、Amazon、Faceboo等國際知名企業，其含金量不言而喻。福昕掃描王出自中

怎麽在迅捷OCR文字識別軟件中將圖片文字識別出來

size 打出 watermark 移動位置現在 water 解決方法 src 解決工作中我們經常會遇到從圖片中識別文字的問題，如果我們一個字一個字打出來，太浪費時間了，這時候就需要使用借助到文字識別軟件來幫助實現圖片文字識別的問題了，具體要怎樣去操作呢？一起來看看下面

python呼叫百度圖片文字識別介面

# 登入百度api應用頁面獲取下面三相內容 APP_ID = 'xxxxx' API_KEY = 'xxxxxxx' SECRET_KEY = 'xxxxxxx' class BaiduImg(): def __init__(self, img_path): self.im

python 使用pytesseract圖片文字識別

python 使用pytesseract圖片文字識別 2017年03月02日 16:10:14 Saj_L 閱讀數：1742更多個人分類： python 1. 安裝tesseract 下載地址：http://digi.bib.uni-mannheim.de/tesseract/t

OCR圖片文字識別的過程方法

2018年11月02日 16:58:52 人生幾何歡喜就好閱讀數：6 標籤： OCR 圖文識別

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 18—Photo OCR 應用例項:圖片文字識別

Lecture 18—Photo OCR 應用例項:圖片文字識別 18.1 問題描述和流程圖 Problem Description and Pipeline 影象文字識別需要如下步驟: 1.文字偵測(Text detection)——將圖片上的文字與其他環境物件分離開來2.字元切分(Character

Python爬蟲專案實戰3 | 圖片文字識別（以驗證碼識別為例）

1.專案背景我在實習過程中，當我抓取環保平臺相關資料時，常常發現有圖片的情況，比如以下這種圖片，所以抓取這種圖片中的資訊是我進行圖片文字識別的動力： 2.專案思路因為在某一網站中有大量這種想要抓取的圖片，所以我的思路是， 1.先抓取這些圖片的名稱和URL； 2.然後再根

Python-圖片文字識別

　　百度AI介面（手寫文字識別）：https://ai.baidu.com/docs#/OCR-API/9ef46660 　　實現效果: 　　　　　　　　步驟一：接入介面　　進入上述網站申請賬號,然後執行相關程式碼，獲取 access_token 即算完成（由於百度json

圖片文字識別：Tesseract OCR庫在Python中基本使用

圖片識別：Tesseract OCR庫在Python中基本使用

相關推薦