Python學習之圖片對比和識別小記

阿新 • • 發佈：2018-11-16

因工作中需要對視訊圖片做處理，於是就把應用得到的幾個需求功能在網上solo了一波。

一、圖片對比

主要應用的庫Image,函式Image.size(),resize(),convert(),getpixel(),

1、根據R-G -B三原色原理：

只要使R=G=B，三者的值相等就可以得到灰度影象。R=G=B=255為白色，R=G=B=0為黑色，R=G=B=小於255的某個整數時，此時就為某個灰度值。

在python裡處理圖片直接設定mode='L'模式，Image庫原始碼處理時，根據如下公式做的RGB轉換：

L = R * 299/1000 + G * 587/1000 + B * 114/1000

2、為了處理方便，將圖片比例做一定的調整，解析度設定為12*12，獲取畫素值（灰度值）。

求出平均灰度值，SUM(畫素點的畫素)/畫素點個數；

根據處理後的圖片的畫素跟平均畫素做對比，生成影象的波動值，如下：

3、最後根據影象的波動值對比，生成兩張圖片的相似度值。

此方法比較可取的是圖片的單個畫素點的畫素(0-255)取出有固定值，一定程度上可以參照；不可取的地方是取出的平均畫素值可能相差比較大，後期優化可在此基礎上進行。

二、圖片文字識別

主要應用庫，pytesseract,Image，函式，pytesseract.image_to_string(),crop(),和一個重要的識別庫Tesseract-OCR。

1、得到圖片，網上很多方式，selenium裡有driver.get_screenshot_as_file()獲取截圖等其它方式。

2、擷取想要識別的圖片區域，支援英文、數字、中文等其它語言。

A = image123.jpg；

需要擷取的圖片範圍box= （68,140,232,155），這裡自定義。

需要的圖片:B = Image.open(A).crop(box).save(image124.jpg)

3、最後是識別

print(pytesseract.image_to_string(Image.open(image124.jpg)))

圖片識別主要是藉助識別庫裡的原始資料和現在獲取的資料做畫素對比輸出，喜歡研究的可以看看識別庫的實現。

先寫到這，希望能幫到需要圖片識別的夥伴。如有紕漏，歡迎指正！

Python學習之圖片對比和識別小記

因工作中需要對視訊圖片做處理，於是就把應用得到的幾個需求功能在網上solo了一波。一、圖片對比主要應用的庫Image,函式Image.size(),resize(),convert(),getpixel(), 1、根據R-G -B三原色原理：只要使R=G=B，三者的值相等就可以

Python學習之路 —— *args 和**kwargs

轉載自部落格園： http://www.cnblogs.com/moodlxs/p/3232222.html 當函式的引數不確定時，可以使用*args 和**kwargs，*args 沒有key值，**kwargs有key值。話不多說直接上程式碼 [python] de

Python學習之Jupyter Notebook和highchart安裝

執行環境 Win10 64位 + Python3.6.0 一、安裝網頁端編譯器Jupyter Notebook 在cmd輸入pip3 install jupyter 在cmd輸入jupyter notebook,啟動jupyter notebook，然後會跳轉到網頁，

Python學習之 a == b 和 a is b 的區別

Python學習中經常會遇到 a == b 和 a is b 的問題, 也許你會為此迷惑。下面,我們來簡單分析一下: 首先我們要了解對於Python物件而言,一般存在三個屬性:type 型別, value 值以及地址id 1 a == b , 這是一個比

Python人工智慧之圖片轉文字識別

自學Python3第5天，今天突發奇想，想用Python識別圖片裡的文字。沒想到Python實現圖片文字識別這麼簡單，只需要一行程式碼就能搞定 #作者微信：xuxin15 from PIL import Image import pytesseract #上面都是導包，只

python學習之使用UDP和多執行緒實現一個群聊天室

在學習UDP的時候,想著試一試能不能搞一個命令視窗的udp聊天工具,因為udp的廣播機制,所以就想著乾脆直接搞一個群聊的吧。不過最後搞來搞去，命令視窗下使用多執行緒，沒有做出什麼好看整潔的“圖形化”介面，湊合著用吧，畢竟是一個練習的學習型的小玩意。有時間把列印

Python學習之路8?叠代器協議和生成器

rep 好處 obj 必須決定內容 cnblogs 有用 pri 一什麽是叠代器協議 1.叠代器協議是指：對象必須提供一個next方法，執行該方法要麽返回叠代中的下一項，要麽就引起一個StopIteration異常，以終止叠代（只能往後走不能往前退） 2.可叠代對象

Python學習之三【對象和類型&&運算符】

str pop python學習十六進制更強 ring span 整數相除一定的 [對象和類型] 學生的屬性: 小明對象姓名：男性別：年齡：身高：體重：籍貫：五種基本對象類型字符串（string），簡

Python自動化3.0-------學習之路------日期和時間！

unix dst python自動化相關 http -a 年份字符串 cti Python 日期和時間 Python 程序能用很多方式處理日期和時間，轉換日期格式是一個常見的功能。 Python 提供了一個 time 和 calendar 模塊可以用於格式化日期和時間。

Python學習之路2 - 列表和元組

copy cto .com 會有 pen 輸入插入元素 http 數據類型列表概念：Python內置的一種數據類型是列表：list。list是一種有序的集合，可以隨時添加和刪除其中的元素。列表的使用 names = [‘zhangsan‘,‘lisi‘,‘

python學習之range()和xrange()

python2 har col 叠代 cnblogs 註意 tor 並不是但是在python2中，xrange()返回一個xrange對象，註意這個對象並不是生成器，也不是叠代器，但是是叠代對象。而range()則返回列表對象。 >>> range

Python學習之旅—Mysql數據庫之數據類型和約束

都是 warnings there 結構 clas 體重 set集合 scale 自增前言　　　本篇博客我們主要專註於解決Mysql數據庫中的數據類型和約束，將重點聚焦於字符類型，日期類型，集合類型和主鍵和unique等知識點，希望各位可以好好掌握今天的知識點。一.整

Python學習之dict和set

不可變需要 after 集合 value 報錯 list 也會如果 #coding=utf-8 # dict dict= {‘bob‘: 40, ‘andy‘: 30} print dict[‘bob‘] # 通過dict提供的get方法，如果key不存在，可以返回N

Python學習之路：time和datetime模塊

exists atime shuffle aaa 絕對路徑 ons 平臺文件名可能轉自：http://blog.51cto.com/egon09/1840425 一：內建模塊 time和datetime（http://www.jb51.net/article/49

Python 學習之文件對象的屬性和方法簡介

bject order 直接 rsyslogd cep com except pri and python的文件處理和相關輸入輸出能力。介紹文件對象(它的內建函數，內建方法和屬性)，標準文件，同時討論文件系統的訪問方法，文件執行，以及相關文件模塊。一、內建函數open

Python學習之路（四）爬蟲（三）HTTP和HTTPS

CP 發出 net 長度現在消息頭理論 LV 模型 HTTP和HTTPS HTTP協議（HyperText Transfer Protocol，超文本傳輸協議）：是一種發布和接收 HTML頁面的方法。 HTTPS（Hypertext Transfer Protoc

python學習之break和continue在for循環中的使用(案例:打印出10以內的偶數,並且只要前三個偶數)

com python學習 bsp 次循環 bubuko python alt info 偶數運行程序,break是整個程序都跳出 continue則表示跳過當前一次循環,然後繼續執行循環 python學習之break和continue在for循環中的使用(案例:打

python學習之高級語言和低級語言

框架 HP 算法高級 bin 環境 ruby 後綴局限註意：隨筆大家都可以看，文章別人找不到但可以通過URL訪問，日誌別人找不到URL也看不到網絡編程：斷點續傳 WEB框架：用於寫網站設計模式+算法高級語言：Java、C#、PHP、Go、ruby 、C++

機器學習和python學習之路吐血整理技術書從入門到進階(珍藏版)

轉載自某大佬部落格：https://pymlovelyq.github.io/2018/10/15/machineLearning/ “機器學習／深度學習並不需要很多數學基礎！”也許你在不同的地方聽過不少類似這樣的說法。對於鼓勵數學基礎不好的同學入坑機器學習來說，這句話是挺不錯的

三十六、python學習之Flask框架: 藍圖和單元測試

一、藍圖和單元測試: 1.藍圖: 隨著flask程式越來越複雜,我們需要對程式進行模組化的處理,之前學習過python的模組化管理,於是針對一個簡單的flask程式進行模組化處理名詞解釋: 高內聚,低耦合: 所謂高內聚是指一個軟體模組是由相關性很強的程式碼組成，

Python學習之圖片對比和識別小記

相關推薦