Python 識別12306圖片驗證碼物品的實現示例
1、PIL介紹以及圖片分割
Python 3 安裝: pip3 install Pillow
1.1 image 模組
Image模組是在Python PIL影象處理中常見的模組,主要是用於對這個影象的基本處理,它配合open、save、convert、show…等功能使用。
from PIL import Image #開啟檔案代表開啟pycharm中的檔案 im = Image.open('1.jpg') #展示圖片 im.show()
1、Crop類
拷貝這個影象。如果使用者想貼上一些資料到這張圖,可以使用這個方法,但是原始影象不會受到影響。
im.crop(box) ⇒ image
從當前的影象中返回一個矩形區域的拷貝。變數box是一個四元組,定義了左、上、右和下的畫素座標。用來表示在原始影象中擷取的位置座標,如box(100,100,200,200)就表示在原始影象中以左上角為座標原點,擷取一個100*100(畫素為單位)的影象。
from PIL import Image im = Image.open("pic1.jpg") ##確定拷貝區域大小 box = (5,41,72,108) ##將im表示的圖片物件拷貝到region中,大小為box region = im.crop(box) region.show()
實戰一:12306影象分割並儲存
from PIL import Image #切割影象,由於下載的圖片都是有固定的位置,所以直接控制畫素進行切割就行了 def cut_img(im,x,y): assert 0 <= x <= 3 assert 0 <= y <= 2 left = 5 + (67 + 5) * x top = 41 + (67 + 5) * y right = left + 67 bottom = top + 67 return im.crop((left,top,right,bottom)) if __name__ == '__main__': im = Image.open("./pic1.jpg") #控制y軸 for y in range(2): #控制x軸 for x in range(4): im2 = cut_img(im,y) im2.save('./images/%s_%s.png'%(y,x))
2、百度平臺介面實現
2.1.平臺接入:
1.開啟https://ai.baidu.com/進入控制檯,選擇文字識別服務。
2.建立應用,如圖示:
3.輸入應用名稱、描述,並選擇應用型別,之後點選“立即建立”按鈕。
4.建立完畢,點選“返回應用列表”。
5.此處顯示AK,SK,後面程式中會用到
3. 官方文件的讀取
1.開啟https://ai.baidu.com/docs#/OCR-API/top 文件說明
需要用到的資訊有:
(1)影象識別URL:https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general
(2)Header格式:Content-Type:application/x-www-form-urlencoded
(3) 請求引數:image和multi_detect兩個引數,image為影象資料,base64編碼後進行urlencode,要求base64編碼和urlencode後大小不超過4M。
(4)返回引數:車牌顏色Color、車牌號碼number等。
#!/usr/bin/python # -*- coding: utf-8 -*- import base64 import requests import os import time #todo:獲取百度許可權驗證碼access_token def get_token(): get_token_url = "https://aip.baidubce.com/oauth/2.0/token" params = { "grant_type": "client_credentials","client_id": "7ax98QuWU5l2zTbaOkzvKgxE","client_secret": "INugQTM2DAfNFgfxtvgR7eF8AHPFGP5t",} res = requests.get(get_token_url,params).json() return res["access_token"] #todo:通過許可權驗證碼和圖片進行識別物品 def get_result(access_token,image): url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general" #開啟檔案並進行編碼 with open(image,'rb')as f: image = base64.b64encode(f.read()) # image = #頭部資訊 headers = { 'Content-Type': 'application/x-www-form-urlencoded' } #傳送資料 data = { "access_token": access_token,"image": image } #傳送請求,並返回識別資料 res = requests.post(url,headers=headers,data=data).json() if res: result = res['result'] return result #todo:獲取圖片關鍵物品 def get_keywords(result): #按照最大匹配率進行排序,並獲取左最後一個 max_score = sorted(result,key=lambda x:x['score'])[-1] # print(max_score['keyword']) keyword = max_score['keyword'] return keyword if __name__ == '__main__': access_token = get_token() get_result(access_token,'pic1.jpg') datas = [] for root,dir,files in os.walk('images'): for file in files: image = os.path.join(root,file) result = get_result(access_token,image) keyword = get_keywords(result) print(keyword) time.sleep(1) datas.append(keyword) print(datas)
總結:
- PIL介紹以及圖片分割
- 百度AI影象識別例項搭建
- 識別12306類別碼
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。