1. 程式人生 > 程式設計 >Python 識別12306圖片驗證碼物品的實現示例

Python 識別12306圖片驗證碼物品的實現示例

1、PIL介紹以及圖片分割

Python 3 安裝: pip3 install Pillow

1.1 image 模組

Image模組是在Python PIL影象處理中常見的模組,主要是用於對這個影象的基本處理,它配合open、save、convert、show…等功能使用。

from PIL import Image
#開啟檔案代表開啟pycharm中的檔案
im = Image.open('1.jpg')
#展示圖片
im.show()

1、Crop類

拷貝這個影象。如果使用者想貼上一些資料到這張圖,可以使用這個方法,但是原始影象不會受到影響。

im.crop(box) ⇒ image

從當前的影象中返回一個矩形區域的拷貝。變數box是一個四元組,定義了左、上、右和下的畫素座標。用來表示在原始影象中擷取的位置座標,如box(100,100,200,200)就表示在原始影象中以左上角為座標原點,擷取一個100*100(畫素為單位)的影象。

from PIL import Image
im = Image.open("pic1.jpg")
##確定拷貝區域大小
box = (5,41,72,108)
##將im表示的圖片物件拷貝到region中,大小為box
region = im.crop(box)
region.show()

實戰一:12306影象分割並儲存

from PIL import Image
#切割影象,由於下載的圖片都是有固定的位置,所以直接控制畫素進行切割就行了
def cut_img(im,x,y):
  assert 0 <= x <= 3
  assert 0 <= y <= 2
  left = 5 + (67 + 5) * x
  top = 41 + (67 + 5) * y
  right = left + 67
  bottom = top + 67
  return im.crop((left,top,right,bottom))
 
if __name__ == '__main__':
  im = Image.open("./pic1.jpg")
  #控制y軸
  for y in range(2):
    #控制x軸
    for x in range(4):
      im2 = cut_img(im,y)
      im2.save('./images/%s_%s.png'%(y,x))

2、百度平臺介面實現

2.1.平臺接入:

1.開啟https://ai.baidu.com/進入控制檯,選擇文字識別服務。

2.建立應用,如圖示:

3.輸入應用名稱、描述,並選擇應用型別,之後點選“立即建立”按鈕。

4.建立完畢,點選“返回應用列表”。

5.此處顯示AK,SK,後面程式中會用到

3. 官方文件的讀取

1.開啟https://ai.baidu.com/docs#/OCR-API/top 文件說明

需要用到的資訊有:

(1)影象識別URL:https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general

(2)Header格式:Content-Type:application/x-www-form-urlencoded

(3) 請求引數:image和multi_detect兩個引數,image為影象資料,base64編碼後進行urlencode,要求base64編碼和urlencode後大小不超過4M。

(4)返回引數:車牌顏色Color、車牌號碼number等。

#!/usr/bin/python
# -*- coding: utf-8 -*-
import base64
import requests
import os
import time
#todo:獲取百度許可權驗證碼access_token
def get_token():
  get_token_url = "https://aip.baidubce.com/oauth/2.0/token"
  params = {
    "grant_type": "client_credentials","client_id": "7ax98QuWU5l2zTbaOkzvKgxE","client_secret": "INugQTM2DAfNFgfxtvgR7eF8AHPFGP5t",}
  res = requests.get(get_token_url,params).json()
  return res["access_token"]
#todo:通過許可權驗證碼和圖片進行識別物品
def get_result(access_token,image):
  url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general"
  #開啟檔案並進行編碼
  with open(image,'rb')as f:
    image = base64.b64encode(f.read())
  # image =
  #頭部資訊
  headers = {
    'Content-Type': 'application/x-www-form-urlencoded'
  }
  #傳送資料
  data = {
    "access_token": access_token,"image": image
  }
  #傳送請求,並返回識別資料
  res = requests.post(url,headers=headers,data=data).json()
  if res:
    result = res['result']
    return result
#todo:獲取圖片關鍵物品
def get_keywords(result):
  #按照最大匹配率進行排序,並獲取左最後一個
  max_score = sorted(result,key=lambda x:x['score'])[-1]
  # print(max_score['keyword'])
  keyword = max_score['keyword']
  return keyword
 
if __name__ == '__main__':
  access_token = get_token()
  get_result(access_token,'pic1.jpg')
  datas = []
  for root,dir,files in os.walk('images'):
    for file in files:
      image = os.path.join(root,file)
      result = get_result(access_token,image)
      keyword = get_keywords(result)
      print(keyword)
      time.sleep(1)
      datas.append(keyword)
  print(datas)

總結:

  • PIL介紹以及圖片分割
  • 百度AI影象識別例項搭建
  • 識別12306類別碼

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。