1. 程式人生 > 其它 >爬蟲驗證碼識別免費開源版(5行程式碼解決)

爬蟲驗證碼識別免費開源版(5行程式碼解決)

背景

爬取資料的過程中難免遇到登入的問題,為了繞過登入,儲存cookie是常見的的解決方法.在遇到有驗證碼的問題時,無疑增加了獲取cookie的難度.該python包,解決你的實際問題,避免了購買雲打碼或者自己搭建機器學習,訓練模型的過程,話不多說,直接進入主題.

環境要求

目前已經支援python3.8以下的了,python3.8以上毫無問題。

呼叫方法

pip install ddddocr

如何使用

import ddddocr
 
ocr = ddddocr.DdddOcr()
 
with open('test.png', 'rb') as f:
 
    img_bytes = f.read()
 
res = ocr.classification(img_bytes)
 
print(res)

  

引數說明

DdddOcr 接受兩個引數:


引數名

預設值

說明

use_gpu

False

Bool 是否使用gpu進行推理,如果該值為False則device_id不生效

device_id

0

int cuda裝置號,目前僅支援單張顯示卡


classification引數:


引數名

預設值

說明

img

0

bytes 圖片的bytes格式


我試了試很不錯,而且是cpu的情況下,幾毫秒返回結果。
我的驗證碼如下:

想要學習Python基礎知識的,掃描右上角二維碼關注作者的公眾號,回覆"專輯"倆字.進行知識的獲取