1. 程式人生 > 實用技巧 >Python tesserocr的識別精度如此之低?

Python tesserocr的識別精度如此之低?

今天在學習Python爬蟲的驗證碼識別的時候發現tesserocr這個庫的圖片識別能力居然能低到離譜的程度,我都很好奇為什麼崔神書上那張圖片居然能識別出來。

實驗的三張圖片如下。

我剛開始想的是除了圖一略有難度以外,圖二圖三應該不難識別吧?

於是我先直接對原圖片進行識別。

import tesserocr
from PIL import Image


img1 = Image.open('img1.jpg')
print('圖片1的內容為:', tesserocr.image_to_text(img1))
img2 = Image.open('img2.jpg')
print('圖片2的內容為:
', tesserocr.image_to_text(img2)) img3 = Image.open('img3.jpg') print('圖片3的內容為:', tesserocr.image_to_text(img3))

結果只有圖3出了內容,而且還是錯誤的