Python tesserocr的識別精度如此之低?
阿新 • • 發佈:2020-09-16
今天在學習Python爬蟲的驗證碼識別的時候發現tesserocr這個庫的圖片識別能力居然能低到離譜的程度,我都很好奇為什麼崔神書上那張圖片居然能識別出來。
實驗的三張圖片如下。
我剛開始想的是除了圖一略有難度以外,圖二圖三應該不難識別吧?
於是我先直接對原圖片進行識別。
import tesserocr from PIL import Image img1 = Image.open('img1.jpg') print('圖片1的內容為:', tesserocr.image_to_text(img1)) img2 = Image.open('img2.jpg') print('圖片2的內容為:', tesserocr.image_to_text(img2)) img3 = Image.open('img3.jpg') print('圖片3的內容為:', tesserocr.image_to_text(img3))
結果只有圖3出了內容,而且還是錯誤的