某車之家字型反爬最終版
阿新 • • 發佈:2022-03-14
前幾個版本的程式碼, 雖然都可以解決問題, 但是有點麻煩, 如果是很多個文字, 也不能一個一個手敲上去, 更不能保證字型的順序不變, 這次使用pillow + ddddocr來徹底解決這個問題
思路和過程在前幾篇已經寫過了, 有什麼不明白的, 先看一下前幾篇, 連結放在了最下面, 原始碼也在最下面
首先獲取字型檔案unicode_map, 取出字型的ascii值和字形的名稱
然後使用pillow的 ImageFont 和 ImageDraw, 將字型轉為圖片, 儘量將字放在中間, 切在周圍留有空白, 這樣可以提高準確率
最後使用ddddocr
將ttf檔案字型轉為圖片如下, 可以人工對比一下是否正確
最後完善一下程式碼, 可以儲存圖片, 驗證結果, 如果不存在字型檔案會先下載, 然後再識別, 可以完美解決這個字型反爬, 其它網站相關的字型反爬, 也可以使用
完整程式碼後臺回覆 font_ddddocr_spider 獲取
參考
https://blog.csdn.net/zjq592767809/article/details/122426907
https://blog.csdn.net/weixin_45304329/article/details/122408336
https://github.com/sml2h3/ddddocr
https://pillow.readthedocs.io/en/stable/reference/ImageFont.html
相關閱讀
文章來源於公眾號:某車之家字型反爬