1. 程式人生 > 其它 >某車之家字型反爬最終版

某車之家字型反爬最終版

 

 

 

      前幾個版本的程式碼, 雖然都可以解決問題, 但是有點麻煩, 如果是很多個文字, 也不能一個一個手敲上去, 更不能保證字型的順序不變, 這次使用pillow ddddocr來徹底解決這個問題

 

思路和過程在前幾篇已經寫過了, 有什麼不明白的, 先看一下前幾篇, 連結放在了最下面,  原始碼也在最下面


首先獲取字型檔案unicode_map, 取出字型的ascii值和字形的名稱

 

 

 

然後使用pillow的 ImageFontImageDraw, 將字型轉為圖片, 儘量將字放在中間, 切在周圍留有空白, 這樣可以提高準確率

 

 

 

最後使用ddddocr

來識別圖片文字, 準確率非常高

 

 

 

將ttf檔案字型轉為圖片如下, 可以人工對比一下是否正確

 

 

最後完善一下程式碼, 可以儲存圖片, 驗證結果, 如果不存在字型檔案會先下載, 然後再識別, 可以完美解決這個字型反爬, 其它網站相關的字型反爬, 也可以使用

 

 

完整程式碼後臺回覆 font_ddddocr_spider 獲取

 

參考


https://blog.csdn.net/zjq592767809/article/details/122426907
https://blog.csdn.net/weixin_45304329/article/details/122408336

https://github.com/sml2h3/ddddocr
https://pillow.readthedocs.io/en/stable/reference/ImageFont.html

 

 

 

相關閱讀

 

 

 

文章來源於公眾號:某車之家字型反爬