1. 程式人生 > >身份證號碼識別

身份證號碼識別

       我們的錄單系統中,除了上傳身份證外,還需要手動填寫身份證和銀行卡號,特別是銀行卡號,那些凹凸效果和特殊字型實在是人眼不友好的,之前系統老的訂單中不少卡號輸入錯誤的。先看下身份證識別。

對於身份證內容的識別,輸入OCR技術,有一些收費和開源的實現。

         開源實現中,比較著名的是tesseract,對應的網址是https://github.com/tesseract-ocr/tesseract,除了識別外,還能夠增加不同的語言庫進行訓練,提高識別率。關於tesseract的用法,參見http://www.52itstyle.com/thread-4803-1-1.html,裡面講解的已經比較清楚。

        個人在試驗過程中,發現不大穩定,識別率受圖片質量的影響很大,特別是一些白光或者背光的圖片,很多什麼都識別不出來。如果懂影象處理這一塊的知識,先對圖片進行一些必要的修正處理,應該會極大增加識別率,達到能夠使用的目的。

        又找了收費實現,有云脈、曠視等。其中曠視http://cloud.megvii.com,是一款收費產品,主要包含人臉、身份證、駕照等相關識別應用,其中身份證識別有免費的http服務以及針對android和ios的sdk,效果很多,基本是100%識別,但是隻包含網路圖片的識別,對本地的圖片有限制。