1. 程式人生 > >關於呼叫百度雲OCR身份證識別介面,用Java語言,識別結果缺少身份證號碼的問題解決

關於呼叫百度雲OCR身份證識別介面,用Java語言,識別結果缺少身份證號碼的問題解決

問題描述:

最近專案系統開發,使用到了相關證件的資訊提取、識別,由於是學校科研使用,選擇了百度雲OCR文字識別的API。具體的相關識別身份等證件的程式碼將在另一篇文章中敘述,最近真的太忙了,草稿箱中還有兩篇文還沒發.......週末一定要發了其中的關於文字識別的文章。這個問題就是出現在呼叫身份證識別接口出現的,身份證上其他資訊都可以識別出來,準確率還是可以的,但是身份證號碼識別不出來,下圖是識別出來的結果。

 

 

問題原因: 

通過不同身份證圖片大量對比實驗, 考慮到有可能是圖片資訊質量等相關問題,對圖片進行了實驗,其中包括彩色、黑白等進行了分析。發現用真實的身份證就可以很好的識別出來身份證號碼等相關資訊。因此進行了查證,原來,百度OCR身份證識別,對身份證號碼有個校驗機制,如果使用假的身份證是識別不出來身份證號碼的,返回就是“  ”。在經過彩色轉黑白等一系列圖片的試驗,我的內心竟然毫無波動,竟然有點想笑。 最後附一張真實身份證的識別結果。