1. 程式人生 > >創藍253-創藍萬數平臺影象識別OCR技術

創藍253-創藍萬數平臺影象識別OCR技術

影象識別OCR,廣泛用於識別各種證件、卡類、甚至發票和單據,快速把圖片資訊轉換成文字資訊;主要用於解決快速卡證類的資訊輸入,以及卡證的介面呼叫查詢;

目前支援API的方式呼叫,圖片支援Base64編碼以及圖片Url兩種方式,目前支援的格式有:jpg、png、bmp三種格式,建議檔案大小在2M以內。

一.技術實現流程:

二. 影象矯正技術:

之前對於OCR文字識別的影象要求非常高,不僅需要解析度高,而且還需要比較正,歪斜或者對焦不準照成的模糊和光影都會對識別的準確率造成非常大的影響。創藍萬數平臺通過對拍攝圖片的智慧檢測自動拉伸、矯正、增強對比,只為提高OCR的識別率。案例如下:

【原圖】

【矯正】

【增強對比識別】

三.基於AI深度學習的版面分析技術

創藍萬數平臺通過數百萬的照片識別學習,智慧糾錯識別在各種干擾環境中的準確識別,大大提高OCR識別的準確率。

四. 基於各種證件的特定漢字形態優化演算法:

各種證件五花八門,字型大小形態也是各異,我們針對每一類證件進行特定優化識別,精確化的文字的字型、版面佈局、文字比例大小等,進一步提高OCR識別的精度與準度。

五.全形度識別無壓力

正著拍,倒著拍,翻著拍,想怎麼拍就怎麼拍,我們都能準確無誤的識別。

輸出示例: