乾貨-ocr識別流程深度解析
我們都知道ocr識別就是把圖片中的文字資訊採集出來。看似很簡單,但是流程是很複雜的。下面小編帶著大家來深入瞭解一下。
影象輸入、預處理:
影象輸入:對於不同的影象格式,有著不同的儲存格式,不同的壓縮方式,目前有OpenCV,CxImage等開源專案 。預處理:主要包括二值化,噪聲去除,傾斜較正等
二值化:
對攝像頭拍攝的圖片,大多數是彩色影象,彩色影象所含資訊量巨大,對於圖片的內容,我們可以簡單的分為前景與背景,為了讓計算機更快的,更好的識別文字,我們需要先對彩色圖進行處理,使圖片只前景資訊與背景資訊,可以簡單的定義前景資訊為黑色,背景資訊為白色,這就是二值化圖了。
噪聲去除:
對於不同的文件,我們對噪聲的定義可以不同,根據噪聲的特徵進行去噪,就叫做噪聲去除
傾斜較正:
由於一般使用者,在拍照文件時,都比較隨意,因此拍照出來的圖片不可避免的產生傾斜,這就需要文字識別軟體進行較正。
版面分析:
將文件圖片分段落,分行的過程就叫做版面分析,由於實際文件的多樣性,複雜性,因此,目前還沒有一個固定的,最優的切割模型。
字元切割:
由於拍照條件的限制,經常造成字元粘連,斷筆,因此極大限制了識別系統的效能,這就需要文字識別軟體有字元切割功能。
字元識別:
這一研究,已經是很早的事情了,比較早有模板匹配,後來以特徵提取為主,由於文字的位移,筆畫的粗細,斷筆,粘連,旋轉等因素的影響,極大影響特徵的提取的難度。
版面恢復:
人們希望識別後的文字,仍然像原文件圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文件,pdf文件等,這一過程就叫做版面恢復。
後處理、校對:
根據特定的語言上下文的關係,對識別結果進行較正,就是後處理。
移動端車牌識別產品特點
-
移動端車牌識別APP整牌識別率高達99.7%,尤其漢字識別遙遙領先同類產品;
-
移動端車牌識別APP識別速度快,極致優化的車牌定位和識別演算法;
-
移動端車牌識別APP支援牌照全,包括藍牌、黃牌、掛車號牌、新軍牌、警牌、新武警車牌、教練車牌、大使館車牌、 農用車牌、個性化車牌、港澳出入境車牌、澳臺車牌、民航車牌、領館車牌、新能源車牌等;
4.移動端車牌識別APP車牌寬度要求低,車牌寬度≥60個畫素,都不影響識別;
- 移動端車牌識別APP完美支援安卓系統,ios系統,支援手機ARM平臺和PDA的X86架構;
6.移動端車牌識別APP支援視訊識別和拍照識別兩種識別模式
移動端車牌識別拍攝規範
規範的拍攝有助於提高識別率
-
保持水平,儘量使車牌在畫面中保持水平;
-
合理光照,拍攝時注意光照的影響,儘量避免反光和黑影;
-
避免傾斜,不要使拍攝角度傾斜過大,以免造成車牌嚴重變型;
-
聚焦清晰,避免影象模糊不清楚。
移動端車牌識別APP配置要求
•作業系統:支援Android 4.0,ios7.0
•硬體配置:推薦ARM Cortex-A7以上,1G RAM
•攝像頭:支援自動對焦,200萬畫素以上
作者:平大安,歡迎百度搜索“ocr識別平大安”/“移動端車牌識別平大安”聯絡調取介面測試