1. 程式人生 > >乾貨-ocr識別流程深度解析

乾貨-ocr識別流程深度解析

我們都知道ocr識別就是把圖片中的文字資訊採集出來。看似很簡單,但是流程是很複雜的。下面小編帶著大家來深入瞭解一下。

影象輸入、預處理:

影象輸入:對於不同的影象格式,有著不同的儲存格式,不同的壓縮方式,目前有OpenCV,CxImage等開源專案 。預處理:主要包括二值化,噪聲去除,傾斜較正等

二值化:

對攝像頭拍攝的圖片,大多數是彩色影象,彩色影象所含資訊量巨大,對於圖片的內容,我們可以簡單的分為前景與背景,為了讓計算機更快的,更好的識別文字,我們需要先對彩色圖進行處理,使圖片只前景資訊與背景資訊,可以簡單的定義前景資訊為黑色,背景資訊為白色,這就是二值化圖了。

噪聲去除:

對於不同的文件,我們對噪聲的定義可以不同,根據噪聲的特徵進行去噪,就叫做噪聲去除

傾斜較正:

由於一般使用者,在拍照文件時,都比較隨意,因此拍照出來的圖片不可避免的產生傾斜,這就需要文字識別軟體進行較正。

版面分析:

將文件圖片分段落,分行的過程就叫做版面分析,由於實際文件的多樣性,複雜性,因此,目前還沒有一個固定的,最優的切割模型。

字元切割:

由於拍照條件的限制,經常造成字元粘連,斷筆,因此極大限制了識別系統的效能,這就需要文字識別軟體有字元切割功能。

字元識別:

這一研究,已經是很早的事情了,比較早有模板匹配,後來以特徵提取為主,由於文字的位移,筆畫的粗細,斷筆,粘連,旋轉等因素的影響,極大影響特徵的提取的難度。

版面恢復:

人們希望識別後的文字,仍然像原文件圖片那樣排列著,段落不變,位置不變,順序不變,的輸出到word文件,pdf文件等,這一過程就叫做版面恢復。

後處理、校對:

根據特定的語言上下文的關係,對識別結果進行較正,就是後處理。

移動端車牌識別產品特點

  1. 移動端車牌識別APP整牌識別率高達99.7%,尤其漢字識別遙遙領先同類產品;

  2. 移動端車牌識別APP識別速度快,極致優化的車牌定位和識別演算法;

  3. 移動端車牌識別APP支援牌照全,包括藍牌、黃牌、掛車號牌、新軍牌、警牌、新武警車牌、教練車牌、大使館車牌、 農用車牌、個性化車牌、港澳出入境車牌、澳臺車牌、民航車牌、領館車牌、新能源車牌等;

4.移動端車牌識別APP車牌寬度要求低,車牌寬度≥60個畫素,都不影響識別;

  1. 移動端車牌識別APP完美支援安卓系統,ios系統,支援手機ARM平臺和PDA的X86架構;

6.移動端車牌識別APP支援視訊識別和拍照識別兩種識別模式

移動端車牌識別拍攝規範

規範的拍攝有助於提高識別率

  1. 保持水平,儘量使車牌在畫面中保持水平;

  2. 合理光照,拍攝時注意光照的影響,儘量避免反光和黑影;

  3. 避免傾斜,不要使拍攝角度傾斜過大,以免造成車牌嚴重變型;

  4. 聚焦清晰,避免影象模糊不清楚。

移動端車牌識別APP配置要求

•作業系統:支援Android 4.0,ios7.0

•硬體配置:推薦ARM Cortex-A7以上,1G RAM

•攝像頭:支援自動對焦,200萬畫素以上

作者:平大安,歡迎百度搜索“ocr識別平大安”/“移動端車牌識別平大安”聯絡調取介面測試