1. 程式人生 > >OCR 基本知識

OCR 基本知識

圖形 誤判 過程 輸出結果 針對 popu -a 什麽 cte

OCR,optical character recognition 的簡稱,也就是光學識別系統,屬於圖形識別的一個分支,OCR是針對印刷體字符,採用光學的方式將文檔資料轉換成原始資料黑白點陣的圖像文件,通過識別軟件將圖像中的文字識別成中文和英文內碼,然後轉換成文本格式。這樣計算機就能夠通過OCR識別系統。能夠清楚自己看到了什麽,讀到了什麽,尤其是文字資料。

(1)處理過程:
影像輸入->影像前處理->文字特征的提取->對照識別->最後通過人工矯正將誤判的文字更正,最後將結果輸出。

(2)詳細流程

1、影像輸入:目標文件經過光學儀器後生成位圖存儲在計算機。

2、影像預處理:包含二值化、腐蝕與膨脹、中值濾波等。

圖像二值化:圖像顯示的時候僅僅能看到兩種顏色(常常是黑白兩色)。

3、文字特征的提取:依據字符本身特點,在不同區域採集數據。

4、對照數據庫:通過畫板制作對應的字母和數字模板作為對照的標準。

5、對照識別:依據不用區域的特征比較,找出最相近的字符。

6、輸出結果:將最相近的字符作為識別的結果輸出。即識別碼輸出。

OCR 基本知識