Halcon中OCR的實現及關鍵函式解析

阿新 • • 發佈：2019-02-17

　　OCR的實現共分為兩步，1是使用字元資料來訓練OCR。2是使用OCR進行字元的識別。

訓練分類器

　　訓練分類器共分為4步：1是使用閾值來分割字元區域；2是呼叫append_ocr_trainf函式將字元加入訓練集；3是建立分類器；4是呼叫trainf_ocr_class_mlp函式來訓練分類器。

*對字元進行訓練得到分類器
TrainingNames := ['F','M','1','4','A','4','2']
FontName := 'F:/YM_Project/SZWX/work_x32_MFOL2/function/MFOL2'
TrainingFileName := FontName+'.trf' 

*當dev_set_check的引數為'~give_error'時，這次檢測會被忽略，程式進入後面的操作。
dev_set_check ('~give_error')
*刪除指定位置的檔案
delete_file (TrainingFileName)
for i := 0 to |TrainingNames|-1 by 1
    select_obj (FinalNumbers, CharaterRegions, i+1)
    *將字元CharaterRegions新增到訓練集TrainingFileName中
    append_ocr_trainf (CharaterRegions, FourthDarkImage, TrainingNames[i], TrainingFileName)
    disp_message (WindowID, TrainingNames[i], 'image' 
, MeanRow-40, Column[i]-6, 'yellow', 'false')
endfor
*tuple_uniq( : : Tuple : Uniq)
*相鄰重疊的元組只保留一個。常用於tuple_sort( : : Tuple : Sorted)之後，tuple_sort是升序排列。
CharNames := uniq(sort(TrainingNames))
*創建mlp
create_ocr_class_mlp (8, 10, 'constant', 'default', CharNames, 5, 'none', 10, 42, OCRHandle)
*使用訓練集來訓練mlp
trainf_ocr_class_mlp (OCRHandle, TrainingFileName, 200 
, 1, 0.01, Error, ErrorLog)
write_ocr_class_mlp (OCRHandle, FontName)
clear_ocr_class_mlp (OCRHandle)

使用分類器進行識別

　　使用分類器進行字元識別的函式有兩個：1是do_ocr_multi_class_mlp，該函式對一幅影象內的多個字元進行一次分類並輸出分類結果。2是do_ocr_single_class_mlp，該函式是對一幅影象中的單個字元進行分類。兩者的對比試驗表明，後者的分類準確度要高，因此，下文使用do_ocr_single_class_mlp運算元進行字元的分類。
　　分類的實現分為４步：1是讀取分類器；2是讀取圖片；3是分割單個字元；４分類

*Step1根據分類器來分類
read_ocr_class_mlp (FontName, OCRHandle)
*Step2讀取圖片獲得每一個影象
read_image (Image, 'F:/YM_Project/SZWX/1024SZWX/SVS900_XFMT1X110_CR6030_S1_4.bmp')
*Step３分割單個字元
gen_rectangle1 (Rectangle1, 43, 2243, 707, 3675)
reduce_domain (Image, Rectangle1, ImageReduced1)
crop_domain (ImageReduced1, ImagePart)
median_image (ImagePart, ImageReduced1, 'circle', 3, 'mirrored')
threshold (ImageReduced1, Regions, 84, 255)
opening_circle (Regions, RegionOpening, 3.5)
connection (RegionOpening, ConnectedRegions)
select_shape (ConnectedRegions, Numbers, 'area', 'and', 1000, 9999)
count_obj (Numbers, CharacterNums)
ArrayConfidence := []
for IndexCharacter := 1 to CharacterNums by 1
    select_obj (Numbers, CharacterSelected, IndexCharacter)  
    *Step４分類
    do_ocr_single_class_mlp(CharacterSelected, ImagePart, OCRHandle,1, Class, Confidence)
    ArrayConfidence := [ArrayConfidence,Confidence]
endfor

關鍵函式解析

create_ocr_class_mlp( : : WidthCharacter, HeightCharacter, Interpolation, Features, Characters, NumHidden, Preprocessing, NumComponents, RandSeed : OCRHandle)

WidthCharacter：輸入被分割的字元縮放到指定的寬度
HeightCharacter：
Interpolation：設定縮放的字元的縮放模式，對於多數應用而言，Interpolation = 'constant'。請注意：轉換後的字元大小不能太大，因為分類器對較大尺寸的字元分類效果並不好。特別是，如果尺寸較大，一些小的分割誤差會較大程度上影響分類的效果，一般情況下，sizes between 6x8 and 10x14
Features：分類的特徵向量的長度
Characters：輸出層神經元的個數；也就是是需要匹配的字元查閱表中字元的個數。
NumHidden：MLP中隱藏層神經元的個數
Preprocessing：向量特徵裝換的預處理型別
NumComponents：匹配字元的數量
這兩個引數主要是對輸入的值進行預處理。

RandSeed：初始化mlp
OCRHandle：輸出OCR_mlp分類器控制代碼

trainf_ocr_class_mlp( : : OCRHandle, TrainingFile, MaxIterations, WeightTolerance, ErrorTolerance : Error, ErrorLog)
訓練一個神經網路分類器

do_ocr_multi_class_mlp(Character, Image : : OCRHandle : Class, Confidence)
使用OCR分類多個字元
Character是字元區域
Image是字元圖片
OCRHandle是分類器控制代碼
Class是輸出的類別
Confidence是輸出的分類精度


do_ocr_single_class_mlp(CharacterSelected, ImagePart, OCRHandle,1, Class, Confidence)
分類單個字元，其分類效果比上述同時分類多個字元的效果要好

Halcon中OCR的實現及關鍵函式解析

　　OCR的實現共分為兩步，1是使用字元資料來訓練OCR。2是使用OCR進行字元的識別。訓練分類器　　訓練分類器共分為4步：1是使用閾值來分割字元區域；2是呼叫append_ocr_trainf

vue中各選項及鉤子函式執行順序

在vue中，例項選項和鉤子函式和{{}}表示式都是不需要手動呼叫就可以直接執行的。 vue的生命週期如下圖：在頁面首次載入執行順序有如下： beforeCreate //在例

C中程式設計實現，strcat函式，最完善程式碼，如果不是，請大神留言

#define _CRT_SECURE_NO_WARNINGS 1 #include <stdio.h> #include <assert.h> #include <string.h> char *My_strcat(c

Gabor濾波簡介與Opencv中的實現及引數變化實驗

Gabor濾波是一種非常常見的特徵提取演算法，在人臉識別等領域有著很廣泛的應用，在這裡我主要介紹一下Gabor濾波器的公式及Opencv下的程式碼實現，以及我做的一些引數變化的實驗。一、Gabor濾波簡介注意，這裡我介紹的Gabor演算法與在人臉識別

網際網路DSP廣告系統架構及關鍵技術解析 | 廣告行業資深架構師親述

http://www.360doc.com/content/15/0806/07/2909773_489803369.shtml 此文是根據付海軍在【QCON高可用架構群】中的分享內容整理而成，轉發請註明出處。付海軍，現就職於時趣互動，任技術總監，負責移動原生廣告平臺引擎開發和資料探勘工作，06年畢業

C++多型的實現及原理詳細解析

C++的多型性用一句話概括就是：在基類的函式前加上virtual關鍵字，在派生類中重寫該函式，執行時將會根據物件的實際型別來呼叫相應的函式。如果物件型別是派生類，就呼叫派生類的函式；如果物件型別是基類，就呼叫基類的函式，此為多型的表現；在看看以下幾點： 1. 用vir

在shell中程式設計實現獲取c函式輸出

最近碰到這樣一個問題，通過c語言寫了一個程式，然後再shell指令碼中獲取這個c語言的輸出，執行其他的處理，該如何做？比如，c語言程式輸出hello world,通過shell指令碼獲取到這個輸出，然後輸出:the first is hello, the second i

DSP廣告系統架構及關鍵技術解析(轉)

都是用戶id 定義 log 運營商歷史 9.png 整合客戶廣告和網絡遊戲是互聯網企業主要的盈利模式廣告是廣告主通過媒體以盡可能低成本的方式與用戶達成接觸的商業行為。也就是說按照某種市場意圖接觸相應人群，影響其中潛在用戶，使其選

vue系列---響應式原理實現及Observer原始碼解析(一)

閱讀目錄一. 什麼是響應式？二：如何偵測資料的變化？ 2.1 Object.defineProperty() 偵測物件屬性值變化 2.2 如何偵測陣列的索引值的變化 2.3 如何監聽陣列內容的增加或減少？ 2.4 使用Proxy來實現資料監聽三. Observer原始碼解析

Redis（二）：redis命令構建及關鍵屬性解析

　　上一篇文章，我們從框架層面，主要介紹了redis的啟動過程，以及主要的命令處理流程邏輯。這些更多的都是些差不多的道理，而要細瞭解redis，則需要更細節的東西。　　今天我們稍微內圍的角度，來看看幾個命令執行的重要方法，深入理解下redis的魅力所在。首先，我們通過上一章知道，processComman

Redis（二）：命令集構建及關鍵屬性解析

CVPR論文《100+ Times FasterWeighted Median Filter (WMF)》的實現和解析（附原始碼）。任意半徑中值濾波（擴充套件至百分比濾波器）O(1)時間複雜度演算法的原理、實現及效果任意半徑中值濾波（擴充套件至百分比濾波器）O(1)時間複雜度演算法的原理、實現及

　　四年前第一次看到《100+ Times FasterWeighted Median Filter (WMF)》一文時，因為他附帶了原始碼，而且還是CVPR論文，因此，當時也對程式碼進行了一定的整理和解讀，但是當時覺得這個演算法雖然對原始速度有不少的提高，但是還是比較慢。因此，沒有怎麼在意，這幾天有幾位朋友

Halcon中OCR的實現及關鍵函式解析

訓練分類器

使用分類器進行識別

關鍵函式解析

Halcon中OCR的實現及關鍵函式解析

vue中各選項及鉤子函式執行順序

C中程式設計實現，strcat函式，最完善程式碼，如果不是，請大神留言

Gabor濾波簡介與Opencv中的實現及引數變化實驗

網際網路DSP廣告系統架構及關鍵技術解析 | 廣告行業資深架構師親述

C++多型的實現及原理詳細解析

在shell中程式設計實現獲取c函式輸出

DSP廣告系統架構及關鍵技術解析(轉)

vue系列---響應式原理實現及Observer原始碼解析(一)

Redis（二）：redis命令構建及關鍵屬性解析

Redis（二）：命令集構建及關鍵屬性解析

Halcon中二維碼解析函式解位元速率和時長的優化方法

【php】jquery中$.get實現解析json格式資料及jsonp跨域

Hi3559AV100 NNIE開發（6）RFCN中NNIE實現關鍵執行緒函式->SAMPLE_SVP_NNIE_Rfcn_ViToVo()進行資料流分析

【Java學習筆記之二十二】解析接口在Java繼承中的用法及實例分析

Halcon中的坐標系特點及XLD的鏡像轉換

Halcon中二維碼解析函數解碼率和時長的優化方法

MVVM模式解析和在WPF中的實現（一）

InnoDB MVCC實現原理及源碼解析

Halcon中OCR的實現及關鍵函式解析

訓練分類器

使用分類器進行識別

關鍵函式解析

相關推薦