OCR學習及tesseract的一些測試

阿新 • • 發佈：2019-01-05

最近接觸OCR，先收集一些資料，包括成熟軟體、SDK、流行演算法。

1. 一個對現有OCR軟體及SDK的總結，比較全面，包括支援平臺、程式語言、支援字型語言、輸出格式、相關連結等

以此為索引，比較、選擇你想要的OCR SDK。

2. 另外一個OCR SDK 網站連結，商用，號稱high performance，未深入瞭解，連結如下：

3. 一個大學UCI 給出的handwriting數字的 training及testing資料：

其每個數字近550個樣本，出自43個人，30個人的用於training，13個人的用testing。其網站上有詳細介紹。

4. 一個哥們對開源的OCR 庫的總結：

5. 網上有很多OCR的online service，這裡給出一個：

是以tesseract為OCR引擎。

----------------------------------------------------------------------------------------------------

OCR常用演算法：

OCR重要的是識別率，專家說達到90%以上才有意義。

OCR重要的兩點：特徵提取與匹配能力。

特徵提取與影象處理演算法的好壞密切相關。

匹配演算法：

1. 模板匹配

包括多模板匹配、關鍵點模板匹配

2. 人工神經網路訓練

3. 結構化分析、特徵統計

---------------------------------------------------------------------------------------------------

tesseract是google開源的OCR，很流行。

這裡記錄下其應用方法及原理。

單個字元tesseract 測試：

命令列： tesseract input.jpg out -psm 10

輸入影象應該遵守一定的規則，這樣才能提高識別率：

其結果是M，錯的結果。

而對

其結果是H，正確。

兩個圖片的區別就在於寬度不同，一個大小是（29,55），另外一個是（55,55），原以為圖片是需要歸一化，或寬高相等。後檢視tesseract FAQ，提到改善結果的要素：

try to set different segmentation mode (-psm option for command line) if you try to OCR small part of text (line, text)

try to add border (see issue 398)
try to pre-process image (increase DPI, resize, blur/sharpen image) before OCR (see issue 191)
try to remove noise dewarp (so there are straight text lines) image and binarize image

這裡是第三點add border，使結果改善。

經批量測試，確是如此。

其他，設定識別白名單，如只識別數字，或大寫字母，可以大大提高識別率

將tessedit_char_whitelist 0123456789 放在config/digits中，數字可被替換。

測試200多個單個字元（200張圖片），識別率達到90%，字元為黑體印刷體。

目前測試中增加字型寬度，對識別率，無明顯影響。

為進一步提高識別率，對錯誤識別的字元再次進行訓練學習：

OCR學習及tesseract的一些測試

最近接觸OCR，先收集一些資料，包括成熟軟體、SDK、流行演算法。 1. 一個對現有OCR軟體及SDK的總結，比較全面，包括支援平臺、程式語言、支援字型語言、輸出格式、相關連結等以此為索引，比較、選擇你想要的OCR SDK。 2. 另外一個OCR SDK 網站連結，

深度學習及機器學習的一些問題（面試）

1.為什麼正則化可以防止過擬合參考連結深度學習面試100題：深度學習面試100題（第1-5題）：經典常考點CNN 深度學習面試100題（第6-10題）深度學習面試100題（第11-15題）深度學習面試100題（第16-20題）深度學習面試10

以一元及二元函式為例，通過多項式的函式影象觀察其擬合效能；以及對用多項式作目標函式進行機器學習時的一些理解。

先給出程式碼： import numpy as np from mpl_toolkits.mplot3d import Axes3D from matplotlib import pyplot as plt from datetime import datetime t

java學習筆記之webservice（二）--WSDL文件及用myeclipse測試webservice

>>接上篇一、WSDL 定義：web services description language，用來描述web服務的xml格式的資訊。標籤的解釋 1. <types>：定義了服務的namespace和關鍵資訊的型別（方法的引數型別和返回值的

Animator Override Controller學習及效能測試

一、Animator Override Controller簡介：　　動畫覆蓋器是一類asset，它允許你擴張已經存在的動畫控制器，用特定的animations，但是需要保留原始的結構、引數和邏輯；這就允許你建立同一個基礎狀態機的多個變種，這些變種使用不同的animations。　　例如：你有

google Tesseract-ocr配置及訓練

一、配置 1、從http://code.google.com/p/tesseract-ocr/downloads/list下載tesseract-ocr-3.02-vs2008、tesseract-ocr-3.02.eng.tar、tesseract-ocr-3.02.

tesseract-ocr字元識別，安裝/測試/訓練問題/解決方案

2018.5.4更新 training tesseract由於Ubuntu下訓練tesseract 教程不足，還在繼續摸索。現在轉用Windows下的tesseract 3.05版本（tesseract 4.0在我的win10下總是出錯還沒辦法解決）windows tess

深度學習中的一些元件及使用技巧

【說在前面】本人部落格新手一枚，象牙塔的老白，職業場的小白。以下內容僅為個人見解，歡迎批評指正，不喜勿噴！[認真看圖][認真看圖] 【補充說明】深度學習有多火，我就不多說了。本文主要介紹深度學習專案實踐過程中可能遇到的一些元件及使用技巧！一、Optimizor優化器選擇 1. 梯度下降：經典梯度下降的通用

Oracle 左外連接的一些測試

ase set 初始化 nbsp 連接 reat 我們 style else 為了更加深入左外連接，我們做一些測試，外連接的寫法有幾種形式，我們能夠通過10053跟蹤到終於SQL轉換的形式。 --初始化數據 create table A ( id number,

學習《selenium2自動化測試基於python》遇到的問題（一）

pypi tools bsp sel dir python 解決方案打不開什麽問題一：通過cmd，用Python安裝setuptools時,報錯no module named ‘six‘等類似情況時，解決方案：翻譯過來就是缺少SIX的模塊，直接到官網打開，下載

Spring+SpringMVC+MyBatis深入學習及搭建(三)——MyBatis全局配置文件解析

保持 nbsp 延遲加載行為 span 方便 doc ima actor 轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/6874672.html 前面有寫到Spring+SpringMVC+MyBatis深入學習及搭建(二)&

laraver框架學習------工廠模型填充測試數據

自己的 div nbsp thum ocl fine 代碼 style student 在laravel中填充數據有幾種方式。一種是Seeder,另一種是工廠模式進行的填充。工廠模式可以實現大批量的填充數據，數據的量可以自定義。這也為後續的軟件測試提供方便。在larav

Spring+SpringMVC+MyBatis深入學習及搭建(四)——MyBatis輸入映射與輸出映射

指定 2.6 face 生成 shm hashmap ace and 包裝轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/6878529.html 前面有講到Spring+SpringMVC+MyBatis深入學習及搭建(三)&

最大概率法分詞及性能測試

初始化 and ifs push 復位 enc prev 特殊字符 mat 最大概率分詞是一種最主要的統計方法分詞。一個待切割的字符串有多種分詞結果，最大概率分詞的原則是將當中概率最大的那個作為該字符串的分詞結果。第一部分理論基礎

STM32學習及應用筆記二：一次運算符優先級造成的錯誤

位與指向 cells 偏移 getchar() 取地址大於沒有事情本人在最近一個項目的開發中，出現一個應為疏忽運算符優先級造成的問題，檢查了很久才發現問題，所以覺得運算符的優先級問題還是有必要再研究一下。具體的問題是這樣的，我采集了傳感器的原始數據，然後會

Spring+SpringMVC+MyBatis深入學習及搭建(八)——MyBatis查詢緩存

idt rtu void spring 寫到查詢緩存修改針對 target 轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/6956206.html 前面講到：Spring+SpringMVC+MyBatis深入學習及搭建(

Spring+SpringMVC+MyBatis深入學習及搭建(十)——MyBatis逆向工程

cat springmvc blank 不為 tex llc root from ssi 轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/6973266.html 前面講到：Spring+SpringMVC+MyBatis深入學習及

Spring+SpringMVC+MyBatis深入學習及搭建(十一)——SpringMVC架構

框架 ppi spring框架 edit 不同的 com get request html 轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/6985816.html 前面講到：Spring+SpringMVC+MyBatis深入學習

Spring+SpringMVC+MyBatis深入學習及搭建(十四)——SpringMVC和MyBatis整合

文件拷貝 conf lips glib ide doc from ive body 轉載請註明出處：http://www.cnblogs.com/Joanna-Yan/p/7010363.html 前面講到：Spring+SpringMVC+MyBatis深入學習及搭建(

7.2bash 腳本選項及組合條件測試

bash 腳本選項及組合條件測試7.2十六、使用vim編輯多個文件vim FILE1 FILE2 FILE3:next 切換至下一個文件：prev切換至前一個文件：last切換至最後一個文件：first切換至第一個文件退出:qa 全部退出十七、分屏顯示一個文件Ctrl+w,s:水平拆分窗口Ctrl+w,上下箭

OCR學習及tesseract的一些測試

相關推薦