tesseract-ocr 3.02 信心值字元座標學習筆記

阿新 • • 發佈：2019-02-09

在使用字元識別的過程中,需要辨別一些字元本身是否殘缺或與標準字元是否有形變又或者想知道其在截圖上面的座標是什麼,這樣就需要用到tesseract-ocr 輸出的HTML檔案的功能了.

命令列為

tesseract -l eng outtext hocr

其中hocr 引數是本身自帶的一個配置檔案,裡面包含內容 tessedit_create_hocr 1,表示輸出Htmlde 意思

這時候當前工作目錄中就會出現 outtext.html檔案了.

但用3.02版本的同學可能會看到,html裡面只有bbox的座標資料,沒有信心值啊.原來3.02

版已經把該內容刪減掉了.見下面有加號的程式碼,把它們加進去,重新編譯一下就可以了.

	Modify	/trunk/api/baseapi.cpp	diff
...			
1103	1103		
1104	1104		    // Now, process the word...
1105	1105		    hocr_str.add_str_int("<span class='ocrx_word' id='word_", wcnt);
1106		-	    AddBoxTohOCR(res_it, RIL_WORD, &hocr_str);
1106	+		int left, top, right, bottom;
1107	+	    res_it->BoundingBox(RIL_WORD, &left, &top, &right, &bottom);
1108	+	    hocr_str.add_str_int("' title=\"bbox ", left);
1109	+	    hocr_str.add_str_int(" ", top);
1110	+	    hocr_str.add_str_int(" ", right);
1111	+	    hocr_str.add_str_int(" ", bottom);
1112	+	    hocr_str.add_str_int("; x_wconf ", res_it->Confidence(RIL_WORD));
1113	+	    hocr_str += "\">";
1107	1114		    const char *font_name;
1108	1115		    bool bold, italic, underlined, monospace, serif, smallcaps;
1109	1116		    int pointsize, font_id;

這時問題又遇到了,在編譯時出現很多錯誤,說某個字元缺少了啊之類,實際上這大多跟內碼有關,VS2010以上的把有問題的轉成unicode就搞定了,換行符的也一樣.

有的人可能做到這步,但編譯出來的程式又執行不了. 不要急,這主要跟兩個地方有關:

1、libtesseract302d.dll 沒有成功編譯,或沒有擺在剛剛編譯出來的tesseract程式同一目錄.

2、 liblept168d.dll不是用VS2010編譯的，這個上網下一個編譯好的就行了。

最後，程式終於正常運行了。看看輸出檔案 outtext.html，裡面想要的那句話已經變成了這樣

<span class='ocrx_word' id='word_1' title="bbox 64 21 110 45 ;x_wconf 92">200</span>

其中x_wconf 92 就是信心值了，bbox 後面的就是其相對截圖左上角的座標了

至此，通過一些文書處理的演算法，就能把他們提出來比較了。

tesseract-ocr 3.02 信心值字元座標學習筆記

在使用字元識別的過程中,需要辨別一些字元本身是否殘缺或與標準字元是否有形變又或者想知道其在截圖上面的座標是什麼,這樣就需要用到tesseract-ocr 輸出的HTML檔案的功能了. 命令列為 tesseract -l eng outtext hocr 其中hocr 引數是

Tesseract-OCR 3.02命令列程式的使用

　　OCR(Optical Character Recognition):光學字元識別,是指對圖片檔案中的文字進行分析識別，獲取的過程。最近因為需要看了看OCR的相關知識，這裡我看的是谷歌的Tesseract-OCR檢測引擎。Tesseract：開源的OCR識別

Tesseract-OCR 3 04在Windows7 vs2013上編譯過程

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Tesseract-OCR 3.04在Windows7 vs2013上編譯過程

static const STRING kCharsToEx[] = {"'", "`", "\"", "\\", ",", ".", "〈", "〉", "《", "》", "」", "「", ""}; 修改為 static const

Tesseract-OCR 3.04簡單使用舉例(讀入影象輸出識別結果)

下面code是對Tesseract-OCR 3.04版本進行簡單使用的舉例：包括兩段，一個是讀入帶有中文字元的影象，一個是讀入僅有英文字元的影象：#include "funset.hpp" #include <iostream> #include

Tesseract-OCR 3.0+ 安裝和使用

終端輸入命令:tesseract --help Usage: tesseract --help | --help-psm | --version tesseract --list-langs [--tessdata-dir PATH] tesseract --print-parameters [

PyTorch框架+Python 3面向對象編程學習筆記

clu 外部接口需要 util self. mat its 函數表一、CNN情感分類中的面向對象部分 sparse.py 1 super(Embedding, self).__init__() 表示需要父類初始化，即要運行父類的_init_()，如果沒有這個，則

【Django】（3）創建網頁：學習筆記主頁

nbsp 圖片 png 剛才需要 ews namespace render esp 創建Django的過程通常為三個階段：定義URL，編寫視圖和編寫模板。映射URL 當在瀏覽器中輸入URL時，現在默認會返回默認的Django網站，現在需要將主頁映射到項目&ldquo

第3章 Pandas資料處理(3.1-3.2)_Python資料科學手冊學習筆記

第2章介紹的NumPy和它的ndarray物件. 為多維陣列提供了高效的儲存和處理方法. Pandas是在NumPy的基礎上建立的新程式庫, 提供DataFrame資料結構. DataFrame帶行標籤(索引),列標籤(變數名),支援相同資料型別和缺失值的多維陣

第3章 Pandas資料處理(3.4-3.5)_Python資料科學手冊學習筆記

3.4 Pandas 數值運算方法對於一元運算(像函式與三角函式),這些通用函式將在輸出結果中保留索引和列標籤; 而對於二元運算(如加法和乘法), Pandas在傳遞通用函式時會自動對齊索引進行計算. 這就意味著,儲存資料內容和組合不同來源的資料—兩處在Num

第3章 Pandas資料處理(3.9-3.10)_Python資料科學手冊學習筆記

3.9 累計與分組 3.9.1 行星資料 import seaborn as sns planets = sns.load_dataset('planets') planets.shape (1035, 6) planets.head()

第3章 Pandas資料處理(3.7-3.8)_Python資料科學手冊學習筆記

3.7 合併資料集: Concat與Append操作 - pd.concat - pd.merge - pd.join import pandas as pd def make_df(cols,ind): data = {c: [str(c) + st

3.1 ESP8266- FreeRTOS SDK 入門學習筆記

============================================================================ 感謝開源原始碼和視訊貢獻者:

組件基礎（非父子組件傳值）—Vue學習筆記

cli back change 作用域 src 就是示例一行代碼 pla 最近幾天忙著寫Api去了，抽空把後面的內容下出來，然後再分享給大家web可以使用的api。上次說了父子組件直接的傳值，這次看一下非父子組件之間的傳值（總線機制）要實現非父子組件之間的傳值非常重

Tesseract-OCR 字元識別---樣本訓練

Tesseract是一個開源的OCR（Optical Character Recognition，光學字元識別）引擎，可以識別多種格式的影象檔案並將其轉換成文字，目前已支援60多種語言（包括中文）。 Tesseract最初由HP公司開發，後來由Goo

Tesseract-OCR 字元識別---樣本訓練圖片識別訓練

Tesseract是一個開源的OCR（Optical Character Recognition，光學字元識別）引擎，可以識別多種格式的影象檔案並將其轉換成文字，目前已支援60多種語言（包括中文）。 Tesseract最初由HP公司開發，後來由Google維護，目前釋出在Googel Pr

tesseract-ocr字元識別，安裝/測試/訓練問題/解決方案

2018.5.4更新 training tesseract由於Ubuntu下訓練tesseract 教程不足，還在繼續摸索。現在轉用Windows下的tesseract 3.05版本（tesseract 4.0在我的win10下總是出錯還沒辦法解決）windows tess

java利用tesseract-OCR對影象進行字元識別

try { Process pro = Runtime.getRuntime() .exec(new String[]{"D:/Program Files (x86)/Tesseract-OCR/tesseract.exe",

Tesseract 3.02中文字型檔訓練----整理

下載chi_sim.traindata字型檔下載tesseract-ocr-setup-3.02.02.exe 安裝到e:\Tesseract-ocr目錄下 1.Tes

《編程導論（Java）·3.3.2 按值傳遞語義》

文字指定來源 center public 語言斷點 enter art 不要受《Java編程思想》的影響，計算機科學中的術語——按引用傳遞(pass-by-reference)。不要搞成自說自話的個人用語。這些術語也不是專門針對Java的，你不應該從某一本Java

tesseract-ocr 3.02 信心值 字元座標 學習筆記

相關推薦

tesseract-ocr 3.02 信心值字元座標學習筆記