1. 程式人生 > >tesseract使用的一些方法-ocr

tesseract使用的一些方法-ocr

tesseract_api.Init("./", "chi_sim", tesseract::OEM_DEFAULT); //當前目錄下存放訓練好的chi_sim檔案

如果左右結構的漢字被識別為兩個漢字,這通過設定下面的引數來控制

tesseract_api.SetVariable("enable_new_segsearch", "0");



tesseract_api.SetPageSegMode(tesseract::PSM_SINGLE_BLOCK); //7 = Treat the image as a single text line.   PSM_SINGLE_LINE 

識別的黑名單
tesseract_api.SetVariable("tessedit_char_blacklist", "0123456789{");