文字識別 OCR 4.0
阿新 • • 發佈:2018-11-25
文字識別 OCR 4.0
文字識別 OCR 簡介
文字識別(Optical Character Recognition,OCR ),
基於深度學習技術,將圖片上的文字內容,
智慧識別成為可編輯的文字。支援通用的印刷體識別,也支援運單等手寫體識別,
支援提供定製化服務,可以有效地代替人工錄入資訊。
通用的文字識別
演示地址: http://47.98.237.162/tool/getGeneralOCR
## 手寫的文字識別
演示地址: http://47.98.237.162/tool/getHandwritingOCR
## 技術特色
#### 高精度
基於深度學習演算法和OCR技術,多語種演算法識別準確率均在92%以上。
#### 快速
識別速度GPU平均1個字元約2ms;CPU平均1個字元約6ms。並不斷優化更新模型保持服務的快速穩定。
#### 高魯棒性
支援多場景、任意版面、任意背景,可容忍透視畸變、光照不均等情況,並可實現自動裁邊、修正傾斜等。
#### 完備性
支援中英文、日文、韓文、西班牙文、法文、德文、葡萄牙文、英文、阿拉伯數字及常用符號等的識別。並不斷更新迭代模型,擴充支援的廣度。
## 開發遇到的坑
JSONObject response;
response = faceYoutu.GeneralOcrUrl(url); //通用印刷體文字識別
String alist = response. get("items").toString();
JSONArray array = new JSONArray(alist);
//JSONArray遍歷
for(int i=0; i<array.length(); i++) {
JSONObject jsonObj = array.getJSONObject(i);
result += jsonObj.get("itemstring").toString()+ "\r\n";
}
識別出每行文字,以陣列形式返回,可以通過json格式轉array陣列遍歷出每行文字。手寫識別api同理,
本技術使用了騰訊的優圖api,快速且精準識別。
獲取原始碼,請點選 http://47.98.237.162/detail/1/186