1. 程式人生 > >文字識別 OCR 4.0

文字識別 OCR 4.0

文字識別 OCR 4.0

文字識別 OCR 簡介

文字識別(Optical Character Recognition,OCR ),
基於深度學習技術,將圖片上的文字內容,
智慧識別成為可編輯的文字。支援通用的印刷體識別,也支援運單等手寫體識別,
支援提供定製化服務,可以有效地代替人工錄入資訊。

通用的文字識別

演示地址: http://47.98.237.162/tool/getGeneralOCR

## 手寫的文字識別
演示地址: http://47.98.237.162/tool/getHandwritingOCR

## 技術特色

#### 高精度
基於深度學習演算法和OCR技術,多語種演算法識別準確率均在92%以上。

#### 快速
識別速度GPU平均1個字元約2ms;CPU平均1個字元約6ms。並不斷優化更新模型保持服務的快速穩定。

#### 高魯棒性
支援多場景、任意版面、任意背景,可容忍透視畸變、光照不均等情況,並可實現自動裁邊、修正傾斜等。

#### 完備性
支援中英文、日文、韓文、西班牙文、法文、德文、葡萄牙文、英文、阿拉伯數字及常用符號等的識別。並不斷更新迭代模型,擴充支援的廣度。

## 開發遇到的坑

JSONObject response;
response = faceYoutu.GeneralOcrUrl(url); //通用印刷體文字識別
String alist = response.
get("items").toString(); JSONArray array = new JSONArray(alist); //JSONArray遍歷 for(int i=0; i<array.length(); i++) { JSONObject jsonObj = array.getJSONObject(i); result += jsonObj.get("itemstring").toString()+ "\r\n"; }

識別出每行文字,以陣列形式返回,可以通過json格式轉array陣列遍歷出每行文字。手寫識別api同理,
本技術使用了騰訊的優圖api,快速且精準識別。

https://ws1.sinaimg.cn/large

獲取原始碼,請點選 http://47.98.237.162/detail/1/186