在Android中呼叫百度的OCR介面

阿新 • • 發佈：2018-12-05

前言

最近實驗室開了個新專案，是一個通過掃描單詞後把掃描過的單詞生成遊戲來讓小朋友記單詞的APP，掃描單詞這個功能需要用到OCR.
現在常用的OCR有

Tesseract 這個用的人比較多，而且開源，目前google正在維護，但是我嘗試了一下，發現識別準確率不是特別理想。
微軟的Azure上的認知服務識別率很高，但是收費，現在有1元體驗的套餐，而且不需要驗證信用卡，感興趣的同學可以試試。
百度的文字識別之所以用這個是因為免費，不過有每天的限制次數，對於學生專案來說夠用，還要什麼自行車。

下面進入正文

如何在Android 中呼叫百度的OCR進行文字識別

1.獲取百度文字識別產品服務的 Ak/Sk

1.在百度AI開放平臺中進入控制檯

2.找到文字識別產品服務

3,建立應用

4,填寫資訊，注意這裡的包名一定要和專案的包名一致

5.獲得AK/SK

6.下載license檔案，在專案中如果直接用AK/SK明文呼叫百度的OCR，很不安全，可能會被別人反編譯之後獲得你的AK.SK
license檔案集成了AK/SK 放在專案中可以防止別人破解。

7.下載之後將獲得的api.license檔案放入main目錄下的assets目錄中

2.新增百度OCR的SDK到專案中

1.下載百度OCR的android Sdk

2.下載的SDK壓縮包將其解壓，並將libs下的ocr-sdk的jar包放入專案的libs目錄下

3.在main目錄下新建jniLibs目錄，並將libs資料夾中的其他檔案放入其中

4.在app下的build,gradle中新增

將新增在libs下的sdk JAR包編譯

5.這裡下載的壓縮包中包括了百度提供的相機掃描時的UI，在拍完照有裁剪框，比較方便，這裡我們可以作為module引入專案中

3.呼叫百度OCR

做完準備工作我們就可以開始呼叫百度的OCR介面了。

首先在我們需要進行識別的頁面所在的檔案中建立根據License檔案初始化OCR例項的函式，並在onCreate()方法中呼叫

/**
     * 自定義license的檔案路徑和檔名稱，以license檔案方式初始化
     */
    private void initAccessTokenLicenseFile() {
        OCR.getInstance(mActivity.getApplicationContext()).initAccessToken(new OnResultListener<AccessToken>() {
            @Override
            public void onResult(AccessToken accessToken) {
                String token = accessToken.getAccessToken();
                Log.d(TAG,token);
                hasGotToken = true;
            }

            @Override
            public void onError(OCRError error) {
                error.printStackTrace();
                alertText("自定義檔案路徑licence方式獲取token失敗", error.getMessage());
            }
        }, "aip.license", mActivity.getApplicationContext());
    }

定義我們的開啟相機事件

/**
     * 開啟相機，進入的相機頁面是借用百度OCR 官方DEMO中的相機頁面
     * 能夠在相機中裁剪圖片，和進入相簿
     * @author cyd
     */
    private void openCameraForResult() {
        if (!checkTokenStatus()) {
            return;
        }
        Intent intent = new Intent(mActivity, CameraActivity.class);
        intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH,
                FileUtil.getSaveFile(getActivity()).getAbsolutePath());
        intent.putExtra(CameraActivity.KEY_CONTENT_TYPE,
                CameraActivity.CONTENT_TYPE_GENERAL);
        startActivityForResult(intent, REQUEST_CODE_GENERAL_BASIC);
    }

這裡的CameraActivity用的是引入OCR_UI中的相機活動，自帶剪裁框

接下來需要我們新建一個可以存放OCR的識別方法的類RecognizeService

**
 * 這個類是用於將拍攝或者相簿中獲得的圖片進行識別，返回JSON格式的字串。
 */
public class RecognizeService {

	public interface ServiceListener {
        public void onResult(String result);
    }
    
    //高精度版
    public static void recAccurateBasic(Context ctx, String filePath, final ServiceListener listener) {
        GeneralParams param = new GeneralParams();
        param.setDetectDirection(true);
        param.setVertexesLocation(true);
        param.setLanguageType(GeneralBasicParams.ENGLISH);
        param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);
        param.setImageFile(new File(filePath));
        
        //這裡的recognizeAccurateBasic方法為百度OCR識別的核心方法
        OCR.getInstance(ctx).recognizeAccurateBasic(param, new OnResultListener<GeneralResult>() {
            @Override
            public void onResult(GeneralResult result) {
                StringBuilder sb = new StringBuilder();
                for (WordSimple wordSimple : result.getWordList()) {
                    WordSimple word = wordSimple;
                    sb.append(word.getWords());
                    sb.append("\n");
                }
                listener.onResult(result.getJsonRes());
            }

            @Override
            public void onError(OCRError error) {
                listener.onResult(error.getMessage());
            }
        });
    }


}

在onActivityResult方法中，我們呼叫剛剛新建的類的recAccurateBasic方法，此方法接收三個引數，分別是context,拍照獲取的圖片路徑，和在RecognizeService類中定義的監聽介面，這裡的獲取圖片路徑方法，我用的是百度官方DEMO中的方法

在onResult方法中，返回的result字串即為識別結果的json字串，只需要對JSON解析一下就能得到識別結果啦

@Override
    public void onActivityResult(int requestCode, int resultCode, Intent data) {
        super.onActivityResult(requestCode, resultCode, data);
        switch (requestCode) {
            case REQUEST_CODE_GENERAL_BASIC:
                if (resultCode == Activity.RESULT_OK) {
                    RecognizeService.recAccurateBasic(mActivity, FileUtil.getSaveFile(mActivity.getApplicationContext()).getAbsolutePath(),
                            new RecognizeService.ServiceListener() {
                                @Override
                                public void onResult(String result) {
                                    Bundle bundle = new Bundle();
                                    bundle.putString("wordResultJson",result );
                                    Intent intent = new Intent(mActivity,SelectWordsActivity.class);
                                    intent.putExtra("wordResultBundle",bundle );
                                    startActivity(intent);
                                }
                            });
                }
                break;
            default:
                Log.d(TAG, "onActivityResult: "+"run in default");
                break;
        }
    }

FileUtil類

public class FileUtil {
    public static File getSaveFile(Context context) {
        File file = new File(context.getFilesDir(), "pic.jpg");
        return file;
    }
}

在Android中呼叫百度的OCR介面

前言最近實驗室開了個新專案，是一個通過掃描單詞後把掃描過的單詞生成遊戲來讓小朋友記單詞的APP，掃描單詞這個功能需要用到OCR. 現在常用的OCR有 Tesseract 這個用的人比較多，而且開源，目前google正在維護，但是我嘗試了一下，發現識別準確率不是特別理想。

Android中使用百度APIstore介面

百度APIStore對開發者而言是比較方便的工具，它提供了很多介面給我們。在這篇文章中將介紹APIstore的使用方法。 1.從百度APIdtore找到我們所需要的介面，以新聞為例。 2.使用HttpURLConnection方法訪問該介面，拿到資料用IO流讀取出來。需要注

Android 百度地圖開發（一）如何呼叫百度地圖介面和在專案中顯示百度地圖以及實現定位

二、下載百度地圖API庫然後新增到專案中即可。三、在專案清單AndroidMainifest.xml配置百度地圖API key和新增相關許可權四、在專案呼叫百度地圖專案功能，這篇文章就首先講講顯示地圖和定位的功能首先

在頁面中呼叫百度引擎

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8" /> <title>呼叫百度引擎</tit

呼叫百度翻譯介面

表單提交頁面ajax提交百度翻譯 </textarea> 控制器頁面 <?php namespace App\Http\Controllers\Admin; use Illuminate\Http\Request; use Ap

js呼叫百度地圖介面繪製任意多邊形並獲取每個點的經緯度等

來自：https://blog.csdn.net/u013239236/article/details/52213977 侵刪 <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type"

怎樣在自己的網頁中呼叫百度API

https://blog.csdn.net/u010251278/article/details/52877370 以下內容轉自上述網站，為了以後的學習方便，為此才特地將該網站內容轉到自己的部落格，多謝博主，見諒！ step1：獲取金鑰為了統一平臺服務的配額管理，JavaScript AP

PHP呼叫百度天氣介面API

//百度天氣介面API $location = "北京"; //地區 $ak = "5slgyqGDENN7Sy7pw29IUvrZ"; //祕鑰，需要申請，百度為了防止頻繁請求 $weatherURL = "http://api.map.baidu.com/telematics/v3/weather?lo

python wand image純圖片PDF轉圖片後呼叫百度OCR

一、安裝庫 pip install wand yum update yum -y install ImageMagick-devel 我自己是在docker裡面安裝測試的，沒問題二、開整大體思路：使用wand處理純圖片的PDF檔案(轉成圖片) 使用I

呼叫百度API介面獲取所在區域地址的經緯度

import requests import pandas as pd import csv #百度地圖API搜尋 def baidu_search(querys, region): url = 'http://api.map.baidu.com/place/

Pepper/Nao中級教程：第五章如何在Choregraphe中呼叫百度翻譯API

目標我希望讓機器人做翻譯，但是Naoqi自身是沒有翻譯API的。那麼我可以呼叫百度翻譯API來實現翻譯功能。原理百度API是RESTfulAPI，直接向百度API的URL發出請求，返回值中就

呼叫百度OCR API過程小記

呼叫百度OCR API過程小記【標籤】 OCR API Python data:2018-10-19 author:怡寶2號【總起】通過url對百度文字識別API進行呼叫，語言為python2 1. 在百度雲控制檯建立API應用整理流程：

【月入41萬】Mono For Android中使用百度地圖SDK

藉助於Mono For Android技術，.Net開發者也可以使用自己熟悉的C#語言以及.Net來開發Android應用。由於Mono For Android把Android SDK中絕大部分類庫都已經實現，基本直接參考Java開發Android的書就可以掌握Mono for android技術。

Winform呼叫百度地圖介面簡單示例

1、首先用一個html檔案呼叫百度地圖介面（主要註冊一個序列號）：<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml

利用java呼叫百度API介面，解析返回的json資料，突破百度API介面呼叫結果的限制

近一段時間的專案的核心是百度API的POI（興趣點）資料，所以需要呼叫百度API資料，下面就來講一下整個流程和遇到的問題及解決辦法。首先要檢視百度API文件，連結如下：http://lbsyun.baidu.com/index.php?title=webapi 專案中主要用到的是Plac

Java文字識別軟體-呼叫百度ocr實現文字識別

java_baidu_ocr Java呼叫百度OCR文字識別API實現圖片文字識別軟體專案原始碼在文末，放到了GitHub上 - https://github.com/Ymy214/java_baidu_ocr 識別圖一圖一識別結果識別圖二圖二識別結果識別圖三

JS呼叫百度api介面——實現簡單的百度頁面

描述： JS呼叫百度api介面——實現簡單的百度頁面效果：實現： css檔案： @charset "utf-8"; /* CSS Document */ *{ margin: 0; padding: 0; list-style: none;

C#呼叫百度地圖介面簡單示例

1、首先用一個html檔案呼叫百度地圖介面（主要註冊一個序列號）： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/x

利用Python呼叫百度地圖介面爬取小區資訊

前幾天有一個需求，就是想要查到每個一二線城市裡所有小區的經緯度，因此爬取程式和啟動程式如下 community_info_do.py 的程式碼如下 # -*- coding: utf-8 -*- """ 功能：呼叫百度地圖介面爬取各城市小區基本資訊呼叫介面

TP5呼叫百度地圖介面進行開發

進入百度地圖開放平臺，建立應用：服務端，生成AK碼，複製。在extend目錄下建立一個Map.php,程式碼如下：<?php /** * 百度地圖相關業務封裝 */ class Map{ //根據地址獲取經緯度 public static funct

在Android中呼叫百度的OCR介面

前言

如何在Android 中呼叫百度的OCR進行文字識別

1.獲取百度文字識別產品服務的 Ak/Sk

2.新增百度OCR的SDK到專案中

3.呼叫百度OCR

相關推薦