Android整合訊飛語音、百度語音、阿里語音識別

阿新 • • 發佈：2019-06-29

一、引言

demo下載地址：https://fir.im/jy28
demo原始碼檢視：https://github.com/wapchief/android-CollectionDemo
效果圖：

選這幾個平臺的主要也是從多方面考慮。
大概從這幾個

識別精準度
免費限制
穩定程度
包體積
拓展性

目前只有百度的語音服務支援長語音（60秒以上），和離線語音識別。
當然語音的庫（.so）檔案也是最大的。足足10多M。

二、申請應用

在整合之前，需要去相應的平臺去申請應用。
拿到key等金鑰。目前這幾個平臺都在測試免費層限制中。

百度是完全免費，訊飛有免費層日呼叫次數限制。

三、整合

首先去各大平臺下載對於的語音檔案庫
一般都包含.so和libs兩部分。這兩部分都需要加入到專案中。

不過這裡只需要注意一點是，每個平臺的文件不一樣，有些是使用libs整合第三方庫，有些是使用jnilibs載入。

如果都按照第三方文件來整合，必定會出錯。
這裡統一使用jniLibs來整合(只適用於AndroidStudio)。如果是eclipse，則需要使用libs整合

如果在整合中遇到了問題，可以參考我以前寫過的解決方案
Android關於libs，jniLibs庫的基本使用說明及衝突解決

1、（必須）將下載後的所有so庫檔案（以.so結尾的檔案）拷貝至專案下/app/src/main目錄，如果沒有則建立一個，裡面的名字是固定的，注意不能修改，必須按照這樣的架構目錄整合。

2、（必須）將jar檔案拷貝到libs目錄中

image.png

然後將jar新增到專案。
可以使用右鍵對應的jar包，add-libs手動新增

3、（必須）在AndroidManifest.xml新增許可權

以訊飛的許可權文件說明為例

<!--連線網路許可權，用於執行雲端語音能力 -->
<uses-permission android:name="android.permission.INTERNET"/>
<!--獲取手機錄音機使用許可權，聽寫、識別、語義理解需要用到此許可權 -->
<uses-permission android:name="android.permission.RECORD_AUDIO"/>
<!--讀取網路資訊狀態 -->
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/>
<!--獲取當前wifi狀態 -->
<uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
<!--允許程式改變網路連線狀態 -->
<uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>
<!--讀取手機資訊許可權 -->
<uses-permission android:name="android.permission.READ_PHONE_STATE"/>
<!--讀取聯絡人許可權，上傳聯絡人需要用到此許可權 -->
<uses-permission android:name="android.permission.READ_CONTACTS"/>
<!--外儲存寫許可權，構建語法需要用到此許可權 -->
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
<!--外儲存讀許可權，構建語法需要用到此許可權 -->
<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>
<!--配置許可權，用來記錄應用配置資訊 -->
<uses-permission android:name="android.permission.WRITE_SETTINGS"/>
<!--手機定位資訊，用來為語義等功能提供定位，提供更精準的服務-->
<!--定位資訊是敏感資訊，可通過Setting.setLocationEnable(false)關閉定位請求 -->
<uses-permission android:name="android.permission.ACCESS_FINE_LOCATION"/>
<!--如需使用人臉識別，還要新增：攝相頭許可權，拍照需要用到 -->
<uses-permission android:name="android.permission.CAMERA" />

如果SDK版本在6.0以上需要在專案中手動獲取錄音許可權


    /*動態許可權申請*/
    private void initPermission() {
        String permission[] = {Manifest.permission.RECORD_AUDIO,
                Manifest.permission.ACCESS_NETWORK_STATE,
                Manifest.permission.INTERNET,
                Manifest.permission.WRITE_EXTERNAL_STORAGE};
        ArrayList<String> applyList = new ArrayList<>();

        for (String per : permission) {
            if (PackageManager.PERMISSION_GRANTED != ContextCompat.checkSelfPermission(this, per)) {
                applyList.add(per);
            }
        }

        String tmpList[] = new String[applyList.size()];
        if (!applyList.isEmpty()) {
            ActivityCompat.requestPermissions(this, applyList.toArray(tmpList), 123);
        }
    }

四、初始化服務

各個平臺的初始化方法都不一樣。
但大多數都是在自己專案的Application中初始化。


        //初始化訊飛語音
        SpeechUtility.createUtility(mContext, SpeechConstant.APPID +"=59daecea," + SpeechConstant.FORCE_LOGIN +"=true");
        //訊飛除錯日誌開啟
        Setting.setShowLog(true);
        //初始化阿里語音
        NlsClient.openLog(true);
        NlsClient.configure(mContext);

有些是在AndroidManifest.xml中初始化

       <!--******************************百度語音**********************************-->
        <meta-data android:name="com.baidu.speech.APP_ID"
            android:value="8172882" />
        <meta-data
            android:name="com.baidu.speech.API_KEY"
            android:value="R3crsZhvpqQSrLGUvG7kuG0pCnpTbXvb" />
        <meta-data
            android:name="com.baidu.speech.SECRET_KEY"
            android:value="6MafqZkSLoNYUML1YduHPDYBg1kkPLHj" />

        <service android:name="com.baidu.speech.VoiceRecognitionService" android:exported="false"/>

五、開啟識別服務

以訊飛為例：
在開始識別前需要初始化識別物件，

 SpeechRecognizer  recognizer = SpeechRecognizer.createRecognizer(this, null);

然後配置聽寫引數

    /**
     * 引數設定
     */
    public void setParam() {
        //2.設定聽寫引數，詳見《科大訊飛MSC API手冊(Android)》SpeechConstant類
        recognizer.setParameter(SpeechConstant.DOMAIN, "iat");
        recognizer.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
        recognizer.setParameter(SpeechConstant.ACCENT, "mandarin ");
        //設定音訊儲存路徑
        recognizer.setParameter(SpeechConstant.AUDIO_FORMAT, "wav");
        recognizer.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory() + "/msc/iat.wav");

    }

開始識別的開始和終止，及識別過程的內容回撥

    //開啟
    private void startXF() {
        setParam();
        recognizer.startListening(recognizerListener);
    }

    //停止
    private void stopXF() {

        recognizer.stopListening();
    }


    /*監聽*/
    private RecognizerListener recognizerListener = new RecognizerListener() {
        @Override
        public void onVolumeChanged(int i, byte[] bytes) {
            //音量變化
        }

        @Override
        public void onBeginOfSpeech() {
            //開始說話
            Log.e(TAG, "XF開始說話");
        }

        @Override
        public void onEndOfSpeech() {
            //結束說話
            Log.e(TAG, "XF結束說話");

        }

        @Override
        public void onResult(RecognizerResult recognizerResult, boolean b) {
            //返回結果需要判斷null
            text = JsonParser.parseIatResult(recognizerResult.getResultString());
            Log.e(TAG, "XFResult:" + text + "\n" + recognizerResult.getResultString());
            mVoiceTv.setText(recognizerResult.getResultString());
            printResult(recognizerResult);
        }

        @Override
        public void onError(SpeechError speechError) {
            //錯誤回撥
            Log.e(TAG, "XFError:" + speechError.toString());

        }

        @Override
        public void onEvent(int i, int i1, int i2, Bundle bundle) {
            //事件拓展
        }
    };

解析語音識別的結果。

    //儲存聽寫結果
    private HashMap<String, String> mIatResults = new LinkedHashMap<String, String>();

 /*解析器*/
    private void printResult(RecognizerResult results) {
        String text = JsonParser.parseIatResult(results.getResultString());

        String sn = null;
        // 讀取json結果中的sn欄位
        try {
            JSONObject resultJson = new JSONObject(results.getResultString());
            sn = resultJson.optString("sn");
        } catch (JSONException e) {
            e.printStackTrace();
        }

        mIatResults.put(sn, text);

        StringBuffer resultBuffer = new StringBuffer();
        for (String key : mIatResults.keySet()) {
            resultBuffer.append(mIatResults.get(key));
        }

        mVoiceEt.setText("訊飛識別結果：" + resultBuffer.toString());
        mVoiceEt.setSelection(mVoiceEt.length());
//        mVoiceTv.setText(resultBuffer.toString());
    }

六、異常及其他

SecurityException異常：
如果是在6.0以上版本的sdk可能會出現該問題，主要是臨時許可權呼叫，比如呼叫系統的錄音檔案播放，或者呼叫系統的相簿。
可以參考呼叫相簿的解決方案，原理一樣
Android版本相機適配問題集合（不斷整理更新中）

demo下載地址：
https://fir.im/jy28
demo原始碼：
https://github.com/wapchief/android-CollectionDemo

作者：八怪不姓醜
連結：https://www.jianshu.com/p/950d73234991
來源：簡書
簡書著作權歸作者所有，任何形式的轉載都請聯絡作者獲得授

Android整合訊飛語音、百度語音、阿里語音識別

一、引言 demo下載地址：https://fir.im/jy28 demo原始碼檢視：https://github.com/

阿里雲、騰訊雲、百度雲、AWS 比較

資料庫對比：供應商 CPU配置硬碟一個月半年一年版本資料複製騰訊 8G 200G 960.00 元

阿里雲、騰訊雲、百度雲、華為雲伺服器雙十一活動價格對比

一、阿里雲今年阿里雲對於新使用者的優惠力度比較大，跟團買價格能低到1折，1核2G記憶體1年的價格才99元，還可以一次買3年，可以說是十分優惠了。活動時間：2018年10月29日——11月8日，每個新使用者限購一款。活動連結：https://m.aliyun.com/act/team1111/#/s

新浪雲、阿裏雲、百度雲、谷歌雲、亞馬遜雲

存在實現常用 sof ava 解決 http 只需要產品新浪雲：http://sae.sina.com.cn/ 阿裏雲：http://www.aliyun.com/百度雲：http://yun.baidu.com/谷歌雲：https://developers.go

中文知識圖譜研討會的學習總結 (上) 圖譜引入、百度知心、搜狗知立方

知識圖譜（Knowledge Graph）是當前學術界和企業界的研究熱點。中文知識圖譜的構建對中文資訊處理和中文資訊檢索具有重要的價值。中國中文資訊學會（CIPS）邀請了有約10家從事知識圖譜研究和實踐的著名高校、研究機構和企業的專家及學者有意參與並發表演講，

基於arduino、百度雲、採用django、redis魚缸線上監控

大家好，今天我給大家分享一下之前做的一個魚缸遠端監控的案例，希望有人喜歡首先給大家看一下結構框架，由於我之前買的arduino開發板不帶wifi功能，所有是通過pc機轉發一下上的百度雲，最近我剛購買了一塊TPYBoard v202開發板（好幾十大洋呢，(╥╯^╰╥)誰能和我分擔一下๑乛◡乛๑），接下來我會用

Android集成訊飛語音、百度語音、阿裏語音識別

下載 oid androi tail dst -- 阿裏 info 科大項目實踐：https://blog.csdn.net/Jsagacity/article/details/80094164 demo下載地址：https://fir.im/jy28 d

整合訊飛語音播報、語音合成；

整合訊飛語音播報：地圖導航沒有語音播報，只給出了語音的文字，所以需要自己整合一個語音播報的功能，把導航返回的文字給說出來；語音這方面選擇了科大訊飛，https://www.xfyun.cn/，註冊使用者、新建專案，下載SDK；訊飛會把你需要的服務生成一個sdk，下載就行了；建立完成後會給

Android定位開發之百度定位、高德定位、騰訊定位，三足鼎立一起為我所用！

這幾天的專案不是很緊，於是想為未來可能要做的專案做一些技術儲備。下一個專案很有可能是定位開發，需要用到手機定位功能，於是查了查現在比較流行的第三方定位，最火的基本上就是百度定位>高德定位>騰訊定位了。想了想不如做一個DEMO把三種定位方式混合一下試試。 Ba

Android百度地圖、高德地圖、騰訊地圖導航路線規劃問題

public class WebViewActivity extends AppCompatActivity { private WebView detailsWebView; private String mUrl; private Handler handler; pr

Android應用內開啟高德、百度、騰訊地圖app

最近在專案中需要地圖導航功能，但是匯入第三方地圖導航包的話，應用打出包後會很大，所以考慮到可以通過呼叫外部地圖應用來解決，參考了微信開啟外部地圖的做法，有了下面的解決辦法：1.主要思路：通過高德、百度、騰訊提供的Uri開啟應用外部地圖app.2.關鍵程式碼（以高德地

Android 科大訊飛語音整合，文字轉語音

前言：記錄一下科大訊飛的文字轉語音功能的sdk的整合過程，希望能夠幫助到大家。 1. 登入官網，應用註冊。訊飛開放平臺，進行簡單的開發者註冊。進入個人中心，註冊應用。註冊完成後，我們可以看到自己的appid。選擇自己要開通的功能，然

Android仿微信呼叫第三方地圖應用導航（高德、百度、騰訊）

好久沒有寫Andorid程式碼啦！最近剛好要實現一個這個功能，順便就在部落格裡分享一下。實現目標先來一張微信功能截圖看看要做什麼其實就是有一個目的地，點選目的地的時候彈出可選擇的應用進行導航。大腦動一下，要實現這個功能應該大體分成兩步：

如何在百度地圖、騰訊地圖標註公司地址信息?

比如百度地圖、騰訊地圖、高德地圖是可以標註公司位置的，不一定是店鋪。所以我們有機會把公司地址在地圖裏標註出來，這樣以後客戶拜訪時就會非常方便。我們遇到很多朋友都是花了幾百塊錢做地圖標註，實際上這一切都是免費的。首先，我們來看看地圖標註效果。微信應用場景案例展

1、百度知道和知乎的區別（騰訊-2014）

用戶更多優先差異階層產品分析似的美團百度搜索 1、題目分析考查點：競品分析、產品分析 2、背景知識用戶體驗五要素：1）戰略層：產品開發者、用戶分別想從產品中獲得什麽 2）範圍層：產品需要具備怎樣的功能，優先級如何 3）結構層：用戶操作產品的路徑是怎樣的，

國內各大互聯網公司相關技術博客3.0版（集合騰訊、阿裏、百度、搜狐、新浪、網易、360等共29個）

hive 時間視覺阿裏媽媽數據可視化發的電商領域事業在2013-07-15 整理了一份國內各大互聯網公司相關技術站點2.0版（集合騰訊、阿裏、百度、搜狐、新浪、360等共49個）近日重新整理了一番，希望能對大家有所幫助 2013年騰訊系列（13）阿

阿裏巴巴、百度、騰訊都在用的Java架構師知識體系

是我經驗根據協同 ons tools 公司 ces sha 一、源碼分析源碼分析是一種臨界知識，掌握了這種臨界知識，能不變應萬變，源碼分析對於很多人來說很枯燥，生澀難懂。源碼閱讀，我覺得最核心有三點：技術基礎+強烈的求知欲+耐心。我認為是閱讀源碼的最核心驅動力。

阿里、騰訊、百度、華為、京東、搜狗、滴滴上10家試題彙總(史上最全)

瘋狂創客圈整理了數百道面試題，不光是為了面試，如果能全部解答， JAVA的技術水平也是傲視群雄了。後續還會不斷更新。有些題目挺難的，歡迎大家來交流答案。 [第一部分] JAVA基礎 [第一篇] 面向物件 [第1題] 面向物件是什麼？ [第2題] 類載入的過程 [第3題] 類載入器有哪些 [第4題] 雙

BAT大揭祕：在騰訊、百度、阿里上班，差別竟然這麼大？

上班篇騰訊因為 QQ 企鵝形象被稱為鵝廠。原騰訊大廈位於馬化騰母校深大對面。騰訊班車覆蓋整個深圳，有超過 250 條線路，比一箇中小城市的公交系統還要完善。從早 8 點到晚 11 點，從深圳機場到鹽田，騰訊班車可直達深圳關內的任何地方。難怪內部有個說法

unity接入Android（訊飛語音）

使用工具;Unity＋Eclipse(Android) 1.在訊飛語音註冊開發者賬號 ip： http://www.xfyun.cn 然後進入控制檯建立一個新的應用。 2.點入進去建立新應用，提交成功後我們需要選擇我們需要開通我們需

Android整合訊飛語音、百度語音、阿里語音識別

一、引言

二、申請應用

三、整合

四、初始化服務

五、開啟識別服務

六、異常及其他

相關推薦