訊飛語音的簡單使用

阿新 • • 發佈：2019-02-09

使用方法:

1 匯入SDK:

將開發工具包中libs目錄下的Msc.jar和armeabi(實際還有多個檔案,我們全部拷貝進來,以便機型適配)複製到Android工程的libs目錄.

2 在專案build.gradle檔案的android{}內,配置下面一段程式碼,同步一下gradle檔案.

sourceSets {

main {

jniLibs.srcDir 'libs'

}

3 對清單檔案進行許可權配置,以下是訊飛語音用到的許可權.

<uses-permission android:name="android.permission.INTERNET"/>

<uses-permission android:name="android.permission.RECORD_AUDIO"/>

<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/>

<uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>

<uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>

<uses-permission android:name="android.permission.READ_PHONE_STATE"/>

<uses-permission android:name="android.permission.READ_CONTACTS"/>

<uses-permission android:name="android.permission.CAMERA" />

5 初始化訊飛語音SDK:
只有初始化後才可以使用MSC的各項服務。建議將初始化放在程式入口處（如Application、Activity的onCreate方法),初始化程式碼如下：

public class MyApplication extends Application {
    @Override
    public void onCreate() {
        //將“12345678”替換成您申請的 APPID，申請地址：http://www.xfyun.cn
        //請勿在“=”與 appid 之間新增任務空字元或者轉義符
        SpeechUtility.createUtility(this, SpeechConstant.APPID +"=12345678");
        super.onCreate();
    }
}

注意:自定義的APPlication要到清單檔案配置一下.在application的">"內,填上android:name=".APP"

6 執行識別語音為文字的的邏輯程式碼.(程式碼放到點選事件裡)

public void Listen(View view) {
//1.建立RecognizerDialog物件,第二個引數就是一個初始化的監聽器,我們用不上就設定為null
        RecognizerDialog mDialog = new RecognizerDialog(this, null);
        //2.設定accent、language等引數
        mDialog.setParameter(SpeechConstant.LANGUAGE, "zh_cn");//設定為中文模式
        mDialog.setParameter(SpeechConstant.ACCENT, "mandarin");//設定普通話模式
        //若要將UI控制元件用於語義理解，必須新增以下引數設定，設定之後onResult回撥返回將是語義理解
        //mDialog.setParameter("asr_sch", "1");
        //mDialog.setParameter("nlp_version", "2.0");
        //建立一個裝每次解析資料的容器
        stringBuilder = new StringBuilder();
        //3.設定回撥介面
        mDialog.setListener(new RecognizerDialogListener() {
            //識別成功執行,引數recognizerResult 識別的結果,Json格式的字串
            //第二引數 b:等於true時會話結束,方法才不會繼續回撥
            //一般情況下通過onResult介面多次返回結果,完整識別內容是多次累加的
            @Override
            public void onResult(RecognizerResult recognizerResult, boolean b) {
                //拿到訊飛是別的結果
                String resultString = recognizerResult.getResultString();
                //自定義解析bean資料的方法,得到解析資料
                String content= parseData(resultString);
                System.out.println("訊飛識別的結果 "+resultString);
                System.out.println("b引數是什麼 "+b);
            }

            //識別失敗執行的方法,speechError:錯誤碼
            @Override
            public void onError(SpeechError speechError) {

            }
        });
        //4.顯示dialog,接收語音輸入
        mDialog.show();
}

7 建立Bean類(名字自定義,如果使用本文章全套程式碼,那麼就暫時不要改,牽一髮動全身),以用來存放訊飛語音識別的結果json資料.

public class XFBean {
    public ArrayList<WS> ws;
    public class WS{
        public ArrayList<CW> cw;
    }
    public class CW{
        public String w;
    }

}

8 建立解析訊飛識別結果bean資料的方法,使用谷歌的Gson.

private String parseData(String resultString){
        //建立gson物件.記得要關聯一下gson.jar包,方可以使用
        Gson gson = new Gson();
        //引數1 String型別的json資料   引數2.存放json資料對應的bean類
        XFBean xfBean = gson.fromJson(resultString, XFBean.class);
        //建立集合,用來存放bean類裡的物件
        ArrayList<XFBean.WS> ws=xfBean.ws;
        //建立一個容器,用來存放從每個集合裡拿到的資料,使用StringBUndle效率高
        StringBuilder stringBuilder = new StringBuilder();
        for (XFBean.WS w : ws) {
            String text= w.cw.get(0).w;
            stringBuilder.append(text);
        }
        //把容器內的資料轉換為字串返回出去
        return stringBuilder.toString();
    }

9 執行識別語音為文字的的邏輯程式碼(之前的拿到的資料是無法直接使用的bean資料,現在就是解析出來的最終String型別資料)

public void Listen(View view) {
        //1.建立RecognizerDialog物件,第二個引數就是一個初始化的監聽器,我們用不上就設定為null
        RecognizerDialog mDialog = new RecognizerDialog(this, null);
        //2.設定accent、language等引數
        mDialog.setParameter(SpeechConstant.LANGUAGE, "zh_cn");//設定為中文模式
        mDialog.setParameter(SpeechConstant.ACCENT, "mandarin");//設定普通話模式
        //若要將UI控制元件用於語義理解，必須新增以下引數設定，設定之後onResult回撥返回將是語義理解
        //mDialog.setParameter("asr_sch", "1");
        //mDialog.setParameter("nlp_version", "2.0");
        //建立一個裝每次解析資料的容器
        stringBuilder = new StringBuilder();
        //3.設定回撥介面
        mDialog.setListener(new RecognizerDialogListener() {
            //識別成功執行,引數recognizerResult 識別的結果,Json格式的字串
            //第二引數 b:等於true時會話結束,方法才不會繼續回撥
            //一般情況下通過onResult介面多次返回結果,完整識別內容是多次累加的
            @Override
            public void onResult(RecognizerResult recognizerResult, boolean b) {
                //拿到訊飛是別的結果
                String resultString = recognizerResult.getResultString();
                System.out.println("訊飛識別的結果 "+resultString);
                //自定義解析bean資料的一個方法.用到了Gson,在專案裡關聯一下.
                String text = parseData(resultString);
                //容器裝解析出來的資料
                stringBuilder.append(text);
                //對引數2進行判斷,如果為true,代表這個方法不會再回調,就把容器裡的資料轉成字串.拿來使用.
                if(b){
                    String result = stringBuilder.toString();
                    System.out.println("話說完,最終的結果 : "+ result);
                }
            }

            //識別失敗執行的方法,speechError:錯誤碼
            @Override
            public void onError(SpeechError speechError) {

            }
        });
        //4.顯示dialog,接收語音輸入
        mDialog.show();
    }

10 訊飛固定的把文字轉文語音的邏輯程式碼,把String引數傳進去,然後呼叫此方法即可

public void textToVoice(String result){
        //1.建立 SpeechSynthesizer 物件, 第二個引數：本地合成時傳 InitListener
        SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer(this, null);
        //2.合成引數設定，詳見《MSC Reference Manual》SpeechSynthesizer 類
        // 設定發音人（更多線上發音人，使用者可參見 附錄13.2
        mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan"); //設定發音人
        mTts.setParameter(SpeechConstant.SPEED, "50");//設定語速
        mTts.setParameter(SpeechConstant.VOLUME, "80");//設定音量，範圍 0~100
        mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); //設定雲端,這些功能用到了訊飛伺服器,所以要有網路
        //設定合成音訊儲存位置（可自定義儲存位置），儲存在“./sdcard/iflytek.pcm”
        //儲存在 SD 卡需要在 AndroidManifest.xml 新增寫 SD 卡許可權
        //僅支援儲存為 pcm 和 wav 格式，如果不需要儲存合成音訊，註釋該行程式碼
        // mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm");
        // 3.開始合成,第一個引數就是轉換成聲音的文字,自定義,第二個引數就是合成監聽器物件,我們不需要對聲音有什麼特殊處理,就傳null
        mTts.startSpeaking(result, null);
    }

11 使智慧語音能根據使用者說的話,回答相映的內容,這就需要拿到使用者說話的結果,進行判斷,回答對應的內容,在if(b)中新增

String result = stringBuilder.toString();
                    //回答物件,在沒有匹配到使用者說的話,預設輸出語句
                    String anwser="不好意思,年紀大了,耳朵不好,沒有聽清楚";
                    if(result.contains("你好")){
                        anwser="你好,我是你的智慧語音助手,很高興為你服務";
                    }
                    textToVoice(anwser);

12 語音合成中呼叫textToVoice並傳入你想說的話就可以

public void Talk(View view) {
        textToVoice("你好");
    }

MainActivity佈局:

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout
    xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:tools="http://schemas.android.com/tools"
    android:orientation="horizontal"
    android:layout_width="match_parent"
    android:layout_height="match_parent">

    <Button
        android:layout_width="0dp"
        android:layout_weight="1"
        android:layout_height="wrap_content"
        android:onClick="Listen"
        android:text="語音識別"/>

    <Button
        android:layout_width="0dp"
        android:layout_weight="1"
        android:layout_height="wrap_content"
        android:onClick="Talk"
        android:text="語音合成"/>

</LinearLayout>

android+訊飛語音+一個簡單的文字語音相互轉換

<uses-permissionandroid:name="android.permission.INTERNET"/>

訊飛語音合成簡單使用

最近用到了，訊飛語音，所以簡單給大家介紹一下怎麼加入語音朗讀； Step 1：首先你需要申請一個 appid，去訊申請吧

java版阿里雲,百度ai,訊飛語音識別效果簡單對比及demo

因為公司的業務的需要,對三家的語音識別(簡短語句識別java版)進行了呼叫和對比,把自己的測試成果貼出來供需要的人蔘考使用.並貼出主要程式碼塊阿里雲的一句話識別: package com.alibaba.idst.nls.demo; import

關於科大訊飛語音合成的開發（先寫個本地的，簡單）

1、首先在科大訊飛官網申請應用下載語音合成SDK，在專案中匯入Msc.jar包，別忘了還有armeabi目錄下的檔案。然後建一個語音合成的工具類SpeechUtil_xf,具體程式碼下面貼出來，相信大家看註釋已經很清楚了； package com.chai

訊飛語音的簡單使用

使用方法: 1 匯入SDK: 將開發工具包中libs目錄下的Msc.jar和armeabi(實際還有多個檔案,我們全部拷貝進來,以便機型適配)複製到Android工程的libs目錄. 2 在專案build.gradle檔案的android{}內,配置下面一段程式碼,同步

訊飛語音SDK繼承簡單使用

//1.建立RecognizerDialog物件,第二個引數就是一個初始化的監聽器,我們用不上就設定為null RecognizerDialog mDialog = new RecognizerDialog(this, null); //2.設定accent、language等引數 mDialog.setPa

訊飛語音JavaWeb語音合成解決方案

docker ffmpeg 訊飛語音合成在線語音合成將文字信息轉化為聲音信息，給應用配上“嘴巴”。我們提供了眾多極具特色的發音人（音庫）供您選擇。其合成音在音色、自然度等方面的表現均接近甚至超過了人聲。這種語音合成體驗，達到了真正可商用的標準訊飛的語音合成還是很牛P的，不但有基礎發音

Android集成訊飛語音、百度語音、阿裏語音識別

下載 oid androi tail dst -- 阿裏 info 科大項目實踐：https://blog.csdn.net/Jsagacity/article/details/80094164 demo下載地址：https://fir.im/jy28 d

php調用訊飛語音合成

提示 tran post ade 註意定義時代 for inf 開發背景：需要機器閱讀文檔，看了bat和訊飛的，領導決定用訊飛的，其實bat的也非常好廢話又多了，直接看代碼吧 header("Content-type: text/html; charset=utf-8

Unity接入訊飛語音識別___Android版

Unity版本4.6＋Eclipse 1，首先我們先去訊飛開放平臺註冊一個開發者賬號（註冊地址：http://www.xfyun.cn）,註冊完成後進入控制檯建立一個新的應用。 2，提交成功後我們需要選擇我們需要開通我們需要的服務，點選開

linux 下 QT 訊飛語音合成

1. 下載訊飛基於Linux的語音文件Linux_tts_online demo連結https://download.csdn.net/download/weixin_39841821/10568834 裡面的目錄如下: bin: 一些用來測試的檔案 doc：技術文件 include

Android Studio 接入訊飛語音合成（文字轉語音）

1.下載相應的SDK（參考我上一篇文章：https://mp.csdn.net/postedit/83743563） 2.佈置資源 . 3.新增許可權：在Application的根目錄下，為了可以訪問手機的一些功能

unity接入Android（訊飛語音）

使用工具;Unity＋Eclipse(Android) 1.在訊飛語音註冊開發者賬號 ip： http://www.xfyun.cn 然後進入控制檯建立一個新的應用。 2.點入進去建立新應用，提交成功後我們需要選擇我們需要開通我們需

iOS 訊飛語音之語音聽寫錄音的實現

引入庫第一步獲取appid appid是第三方應用整合訊飛開放平臺SDK的身份標識，SDK靜態庫和appid是繫結的，每款應用必須保持唯一，否則會出現10407錯誤碼。appid在開放平臺申請應用時可以獲得，下載SDK後可從SDK中sample資料夾的Demo工程裡找到（例如: /sam

整合訊飛語音播報、語音合成；

整合訊飛語音播報：地圖導航沒有語音播報，只給出了語音的文字，所以需要自己整合一個語音播報的功能，把導航返回的文字給說出來；語音這方面選擇了科大訊飛，https://www.xfyun.cn/，註冊使用者、新建專案，下載SDK；訊飛會把你需要的服務生成一個sdk，下載就行了；建立完成後會給

訊飛語音輸入法iPhone公測版釋出

2011年8月8日，安徽科大訊飛資訊科技股份有限公司釋出了訊飛語音輸入法（iPhone）首個公測版本。訊飛語音輸入法iPhone版集語音、手寫、拼音輸入於一體，延續了Android版語音、手寫快速識別的優勢，手機輸入更加方便快捷。軟體特性： 1、語音輸入基於“語音雲”實現，邊說邊識別，智慧新增標

科大訊飛語音雲使用經歷

科大訊飛的語音識別是屬於一流的行列，那不多想當然選擇科大訊飛了。在百度上輸：訊飛語音就能找到，輸科大訊飛會直接出現官網，那裡面沒有。（ps我第一次就是這樣）下載後會有三個檔案選擇。一個是語音+ 帶有語音+APP的。一個是含語音互動介面，一個是不含語音互

利用訊飛語音聽寫介面實現實時語音轉寫。

訊飛語音，識別真的很準確。訊飛語音轉寫，實時的貴，不實時的慢。。。今天嘗試了用訊飛聽寫通過流的方式實現實時轉寫。主要思路是這樣。首先確認pcm檔案的儲存路徑。然後建立一個執行緒不斷讀寫pcm內的內容變化。每次讀取1024*1024位元組呼叫 mIat.w

ionic載入cordova科大訊飛語音輸入法外掛相關問題

1：申請相關appid，見官網，新增語音聽寫服務，下載sdk 2：下載cordova外掛，見https://github.com/Edc-zhang/cordova-plugin-IFlyspeech 3：將sdk的libs資料夾，替換cordova外掛的src/android/libs 　將cordo

unity接科大訊飛語音識別Windows平臺（補充前面的文章，添加了錄音功能）

其他操作就不在一一贅述了，直說一下新增的負責錄音的那段程式碼 1、首先利用Microphone類開始錄製和結束錄製音訊 2、利用AudioSource類播放錄製的音訊 3、然後用自己寫的方法Float2Byte將錄製的音訊轉成byte資料，供訊飛語音識別方法呼叫詳細

訊飛語音的簡單使用

相關推薦