1. 程式人生 > >Learning by doing

Learning by doing

訊飛雲開放平臺http://www.xfyun.cn/,其實早在三月份就註冊了一個帳號,這些天看見機器人群的一個群友在做語音,還給我發了一個語音識別放歌曲的視訊,我感覺像那麼回事,自己興趣一下就來了,先試試看。


可以申請多個服務,也可以是一個,如上圖所示。我這裡是拿一個服務做例子。建議一開始多開幾個服務,後文就是由於開少了出了點問題(包括離線命令字識別,離線語音合成,申請開發雲語義,語音喚醒)

下載的Linux下的SDK有這麼幾個檔案,外加一個README,短小精悍,很對胃口。

進到samples裡依次編譯每個程式,首先source 64bit_make.sh建立環境變數並且藉助當前目錄下的Makefile編譯程式,編譯好的程式在bin目錄下。

幾個縮寫詞解釋《Development Manual_MSP50.pdf》


  1. asr_sample (Automatic Speech Recognition)語音識別
注意這裡執行程式的時候要先指定庫目錄的位置哦,即LD_LIBRARY_PATH=...這句,是在用BeagleBone的時候學到的,有些東西是互通的。

因為本地有一段電話號碼的文字,以後綴abnf結尾,README裡稱它為(abnf語法樣例)開啟後有些亂碼,我會換到windows下試試。


2. iat_record(iFly Auto Transform)語音轉文字,語音聽寫

它的結果

關鍵字放在了下圖中,錄音是說的:中美速控。不知是系統原因還是沒有識別到,顯出的是亂碼。

3. 實時語音轉文字

這個跟第二個差不多

使用者詞表,用來提高識別率

4. tts 文字轉語音


5. sch_speak 語音語義技術能夠將語音聽寫業務中的內容進行語義解析

6. sch_text 語音理解,本地文字

後來網頁上開通後就可以了,也不用重新下載SDK,結果如下圖所示:


跑完他們的例子,體驗了他們的三大主要服務,語音識別語音轉文字文字轉語音,語義理解沒跑通

另外使用指令 LD_LIBRARY_PATH=../libs/x64 gdb ./sch_text 可以呼叫gdb來除錯程式


===================2016.11==============================

在《MSC Novice Manual for Linux.pdf》中

也見過將libmsc.so拷貝到/usr/lib下的做法,我上面的做法也只是其中一個,但相對來說稍微繁瑣點,每次都需要輸入。

Save