ROS實戰（二）科大訊飛語音合成模組

阿新 • • 發佈：2019-02-02

一.前言

繼上篇部落格的內容,下面主要介紹科大訊飛語音合成模組:
這裡寫圖片描述
主要分成是三部分講解.

二.註冊科大訊飛平臺賬號,下載linux版本線上語音合成模組SDK

這裡寫圖片描述
下載好的檔案如下:

解壓到當前資料夾:

unzip xxx.zip -d voice   後面的voice為解壓到所在資料夾的名稱,可以是其他名稱

三.測試SDK,安裝命令列播放下的sox軟體

首先下載sox

sudo apt-get install sox

下載好之後cd到voice目錄下

cd samples/tts_sample/
source 64bit_make.sh
make
cp 
 64bit_make.sh ../../bin

之後會在bin目錄下面生成一個叫tts_sample的可執行檔案

./tts_sample

生成一個.wav的音訊檔案,用sox播放

play tts_sample.wav

這裡寫圖片描述

為了不要每次執行都souce,把x64目錄下的共享庫檔案拷貝到/usr/lib/下,先cd到voice/libs/x64目錄下

cp libmsc.so /usr/lib/

為了確保成功,你可以cd到/usr/lib/下用指令檢視是否拷貝成功

ls -l libmsc.so

若出現

-rw-r--r-- 1 zc zc 1138672  5月 17 19:45 
 libmsc.so

則成功
若出現

ls: 無法訪問libmsc.so: 沒有那個檔案或目錄

則失敗

三.理解線上語音合成程式碼

程式碼如下:

/*
* 語音合成（Text To Speech，TTS）技術能夠自動將任意文字實時轉換為連續的
* 自然語音，是一種能夠在任何時間、任何地點，向任何人提供語音資訊服務的
* 高效便捷手段，非常符合資訊時代海量資料、動態更新和個性化查詢的需求。
*/

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h> 


#include "qtts.h"
#include "msp_cmn.h"
#include "msp_errors.h"

/* wav音訊頭部格式 */
typedef struct _wave_pcm_hdr
{
    char            riff[4];                // = "RIFF"
    int     size_8;                 // = FileSize - 8
    char            wave[4];                // = "WAVE"
    char            fmt[4];                 // = "fmt "
    int     fmt_size;       // = 下一個結構體的大小 : 16

    short int       format_tag;             // = PCM : 1
    short int       channels;               // = 通道數 : 1
    int     samples_per_sec;        // = 取樣率 : 8000 | 6000 | 11025 | 16000
    int     avg_bytes_per_sec;      // = 每秒位元組數 : samples_per_sec * bits_per_sample / 8
    short int       block_align;            // = 每取樣點位元組數 : wBitsPerSample / 8
    short int       bits_per_sample;        // = 量化位元數: 8 | 16

    char            data[4];                // = "data";
    int     data_size;              // = 純資料長度 : FileSize - 44 
} wave_pcm_hdr;

/* 預設wav音訊頭部資料 */
wave_pcm_hdr default_wav_hdr = 
{
    { 'R', 'I', 'F', 'F' },
    0,
    {'W', 'A', 'V', 'E'},
    {'f', 'm', 't', ' '},
    16,
    1,
    1,
    16000,
    32000,
    2,
    16,
    {'d', 'a', 't', 'a'},
    0  
};
/* 文字合成 */
int text_to_speech(const char* src_text, const char* des_path, const char* params)
{
    int          ret          = -1;
    FILE*        fp           = NULL;
    const char*  sessionID    = NULL;
    unsigned int audio_len    = 0;
    wave_pcm_hdr wav_hdr      = default_wav_hdr;
    int          synth_status = MSP_TTS_FLAG_STILL_HAVE_DATA;

    if (NULL == src_text || NULL == des_path)
    {
        printf("params is error!\n");
        return ret;
    }
    fp = fopen(des_path, "wb");
    if (NULL == fp)
    {
        printf("open %s error.\n", des_path);
        return ret;
    }
    /* 開始合成 */
    sessionID = QTTSSessionBegin(params, &ret);
    if (MSP_SUCCESS != ret)
    {
        printf("QTTSSessionBegin failed, error code: %d.\n", ret);
        fclose(fp);
        return ret;
    }
    ret = QTTSTextPut(sessionID, src_text, (unsigned int)strlen(src_text), NULL);
    if (MSP_SUCCESS != ret)
    {
        printf("QTTSTextPut failed, error code: %d.\n",ret);
        QTTSSessionEnd(sessionID, "TextPutError");
        fclose(fp);
        return ret;
    }
    printf("正在合成 ...\n");
    fwrite(&wav_hdr, sizeof(wav_hdr) ,1, fp); //新增wav音訊頭，使用取樣率為16000
    while (1) 
    {
        /* 獲取合成音訊 */
        const void* data = QTTSAudioGet(sessionID, &audio_len, &synth_status, &ret);
        if (MSP_SUCCESS != ret)
            break;
        if (NULL != data)
        {
            fwrite(data, audio_len, 1, fp);
            wav_hdr.data_size += audio_len; //計算data_size大小
        }
        if (MSP_TTS_FLAG_DATA_END == synth_status)
            break;
        printf(">");
        usleep(150*1000); //防止頻繁佔用CPU
    }
    printf("\n");
    if (MSP_SUCCESS != ret)
    {
        printf("QTTSAudioGet failed, error code: %d.\n",ret);
        QTTSSessionEnd(sessionID, "AudioGetError");
        fclose(fp);
        return ret;
    }
    /* 修正wav檔案頭資料的大小 */
    wav_hdr.size_8 += wav_hdr.data_size + (sizeof(wav_hdr) - 8);

    /* 將修正過的資料寫回檔案頭部,音訊檔案為wav格式 */
    fseek(fp, 4, 0);
    fwrite(&wav_hdr.size_8,sizeof(wav_hdr.size_8), 1, fp); //寫入size_8的值
    fseek(fp, 40, 0); //將檔案指標偏移到儲存data_size值的位置
    fwrite(&wav_hdr.data_size,sizeof(wav_hdr.data_size), 1, fp); //寫入data_size的值
    fclose(fp);
    fp = NULL;
    /* 合成完畢 */
    ret = QTTSSessionEnd(sessionID, "Normal");
    if (MSP_SUCCESS != ret)
    {
        printf("QTTSSessionEnd failed, error code: %d.\n",ret);
    }

    return ret;
}

int main(int argc, char* argv[])
{
    int         ret                  = MSP_SUCCESS;
    const char* login_params         = "appid = 5afcee34, work_dir = .";//登入引數,appid與msc庫繫結,請勿隨意改動
    /*
    * rdn:           合成音訊數字發音方式
    * volume:        合成音訊的音量
    * pitch:         合成音訊的音調
    * speed:         合成音訊對應的語速
    * voice_name:    合成發音人
    * sample_rate:   合成音訊取樣率
    * text_encoding: 合成文字編碼格式
    *
    */
    const char* session_begin_params = "voice_name = xiaoyan, text_encoding = utf8, sample_rate = 16000, speed = 50, volume = 50, pitch = 50, rdn = 2";
    const char* filename             = "tts_sample.wav"; //合成的語音檔名稱
    const char* text                 = "親愛的使用者，您好，這是一個語音合成示例，感謝您對科大訊飛語音技術的支援！科大訊飛是亞太地區最大的語音上市公司，股票程式碼：002230"; //合成文字

    /* 使用者登入 */
    ret = MSPLogin(NULL, NULL, login_params);//第一個引數是使用者名稱，第二個引數是密碼，第三個引數是登入引數，使用者名稱和密碼可在http://www.xfyun.cn註冊獲取
    if (MSP_SUCCESS != ret)
    {
        printf("MSPLogin failed, error code: %d.\n", ret);
        goto exit ;//登入失敗，退出登入
    }
    printf("\n###########################################################################\n");
    printf("## 語音合成（Text To Speech，TTS）技術能夠自動將任意文字實時轉換為連續的 ##\n");
    printf("## 自然語音，是一種能夠在任何時間、任何地點，向任何人提供語音資訊服務的  ##\n");
    printf("## 高效便捷手段，非常符合資訊時代海量資料、動態更新和個性化查詢的需求。  ##\n");
    printf("###########################################################################\n\n");
    /* 文字合成 */
    printf("開始合成 ...\n");
    ret = text_to_speech(text, filename, session_begin_params);
    if (MSP_SUCCESS != ret)
    {
        printf("text_to_speech failed, error code: %d.\n", ret);
    }
    printf("合成完畢\n");

exit:
    printf("按任意鍵退出 ...\n");
    getchar();
    MSPLogout(); //退出登入

    return 0;
}

ROS實戰（二）科大訊飛語音合成模組

一.前言繼上篇部落格的內容,下面主要介紹科大訊飛語音合成模組: 主要分成是三部分講解. 二.註冊科大訊飛平臺賬號,下載linux版本線上語音合成模組SDK 下載好的檔案如下: 解壓到當前資料夾: unzip xxx.zip -d

關於科大訊飛語音合成的開發（先寫個本地的，簡單）

1、首先在科大訊飛官網申請應用下載語音合成SDK，在專案中匯入Msc.jar包，別忘了還有armeabi目錄下的檔案。然後建一個語音合成的工具類SpeechUtil_xf,具體程式碼下面貼出來，相信大家看註釋已經很清楚了； package com.chai

【從零單排之二】科大訊飛語音包Mscdemo的使用

前幾天寫的從零單排系列我發現了一個嚴重的錯誤，就是科大訊飛下載的Mscdemo是可以使用的，只不過是我沒設定好環境而已才有那麼多錯誤，特此更正一下。具體遇到的錯誤即解決辦法如下。 1.註釋是亂碼。右鍵單擊src包，選擇properties，找到Text code enco

《惢客創業日記》2018.10.18（週四）給訊飛語音的三條建議

　　今天，在上班的路上繼續用訊飛語音的一款產品“訊飛語記”來寫日記。現在，即使晚上躺在床上，用“訊飛語記”來寫日記，每天仍然會花去兩個多小時的時間。這對我來說，不僅僅是痛苦，還是一種折磨。但我相信，只有這樣的折磨，才會逼迫我去考慮時間和效率的問題，從而能讓我把每一時段的垃

如何開發一個線上朗讀的功能----科大訊飛語音合成實戰

-- 很久沒寫技術部落格，心血來潮，準備繼續撿起。起因天天學習強國，不過強國APP的語音朗讀不錯，瞭解之後是科大訊飛支援的，於是開始擼碼。https://www.xfyun.cn/doc/tts/online_tts/API.html 註冊為開發者，介面要求這些我就不贅述了，文件裡面寫的清楚。當然具體實

科大訊飛語音合成，pcm轉wav

import android.media.AudioFormat; import android.media.AudioRecord; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.Fi

科大訊飛語音合成5.0破解版安裝方法

安裝方法第一步：建立安裝目錄在D盤新建兩個資料夾 A和 B做為軟體的安裝目錄第二步：安裝執行庫點選InterPhonic5.0執行庫\Runtime Demo資料夾中的Runtime(Demo)_Chinese (PRC).msi 進行安裝安裝到第一步時在D

ROS+科大訊飛語音=讓你的機器人能聽會說---（二）說話篇

（二）說話篇基本環境配置建立工作空間 $ mkdir -p ~/catkin_ws/src $ cd ~/catkin_ws/src $ catkin_init_workspace 首次編譯 $ cd ~/catkin_ws/

ROS+科大訊飛語音=讓你的機器人能聽會說---（一）環境搭建與準備

概述 ROS介紹 ROS是是用於機器人的一種次級作業系統。它提供類似作業系統所提供的功能，包含硬體抽象描述、底層驅動程式管理、共用功能的執行、程式間的訊息傳遞、程式發行包管理，它也提供一些

unity接科大訊飛語音識別Windows平臺（補充前面的文章，添加了錄音功能）

其他操作就不在一一贅述了，直說一下新增的負責錄音的那段程式碼 1、首先利用Microphone類開始錄製和結束錄製音訊 2、利用AudioSource類播放錄製的音訊 3、然後用自己寫的方法Float2Byte將錄製的音訊轉成byte資料，供訊飛語音識別方法呼叫詳細

J2SE核心開發實戰（二）——字符串與包裝類

刪除 i++ cnblogs amp 分支語句核心最大用途 else 字符串與包裝類一、實驗簡單介紹在本章。我們將學習一些用於處理字符串的API以及包裝類的相關知識。本章知識點字符串API 包裝類及其應用二、認識字符

Spring Boot 揭秘與實戰（二）數據存儲篇 - 聲明式事務管理

public rollback long tar jpa oid config 新的 autowire 文章目錄 1. 聲明式事務 2. Spring Boot默認集成事務 3. 實戰演練4. 源代碼 3.1. 實體對象 3.2. DAO 相關 3.3. Service

Redis實戰（二）CentOS 7上搭建redis-3.0.2

str 進程 ps 禁用安裝redis 結果 redis 啟動服務 pro bin 1.安裝redis wget http://download.redis.io/releases/redis-3.0.2.tar.gz tar zxvf redis-3.0.2.tar

Wicket實戰（二）hello world

clas gpo 研究 eth 抽象 http 配置文件 href ont 上次的博文Wicket實戰（一）概述中給大家簡介了一下關於Wicket的概念性內容，今天我們完畢第一個Wicket實例-Hello

Docker從入門到實戰（二）

Docker 虛擬化一步一步走，寫小白都能看懂的文章，將持續更新中，敬請期待！Docker從入門到實戰（二）一：什麽是dockerDocker是一個開源的應用容器引擎，開發者可以打包他們的應用以及依賴包到一個可移植的容器中，然後發布到主流的Linux、macOS、Windows機器上，實現虛擬化。D

Python 爬蟲實戰（二）：使用 requests-html

分享 -html 調用交流 html 技術 python-re find 自己的 Python 爬蟲實戰（一）：使用 requests 和 BeautifulSoup，我們使用了 requests 做網絡請求，拿到網頁數據再用 BeautifulSoup 解析，就在前不久

Android項目實戰（二）：安卓應用程序退出的三種方法

eat 延遲用戶 pre html port length tst 二次原文:Android項目實戰（二）：安卓應用程序退出的三種方法現在的APP退出的時候都不是讓用戶點擊了“後退鍵”就退出。防止用戶點錯了後退鍵而造成的用戶體檢不好。一年前搞

Laravel 完整實戰（二） —— 用戶登錄註冊

laravel 實戰參考網絡上的項目：仿新浪微博簡單功能：用戶的註冊登錄用戶個人信息的更改使用管理員權限刪除用戶發布微博關註用戶查看關註用戶的微博動態刪除無用頁面 welcome.blade.php 視圖文件 rm re

docker實戰（二）之redis的使用

系統版本 Redis的使用 redis啟動 font height https eight img ont docker中安裝redis的步驟比較簡單，Linux系統版本centos7.4 1.官方倉庫https://hub.docker.com/r/library/red

springCloud分布式事務實戰（二）分布式事務處理器的編譯和運行之Redis安裝

安裝 water 客戶端測試 server 分布式 log 運行 -o 啟動一、分布式事務處理器的編譯和運行1)Redis 的安裝和啟動(1)下載redis 解壓縮 (2) 啟動和測試redis 1進入redis 目錄 2 雙擊redis-server.exe 程序

ROS實戰（二） 科大訊飛語音合成模組

一.前言

二.註冊科大訊飛平臺賬號,下載linux版本線上語音合成模組SDK

三.測試SDK,安裝命令列播放下的sox軟體

三.理解線上語音合成程式碼

相關推薦

ROS實戰（二）科大訊飛語音合成模組