有關整合科大訊飛sdk的語音(一)帶語音的介面

阿新 • • 發佈：2018-11-06

最近專案需要整合語音這塊,我選擇了科大訊飛的sdk,IFlySpeechRecognizer是不帶介面的語音聽寫控制元件，顯示介面的時候需要使用者進行自定義語音動畫介面,IFlyRecognizerView是帶介面的控制元件.我會分別介紹這兩種顯示.

帶語音的介面:

#import "iflyMSC/IFlyMSC.h"

@property (nonatomic, strong) IFlyRecognizerView *iflyRecognizerView;//帶介面的識別物件

- (void)viewWillAppear:(BOOL)animated

{

[super viewWillAppear:animated];

if (_iflyRecognizerView == nil) {

[self initIflySound];

}else{

[

_iflyRecognizerView start];

}

[self.searchBar resignFirstResponder];

}

- (void)initIflySound{

//UI顯示劇中

_iflyRecognizerView= [[IFlyRecognizerView alloc] initWithCenter:self.view.center];

[_iflyRecognizerView setParameter:@"" forKey:[IFlySpeechConstant PARAMS]];

//設定聽寫模式

[_iflyRecognizerView setParameter:@"iat" forKey:[IFlySpeechConstant IFLY_DOMAIN]];

_iflyRecognizerView.delegate = self;

//設定最長錄音時間

[_iflyRecognizerView setParameter:@"30000" forKey:[IFlySpeechConstant SPEECH_TIMEOUT]];

//設定後端點

[_iflyRecognizerView setParameter:@"3000" forKey:[IFlySpeechConstant VAD_EOS]];

//設定前端點

[_iflyRecognizerView setParameter:@"3000" forKey:[IFlySpeechConstant VAD_BOS]];

//網路等待時間

[_iflyRecognizerView setParameter:@"20000" forKey:[IFlySpeechConstant NET_TIMEOUT]];

//設定取樣率，推薦使用16K

[_iflyRecognizerView setParameter:@"16000" forKey:[IFlySpeechConstant SAMPLE_RATE]];

//設定語言

[_iflyRecognizerView setParameter:@"zh_cn" forKey:[IFlySpeechConstant LANGUAGE]];

//設定是否返回標點符號

[_iflyRecognizerView setParameter:@"0" forKey:[IFlySpeechConstant ASR_PTT]];

//設定音訊來源為麥克風

[_iflyRecognizerView setParameter:IFLY_AUDIO_SOURCE_MIC forKey:@"audio_source"];

//設定聽寫結果格式為json

[_iflyRecognizerView setParameter:@"plain" forKey:[IFlySpeechConstant RESULT_TYPE]];

//保存錄音檔案，儲存在sdk工作路徑中，如未設定工作路徑，則預設儲存在library/cache下

[_iflyRecognizerView setParameter:@"asr.pcm" forKey:[IFlySpeechConstant ASR_AUDIO_PATH]];

BOOL ret = [_iflyRecognizerView start];

NSLog(@"%d",ret);

}

#pragma mark - IFlyRecognizerViewDelegate

- (void)onResult:(NSArray *)resultArray isLast:(BOOL)isLast

{

NSMutableString *result = [[NSMutableString alloc] init];

NSDictionary *dic = [resultArray objectAtIndex:0];

for (NSString *key in dic) {

[result appendFormat:@"%@",key];

}

if (!isLast) {

self.searchBar.text = result;

NSLog(@"result = %@",result);

}else{

//每次返回的result都是你說的每一段話,當isLast=YES是,證明你已經識別完所有內容,處理邏輯

NSLog(@"result = %@",result);

}

如果只需要用科大訊飛自帶的語音識別的UI介面,以上程式碼就可以集成了!
由於我的專案是用到的不帶語音是識別的,所以下一篇,我會重點介紹不帶語音的,裡面還會加入有關麥克風許可權設定的問題處理辦法

有關整合科大訊飛sdk的語音(一)帶語音的介面

最近專案需要整合語音這塊,我選擇了科大訊飛的sdk,IFlySpeechRecognizer是不帶介面的語音聽寫控制元件，顯示介面的時候需要使用者進行自定義語音動畫介面,IFlyRecognizerView是帶介面的控制元件.我會分別介紹這兩種顯示. 帶語音的介面: #impor

有關整合科大訊飛sdk的語音(三)語音合成

有關語音合成的,廢話不說,直接程式碼 @property (nonatomic, strong) IFlySpeechSynthesizer *iFlySpeechSynthesizer;//語音合成 - (void)viewWillAppear:(BOOL)animated

有關整合科大訊飛sdk的語音(二)不帶語音的介面

不帶語音的就需要自定義語音識別時播放的動畫.在呼叫的時候我們需要先判斷麥克風的許可權. - (void)getUserMicrophonePermissions{ int flag; AVAuthorization

android 語音轉換文字（科大訊飛SDK簡易封裝）

簡介：本地講解的是科大訊飛開發平臺的語音轉換功能的整合方法和封裝準備工作： 1、首先申請平臺賬號，建立我的應用，新增語音服務，獲取Appid 2、下載建立的應用的對應SDK，這條很重要，每一個應用會對應一個SDK，用於做區分。構建專案： 1、首先將需要的元件.

ROS下使用科大訊飛SDK進行線上語音識別

以線上命令詞識別為例：主要步驟、易產生的錯誤其解決辦法如下： 1、下載SDK，解壓； 2、在ROS工作空間下建立一個Package； catkin_create_pkg xfei_asr roscpp rospy std_msgs 3、將SDK資料夾中的標頭檔案，即

整合科大訊飛語音聽寫功能

一、準備工作 1.建立應用，並獲取appId； 2.下載科大訊飛語音聽寫功能的jar包和so包（http://www.xfyun.cn/sdk/dispatcher）； 3.將jar包新增到libs中（記得libs的jar包右鍵Add As Library

呼叫科大訊飛API實現文字轉語音

#ifndef TRANSCODE_AUDIO_H #define TRANSCODE_AUDIO_H typedef void(*TranscodeCallbackFcn)(int, int, void*); extern int transcode_audio(const char *inAudio,

android 融雲 + 科大訊飛實現仿微信語音訊息轉換為文字（附DEMO原始碼）

融雲SDK 使用很方便，簡單配置就可以搭建即時通訊功能，配合科大訊飛的語音識別，即可實現微信中語音訊息轉換為文字的功能融雲sdk的基本使用就不細說了，網上很多資料使用融雲sdk自帶的聊天會話介面，想要在此會話介面上增加語音訊息長按時彈出 “轉換為文

FreeSWITCH 語音識別 ASR 介面介紹科大訊飛百度阿里雲等介面實現

FreeSWITCH 語音識別 ASR 模組最近很多人都對FreeSWITCH和ASR對接比較感謝興趣，我之前已經做了一個商業模組（商業模組請點選這裡http://www.dingdingtong.

總結一篇熱乎的【科大訊飛】SDK整合常見問題！

總結一篇熱乎的【科大訊飛】SDK整合常見問題！【離線喚醒】+【離線命令詞】近日，業務需要增加語音輔助功能到APP 上，於是就找到了2家比較好一點的SDK 【科大訊飛】和【百度語音】！先說說各自的優缺點吧！各位新入手的小白能稍微從我這裡得到一點資

C#調用科大訊飛離線語音SDK合成TTS

zha http post ref top 代碼來源內容 lib bin目錄下有msc.dll動態庫。c#調用科大訊飛的語音合成，需要引用該文件。該文件是C語言生成的dll，C#沒辦法直接引用。所有需要用C#重新封裝一個TTS.dll，然後再在C#項目中引用封裝的TT

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）

#用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）本人接的任務，做離線語音識別，用的是科大訊飛的離線識別，java不支援離線了，所以下載了windows的離線包，用JNA進行呼叫。之前用的是jni，但是一直沒有測試通過，本人又不會C++，研究了一個星期終究

使用科大訊飛最新版SDK在樹莓派上搭建語音識別服務

本人的SDK是2017年1月30號左右下載的，可以在http://www.xfyun.cn/科大訊飛官網註冊，選擇相應的Linux SDK下載。 1、因為最新版SDK不支援樹莓派了，所以要下載個RaspberryPi檔案來支援在樹莓派上使用： 2、解壓好SDK後，如圖。

科大訊飛語音sdk 在linux 部署報20021的問題

最近有個專案，使用了科大訊飛的文字轉語音sdk，在linux上部署的時候出現了些問題，主要原因就是找不到一個叫libmsc64.so的檔案，其實，對於這個問題，網上有很多資料，無非就是設定環境變數，告訴系統去哪裡查詢這個共享庫資源。這裡是官方資料地址：http://b

接入高德 SDK 遇到的問題 01：語音導航中科大訊飛線上語音合成次數限制

需求：採用高德導航SDK實現路線導航，並且實現語音播報導航問題：高德導航語音合成開發指南中，建議採用的科大訊飛線上語音合成存在次數限制，遠遠達不到生產環境的需求量解決：採用百度離線上語音識別 Android SDK 一、科大訊飛語音合成使用次數有限

Java 使用科大訊飛MSC SDK，在web服務端將文字合成語音，將pcm檔案轉為wav格式返回

本文講述的是使用科大訊飛MSC SDK將語文字合成語音，然後以web介面的形式把合成的音訊資料返回前端。流程 1、接收介面引數傳入的要合成的資料 2、使用MSC SDK把資料合成*.pcm檔案 3、獲取wav檔案格式頭 4、將格式頭與檔案內容拼接

Android 科大訊飛語音整合，文字轉語音

前言：記錄一下科大訊飛的文字轉語音功能的sdk的整合過程，希望能夠幫助到大家。 1. 登入官網，應用註冊。訊飛開放平臺，進行簡單的開發者註冊。進入個人中心，註冊應用。註冊完成後，我們可以看到自己的appid。選擇自己要開通的功能，然

ROS+科大訊飛語音=讓你的機器人能聽會說---（一）環境搭建與準備

概述 ROS介紹 ROS是是用於機器人的一種次級作業系統。它提供類似作業系統所提供的功能，包含硬體抽象描述、底層驅動程式管理、共用功能的執行、程式間的訊息傳遞、程式發行包管理，它也提供一些

科大訊飛語音整合,非常詳細的使用講解

訊飛語音開發整合地址解壓後的doc資料夾下的msc develop 檔案中有詳細整合步驟 AppId: 1.先要註冊開發者賬戶, 新增我的應用 , 下載sdk 2.下載後將sdk解壓, 把案例匯入工程中執行看看效果 3.將libs下的兩個jar包新增到libs目錄下

科大訊飛語音無限制錄音、識別功能的實現：Android studio(一)

最近想要做一款語音聽寫APP，在網上搜索關於如何使用科大訊飛語音的Demo少之又少，又或者是隻是單純的按照文件來實現簡單的語音聽寫，遠遠不能滿足需求，看了幾天的文件和自己搜尋的一些資料，還有這幾天中遇到的一些問題，覺得有必要做一個筆記，能給初學者一些

有關整合科大訊飛sdk的語音(一)帶語音的介面

如果只需要用科大訊飛自帶的語音識別的UI介面,以上程式碼就可以集成了!由於我的專案是用到的不帶語音是識別的,所以下一篇,我會重點介紹不帶語音的,裡面還會加入有關麥克風許可權設定的問題處理辦法

相關推薦

如果只需要用科大訊飛自帶的語音識別的UI介面,以上程式碼就可以集成了!
由於我的專案是用到的不帶語音是識別的,所以下一篇,我會重點介紹不帶語音的,裡面還會加入有關麥克風許可權設定的問題處理辦法