ROS實戰(一) 語音互動系統的學習:初步瞭解語音互動流程
前言
雖然說目前語音識別,合成這塊技術已經很成熟了,沒什麼可以拓展的地方了,但是還是想自己實現一下在ros下進行語音識別以及熟悉整個流程,感覺還是挺cool的。
目前這塊屬科大訊飛和百度語音這兩公司做的不錯,不過還有其他的一些比如:思必馳,捷通華聲,雲之聲,圖靈OS等
ros下的語音互動系統,原生態的主要是支援的一個叫cmu sphinx,
支援多種語言,英語和德語都是支援的。
比如蘋果手機的siri,它主要是Nuance公司來做的,應該是目前語音這塊最前端的公司了,
還有一個叫festival,它是lincx可以簡單實現的一個語音互動系統,它是由愛丁堡大學開源的,測試也很簡單
還有Ekho(餘音)是一個免費、開源的中文語音合成軟體。它目前支援粵語、普通話(國語)、廣東臺山話、詔安客語、藏語、雅言(中國古代通用語)和韓語(試驗中),英語則通過eSpeak或Festival間接實現。Ekho支援Linux、Windows和Android平臺。
介紹完國外的,下面來介紹國內的,國內的語音識別技術如下:
NLU以前叫NLP,其實是一個東西,叫做自然語言處理(natural language process)
語音喚醒
百度語音喚醒
科大訊飛語音喚醒
語音喚醒(VoiceWakeuper)通過辨別輸入的音訊中特定的詞語(如“訊飛語點”),返回被命中(喚醒)結果,應用通過回撥的結果,進行下一步的處理,如點亮螢幕,或與使用者進行語音互動等。喚醒資源中含有一個或多個資源,只要命中其中一個,即可喚醒。需下載使用對應的語音喚醒SDK。
語音聽寫主要API呼叫流程如下圖所示:
思必馳 收費
像如上所述的語音識別方面的公司都提供線上體驗功能,感興趣的可以登入其官網體驗一下。效果還是不錯的。
語音識別ASR
百度線上語音識別
科大訊飛線上語音識別ASR
雲之聲線上識別ASR
語義理解
圖靈機器人 免費線上使用5000次每天
雲之聲 線上體驗
科大訊飛 免費線上使用體驗
捷通華聲(靈雲線上體驗)
語音合成TTS
科大訊飛語音合成TTS
雲之聲
百度線上語音
捷通華聲
接下來的教程會逐漸把這些語音互動流程與ros結合起來,並且在ros上實現。比如語音合成啊,語音識別啊,語義理解啊,讓機器人也具備語音互動功能。
相關推薦
ROS實戰(一) 語音互動系統的學習:初步瞭解語音互動流程
前言 雖然說目前語音識別,合成這塊技術已經很成熟了,沒什麼可以拓展的地方了,但是還是想自己實現一下在ros下進行語音識別以及熟悉整個流程,感覺還是挺cool的。 目前這塊屬科大訊飛和百度語音這兩公司做的不錯,不過還有其他的一些比如:思必馳,捷通華聲,雲之聲,
Linux系統集群架構線上項目配置實戰(一)
linux 項目 實戰 Linux系統集群架構線上項目配置實戰(一)本文出自 “民工哥博客” 博客,請務必保留此出處http://mingongge.blog.51cto.com/2429897/1971210Linux系統集群架構線上項目配置實戰(一)
zookeeper實戰(一) - win系統安裝
下載地址 https://archive.apache.org/dist/zookeeper/ 選擇一個不是太新的也不是太舊的版本,那就是zookeeper-3.4.9吧^_^ 安
Django在OS X下的程式設計實戰(一)構建一個部落格系統
廢話少說,直奔主題,你要做事之前需要有一臺電腦,最好是Linux或者OS X,因為我在Macbook pro下工作,所以至少這裡的命令都在OS X下執行通過的。所有程式碼都是單獨一行方便你拷貝。Python程式碼會有>>>的提示,除此之前,沒有特別提示都是
SSM專案實戰(一)--- 高併發秒殺系統之DAO層
專案為慕課網上 搞定Java SSM框架開發的綜合案例–實現一個秒殺系統案例。 1.首先搭建專案 使用Maven構建來管理依賴項,pom.xml檔案: 此pom.xml可作為大多數ssm專案依賴的參考 <project xmlns="http:
ROS實戰(二) 科大訊飛語音合成模組
一.前言 繼上篇部落格的內容,下面主要介紹科大訊飛語音合成模組: 主要分成是三部分講解. 二.註冊科大訊飛平臺賬號,下載linux版本線上語音合成模組SDK 下載好的檔案如下: 解壓到當前資料夾: unzip xxx.zip -d
ROS專案開發實戰(一)——STM32與ROS串列埠通訊
序 本文主要釋出一些作者從零開始開發ROS的專案實戰經驗,包括一些經驗與本文遇到坑時的解決方案,ROS因為版本不同與開發環境不同在實際開發中會遇到各類問題,下面就細細道來。一、環境搭建 本人開發環境 ——上位機:MAC主機+PD虛擬機器+Ubuntu12.04(6
Java電商支付系統實戰(一)- 簡介
現如今,支付成為熱點 對於電商業務,這都是不可或缺的 核心功能剖析 下單-》支付 nginx 將使用者請求反向代理到我們編寫的電商系統 = 下單 之後,點選支付跳轉到支付系統,最後對接 通過跳轉將業務和支付解耦,不管電商系統,還是新增的活動系統都可調支付系統 支付結果通知 本教程側重 電商經
Spring 事務配置實戰(一):過濾無需事務處理的查詢之類操作
log pla ssi pan spl tail gif aop img <tx:advice id="txAdvice" transaction-manager="transactionManager"> <tx:attributes
RabbitMq 實戰(一)
rabbitmq spring boot (消費者處理消息)RabbitMq消息消費者服務 開發工具Idea和Spring boot來開發的。消息消費目前只是一個簡單的Demo,後續會處理成更智能一些。首先配置文件類,RabbitMqConfig,裏面配置一些用戶名和密碼嗨喲隊列信息。package com.
Wicket實戰(一)概述
rac span 下載 本質 jsf xtend 公式 href tar 今天給大家介紹一個很好的東西。一個被稱作Java平臺上的ASP.NET——Wicket。 什麽是Wicket 什麽是Wicket,假設你用谷歌或其它
自己搭建自動化巡檢系統(一) 環境準備系統連接gns3
自動化 巡檢 這系列的博文,講述一個自制的自動巡檢系統,僅僅是在cisco設備中運行,之後會基於這個思路,寫出一個兼容性的通用巡檢系統,傳統網工對網絡設備是非常熟悉的,然而在編程開發這一塊是相對弱勢一點。我在想在SDN的背景下,網工一旦會編程,該有多麽強勢,一些重復執行的步驟,電腦代勞,
機器學習實戰(一)—— 用線性回歸預測波士頓房價
-1 png 機器學習 mage 回歸 線性回歸 blog 分享 機器 機器學習實戰(一)—— 用線性回歸預測波士頓房價
全棧性能測試修煉寶典--Jmeter實戰(一)
div 測試用例 ceo 上下文切換 知識 能力 熱點 mongo rac 性能測試方向職業發展 1、軟件測試發展路線 我們可以暫且把軟件測試職業路線分為3個方向,分別是業務路線、技術路線、管理路線;4個象限,分別為執行層、中層、中高層過渡、高層。 (1)業務路線
mmall 項目實戰(一)項目初始化
ant log 初始 post gpo using base inno ole 1.創建 數據庫 及 表 數據腳本: /* Navicat Premium Data Transfer Source Server : 182.92.82.1
Docker從入門到實戰(一)
roc serve net lin 軟件 系統調用 生命 etc before 一步一步走,寫小白都能看懂的文章,將持續更新中,敬請期待! Docker從入門到實戰(一) 一:容器技術與Docker概念 1 什麽是容器 容器技術並不是一個全新的概念,它又稱為容器虛擬化。虛擬
(一)Zabbix監控系統
。。;‘隨著雲計算和互聯網的高速發展,大量應用需要橫跨不同網絡終端,並廣泛接入第三方服務(如支付、登錄、導航等),IT系統架構越來越復雜。快速叠代的產品需求和良好的用戶體驗,需要IT運維管理者時刻保障核心業務穩定可用,而企業運維中的痛點和難點也急需解決。 1、面向業務的運維,不但關心單點IT資源的運行狀態,
MySQL數據庫從入門到實戰(一)
DBA體系 mysql 非關系型數據庫 SQL優化 第一部分:了解DBA體系一、初級DBA應該掌握哪些技能?(運維人員必會知識)1.MySQL安裝部署2.基本參數配置3.備份策略設計與實現 二、中級DBA應該掌握哪些技能?1.故障處理能力(備份或者其他手段)2.MySQL監控能力3.基本優化能
自動化運維工具Ansible實戰(一)簡介和部署
Ansible 自動化運維 一、Ansible的介紹 Ansible是新出現的自動化運維工具,基於Python開發,集合了眾多運維工具(puppet、cfengine、chef、func、fabric)的優點。實現了批量系統配置、批量程序部署、批量運行命令等功能。Ansible是基於模塊工作的,本身沒
Android項目實戰(一): SpannableString與SpannableStringBuilder
append() 同時 uil 註意 1.5 查看 strong 尊重 bject 原文:Android項目實戰(一): SpannableString與SpannableStringBuilder前言: 曾經在一些APP中的一些類似“幫助”&ld