1. 程式人生 > >泡沫下的破浪者,智慧語音產品到底落地何處?

泡沫下的破浪者,智慧語音產品到底落地何處?

開發十年,就只剩下這套架構體系了! >>>   

前言:

如今的科技在各個方面的發展都非常的迅速,越來越多“不切實際”的幻想也在被實現!而作為現代人資訊獲取以及溝通需求最為方便快捷的路徑-智慧語音,這條路就擺在我們面前。

演講嘉賓:
盛京,阿里雲達摩院-機器智慧技術專家

達摩院語音組成立於2014年,具有語音識別、語音合成、聲紋識別、自然語言處理、語音互動等等的能力。

以下內容根據演講嘉賓視訊分享以及PPT整理而成。

本次主要內容分為四部分:
一.公共雲方案
二.智慧語音本地化部署方案
三.智慧互動大屏
四.語音自學習平臺

一、公共雲方案

在公共雲方面,服務於集團34個BU,107個業務,包括手淘、支付寶、菜鳥、釘釘、口碑、高德、UC、優酷土豆、天貓精靈等;除了內部外,還有映客直播、一號互聯等使用者。

從2014年手淘上線後,我們的語音識別覆蓋了各種各樣的場景。這裡面有單純的手機APP,也有車載,包括18年的時候,包括地鐵通過語音購票、甚至最新款的汽車。

給大傢俱體介紹下,服務於客服方面,我們是如何利用智慧語音能力的? 

在智慧客戶領域,我們兩個最典型的的案例就是支付寶95188和菜鳥的1518。
支付寶是一個呼入的場景,他是一個電話的、智慧的客服。大家如果有打過支付寶電話的一定知道,打完之後,電話另一方會說“請用一句話來描述您的問題”。這時候您可以說:“我的密碼忘了”,這時候會有機器人和你對話,告訴你具體的方法。這個就是支付寶電話客服的應用場景。

那麼撥出場景,就是菜鳥的智慧語音助手,去年雙11的時候,我本人就接到過菜鳥打來的電話,他會說:先生,您的某某快遞放在小區的蜂站了。如果您說可以,他會禮貌的掛機;如果您說不可以的,他會問你:先生,您什麼時候在家,我會把快遞給您送過去等等。

這兩個應用都節省了大量的人力,在雙11時,支付寶智慧客服自主率達到了97%;菜鳥機器人替200W快遞員打電話。在過去11快遞員工作主要就是打電話,現在通過菜鳥助手,就能解決絕大多數問題。

二、智慧語音本地化部署方案

除了剛剛介紹的公共雲的情況,我們在本地化部署上也有很多應用的場景。
我們提供的主要是一套軟體,有能力的開發公司可以把我們語音的能力整合到你們的產品中,這樣我們可以共同深入打造各行各業各個場景下的解決方案。
我們提供的能力包括 語音識別、語音合成、MRCP、防串音、最重要的還有語音自學習平臺。

我們最主要的是聚焦於語音的核心能力,緊靠行業夥伴,我們是一起打造產品的。
我們和友商的區別主要是:友商做語音產品都是端對端的,所有東西都是自己做;而我們只做最核心的,語音識別或者語音合成。然後把能力開放出來,讓合作伙伴基於這樣的能力來做各種各樣的應用。

我們本地化部署方案的標杆是有:智慧法院的一個解決方案,目前我們深度合作了法院領域頭部的ISV,包括了華宇、雲嘉等等。

我們標杆案例有浙江高院、福建高院等等,覆蓋了300家法院,有超過1萬家法庭應用了我們語音識別。

這是我們在法院的一些場景,所做的一些事情。同時全國的幾大網際網路法院,包括第一家杭州網際網路法院,北京、廣州網際網路法院,用的都是我們的語音識別。

在智慧客服領域,我們聯合阿里小蜜,和ISV為中國移動、中國平安做了智慧電話機器人、外呼以及金牌話術。

金牌話術還是要再提一下,在客服領域,不同人的交流溝通能力也不一樣的,反饋到結果上就是有的人業績比較好,有的人差一些。我們金牌話術要做的就是:基於客服和客戶的聊天,來把溝通弄技巧挖掘出來。每當你和客戶交流的時候,就會提示你應該怎麼說,應該做什麼樣的引導。

三、智慧互動大屏

除了剛才介紹的客服和司法,我們還有達摩院全球首創多模態語音互動方案,能夠實現在強噪音環境下的免喚醒人機互動。
比如說在公共空間,地鐵購票、肯德基點餐,都能夠通過我們這套解決方案實現人機互動,我們這個產品的優勢,就是強噪音語音環境下的語音識別、同時免喚醒、以及長句子的流失理解。
這套語音互動產品模式就是:我們提供軟硬體一體的套件,再加上定製的外殼,我們有一個官方標準的,合作伙伴也可以根據各種需求來定製,之後我們就可以對接到客戶的系統裡面。
這時候就能有各行各業的應用,比如對接客戶的支付系統。圖書管理系統、導航系統。

這套方案的標杆案例就是:上海地鐵語音售票機。
• 2018年3月已正式落地上海南站和漢中路地鐵站
• 全球第一臺地鐵語音售票機
• 在地鐵真實嘈雜環境下語音識別準確率超過96%

上海地鐵語音售票機介紹視訊點選播放

四、語音自學習平臺

最後我們來介紹下—語音自學習平臺
之所以提供語音自學習平臺,是因為我們在與客戶接觸中,聽到客戶很多對語音識別的建議。首先語音識別是一個非標輸出的軟體,部署到客戶現場的時候,可能由於麥克風、口音等等,導致識別率不好;或者領域不匹配,比如客戶有一些專業的用語,我們自己的模型可能覆蓋不到。

所以我我們提供了語音自學習平臺。獨特優勢主要在於:可以通過自助來新增語料的方式來進行優化,可以輸入詞、句子、篇章,具備分鐘級的訓練速度,而且操作很簡單,可以一鍵式完成。
語音自學習平臺主要包括三部分:

泛熱詞
北京女子圖片→北京女子圖鑑

類熱詞(人名、地名等)
原告以不應選公司→原告與布衣軒公司
我們可以看到,如果你不做任何的優化,很容易出現各種混淆錯誤。

定製化語言模型
提供的是整個的篇章,比如說有些公司有內部的材料,比如說客服行業,我們可能有一些產品介紹、文件之類的,都是長篇的文字,我們就可以定製化語言模型來優化。

以上就是我們今天講的主要內容,大家如果有興趣可以持續關注我們!

下面是我們的QA環節:

1. 語音產品收費
公有云都是支援免費試用的,按照文件一步步操作,就可以建立自己的語音識別程式。
點選試用
2. 我們語音有哪些型別?
a) 實時語音識別:實時反饋結果
b) 一句話識別:應用在搜尋的場景下
c) 錄音檔案轉寫:相較於實時語音識別,速度很快

3.教育行業有哪些語音場景?
在過去,我們無法落實每堂課的知識點,如果有了智慧語音,我們可以把老師講的內容全部轉成文字,再通過一定的質檢規則來判斷老師是否做到位了;同時類似於兒童學英語行業,口語評測之類的也會有一些需求。

相關連結:

PPT地址:敬請期待
產品地址:https://ai.aliyun.com/nls
上海雲棲大會主論壇孫權現場直播連線上海南站
點選觀看語音點餐機介紹視訊
點選觀看真機演示視訊

相關推薦

泡沫智慧語音產品到底落地何處

開發十年,就只剩下這套架構體系了! >>>   

Javascript中的號~其實就是位操作符取反操作

JavaScript中的取反位運算子:~js中的數字預設是有符號的。有符號的32位二進位制的最高位也就是第一位數字代表著正負,1代表負數,0代表整數為什麼要用補碼?,計算機內部就是以補碼存儲。(負數的補碼規則:符號位不變,其他位取反加1;正數的補碼規則:就是其本省)~-1返回

盤點麥克風技術及市場智慧語音識別系統選型麥克風

智慧語音互動市場的火熱逐漸輻射到產業鏈的供應商,其中最直接受益就是作為聲音的感測裝置——麥克風。特別是麥克風陣列的興起,未來可以讓麥克風廠家的銷量翻倍增長。在此之前,由於受制於智慧手機和平板電腦的增長速度下滑,樓氏、歌爾和瑞聲,中電麗聲等麥克風廠商的股票相繼在2016年中

物聯網IoT技術應用智慧社區如何做到安全與智慧並存

物聯網 人力 alt 通信 src 雲計算 攝像 defined 做到 社區作為城市發展最基本的組成部分, 如何利用物聯網讓社區實現智慧化?智慧社區從功能上講,是以社區居民的安全為核心,用現代化手段讓小區獲得“智慧”。那麽,如何讓智慧社區做到安全與智慧相結合呢?

人工智慧趨勢智慧物流核心技術有哪些?

在電子商務風起雲湧的當下,物流已經成為當下生活不可缺少的重要部分。那在人工智慧趨勢下,智慧物流的核心技術與當下趨勢,是怎樣的? 智慧物流的主要技術分析 1.自動識別技術 (1)自動識別技術以計算機、光、機、電、通訊等技術的發展為基礎的一種高度自動化的資料採集技術,通過應用一定的識別裝置,自動地獲取被

移動端網頁錄音上傳服務端智慧語音識別

移動端網頁錄音上傳,服務端智慧語音識別 最近,看了創業時代的魔鏡,想法突如起來,能不能手機發送一條語音,語音上傳到後臺,自動識別語音的資訊,轉化為文字,將文字分析,然後回覆使用者豔學網的資源。 我們的資源以原始碼為主,一起編集豔學情緣。我們不僅分享原始碼 http://47.98.2

“搶佔心智”水土不服智慧營銷3.0局車市營銷?

文|曾響鈴 來源|科技向令說(xiangling0815) 佔領使用者心智——定位大師特勞特推崇的營銷理念,時至今日頗受市場的歡迎,以各電視臺、分眾傳媒等為代表,廣告公司、諮詢公司、企業主紛紛參與實踐,也取得了不錯的營銷實踐效果。 但是,一些垂直領域的營銷實踐參與者卻有自己的看法,

深圳開發智慧語音機器人找oem搭建是您的不二之選

        深圳智慧語音機器人,oem搭建是您的不二之選,隨著人工智慧的發展,越來越多的企業開始選擇採用智慧語音機器人,來減輕人工的壓力,更好的服務客戶,提高效率。         科技革新智慧化浪潮來襲,如智慧家居

自動駕駛之後智慧城市成為巨頭們的一個爭奪賽點!

近日,百度與長沙市人民政府、湖南湘江新區管委會達成全面合作,雙方將依託百度Apollo平臺生態資源和長沙智慧網聯產業基礎,共建“自動駕駛與車路協同創新示範城市”,將長沙打造為自動駕駛之城。業內人士表示,百度和長沙的合作然智慧城市初顯輪廓。在此之前,百度已經與保定、蕪湖、青島、

思必馳釋出AI晶片透視智慧語音企業的商業化歷程

2019年1月4日,言由芯生——2019年思必馳AI晶片暨戰略釋出會在京舉行。現場,AI晶片作為重頭戲展示了其低功耗、高效能的核心優勢,同時,思必馳多視角解讀了2018年所取成果,並公佈了2019年戰略路線,在車載和家居場景外,推出新場景方案。開放共贏,思必馳用AI語音的商業化落地推進著這場智慧

阿里雲釋出智慧語音自學習平臺零基礎訓練人工智慧模型

摘要: 業務人員甚至門衛大爺也能訓練人工智慧?曾經只出現科幻電影中的一幕真的發生了。7月18日,阿里巴巴機器智慧技術實驗室宣佈在阿里雲正式釋出智慧語音自學習平臺公有云產品,突破性地提供一鍵式語音智慧自助優化方案,使得語音識別優化不再依賴於語音供應商的專家服務,讓不懂技術的人員

新基建智慧交通發展新規劃:智慧隧道監控視覺化系統

前言 隨著當代經濟的發展,交通環境日益緊張,加上山區地區的交通運輸的需求,隧道的交通建設開發方興未艾。隧道交通的規劃越來越完備,而對於隧道內監控管理維護卻顯得有些不足。而工業4.0的崛起,逐步進入了智慧化的新時代,伴隨著工業網際網路的新興力量,工控視覺化系統應運而生,不僅能起到日常的監控管理維護,在發現事故或

Android PullToRefresh 拉刷新上拉很多其它支持ScrollViewListView可方便拓展GridViewWebView等

包含 ict 重置 refresh 分享 .com img tar fcm 在寫著東西之前。從網上找到非常多這方面的源代碼,可是基本沒有找到愜意的。包含在GitHub上的比較有名的Android-PullToRefresh-master。思來想去還是自己寫吧。當然當中借

uploadify在chrome初始化失敗在Firefox卻可以原因探析

報錯 logs .com log 其他 原因 初始化 -1 參考 如果沒有報錯,在其他瀏覽器下沒問題,那就只有一種可能:瀏覽器flash加載失敗,解決辦法是,更改瀏覽器對站點flash的設置。參考下圖: uploadify在chrome下初始化失敗,在Firefox下卻

與立且看傳統餐飲如何走好轉型之路

實現 網信 適應 src 依靠 大發 導致 互動 訂餐 自2013年網絡訂餐APP進入城市居民的生活開始,眾多第三方外賣平臺紛紛湧現,大街上隨處可見各類狂奔的送餐“騎士”,美團、餓了麽、百度外賣等網絡訂餐APP已經成為人們手機裏的常備APP。與此同時,網絡訂餐也開始成為人

改進Vim體驗:在插入模式移動光標我不要用方向鍵!alt快捷鍵使用技巧!

targe 判斷 映射 tar 什麽 nbsp .vimrc 一次 time 改進Vim體驗:在插入模式下移動光標,我不要用方向鍵!alt快捷鍵使用技巧! 大家都知道,我們在插入模式下編輯代碼的時候 若想寫完這一部分後,移動到鄰近的一部分,如下一個單詞的後面,是很復雜的

robotframework 判斷拉框是否存在如果存在就執行拉框操作不存在就跳過執行拉框操作進行一步操作;

新頁面 存在 robot sel log 是否 work val image #本人新手,僅做學習記錄之用 因為工作要求,打開的ui頁面,根據前面篩選的條件不同,跳轉的新頁面不同,本記錄涉及的就是有下拉框和沒有下拉框,所以要對新打開的頁面進行判斷;run keyword

小豬CMS線沙龍完美閉幕開啟合作共贏新征程!

小豬CMS 線下沙龍 小豬CMS線下沙龍完美閉幕,開啟合作共贏新征程! 2017年6月13日,小豬CMS線下沙龍交流會在中國·合肥隆重召開。來自全國各地的互聯網創業者、小豬智慧店鋪代理商客戶們濟濟一堂,共同學習和探討移動互聯網趨勢下,行業如何實現經營模式轉型、高效開展業務,以及門店如何快速

linux清理緩存以釋放內存

無奈 inux 程序 釋放 trie linux 目錄 打開 nbsp [[email protected]/* */ src]# free total used free shared buff

vue2 mint-ui loadmore(拉刷新上拉更多)

eat move ott 上拉更多 line col pst first pin <template> <div class="page-loadmore"> <h1 class="page-title">Pull u