1. 程式人生 > >心有靈犀一點通——從『靈犀語音助手』漫談人工智慧的未來

心有靈犀一點通——從『靈犀語音助手』漫談人工智慧的未來

0 引子

最近看了一部有關人工智慧與人類產生情感以及倫理討論的電影《Her》,發現一個有趣的細節:


life

work

上面兩張圖是男主在家中和在工作是的場景,細心地你有沒有發現:電腦前面的鍵盤和滑鼠不見了!取而代之的是智慧語音助手之類的人工智慧工具。Incredible!暢想一下,當你坐在電腦前,只需要通過聲音告訴電腦進行打字、搜尋、購物、列印等等操作時,你是否會覺得雙手從此被解放了?

喬布斯個人肯定是很不喜歡鍵盤的,要不怎麼想把傳統的手機鍵盤扔掉重新定義智慧手機iphone?有人說,siri是個早產兒,喬幫主還沒來得及將她做得完美就生了下來,我猜想,一向崇尚極簡主義的喬幫主生前應該有這樣一個夙願:徹底丟棄那些煩人又佔空間的傢伙,以語音互動替代傳統的鍵盤滑鼠互動。

隨著亞馬遜首次推出智慧音箱Echo,蘋果緊隨其後推出智慧耳機airpods,這簡直就是對電影的場景重現!

1 市場分析

人工智慧到底離我們有多遠?又會以怎樣的形式改變我們的生活呢?

先讓我們來看一組資料[1]:


市場規模

左上圖顯示中國人工智慧市場規模的變化趨勢,AI市場增長率保持高速增長,預計2018年市場規模將達到200億;右上圖為中國語音市場的市場規模變化情況,從2013年到2015年有所回落,2015年後增長率趨於穩定增長的態勢。智慧語音佔據整個人工智慧市場的比重也越來越大。

這並非偶然,智慧語音技術的成熟使商業化應用成為可能。深度學習、高效能運算和大資料迅速發展,推動語音技術從實驗室走向工業界,目前語音識別的準確率最高可到97%



語音識別的準確率

語音互動將成為人工智慧的入口。國內外IT巨頭紛紛入局,谷歌、蘋果、微軟、亞馬遜、Facebook、三星、阿里、百度、騰訊、華為、科大訊飛等等,國內也陸續出現了思必馳、雲知聲、出門問問、聲智科技、三角獸、驀然、Rokid等創業公司,智慧語音市場頓時火熱。


AI產業鏈

2 產品選擇

縱觀國內智慧語音助手市場,靈犀語音助手是普通話綜合識別率最高的智慧語音軟體,也是國內市場佔有率第一的中文語音助手[2]。靈犀語音助手由中文語音領導者科大訊飛和中國移動聯合推出,特別針對中文口音問題進行識別優化,曾獲得第67期豌豆莢設計獎。

截止到目前為止,靈犀語音助手在Android市場的下載量超過4.9億[3],在IOS系統由於有siri的把持未能被廣泛使用,蘋果的封閉性也導致無法獲取其下載量等資料。


靈犀語音助手安卓市場下載量

3 產品分析


靈犀語音助手

本人在兩個系統上分別下載了Android-5.0.2910和IOS-5.0.1724版本進行體驗,下面將從使用者體驗五要素的角度來分析『靈犀語音助手』這款產品。版本之間的差異很小,有明顯不同的地方將特別指出。

3.1 戰略層

靈犀語音助手的SWOT分析


SWOT分析

產品定義
“靈犀語音助手”是基於無處不在的網路和豐富的網際網路內容,結合前沿的智慧語音技術,為廣大移動手機客戶提供“所說即所得”的一站式智慧語音服務。集通訊服務、出行指南、生活服務、音樂服務、上網服務與閒聊服務一體的應用軟體。

產品目標:產品本身不收取任何費用,旨在吸引新使用者,培養使用者習慣,增加使用者黏度;為其他生活服務如火車票、機票、美食、酒店、影院、聽書提供接入口。語音助手不同於輸入法等純工具類的產品,是最具成長為入口潛力的產品。將其當成戰略性產品發展,增長並保持使用者,再誘導使用者進入更有商業價值的入口,增強市場影響力,從而上升到堅不可摧的地位。

使用者需求

  1. 快速便捷地使用手機;
  2. 獲取最新資訊和資訊;
  3. 獲得生活和娛樂服務。

使用者群體分析
截止2016年12月,我國網民規模達7.31億,手機網民規模達6.95億[4],網民對網路的需求和對於生活便捷的追求,使得目標受眾廣大,散佈各行各業。
使用者群體特徵:

  1. 10~60歲,以18~38歲的青年、中年為主體;
  2. 使用者職業的構成比例多層次化,涉及各行各業;
  3. 熱愛嘗試新鮮事物的人群。

3.2 範圍層

產品主要功能:

  1. 基礎的手機功能呼叫,如打電話、發簡訊、設定提醒、語音筆記、開啟應用等;
  2. 個性化的網際網路服務,如搜尋、翻譯、查天氣、查話費、找餐館、訂車票、問路、打車、聽電臺、聽書等;
  3. 人性化的聊天服務,支援人機簡單互動聊天。

3.3 結構層


靈犀語音助手結構圖

分析靈犀語音助手的結構圖,給我的第一感覺是:全而不精。功能過於龐雜,讓人眼花繚亂找不到重點,就像簡單的功能堆砌,難免給人粗製濫造的感覺。

這很中國移動。

3.4 框架層

  • 主頁的頁面佈局及資訊設計


    主頁
    • 聽書頁面佈局及資訊設計


      聽書
    • 語音互動頁面佈局及資訊設計


      這裡寫圖片描述
    • 個人資訊頁面佈局及資訊設計


      個人資訊

3.5 表現層

靈犀語音助手的logo是一個白色背景的藍色語音圖示,整個APP以深粉紅為底色,鮮豔醒目。開啟後主頁和支付寶主頁很相似,突出語音助手作為主要是工具的價值。下面一直滑動的廣告給使用者的視覺造成一定的衝擊,分散注意力,體驗不是很好,聽書推薦怎麼也放到主頁了?建議放到聽書欄,主頁儘量簡潔明瞭,常用功能放在中間位置。

聽書模組我都想不吐槽了,給人的感覺就是網頁直接嵌入APP中,導航顏色也不和諧,節目五花八門,沒法找到重點,很難集中注意力。建議選取優質的節目好好運營,而不是一味堆砌,好的產品用來滿足大部分人的品味而不是所有人的品味。

不要過度依賴沒有網際網路思維的電信運營商,需求至上,體驗是關鍵。

4 總結與展望

語音是最簡單、最自然的互動方式,也是人類溝通最基本的方式,我相信未來一定會取代鍵盤和滑鼠,提升工作效率解放雙手,成為人工智慧的市場入口。但是,現在的語音互動實際上都是語音控制,這個階段我們真的很難讓計算機理解人類語言。在這個前提下,真正的多輪對話實際上很難做到,當前更多的是解決基於場景的搜尋問題。

如果語音只是入口,那麼人工智慧的未來在哪裡?在智慧家居?在智慧車載?在智慧可穿戴?

期待今後與你一起探討,見證這個偉大時代的到來。

→彩蛋←

AI相關影視作品:

超體
超驗駭客
Her
機器人與弗蘭克
黑客帝國
復仇者聯盟2:奧創紀元
超能查派
人工智慧
機器人大爺
史賓機器人
機械公敵
機器管家
機械姬
環太平洋
邪惡機器人
鐵甲鋼拳
機器人總動員
明日邊緣
西部世界(美劇)
傳世(美劇)
黑鏡(英劇)