人機交互,加速機器人擬人化
人機交互簡單來說,就是“人和機器打交道的方式”。人和計算機打交道根源於人類把計算機當成一種有效的計算服務工具。計算機自產生以來,計算能力日益強大,人類對計算機的態度也開始在計算機只是呆板的“機器”,還是可能變得像“人”一樣聰明,甚至比人更聰明之間搖擺。這種模糊的態度伴隨著計算機的進化不斷演變。隨著深度學習技術的崛起,進一步加速了這個進程。人與機器人指尖的交流也逐步從指令交流轉向情感交流,而在這種交互的進化過程中,也伴隨著一些難題與挑戰。
百度為2018人工智能創意賽集訓營邀請了百度AI交互設計院體驗架構師李士巖,為你解答這些難題的解決方案。
機器人和人機交互體驗需要重構
圖一: 1921年捷克劇作家卡爾·恰佩克(Karl Capek)在名為《羅素姆萬能機器人》(Rossums Universal Robot)的戲劇作品中創造了“robot”(機器人)這個名詞。這個詞源於捷克語的“robota”,意思是“苦力”。
第一個問題是語音交互喚醒不夠自然,每次的發出指令前必須有一個喚醒的方式,這樣使得使用機器人的效率非常非常低,比如在家裏面用支持語音的智能電視看電視的時候,要不停地通過喚醒輸出指令。
第三個問題是目前機器人依然不夠主動。經過調研發現有85%的用戶對機器人的主動交流有明確的期待,但目前機器人連怎樣主動交流不知道。這三個問題使得用戶逐步喪失了對機器人的信心,使得機器人不再具有很強的吸引力,這種情況下一定要重構機器人人機交互體驗。所以今天跟大家介紹機器人自然情感任意交互模型。
Frequency Percent(%)
非常不需要 73 6
一般 393 32.5
比較需要 347 28.7
非常需要 287 23.7
Total 1209 100
表一:85%的用戶對主動交流有期盼
自然情感語音交互模型
機器人自然語音交互模型是機器人使用傳統的語音的原創交互模型,它具備三個維度:
第一個維度是喚醒。服務機器人與人進行交互的時候,大部分場景是鏡像交互。所以我們設計了新的進場模型,第一個節點是距離檢測,第二個節點是人臉鎖定,第三個節點是唇動檢測:檢測到用戶正在與機器人對話時,會自動開啟語音交互的流程。
圖二:近遠場的喚醒檢測方式
第二個維度用戶的情緒應對模型,人機交互發展幾十年裏,機器人的IQ取得了巨大的進步,而機器人的EQ一直沒有得到發展,而情感是人類的剛需。當兩個產品的IQ差不多時,一個更具情商的產品一定是更具市場競爭力的。機器人的EQ包含兩個部分,一部分情緒的識別,一部分情緒的應對。關於情緒的識別,我們用東方人的情緒面部數據進行訓練的適合東方人的情感識別系統。比如你很開心的跟智能音箱說給我放一首歌和很悲傷的說跟我放一首歌結果應該是不一樣的。
在附帶情緒任務的悲傷場景下,機器人回饋的語音語調應該是具有同樣的悲傷的情緒,而策略應該是先完成任務後安撫情緒。在負向情緒的化解這個維度,語音語調也是悲傷,但是策略是先安撫再引導任務。通過這種方式,我們能夠使得機器從不關心人類的主觀情感變成對每一種情感都有個性化應對方式,這種策略可以賦予機器情商。
圖三:賦予機器情商的方式
第三個維度是機器人的主動交流模型,主動交流的難度在三點。1. 要根據場景,語氣程度和會話形式,而什麽場景下機器要主動交流,並且不侵犯用戶的隱私。主動交流到什麽程度也是一個值得考慮的問題,過分主動的機器人往往會給用戶造成幹擾,而完全不主動的機器人,通常讓用戶覺得不夠智能。通過試驗發現家庭場景中更適合主動交流,而公共辦公場景下會不一樣,所以主動交流的程度是和用戶的註意力承負相關關系。並且表達方式和場景有密切的關系,所以每個場景下主動交流的方式是不一樣的。
圖四:主動交流的程度是和用戶的註意力承負相關關系
通過一系列的設計我們可以為機器由被動接受指令到主動交流指名一個方向。在百度的NIRO(Nature Language · Initiative Interaction · Emotion Reflection · Origin Models)中每個模型分為三個層次,人類情景包括識別層、策略層和表現層,機器人主動交流模型包括輸入層、策略性和主動層。服務機器人另外一個在行業內重大的問題是怎樣讓服務機器人低成本的進入到廣域智能,機器人的生存環境是人類的生存環境。比如打開一個門,進入並操作一個電梯,清理一個障礙物對人類很容易,但是對機器人非常難。目前的解決方案把大廈裏每一個門換成電動的門,一扇電動門可以跟機器人系統進行數字交互。若想讓機器人清理障礙物,需要給機器人安裝昂貴的機械手臂,這些情景都阻止了機器人向真正的廣域場景和大規模的應用。那我們的解決方式是什麽?我們的答案最佳方式是協同智能。
協同智能
協同智能的時代是非常美好的,在未來機器低成本的,利用NIRO人機交互的設備,可以讓機器人產品快速進入智能時代。在科技發展每一個階段,都會出現一些代表性的產品,比如PC可以作為遊戲機、打字機,比如手機可以作為指南針、MP3、照相機,而在人工智能時代我們認為這個產品是機器人。機器人與前者們出現的邏輯極其相似,都是以技術為基礎,並且通過技術設計人機交互模型,將人機交互模型應用到更多產品。比如說應用了觸屏的技術,打造了交互模型,將交互模型應用到平板電腦、手機、桌面型的設備才造成移動端的繁重。人機交互模型的設計需要不僅僅是技術,還有創意,現在AI技術有了大的技術的提升,這部分更需要創意和技術融合在一起。
圖五:Niro可以給機器賦能協同智能
----實錄結束----
李士巖
百度AI交互設計院體驗架構師。曾主導百度智能路由器、百度智能家居操作系統、Duwear智能手表人機交互系統、Jarvis智能語音管家等產品的人機交互設計,擁有多個世界和中國發明、外觀專利。2017年加入百度AI交互設計院從事交互模型的創新、標準制定等工作。
人機交互,加速機器人擬人化