1. 程式人生 > >人機互動,加速機器人擬人化

人機互動,加速機器人擬人化

前言 人機互動簡單來說,就是“人和機器打交道的方式”。人和計算機打交道根源於人類把計算機當成一種有效的計算服務工具。計算機自產生以來,計算能力日益強大,人類對計算機的態度也開始在計算機只是呆板的“機器”,還是可能變得像“人”一樣聰明,甚至比人更聰明之間搖擺。這種模糊的態度伴隨著計算機的進化不斷演變。隨著深度學習技術的崛起,進一步加速了這個程序。人與機器人指尖的交流也逐步從指令交流轉向情感交流,而在這種互動的進化過程中,也伴隨著一些難題與挑戰。 百度為2018人工智慧創意賽集訓營邀請了百度AI互動設計院體驗架構師李士巖,為你解答這些難題的解決方案。

機器人和人機互動體驗需要重構 在這裡插入圖片描述 圖一: 1921年捷克劇作家卡爾·恰佩克(Karl Capek)在名為《羅素姆萬能機器人》(Rossums Universal Robot)的戲劇作品中創造了“robot”(機器人)這個名詞。這個詞源於捷克語的“robota,意思是“苦力”。 機器人自從在人們想象中誕生的那天起承載了人類巨大的夢想,這個夢想是將人類從繁重的勞動中解放出來。人類的勞動從交通設計角度有兩個部分,第一部分來自於人類與世界的互動,比如搬運;刷碗;洗衣服。第二部分來自於人與人的互動,比如心理輔導;講故事;指路。機器人完成人類的夢想必須解決兩個層面的互動問題,第一個機器人與世界的互動,第二個維度是機器人與人的互動。機器人與世界的互動嚴重的依賴科學和技術主導,目前這部分取得了長足的進步。用設計將技術轉化為機器人類體驗較好的互動方式是機器人與人的互動,而目前這部分依舊處於初級的水平。現在主要存在三個問題: 第一個問題是語音互動喚醒不夠自然,每次的發出指令前必須有一個喚醒的方式,這樣使得使用機器人的效率非常非常低,比如在家裡面用支援語音的智慧電視看電視的時候,要不停地通過喚醒輸出指令。 第二個問題是機器人不關注人的情緒,經過試驗我們發現當人互動的物件越接近於人的時候,人類越傾向於輸出情緒和情感。比如人類會跟語音系統說你怎麼這麼笨,但是不會跟影子、茶杯這麼說。人類有六種基本情緒,27種豐富情感,但是目前無論你有怎樣的情緒,他不會在意你的情緒。 第三個問題是目前機器人依然不夠主動。經過調研發現有85%的使用者對機器人的主動交流有明確的期待,但目前機器人連怎樣主動交流不知道。這三個問題使得使用者逐步喪失了對機器人的信心,使得機器人不再具有很強的吸引力,這種情況下一定要重構機器人人機互動體驗。所以今天跟大家介紹機器人自然情感任意互動模型。 Frequency Percent(%) 非常不需要 73 6 比較不需要 109 9 一般 393 32.5 比較需要 347 28.7 非常需要 287 23.7 Total 1209 100 表一:85%的使用者對主動交流有期盼 自然情感語音互動模型 機器人自然語音互動模型是機器人使用傳統的語音的原創互動模型,它具備三個維度: 第一個維度是喚醒。服務機器人與人進行互動的時候,大部分場景是映象互動。所以我們設計了新的進場模型,第一個節點是距離檢測,第二個節點是人臉鎖定,第三個節點是脣動檢測:檢測到使用者正在與機器人對話時,會自動開啟語音互動的流程。 在這裡插入圖片描述

圖二:近遠場的喚醒檢測方式 第二個維度使用者的情緒應對模型,人機交互發展幾十年裡,機器人的IQ取得了巨大的進步,而機器人的EQ一直沒有得到發展,而情感是人類的剛需。當兩個產品的IQ差不多時,一個更具情商的產品一定是更具市場競爭力的。機器人的EQ包含兩個部分,一部分情緒的識別,一部分情緒的應對。關於情緒的識別,我們用東方人的情緒面部資料進行訓練的適合東方人的情感識別系統。比如你很開心的跟智慧音箱說給我放一首歌和很悲傷的說跟我放一首歌結果應該是不一樣的。 在附帶情緒任務的悲傷場景下,機器人回饋的語音語調應該是具有同樣的悲傷的情緒,而策略應該是先完成任務後安撫情緒。在負向情緒的化解這個維度,語音語調也是悲傷,但是策略是先安撫再引導任務。通過這種方式,我們能夠使得機器從不關心人類的主觀情感變成對每一種情感都有個性化應對方式,這種策略可以賦予機器情商。 在這裡插入圖片描述
圖三:賦予機器情商的方式 第三個維度是機器人的主動交流模型,主動交流的難度在三點。1. 要根據場景,語氣程度和會話形式,而什麼場景下機器要主動交流,並且不侵犯使用者的隱私。主動交流到什麼程度也是一個值得考慮的問題,過分主動的機器人往往會給使用者造成干擾,而完全不主動的機器人,通常讓使用者覺得不夠智慧。通過試驗發現家庭場景中更適合主動交流,而公共辦公場景下會不一樣,所以主動交流的程度是和使用者的注意力承負相關關係。並且表達方式和場景有密切的關係,所以每個場景下主動交流的方式是不一樣的。 在這裡插入圖片描述 圖四:主動交流的程度是和使用者的注意力承負相關關係 通過一系列的設計我們可以為機器由被動接受指令到主動交流指名一個方向。在百度的NIRO(Nature Language · Initiative Interaction · Emotion Reflection · Origin Models)中每個模型分為三個層次,人類情景包括識別層、策略層和表現層,機器人主動交流模型包括輸入層、策略性和主動層。服務機器人另外一個在行業內重大的問題是怎樣讓服務機器人低成本的進入到廣域智慧,機器人的生存環境是人類的生存環境。比如開啟一個門,進入並操作一個電梯,清理一個障礙物對人類很容易,但是對機器人非常難。目前的解決方案把大廈裡每一個門換成電動的門,一扇電動門可以跟機器人系統進行數字互動。若想讓機器人清理障礙物,需要給機器人安裝昂貴的機械手臂,這些情景都阻止了機器人向真正的廣域場景和大規模的應用。那我們的解決方式是什麼?我們的答案最佳方式是協同智慧。 協同智慧 協同智慧的時代是非常美好的,在未來機器低成本的,利用NIRO人機互動的裝置,可以讓機器人產品快速進入智慧時代。在科技發展每一個階段,都會出現一些代表性的產品,比如PC可以作為遊戲機、打字機,比如手機可以作為指南針、MP3、照相機,而在人工智慧時代我們認為這個產品是機器人。機器人與前者們出現的邏輯極其相似,都是以技術為基礎,並且通過技術設計人機互動模型,將人機互動模型應用到更多產品。比如說應用了觸屏的技術,打造了互動模型,將互動模型應用到平板電腦、手機、桌面型的裝置才造成移動端的繁重。人機互動模型的設計需要不僅僅是技術,還有創意,現在AI技術有了大的技術的提升,這部分更需要創意和技術融合在一起。 在這裡插入圖片描述
圖五:Niro可以給機器賦能協同智慧 ----實錄結束----

李士巖 百度AI互動設計院體驗架構師。曾主導百度智慧路由器、百度智慧家居作業系統、Duwear智慧手錶人機互動系統、Jarvis智慧語音管家等產品的人機互動設計,擁有多個世界和中國發明、外觀專利。2017年加入百度AI互動設計院從事互動模型的創新、標準制定等工作。