1. 程式人生 > >探秘未來偶像:知識圖譜如何給AI“生命感”

探秘未來偶像:知識圖譜如何給AI“生命感”

知識圖譜

AI是個非常有趣的詞,不管是中文翻譯的人工智能,還是英文的Artificial Intelligence,都有“生物性”的含義。一個是集結了地球頂尖智慧的“人工”,另一個Intelligence則專指生物擁有的智慧。

不過在當今的AI風潮中,我們提到的種種AI應用大多屬於機器學習——和生物性不沾邊。AI可以從大量數據中尋找規律,經過訓練完成種種工作,可給人的感覺依舊是一種更高效的機械。

這樣的現象在語音助手上更為常見,很多廠商都會給語音助手起個名字,試圖將其人格化,可當用戶真正使用時,往往只能感受到工具感。語音助手可以聽懂你需要播放音樂、叫車出行,也能在你要求下講個笑話。可除了下達指令和獲得反饋以外,語音助手很少能理解情緒、記憶、俚語、雙關等等人與人交流時經常出現的元素,作為工具來講尚且不算優秀,更別提什麽生物性和人格化了。

技術分享圖片

如果要為這一切找出緣由,知識圖譜顯然是其中之一。最近中國信息通信研究院雲計算與大數據研究所聯合Gowild人工智能研究院以及業內多家企業推出了業內首份《知識圖譜白皮書》,為此,我們采訪了來自Gowild人工智能研究院的邵浩博士,和他一同討論了知識圖譜與人工智能“生命感”之間的關系。

除了把工具變成更好的工具,知識圖譜還能做些什麽?

之前我們在文章中,討論過一個“人工智能不會看漫畫”的問題,既利用大量四格漫畫對神經網絡進行訓練,但將四格漫畫中的對話框挖空後,人工智能依然不知道應該填入哪些內容。

原因在於漫畫中的畫面和文字並非具有嚴格的對應性,人類能看懂漫畫是因為建立在對現實世界的理解之上,通過聯想將文字與圖片的內涵建立對應關系。知識圖譜的作用,就是將不同的知識相互關聯,並形成一個網狀的知識結構,幫助人工智能增強認知、理解行業並且建立“世界觀”。

這一點在人機交互中體現的更為明顯,比如在用戶向語音助手詢問“《天龍八部》裏的阿紫”時,普通的語音助手只能調用搜索引擎原樣搜索用戶所說的話,一一展示出指向連接。但建立在知識圖譜之上,語音助手可以分別提供出小說、電視劇、電影等等多個版本《天龍八部》中阿紫這一角色的相關信息。

這樣的知識圖譜,可以幫助我們更好的進行搜索,理解語義、消除歧義、理解相對關系等等。這樣一來,知識圖譜可以幫助人工智能成為更好的工具,但從工具到生命的這一過程中,知識圖譜能做到什麽?

認識自己,認識你:探訪AI偶像的生命引擎

在上一篇關於Gowild產品“琥珀虛顏”的介紹中,我們提到了“未來偶像”這一概念。琥珀是以全息3D主機HoloEra為載體的虛擬形象,用戶可以通過語音和手機App與琥珀進行交互。而琥珀自身的背景故事是一位無意降落地球的外星偶像,正向著成為“偶像”的道路進發。

技術分享圖片

所謂偶像,自然是人格化、有生命感的,這也是琥珀虛顏的主打賣點之一。Gowild曾經在一篇論文中提出過“虛擬生命”這一概念——有記憶、有情緒、能理解、能交互。想要實現這幾點,依然離不開知識圖譜的加持。

技術分享圖片

上圖是Gowild提出的人工智能生命引擎(GAVE),把語義理解、QA系統、智能對話等等技術組件架構在了知識圖譜之上,而知識圖譜則是給予AI“生命感”的重要工具。

比較典型的是Gowild為琥珀建立了她自己的個人知識圖譜,琥珀有自己的喜好和性格特點,喜歡紫色、愛吃葡萄、喜歡聽別人的表揚。當用戶和琥珀進行對話時,琥珀就會展露出這些性格特點,用戶提到“紫色”、“葡萄”等等琥珀喜歡的東西時,會得到相關的反饋。

這就是琥珀的自我認識知識圖譜。其中的狀態、心情、性格、人際關系又是時刻變化的,你對Siri說一句“我討厭你”,它只會回應你“我盡力了”。而你要是對琥珀說一句“我討厭你”,或許她接下來一整天的情緒都會不好。

同時隨著用戶不斷與琥珀交流,琥珀還會建立起有關用戶的知識圖譜。記住用戶提及的個人信息、喜好等等。隨著擁有琥珀的時間越來越長,琥珀也會越來越懂得用戶,雙方累積起共同記憶。

一個有自己喜好、有情緒波動,還會記得你的特點的AI,正在慢慢從“工具”向“生命”跨越。

其實在最近大熱的《偶像練習生》等網綜中也能感知到,粉絲對偶像的情感並非單純的崇拜,而是通過每一次參與打榜、活動形成的陪伴感、付出感甚至是養成感。而通過知識圖譜對人工智能的自我認識和用戶關系的建立,這種人與偶像之間的復雜關系也可以映射到人與AI之間,讓“未來偶像”的命題更具合理性和想象空間。

垂直化+動態化,或許能幫助知識圖譜走入生活

邵浩博士向我們介紹稱,現如今人工智能生命引擎已經開始逐步平臺化,通過API接口將各項能力開放出來,讓更多IP通過HoloEra“活起來”。只要獲得授權,HoloEra中的琥珀可以變成任何一個動漫人物、遊戲角色,甚至是真實世界的Idol,並且通過IP背景構建出不同的自我認識。而通過模塊化的平臺模式,這一過程可以低成本、高效的進行,進一步釋放科技與文娛產業的纏繞。

這其中的可以供更多行業的參考點就在於知識圖譜的快速建立。

邵浩博士表示,知識圖譜的發展之所以相比深度學習、神經網絡較慢,是因為知識圖譜的建立過程非常復雜:將非結構化數據轉變成結構化數據已經是一項繁重的工作,還需要建立數據之間的對應關系。如何保證知識的權威性,更需要技術專家和學術專家一同跨領域合作。

技術分享圖片

何況知也無涯,人類世界的知識實在太過細致龐雜,建立知識圖譜需要耗費的時間和人力成本實在太高。在1984年,美國曾經啟動過一項名為Cyc的工程,試圖把人類世界的日常常識建立起一個適用於計算機的大型知識庫,結果顯而易見——四十多年了,這項工程還是沒有完成。知識圖譜的費勁程度,可能就和Cyc有的一拼。

Gowild的解決方案,其實已經展示了知識圖譜的兩個發展趨勢。

第一個趨勢是知識圖譜的垂直化。建立一個大而全的知識圖譜自然是不可能完成的任務,但將知識圖譜分割成細分領域,如醫療、金融、安防,甚至更細分到某一種疾病、某一種貨幣等等,可以極大的降低知識圖譜的建立成本,同時促進知識圖譜的快速投入使用。

第二個趨勢是知識圖譜的動態化。琥珀之所以有“記憶”,是因為用戶關系的知識圖譜會源源不斷的補充著用戶在交互時透露的信息,因而逐漸讓用戶畫像更加圓滿。隨著我們數據挖掘的能力越來越強,在流數據場景下儲存和查詢知識圖譜正在成為可能。或許在未來不光琥珀能夠“記住”你,冰箱、電視、洗衣機等等生活中的一切設備也可以通過類似的方式建立對用戶的記憶和理解。

當然,問題並不只有一種解決方式。想要制造出有生命感的人工智能,知識圖譜只是可以利用上的技術之一。而讓人工智能具有生命感也僅僅是一段路程,路程的終點還是讓更強大技術改變的我們的世界。

到最後,這些不同的技術路徑還是要在頂點相見。


探秘未來偶像:知識圖譜如何給AI“生命感”