1. 程式人生 > >AI有一招,能幹到王思聰沒幣可撒

AI有一招,能幹到王思聰沒幣可撒

歸納 智能問答 這樣的 想象 結構 nor work 協作 人工智能

曾記得十幾天之前否?那時我們躊躇滿誌的跨進了2018,滿懷著對未來的渴望和珍重……然後我們驚奇的發現,2018第一個火起來的詞叫“撒幣”…

不是我說啥,這可真出戲啊。

似乎一夜之間,直播答題和這個叫做“撒幣”的關鍵詞就火了。王思聰的沖頂大會、映客的芝士超人、花椒的百萬贏家,一時之間大佬們瘋狂爭當“大撒幣”,人民群眾則紛紛出頭想當被幣砸到的那個幸運兒。

技術分享圖片

當然了,不管這些平臺們如何“撒”,最終“幣”還是要回到他們自己口袋裏的,畢竟做生意是為了賺錢,搞出來這麽大場面當然是為了放後招,沒聽說過哪位出題讓人答是為了做慈善的。除非...除非AI化妝成選手,也來答個題,說不定能幹到王思聰們沒幣可撒...

畢竟,答題也是講科學的對不對?

很多人在答題沖關時,會借助搜索引擎尋找信息,搜索引擎返回的結果有兩種形式,一種是我們要在返回頁面的中自己繼續尋找關鍵的答案,另一種呢,搜索引擎則直接明了的告訴我們答案,比如“長城有多長”,在分秒必爭沖向百萬獎金的途中,簡直獲得了直掛雲帆濟滄海的痛快!這背後的功勞主角,就是今天我們要講的知識圖譜。

在由“AI感知”通向“AI理解”的大路上,知識圖譜是被公認的技術基石。更更重要的是——他能幫你答題啊……

知識圖譜是什麽鬼?

知識圖譜這個概念被提出並不算太久,但是要追根溯源理解這個技術到底是玩什麽的,那可能真要往上倒騰幾十年才行。

上世紀40年代,人工智能被提出之後,無數科學家們就開始琢磨,到底用什麽方式能讓機器模擬出人的智慧呢?琢磨來琢磨去,人對於信息能夠進行關聯理解似乎是個路子。所謂信息關聯,就是人類在接受一個信息後,會把它放在記憶中進行歸納和調用。比如我們會記住一些信息:橘子屬於水果,檸檬屬於水果,水果的維生素含量高,這樣我們可以推斷,橘子的維生素含量也高。利用這個思路,上世紀50年代末,學術界提出了語義網絡(semantic network)的設想,打算把數據進行結構化的處理,讓單個信息組合成有聯系、能共鳴的“知識”,語義網常常被看做是知識圖譜的前身。

技術分享圖片

上世紀80年代,受到多方面刺激的地球人開始了一次AI復興運動,而這次運動的主角,就是各國開始打造專家系統和知識庫。那時候科學家們相信,如果把人類大量知識進行邏輯化關聯和語義網絡存儲,最終人類就能打造出全知全能,無所不懂的人工智能,雖然這場運動之後被保留的專家系統不多,但是海量知識構成的知識庫卻成為了更有價值的產物。

2012年,基於語義web技術和Freebase等優質知識庫,谷歌提出了知識圖譜(Knowledge Graph)概念,所謂知識圖譜,是利用多個來源的數據,將真實世界中關於事物的知識、事物之間的關系,組織成一張巨大的、聯通的、讓計算機可以去理解的圖結構,於是文字不僅僅是文字,而是有了它在現實世界中的具體的含義和關聯關系。在產業端它為搜索、內容推薦和智能問答提供了基礎,成為今天AI領域足夠強勢的一個技術類別。舉個直白的例子吧:

假如你這幾天很好奇一個叫PGone的詞為啥火了,然後你去搜索一下,結果給你推薦的詞是PGtwo、PGthree...那你就跟沒搜一樣。假如蹦出來兩個詞,一個是賈乃亮一個是地溝油,那麽你看完整個故事就了然了嘛...

所謂的知識圖譜,就是讓智能體去理解事物以及他們之間的關系,並能基於此提供相關的技術和服務,比如這裏舉例的推薦技術。

今天的知識圖譜專治各種“撒幣”

假如你以為本文到此就該結束了,那麽你又錯了...

上文說了知識圖譜專治各種“大撒幣”行為,並不是隨便講講的。我們要知道,2002年知識圖譜技術假如跟王思聰剛一波正面,那是基本沒有勝算的。

技術分享圖片

這裏有幾種可能:首先是假如你的知識庫是更新到前年的,人家問你PGone的嫂子是誰,你怎麽辦?或者人家不問你長城有多長,問你最長的墻有多長怎麽辦?

在考教真人的直播答題過程中,可能面臨各種語言上的調整、提問方式的改變,以及加入最新信息。這都是幾年前基於單一結構知識庫的知識圖譜技術難以勝任的。

這樣的問答就能把知識圖譜難住了嗎?不能夠。

以百度的知識圖譜技術為例,我們可以看到這項技術幾年間發生了重要的變化,比如:

1.大數據+機器學習帶來了史無前例的效率契機。

今天的AI復興,是建立在機器學習驅動大數據的基礎上的,知識圖譜也是如此。舉例來說,百度的知識圖譜技術,在數據上依賴於全網信息,在技術上,機器學習、深度學習技術則讓百度知識圖譜實現了數據更新時效性更強、以及更完善的語言理解能力。換句話說,百度這類AI巨頭掌握的知識圖譜技術,具有高度的即時性和成長性。往往網友都沒反應過來呢,知識圖譜已經完成數據更新了。

技術分享圖片

2.強語義理解能力成為關鍵。

能聽懂“黃磊的妻子是誰”,卻聽不懂“黃磊女兒的媽媽是誰”的知識圖譜,顯然是知識沒譜。深度學習各種語意、語義、語序和方言的知識圖譜能力,也成為了目前知識圖譜技術的喚醒核心。

這幾種能力加持下,像百度知識圖譜這樣的代表性智能技術偽裝成選手去搞點“撒幣”,顯然已經不算什麽了...但是如果只幹這點事,其實也蠻虧的。

3.語音交互成為知識圖譜的新形式。

知識圖譜技術想要更好的為人類所用,就要更主動理解人類的語言和思維習慣,做到主動輸出服務。這就需要知識圖譜與自然語言理解、語音交互等技術緊密結合,比如百度知識圖譜技術就與DuerOS相互聯系,為喚醒DuerOS的用戶提供各種知識、和分析類功能,同時借助DuerOS來加大自身的打開力度。

撒出一個明天

無論是語音交互還是機器視覺,我們今天正在努力教會AI一件事:“識別”。可是,在“識別”之後呢?AI下一步要幹什麽?是理解和處理。但如果想讓AI開啟這些能力,很多人都認為,知識圖譜將是AI下一步的必經之路。

今天知識圖譜的核心,在於通過數據生成可視化的知識鏈條,用鏈條形成網絡,利用網絡來進行預測、生成自動化,最終生成機器主動提供的智能化服務。

要知道,人類理解世界並不是基於一個個散亂的信息,而是基於信息背後的“知識”。

我們期待的知識圖譜技術,是通過這種技術的完善,把AI調整到主動輸出服務模式。經典計算階段是你想到的,電腦幫你做出來。而知識圖譜時代,是你想不到的,AI可以想到。

技術分享圖片

能做到這一步的AI技術,當然不會只滿足去答答題,做個直播。人家的使命是改變世界好不好?

其實,知識圖譜作為一種後端基礎技術,今天已經悄然布局在了我們的生活。還是以百度為例,我們今天在百度搜“李白寫過哪些飲酒詩?”,已經不是跳出來有這些關鍵詞的網站,而是直接跳出來你的答案,這背後就是知識圖譜即使已經解答了你的問題。

利用知識圖譜,百度已經對搜索、內容推薦等傳統強勢業務進行了升級和叠代,不僅僅是幫我們尋找到相關的信息,而是直接利用知識滿足用戶當前的需求,並基於知識猜測你接下來的相關需求。

更重要的是,知識圖譜技術作為AI交互手段的必要支撐技術,正在為百度構建語音交互和無人駕駛兩大AI產業提供幫助。比如一些廠商最開始使用DuerOS時只是為了提升體驗,但是後來發現它知道的東西、能解答的問題遠遠超過想象,那麽帶來的產業粘合度自然也就提升。百度還有一個知識圖譜開放平臺,提供的技術和數據可以幫助開發者來打造屬於自己的知識圖譜。

未來或許利用知識圖譜技術能達成物聯網間的協作、人機交互的全新升級,那麽最終所能抵達的,遠遠不是答題這一件小事而已。像百度這樣的知識圖譜集成產業模式,顯然已經在準備從量變積累向技術奇點過度,更大的產業變革已經在醞釀中。

所以呢,直播平臺上誰給誰撒幣,誰是“大撒幣”,其實也不是很重要了。真正重要的是,技術正在努力把未來的幣,撒到現在的土壤裏。


AI有一招,能幹到王思聰沒幣可撒