1. 程式人生 > >哈薩比斯的人類補完計劃

哈薩比斯的人類補完計劃

哈薩比斯

在著名動漫《新世紀福音戰士》裏,碇源堂和他背後的SEELE組織始終在執行一項叫做“人類補完計劃”的神秘行動。

這個計劃到底是什麽意思,粉絲們已經爭吵了很多年。但大體上應該是說利用“神性”來補完人類族群,從而消除人類社會中的種種問題。也就是說,這個計劃是“把人類補完的計劃”。

技術分享圖片

但“人類補完”這個詞,其實還可以有另一種解釋,就是“用人類去補完某種東西的計劃”。有東西需要用人類來補完嗎?當然有,比如說人工智能。

號稱AI研發實力地球第一的DeepMind,似乎就在執行著這樣一個“計劃”。我們知道,相比於大部分興趣廣泛的AI實驗室型企業,DeepMind的專註點非常整齊。基本可以形容為:左手遊戲,右手神經學;向下關註醫療落地,向上思考AI道德。

這樣的方向選擇,與DeepMind創始人哈薩比斯的個人經歷與興趣緊密相關。遊戲我們已經看到了圍棋和《星際爭霸2》。還沒有引發公眾關註的,是這位天才右手中攥著的,學習人類大腦與神經來發展高等級人工智能的宏偉野心。

技術分享圖片

有野心不可怕,可怕的是,在不到一年的時間裏,這個計劃已經初現規模。

“狂人”的戰役

大概地球上不會有第二個人,能夠同時擅長人工智能、遊戲、神經科學、創業這四件事。

關於“神童”哈薩比斯的事跡,媒體已經有了太多報道。比如他5歲參加國際象棋正式比賽,16歲進入劍橋學習人工智能,22歲創辦了電腦遊戲公司,以及後面DeepMind的系列“神跡”。

但媒體比較少關註的一件事,是這個被萬維網之父蒂姆·伯納斯·李稱為“星球上最聰明的人之一”的人工智能專家,博士學位修的是認知神經科學。

2005年,已經沈浸人工智能多時的哈薩比斯,決定回到象牙塔中充電。在倫敦大學學院攻讀神經學中,哈薩比斯發現了大腦海馬體與人類情景記憶的關系。這固然是個關於人類記憶的重要發現,但要註意的是,其同時也影響了接下來很長一段時間內關於機器記憶的研究,尤其是在機器學習中的連續學習和長期學習。

其實在上世紀四五十年代,研究機器智能的專家,很多來自於神經科學與社會行為學。畢竟所謂人工智能,歸根結底目標是讓機器產生類似人類智慧的能力。但隨著後來人工智能與計算機科學的聯系日間緊密,神經科學也回到了生物學的研究序列中。

幾十年間二者各自飛速發展,研究人員也越來越“專業”。直到統計學和數學開始籠罩AI研究,人工智能的底層研究似乎很大程度上變成了純碎的函數問題。

顯然,據說5歲就開始思考人工智能問題的哈薩比斯,對這種現象是非常不滿的。DeepMind成立初期,始終在忙著讓AI打遊戲和完成棋類運動。而在2017年,AlphaGo終於無敵於天下,哈薩比斯卻沒怎麽享受勝利果實,而是馬不停蹄開始了一項長期計劃的號召:人工智能必須繼續向神經科學取經。

技術分享圖片

去年7月,哈薩比斯非常少見的親手寫下長篇文章,並且不是像往常一樣發表在人工智能刊物,而是發表在了神經醫學界的最高規格刊物《神經》中。

這篇《神經科學啟發人工智能》,完全可以看做是一篇檄文。文中哈薩比斯開宗明義地表示,假如我們的目標是開發出接近或同等於人類智慧的智能技術,那麽就絕不能放棄對人腦的研究和理解,因為人腦是唯一能夠證明這種智慧存在的證據。同時他還歷數了強化學習、遷移學習等10個神經科學可以啟發AI研究的領域。

在哈薩比斯看來,今天學術界的過於封閉,已經限制了AI研究的發展。目前神經科學對人工智能的影響,更多來自於微妙的啟發和科研成果借鑒,缺乏AI與神經科學的系統性結合,缺乏雙向人才(比如哈薩比斯自己),更缺少兩個領域有效、直接的溝通。所以他呼籲培養跨領域人才,希望建立共同的理論體系、話語機制和跨學科研究項目。

當然了,只呼喊不實幹從來不是DeepMind與哈薩比斯的風格(事實上很少見到哈薩比斯如此努力呼籲某事)。在幾個月時間裏,DeepMind的科學家們已經浩浩蕩蕩把BOSS“學習神經科學”的主張實踐了起來。

“科學狂人”這場“用人類補完AI”的戰役,此刻已在高速運轉中。

用成長心理學解釋AI黑箱

去年6月,似乎為了與哈薩比斯的呼籲相配合,DeepMind團隊發表了一篇論文,探討用心理學中的某些現象和實驗方法來解釋AI的黑箱子問題。

我們知道,黑箱現象如今是困擾人類探索AI的主要問題之一。在經過復雜的神經網絡計算之後,常常會出現人類無法搞懂算法的運作機制,不知道算法如何得出結論的問題。失控的機器智能當然不是好智能,但研究AI的判斷與喜好卻總是缺乏有效途徑。

技術分享圖片

DeepMind的科學家們,想到了去心理學取經。心理學中有個專門學科,叫做成長心理學,研究幼兒成長過程中產生的心理、認知與記憶變化。這門學科中有個有意思的實驗,是研究幼兒究竟是怎麽記住兔子的?

告訴孩子什麽是兔子,再重新找一只兔子讓他識別,他記住的是什麽呢?是顏色?形狀?還是局部特征?最終心理學實驗表明,人類幼兒總是偏向於通過形狀來記憶新事物。

從中受到啟發,DeepMind對AI模型進行了類似的實驗,首先讓模型記住一個物體,然後一面調整物體的顏色,一面調整物體的形狀。最終結果表明,深度學習網絡也與人類有相似的偏好:更喜歡根據形狀來識別對象。

技術分享圖片

這種偏好是此前的AI研究中沒有發現的,雖然它不能完全解釋黑箱,但卻給理解AI開啟了全新的思路。更重要的是,類似的心理學研究與實驗還有太多。也就意味著給AI做心理實驗是有效而價值巨大的。

換句話說,這項研究成果表示,哈薩比斯希望在今天用神經科學補強AI,似乎有門!

用強化學習理解人類大腦

在哈薩比斯看來,不僅AI需要向神經科學學習,對人類大腦與神經的研究,在今天也需要向AI學習。

強化學習,是今天AI前沿研究中最火熱的議題之一。這門技術希望用強化信號,來反復向智能體輸出獎勵機制,從而讓神經網絡不斷做出優化選擇,建立最優決策機制。AlphaGo Zero就強調用強化學習來快速達成高度成熟的圍棋能力。

在9月和10月的兩項研究中,DeepMind開啟了全新腦洞:用強化學習機制來理解人類大腦。

比如在《自然》子刊《自然·人類行為》上發表的一篇論文中,DeepMind聯合多院校的相關團隊,一起探討了人類決策行為時的後繼表示(successor representation,SR)現象。實驗結果顯示,人類決策行為中,確實用到了緩存未來預期並映射到現實決策中的方案。這也是強化學習模式在人腦中工作的第一個證據。

另一篇發表在《自然神經科學》的論文中,DeepMind嘗試用強化學習技術來探究人腦中海馬體的工作方式。大腦中海馬體能夠作為空間定位器,負責幫人類認路,這已經是公認的事實。但是這樣的解釋卻無法說明海馬體是如何參與記憶、決策、推理等任務的。

DeepMind還是基於AI中強化學習技術的思路,設計了相關實驗,來證明海馬體的定位和指路能力,其實是一種有獎勵機制和決策機制的強化學習過程。

相關證據表明,大腦海馬體在指路中的作用,是建立在空間信息之上,對獎勵最大化的選擇。研究人員稱其為“地圖預測機制”。這也就解釋了海馬體參與其他人腦工作時的基本方式。

技術分享圖片

這兩篇研究最有腦洞的地方在於:他們都是用強化學習機制來解釋人腦的運作模式,並通過一些實驗來證明自己的解釋是正確的。同時又反過來闡釋,假如人腦確實是以強化學習中的獎勵機制來執行預測、記憶等基本智能。那麽對人類大腦機制的研究與模仿,應該也可以加強對強化學習技術的理解和升級。

在同一個實驗中,兩個學科相互幫助攜手進步,真的有點奇妙…

用心智理論,幫助機器理解彼此

如果說以上“用人類補完AI”的計劃還停留在學術認識上,那麽到了今年,DeepMind似乎已經準備好在AI技術本身放大招了。

就在上個月,DeepMind發表了他們如何讓智能體理解智能體的研究“機器心智理論”(Machine Theory of Mind),並放出了相關模型。這毫無疑問意味著人類對AI可解釋性的研究到了新的階段。同時這也是我認為本文可以開始寫作的原因之一。

什麽是“心智理論”?

我們認為AI處於黑箱子中難以理解,但我們是怎麽理解其他人類的呢?我們可以跟其他人交流,預測他人的行動和情感,甚至可以預測他人的消費行為...但我們沒有把他們的大腦撬開,看裏面的前額葉海馬體腦皮層是如何工作的...原因就在於,我們是通過心智理解他人和自己的行為與情感。這就是心理學上的心智理論。

DeepMind希望利用這個心理學概念,讓智能體觀察和學習其他智能體的動作與行為,從而準確預測被觀察者下一步的動作。通過不同等級智能體的觀察實驗,論文中已經展示出ToMnet理解並預測不同層級、不同底層技術智能體的能力。

技術分享圖片

換句話說,這項技術突破讓AI成功的通過外部行動來理解AI,而不必將內在架構鏈接在一起。

事情到了這裏,已經彌漫出一點失控的味道。假如未來機器可以像人類一樣,通過交談和行為理解彼此,那與人類好像也沒多大不同了。

根據最近各方面的反饋看,機器心智理論(Theory of Mind neural network)——ToMnet的價值,很有可能不低於歷史上任何一項人工智能技術突破。雖然有專家批評ToMnet並非是建立在知識空白的基礎上去理解其他智能體,但這項技術突破的價值還是被廣泛承認。

很多專家預測,接下來多智能體協同系統,機器交互,AI自我成長,這些關鍵領域很可能都要以ToMnet作為基礎。

而這個突破的根源,卻是來自心理學。

戰鼓初鳴:關於補完計劃的進度

讓我們來總結一下哈薩比斯這場“用神經科學強化AI”行動的進度吧。

目前DeepMind相關研究專註於兩個方面:強化學習、AI可解釋性。整體研究圍繞這兩項技術來展開,既用心理學和神經科學來加強對AI黑箱的破解,同時也希望用強化學習等“AI原理”幫助探秘人類大腦。

整個計劃的最大成績,在於給跨學科研究做出了紮實的示範,證明了用神經學補全AI的可行性。非常關鍵的機器心智理論很可能帶來驚喜,成為主流研究方向。而對於強化學習的探索,可能與機器決策、物理世界處理等AI領域的技術相結合。

還有一點值得註意,DeepMind開源了Psychlab平臺。這是一個“智能體專用心理測試集”,可以讓更多研究者嘗試AI與心理學的結合。

技術分享圖片

整個計劃也不是沒有問題。比如哈薩比斯一度呼籲搭建雙學科理論框架和標準學術話語,今天依舊未見蹤影。由於沒有帶來極其驚人的大動作,大眾對於這類技術所知也不多。此外,雖然哈薩比斯曾經懷疑過這一現象,但直到今天,神經科學與認知心理學對AI的影響依舊主要是啟發性的,缺乏前沿技術成果的相互關照。

而放眼未來,與記憶相關的AI技術或許會成為DeepMind的研究重點。情景記憶、工作記憶、長期學習等技術很有可能成為突破方向。

最重要的是,2018年,我們很大概率會看到哈薩比斯在AI模仿人類神經與心智上搞個轟動社會輿論的“大動作”出來。

技術分享圖片

還有一個問題,哈薩比斯和DeepMind如此堅定地推動AI向神經科學學習,終極目的僅僅是為了強化AI技術嗎?

在去年《神經》雜誌上那篇形同宣言的文章中,哈薩比斯曾在結尾處暢想:通過人工智能來了解人類智慧,讓人工智能與人類大腦形成比對,或許有可能“對人類心靈中一些最深刻和最持久的奧秘產生深刻的見解,例如創造力、夢想,甚至有一天能觸及意識的本質。”

真至於此,是不是同樣喜歡戴黑框眼鏡的哈薩比斯和碇源堂,兩個人的“人類補完計劃”,也就沒有什麽不同了?

-----------------分頁符-----------------

技術分享圖片


哈薩比斯的人類補完計劃