1. 程式人生 > >CCAI2018演講實錄 | 蒲慕明:腦科學與類腦機器學習

CCAI2018演講實錄 | 蒲慕明:腦科學與類腦機器學習

640?wx_fmt=jpeg

來源:人工智慧前沿講習班

摘要:7月28-29日,由中國人工智慧學會和深圳市羅湖區人民政府共同主辦,馬上科普承辦的“2018 中國人工智慧大會(CCAI 2018)”完美收官。

大會第二天下午,中科院神經科學所所長,中國科學院院士,美國國家科學院院士蒲慕明作題為《腦科學與類腦機器學習》的主題演講。

以下是根據速記整理的大會講座實錄。

640?wx_fmt=jpeg

蒲慕明 中科院神經科學所所長,中國科學院院士,美國國家科學院院士

皮層的作用

在近代神經生物學上和腦科學上,最大的進展就是:在19世紀中後期,法國醫生和科學家波卡(Broca)通過解剖失語症病人,發現了Broca區。他是第一個給大腦功能定位的科學家。從他開始,腦科學家們逐漸認識到不同腦區主管不同的功能。同時,各個腦區之間有高度的聯接,特別是側向聯接。高度的橫向連線在處理多感覺資訊整合時具有優勢。這也正是人工智慧做多模態整合時需要解決的問題。

20世紀的腦科學到底有什麼進展?

20世紀腦科學進展主要是對於神經元如何編碼、儲存和提取神經資訊的理解比較清楚。從20世紀初期到21世紀初,與神經科學相關的諾貝爾獎得主都是在解決神經元如何編碼、儲存和提取資訊的,都是在細胞水平而不是網路水平進行研究。

神經細胞都有區域性環路和長程環路。一個功能的出現,必須要求神經元環路中神經元在適當的時候放電。腦網路如何產生諸如知覺、情緒、思維、抉擇、語言等高等腦認知功能?我們對此理解極為粗淺。

現在說起來腦科學的進展,打一個比喻,相當於物理學、化學在19世紀末和20世紀初的狀態,新的理論和關鍵技術還沒有出現的時候,這是腦科學現在的狀態。我們不要對腦科學有過度樂觀的期待。

640?wx_fmt=jpeg

腦科學與類腦智慧研究的關係

歷史上人工智慧出現了三次浪潮,每次往上的推動都是從神經科學裡得到的啟發。例如,McCulloch和Pitts在1943年提出MP神經元模型,以及80年代Hopfield演算法、BP演算法。最近的深度網路學習,它包括多個層次,每個層次具有不同的功能,這也是從視覺系統得到的啟發。

要理解大腦需從三個層次上分析

第一個是巨集觀層次。通過核磁成像的技術可以得到粗略的神經束的走向,但單單隻瞭解神經束的走向對於理解腦功能並沒有太大貢獻。我們要進一步瞭解大腦必須要達到神經元水平。第二個就是介觀層面,空間解析度要達到微米。用特殊方法來標記不同的神經元種類,瞭解不同神經元的功能。介觀神經連線圖譜是目前神經科學的主要方向。第三個是微觀層面,微米到納米尺度。在微觀層面對神經元軸突和樹突的分佈以及突觸產生規律的研究可以得到很多有用資訊的。

突觸傳遞過程非常複雜

所有神經元是通過電訊號來傳遞資訊,但是電波不能直接傳到下一個細胞。突觸前的訊號造成化學物質的釋放,會由於釋放的化學物質不同可以造成突觸後細胞的啟用性或抑制性電訊號反應。這樣就大大增加了神經網路處理資訊的能力。

解讀整個神經網路的難點

第一個難點就是每一種腦功能都有大量神經元叢集參與,簡單的視覺輸入就有百萬千萬的神經元被啟用。我們非常缺乏非干擾性大量觀測神經元叢集活動的技術。美國腦計劃主要就是在開發腦研究新技術,新技術主要是觀測技術,還有能夠分析大量神經元動態資訊的大資料分析方法。大資料分析不是盲目分析,我們需要有理論指導,用資料去檢測這個理論的準確性。

640?wx_fmt=jpeg

突觸可塑性與Hebb假說

可塑性是大腦認知功能的基礎,可塑性使得大腦網路形成新的狀態,就會產生新的行為。大腦是不斷在變的,每一個活動都引起功能和結構的變化。Hebb(DonaldHebb是加拿大的心理學家)認為:同步的電活動可造成突觸加強或穩固。如果兩個神經元同時發放,他們之間的突觸聯接就會加強;如果不同步,那麼突觸前後的連線就會削弱。

可塑性的現象最早是由中國科學家馮德培發現。馮德培在英國拿到博士學位回國之後,在協和的生理系建立了實驗室,專門研究神經肌肉接頭的功能。1946年,在他的系列論文的26篇中報告了一個現象:在神經肌肉接頭的突觸,通過高頻的刺激,可以引起突觸後肌肉電活動的加強,這個加強長達十分鐘之久。

突觸的效率因為電活動而改變,很快的幾秒鐘高頻刺激,產生的後果是十幾分鐘的突觸增強,這就是可塑性。馮德培1941年發現的現象,是可以拿諾貝爾獎的,但是馮德培先生90年代過世了。到20世紀70年代,人們才在中樞神經系統中發現了類似的現象,被稱為長時程增強(LTP)和長時程減弱(LTD)。電活動過後,在腦網路裡留下了長期的痕跡,就是記憶,記憶就是儲存在神經傳遞的效率變化之上。

突觸可塑性除了突觸效率的改變,還有突觸結構的變化。為什麼軸突不直接把資訊送到樹突上而是傳遞到樹突棘上呢?其中原因一直沒有人知道。在耶魯大學做教授的時候,張香桐提出了一個假說:樹突棘(微小的突起)可以作為調節突觸傳遞效率的結構。現在,學界公認樹突棘可以作為調節突觸權重的結構。

赫伯(Hebb)細胞群假說

赫伯認為改變連線強度就是儲存記憶——記憶儲存在網路中,並不由單獨的位置儲存;把已經儲存記憶的細胞群再啟用,電活動再出現,記憶就會被提取。比如說我們從小時候開始,祖母面孔就不斷的啟用我們的細胞,眼睛、嘴巴、鼻子等都會特定啟用一群細胞,整個大細胞叢集在祖母面孔出現時候集體放電。通過這個超級赫伯細胞群,我們長大了以後,只要看到祖母的眼睛,部分的細胞群激活了,就可以喚起祖母面孔的記憶。

赫伯細胞叢集假說可以做進一步補充。祖母是一個概念,這個概念包含了她的面孔,還包含了聲音、唱的歌、名字,我看到這些所有的特徵,任何其中一個特徵,都可以換起對整個祖母全部特徵的反映。這個概念是一個超級超級細胞群,她唱的歌也許儲存在聽覺區,她的面孔在視覺區,味道在嗅覺區,這些資訊在跟祖母相關的事情出現的時候,都會同步被啟用。這是一種多腦區同步放電活動,是一種超級超級赫伯細胞群的放電。

大腦認知的關鍵就是資訊捆綁的問題。

各種資訊如何整合產生一個整體?多年來流行的假說就是聚合型假說:各個組成的成分都在放電,它們都通過軸突輸入到另一個神經元,該神經元同時收到各個組合成分的神經元訊號,同時整合了這個資訊。

人們最早是在視皮層發現證據(這是Hubel和Wiesel得諾貝爾獎的工作)。在視皮層或者視網膜上能夠引起神經元活動的區域我們稱為視覺感受野。從丘腦裡面細胞的點狀感受野到視皮層整合成線狀。由點到線的整合就是一種資訊捆綁。然而,還有其他的可能性,例如同步放電模型:各種組合成分的神經元在某一資訊出現後就一起放電,同步電活動本身活動就代表了整合資訊。

大腦網路形成的過程

在發育過程中,一個月的嬰兒並沒有什麼網路,在兩歲、三歲之間會生成很多的樹突和軸突,從而形成非常複雜的網路。這是非常令人吃驚的現象,這就說明神經元的基本結構是基因決定的,但是網路是在出生以後才建立的,出生以後是各種各樣的學習、經驗在起作用。早期的修剪過程是非常重要的,早期修剪的太少可能是自閉症,過多可能是精神分裂症,所以網路的修剪是正常網路形成必要的一環,修剪不好就造成疾病。

640?wx_fmt=jpeg

突觸是記憶的儲存位點

突觸儲存記憶有兩種儲存方式:一種是改變突觸權重;另一種是突觸連線結構的修飾——新的連線形成,原有連線的改變。大腦在發育期與成年期有不同的可塑性,大腦發育期有大幅度的神經結構修剪,使得新的突觸產生,經驗是主導網路修剪的主要因素;成熟大腦神經網路只有有限的可塑性,是在原有的突觸上增加一點效率,這是經驗和記憶所必需的。每個人的網路都不一樣,每個人的性格都不一樣,這是因為我們每個人的經驗都不一樣,所以我們處理資訊的方式都不一樣,這就是成熟網路的表現。

赫伯學習法則的新轉折

赫伯認為同時放電的神經元連在一起,不同步放電就網路連線,但是20年前出現了新的轉折——強化或者弱化不只是同步,而且有時序性。突觸前放電先於突觸後放電,突觸強化,反過來就弱化,這種有時序資訊的現象我們稱為時序資訊依賴的可塑性(STDP)。現在已經有人在人工網路上運用STDP。

我們可以做一個簡單的遊戲,把貝多芬的《致愛麗斯》正序彈奏每個人都會聽出來,反過來彈卻沒人會聽出來是什麼曲子,這是因為記憶是有時序性的。

可塑性對人工智慧發展曾有過關鍵性貢獻

Hopfield人工神經網路,每一個突觸點賦予某一權重,單元將所有輸入加合,各突觸的權重可以用赫伯學習法則調節。BP(反向傳播)演算法可以用來學習說話,FrancisCrick對此作出了高度評價,在“The  recent  excitement about  neural networks”文章中認為BP演算法非常驚人,但是也提出大腦中似乎沒有這種機制,大腦的是軸突的資訊送到樹突的單向過程,而沒有反饋資訊。幾年以後,我們通過記錄多個神經元來驗證這種說法是否真實。

我們發現突觸前神經元記憶體在逆向傳播和側向傳播,突觸後只有側向傳播,沒有前向傳播。軸突終端產生的LTP可以在突觸前神經元往回傳,但不能往在突觸後往前傳,我們稱這種現象叫做naturalBP。現在在自動化所,我們將natural  BP應用到人工神經網路上面,希望對非監督或者半監督學習有點幫助。

640?wx_fmt=jpeg

最後做一些總結

1.可借鑑的自然神經網路特性

(1)神經元的種類

興奮性和抑制性神經元活動的平衡是正常網路功能所必要的。

①突觸延遲(synaptic delay)在神經環路中起關鍵作用。

②抑制性中間神經元通常出現在興奮性輸入之後,可防止神經元過度興奮,可消除脈衝序列(spiketrain)的尾巴以提高資訊的時間精確度(temporal precision),可通過抑制旁側的神經元的興奮性以增加對比資訊的空間精確度(spatialprecision)。

(2). 多方向(順向、逆向、側向)的神經連線

連線不只有一個方向,大多數的連線是正向的,也有逆向的,也有側向的,而且興奮性和抑制性神經元都有多方向的聯接,而且是有空間和神經元種類特異性的聯接。

(3).神經突觸的可塑性

①突觸的功能有可塑性:傳遞效率的增強與消弱(LTP/LTD); 可依賴於突觸前後神經元同步電活動的頻率,也可依賴於突觸前後神經元電活動時序(STDP)。

②突觸結構可塑性:包括樹突棘的形態變化,和突觸的新生(formation)與修剪 (pruning)。

③突觸可塑性的傳播; LTP和LTD的有序傳播:包括逆向轉播(Back-Propagation),突觸效率可減弱也可增強,和側向傳播(LateralPropagation)有選擇性地在突觸前和突觸後傳播。

(4).記憶的儲存、提取與消退

理解記憶不應只關注儲存問題,還有記憶消退問題, 消退的意義可能比儲存還要更重要。

①記憶的儲存:網路中特定突觸群的效率與結構修飾。

②記憶的遺忘:突觸功能與結構修飾會隨時間消退。

③短期記憶轉化為長期記憶:有規則重複的重要性。

④記憶提取:電活動的再現於儲存記憶的突觸群。

⑤強化學習:依據輸出的結果對學習相關突觸群的修飾, 調質神經元在修飾中的作用。

(5).赫伯神經元叢集概念的應用

①使用巢狀式叢集來組成多成分、多模態的資訊。

②不同模態的資訊在網路的不同區域處理時,可通過側向連線進行互動影響。

③可使用同步或有相差的電活動來捆綁不同區的神經叢集。

④輸入資訊的拓撲結構在傳輸過程中的不同層面有所儲存。

 2.對人工神經網路/機器學習的建議

一是“擺脫”深度學習網路的誘惑。

二是建立全新的人工網路架構和演算法,目標是高效、節能、無監督或者半監督學習。

三是以脈衝神經網路為基礎,加入傳遞延遲。每一個突觸傳遞都有一個時間延遲,這是很多網路處理資訊的關鍵。

四是從簡單網路為基礎,每次加入一個自然神經網路的特性,檢測其效能,然後逐步完善。

未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學交叉研究機構。

未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測;開展網際網路(城市)雲腦研究計劃,構建網際網路(城市)雲腦技術和企業圖譜,為提升企業,行業與城市的智慧水平服務。

  如果您對實驗室的研究感興趣,歡迎加入未來智慧實驗室線上平臺。掃描以下二維碼或點選本文左下角“閱讀原文”

640?wx_fmt=jpeg