認知資訊處理系統的認識和理解
轉載:http://zhan.renren.com/h5/entry/3602888498045421967
1. 背景
2013年4月2日,美國總統奧巴馬在白宮簽署批准了一項新的科研計劃——“通過推進神經科技創新的大腦研究計劃”(Initiative for Brain Research through Advancing Innovative Neurotechnologies; 以下稱BRAIN計劃)。該計劃指出,從2014年起,美國政府將加大對認知與神經科學領域的經費投入,通過開發新的大腦研究科技,推動人類心智探索領域的創新革命,併為帕金森綜合症、阿爾採默症、精神分裂症、抑鬱症、創傷後應激障礙、自閉症、癲癇和腦損傷等棘手的醫學難題提供新的診療方案(White House, 2013)。這項研究計劃是美國政府繼人類基因組工程後的又一大膽舉措。該專案所涉及的內容涵蓋了認知與神經科學、臨床心理學等領域的重大核心課題,具體的目標包括:1) 開發新的大腦成像技術,“透視”大腦資訊儲存與處理的過程(神經科學);2)探明知覺、決策、行動等心智活動的大腦基礎(認知心理學);3)建立基因-神經環路-行為的認識鏈條(遺傳、認知與神經科學);4)探索精神疾病的病因機制與干預診療等(臨床心理學)(NIH, 2013)。該計劃也被類比為“人類大腦圖譜工程”,並被譽為美國政府在大腦研究領域的“阿波羅計劃”。BRAIN計劃不僅令認知與神經科學領域的研究者為之振奮,更可能為美國帶來巨大的經濟效益。據統計,從1988年至2003年,美國聯邦政府對人類基因組工程投入了38億美元,而其所帶來的各項經濟收益總和約為7960億美元。也就是說每1美元的投入就帶來141美元的回報(White House, 2013)。美國政府預期,BRAIN計劃的收益將不亞於人類基因組工程的成就(White House, 2013)。值得注意的是,美國並不是第一個投資人腦研究的國家。在此之前,歐盟就將“人腦工程”(Human Brain Project)視為未來新興科技的重要任務,並在初期投資了7200萬美元進行該領域的技術革新,目標與美國的BRAIN 計劃基本相似(BBC, 2013)。
近年來功能核磁成像(Functional Magnetic Resonance Imaging, fMRI)所帶來的“神經泡沫”(Burge,2010),似乎讓人們誇大了對大腦成像技術的期望,並且加劇了科研領域愈加嚴重的“馬太效應”。Burge(2010) 對心理學中的認知神經科學取向(尤其是fMRI的研究)提出了三點質疑。他指出:
首先,神經科學的研究發現往往只是描述性的,而非解釋性的。憑藉相關腦區啟用的描述性分析,我們無法瞭解人類複雜的心理過程。
其次,神經層面和心理層面的分析並不在同一個水平上,從腦區的啟用到實際的心理活動,其中還有複雜多變的中間過程。因此,從神經層面的活動解釋心理層面的活動,是簡單還原論(reductionism)的思路,其結果不一定可靠。
最後,神經科學的研究牽涉到鉅額的研究資金,這將可能導致對科學本身有害的反饋效應。一些不太成熟的專案可能因為神經科學的取向而獲得更多資金的支援,然而到最後,這些專案所能夠帶來的貢獻卻是相當有限的。如何理性辯證地思考愈益重要的認知神經科學正規化,是心理學界所面臨的機遇和挑戰。
當然,認知神經科學的發展,正在逐步迴應各方的質疑。例如,在大腦功能成像領域,機器學習演算法的引進可以增強資料結果的解釋力,有助於確定心理過程(例如疼痛)的生理標記(Wageret al., 2013);而大批量資料的大腦成像元分析則可以統合不同研究的發現(Lindquist, Wager, Kober,Bliss-Moreau, & Barrett, 2012);同時,傳統的功能定位思路也逐漸被多體素模式分析(Multi-VoxelPattern Analysis)所取代,以此克服孤立地看待腦區功能的傳統視角(Norman, Polyn, Detre, & Haxby,2006)。然而,這些批評與進步,似乎都還未觸及問題的癥結。
Marr(1945-1980)是美國麻省理工大學的心理學家和神經科學家。他採用心理學、人工智慧和神經科學的技術和方法系統地研究人類視覺加工過程。他最為突出的貢獻在於將“計算神經科學”(computationalneuroscience)的方法應用於視覺領域的研究。然而,他在35歲時卻因罹患白血病而早逝。在麻省理工大學同事的合力下,在他去世的第二年,Marr關於視覺研究的專著得以出版(Marr,1982)。這本書總結了Marr在視覺領域的貢獻,具有獨特的見解。而該書的第一章,更從方法學的角度深入地在探討如何研究一個複雜的資訊處理系統,其深刻的內涵越來越受到當今認知與神經科學界的重視(Carandini,2012)。
2. 認識資訊處理系統的三個層次
上個世紀五六十年代,單神經元記錄技術給知覺研究帶來從所未有的革命。研究者發現了視覺神經細胞的“感受野”(receptivefield),更發現了知覺方向(orientation)與大小(size)的特定的神經細胞。研究者甚至認為通過單神經元細胞的記錄,人類將完全瞭解大腦的結構與功能(Barlow,1972)。可是,七十年代過後,相關研究所取得的進展明顯放慢。且不論道德倫理審查對損傷性研究的約束,單神經元細胞記錄領域的研究者似乎漸漸地意識到該領域的侷限:神經細胞層次的探索並不能夠透晰人腦複雜的資訊處理過程,這就像弄清楚一個電路板結構與功能,並不能告訴我們整個電腦作業系統運作的機制一樣。Marr就在這個背景上提出他對複雜資訊處理系統的分析層次理論。
在Marr看來,傳統的神經生理學研究往往只描述現象而不解釋原因,更無法理清機制。“任何一個複雜的系統都幾乎不可能通過剖析它基本組成的構件來認識(Marr,1982)”。他認為,認識一個複雜的資訊處理系統至少需要以下的三個層次:計算理論層次、表徵與演算法層次以及物理實現層次。這個三個層告訴分別我們該資訊處理系統的目標與邏輯(為什麼)、處理過程(是什麼)以及如何執行(怎麼樣)。
在第一個分析層次上,Marr認為研究者首先要弄明白資訊處理系統的計算目標(功能),從而掌握運算的邏輯和思路。在這一認識層次上,資訊處理系統的計算過程和具體實現都不是研究者所應該關心的問題;我們所需要分析的是該系統最終所需實現的功效。這種高屋建瓴視角有如早期“功能心理學”或當前“進化心理學”的觀點。例如,動物的視覺系統最終需要實現的計算目標是讓系統主體獲取外界準確的視覺資訊,以此幫助主體判斷是要逃避還是趨近外在的刺激。這一層面上的分析可以奠定我們對該系統認識的基礎:所有的視覺過程都將服務於這樣的目標和功能。這將更好地幫助我們推測有效的內在表徵和演算法過程,以及其適應性的物理構造形態。例如,逃避驚恐的視覺刺激物能有利於生存的目的,因此驚恐的視覺刺激能夠更快地進入視覺注意的過程(Öhman& Mineka, 2001),具有計算級別的優先性(內在表徵和演算法層面的認識)。再例如,為了適應高空辨別獵物的生存需求,鷹眼的視網膜有兩個中央凹,並且具有更多的視覺細胞(物理實現層面的認識),因此擁有比人眼高數倍的視覺解析度等(Shlaer,1972)。
隨後,第二個分析層次是內在表徵和演算法層面上的認識。這是認知心理學最需瞭解和認識的層次,也是很多心智之謎的所在。Marr(1982)把表徵定義為系統處理資訊的型別或實體。相較於物理規律來說,心理規律有更多更復雜的“不可知”因素,尤其體現為心理表徵的“不可直接測量”。研究者對於這一“黑箱”的探索只能通過實驗進行間接的推測。然而,對於心理過程的內在基本表徵單元,研究者們通常莫衷一是。以短時記憶的內在表徵為例。心理學歷史上有著名的“7±2”規律,即人們通常只能夠在短期記憶體貯7±2個記憶單元(Miller,1956)。然而,對於這種短時記憶侷限的本質,不同研究者卻有不同的看法。一些研究者認為,短時記憶的侷限在於“容量有限”,即短視記憶的內在表徵是個數有限的“儲存槽”,人們只能記住和“儲存槽”個數一樣的記憶專案數量,空間用完即不能容納其他資訊,因此超過容量的記憶專案將無法分配到記憶的認知資源(Zhang& Luck, 2008; 2011)。然而,另一種觀點認為,這種侷限在於“質量有限”,即認知資源能夠分配到所有的記憶專案中,只不過如果記憶專案增多,每個專案所能夠分配的認知資源就會減少。當一個專案內在表徵所需的認知資源小於認知閾限,其內在表徵的質量便在可知覺的範圍之下(Bays& Husain, 2008; Bays, Wu, & Husain, 2011)。這兩種相反的觀點從側面體現了我們對心理內在表徵和演算法層面上認識的侷限。我們只能夠通過假設檢驗的過程,對於相互競爭的模型進行驗證,以此推測內在表徵和演算法的過程(vanden Berg, Shin, Chou, George, & Ma, 2012)。可是,對於很多心理過程的內在表徵(如知覺、語言、決策等),我們通常缺乏相互競爭的模型和理論,這很容易導致大多數研究缺乏“可證偽性”,不利於科學研究的開展(Coltheart,2013)。
最後一個層次的分析屬於物理實現層面上的探討。對於電腦科學,表徵和演算法屬於軟體程式設計,而物理實現則屬於電子工程;而對於探討人類心智的科學,表徵和演算法層面的認識屬於認知心理學的任務,而物理實現層次的認識則屬於神經科學的範疇(Marr,1982)。這一層次的認識就是要實現表徵和演算法的具體運作過程。要注意,對於同一種演算法,可以有多種物理實現模式。例如,同樣是加減乘除的四則運算,算盤和計算器就是兩種不同的物理實現模式。雖然,這兩種計算工具的物理實現不盡相同,內在表徵也略有差異(算盤為十進位制;計算器為二進位制),但是計算任務的目標(第一層次)和演算法過程(第二層次)卻是相同的。反過來,如果我們僅僅通過研究物理實現層次上的差異而斷定算盤和計算器在四則運算過程中完全不同,結論顯然是有失偏頗的。此外,通過理清物理實現層面的規律,我們可以賦予基礎研究的成果以實用的功能。例如,通過探明運動神經腦區的訊號規律,神經工程學(Neuroengineering)已經成功地實現利用人腦意念直接控制外在目標(如機器手或電腦螢幕上的物體)運動方向的設想(Serruya,Hatsopoulos, Paninski, Fellows, & Donoghue, 2002)。這項技術的成熟,將為殘障人士帶來福音:他們能夠通過某種裝置,直接用大腦控制行動輔助工具,擺脫殘障的侷限。可是,這並不意味我們已經理清了運動過程所涉及的複雜的內在表徵和演算法過程。
圖1. 認識資訊處理系統的三個層次
我們可以通過圖1的例子來理解這三個層次。例如,對於一款重力感應的平板電腦賽車遊戲來說,在計算理論層次上,設計者首先要弄清楚該遊戲任務的目標:即遊戲者可通過重力感應控制賽車左右前後運動。進而,在表徵和演算法層次,我們可以進一步思考如何實現計算的目標。在計算機程式設計中,資訊的表徵即為“0”或“1”的二進位制形式。而在系統操作的設計上,我們可以進一步採用邏輯符號規律,建立連結重力感應和使用者控制的演算法。這些都屬於資訊處理系統具體的計算內容(是什麼)。最後,根據表徵(二進位制)與演算法(重力感應與使用者控制的邏輯運算),我們可以使用相應的電子原件,將重力感應裝置與電腦硬體整合在一起,這就在物理層面上實現了該遊戲的計算任務(通過重力感應控制賽車)。
類似的,對於人類的運動任務,如跨欄,我們也可以在不同層次上對其進行剖析。在跨欄過程中,運動員的目標在於能夠讓快速地跨過欄杆障礙(計算理論層次)。對此,在表徵和演算法層面上,運動員的大腦要對欄杆和賽道的資訊進行內部的表徵和統合,並且判斷在何時以何種力度起跳,以及落地後如何調整姿勢保持身體的平衡和運動的速度等。在這個簡單的運動過程中,現場的資訊如何與過往經驗(記憶)相結合從而影響最後的運動決策,是內在表徵與演算法的核心。可是,到目前為止,我們對這一層面的認識還停留在描述的階段。雖然,而在物理實現層面上,我們可以通過單神經元細胞記錄(或者fMRI) 探明運動神經細胞(或運動腦區)在運動執行過程中的活動規律。可是,這並不意味著我們弄清楚了內在表徵和演算法的機制。
前面提到Burge教授批評了當前神經科學研究取向中滿足於“找相關”而不是“找因果”的做法。隨後,他又提出了“知覺科學”作為揭示人類心理表徵的重要科學,應該受到越來越多的重視。他認為人類思維一個重要的前提就是要能夠準確的表徵我們所見的世界。“知覺科學”對心理表徵的研究可以作為通向人類思維的重要途徑。誠然,Burge教授指出了當前神經科學研究領域的一些問題。然而,作為一個非從事神經科學研究的人士,他的批評有失偏頗。例如,他抓住了功能核磁共振(fMRI)研究的一些問題,就批評了整個神經科學對於人類心智研究的努力。他用了“神經泡沫(Neurobabble)一詞來批評當前神經科學在心理學領域的興起。
正如Burge教授所指出的,許多神經科學的研究技術都在尋找神經活動和心理活動之間的相關關係,例如事件相關電位技術(ERP, event-ralted potential)尋找的是腦電和心理行為之間的相關,而功能核磁共振(fMRI, functional Magnetic Resonance)尋找的是腦部血流量和心理行為之間的相關。但是,相關並不能說明因果。為了接近因果關係的求證,神經科學提出了分離的驗證邏輯。
所謂分離,指的是大腦活動和心理行為的分離。在具體的研究當中,我們通常可以看到研究者論證驗證一個大腦特定的活動在特定的心理行為下呈現,而在其他的心理行為活動中不出現。這種論證屬於“單分離”(single dissociation)。然而,這樣的論證還停留在相關關係上。研究者為了更加接近因果關係,提出了“雙分離”(double dissociation)的邏輯。這種做法源於早期的動物實驗。
一個經典的案例是論證大腦顳葉和頂葉在物體識別和位置識別中的特殊作用。研究人員首先損傷了動物的顳葉,動物無法識別物體,但是能夠意識到物體的位置(單分離)。研究人員再在另外的動物身上發現,損傷了頂葉,動物無法識別物體的位置,但是能夠意識到這個物體是什麼(單分離)。這兩個關於物體識別和位置識別功能和大腦部位的分離現象組合起來,就構成了一個典型的雙分離現象:顳葉損傷,物體識別的能力也消失,但是位置識別能力還存在;頂葉損傷,位置識別能力消失,但是物體識別能力還存在。雙分離現象讓腦區活動和心理行為之間的特殊相關關係變得更強,更加接近因果的論證。
相同的邏輯被應用到了神經科學的其他研究思路。只有初級的研究者會滿足於單分離現象的結果,例如,某個腦區在特定的任務下啟用,而在另外的活動中不被啟用(單分離)。為了驗證這個任務和該特定腦區的關係,我們還可以驗證:1. 如果這個腦區功能被削弱(增強),會不會影響該特性任務的表現?(直證因果);2. 其他的腦區在該另外的活動中被啟用,但是在該特定活動下,並沒有被啟用(尋在另外一層分離)。 對於第一條,我們可以採用經顱磁刺激(TMS)通過磁場的作用,暫時使大腦皮層部分腦細胞活動減弱,或者可以採用跨顱直流電刺激(tDCS)通過微弱直流電的作用,暫時使大腦皮層部分細胞活性增強。而第二條,則需要在實驗任務上做出精心的設計。
總之,神經科學並不滿足於找簡單的相關。Burge教授缺乏對神經科學研究的瞭解,以致於片面地認為神經科學的研究可以簡單地解讀。
3.神經科學的研究技術和手段
Burge教授一文給人的印象是神經科學只使用昂貴的fMRI。雖然fMRI技術“貢獻”了至少5位諾貝爾獎得主,但是它的弊端也越來越收到人們的重視。研究者把死掉的三文魚進行核磁共振掃描,之後採用複雜的資料處理方式,也驚人地發現三文魚的一些腦區在某些時間段內被“啟用”。此外,fMRI技術並不是檢測神經電流活動,而是檢測大腦血流量的生理指標。這種間接關係降低了fMRI的說服力。再加之其很差的時間精度,研究者需要在實驗設計過程上花費更大的精力。所以,採用fMRI或者另外一種功能成像技術(PET)本來就並非十全十美。相比於fMRI的昂貴、時間精度差、用生理指標代替神經活動等問題,ERP技術就具有較為廉價、時間精度高、直接檢測神經電活動(突觸後電位)的優點。然而,ERP技術也難以避免具有空間精度低的問題。其他的一些記錄手段包括了腦部損傷技術(僅用於動物模型或者特殊的臨床病人身上)、單神經細胞記錄技術(僅用於動物模型上)等。但是這些技術並不適用於人類被試。fMRI、PET和ERP技術作為無創性技術,獲准在人類身上使用。因此,我們可以發現,神經科學的研究本來就是一個複雜,並且需要新技術新方法的學科。它的研究並非像Burge教授所提出的那般“隨意”(Arbitrary)。神經科學工作者需要“帶著各種鐵鐐跳舞”。同時,它也並一定依賴鉅額的研究投入(如ERP技術)。
隨著經顱磁刺激、跨顱直流電刺激、神經細胞解碼技術等發展,研究者已經能夠初步地把神經科學的技術引用到現實中,推動人類的福祉。具體的例子包括,跨顱直流電刺激技術應用到美國空海軍領域,提高惡劣條件下戰士的認知和決策判斷能力;經顱磁刺激應用到抑鬱症的治療上;以及最神奇的是神經細胞解碼技術應用到癱瘓病人身上。
4. 視角的混淆
一般人認為,大腦活動和行為反應之間是線性的關係。因此,一旦我們知道大腦活動與行為反應之間的對應關係,我們就似乎弄清楚了從神經系統到行為活動的過程和機制(Weisberg,Keil, Goodstein, Rawson, & Gray, 2008)。人們還會認為包含大腦影像的心理學研究報告更加可信,並且更具有科學性(Keehner,Mayberry, & Fischer, 2011; Krull & Silvera, 2013; Schweitzer, Baker,& Risko, 2013)。即使是久經訓練的研究者有些時候也不能避免這一誤區。目前大多數研究仍然遵循著這樣的潛在假設:一旦我們知道特定腦區(或神經網路)在特定任務下的活動模式(血氧訊號或電位規律),與該腦區(或神經網路)所對應的心理過程與機制就得以解釋。但從Marr的角度來看,大腦成像或者是大腦刺激一類的研究僅僅增加了我們對心理過程在物理實現層面上的認識,物理實現層面的認識(第三層次)和表徵與演算法層面的認識(第二層次)不能混為一談。
BRAIN 計劃在認知神經科學領域的設想就充滿了這種假設:通過先進的大腦研究技術,我們可以逐漸探明不同神經細胞的功能,可以從更精微的生物化學角度探討神經遞質在資訊處理過程中的作用,並且從基因遺傳學的角度建立基因-神經環路-行為的鏈條——這一切都意味著人類心智的謎團得以迎刃而解。然而,如上述,這種把物理實現等同於表徵與演算法的做法,並不正確。正如弄清楚一個電路板各個電子元件的構造,我們還是無法弄清計算機作業系統的原理。同理,弄清楚神經細胞或者中樞神經系統特定腦區的結構和功能,也不意味著我們能夠知道心理活動的內在過程與機制。
從認知心理學的角度來說,表徵和演算法觸及心理過程和機制的核心。然而,究竟什麼是心理活動的過程和機制?對此,不同研究者之間莫衷一是。那麼,進一步而言,理清大腦活動就能夠解釋人類心智活動的過程和機制嗎?也就是說,我們是否能夠通過物理實現層次上的認識來促進表徵和演算法層次上的認識呢?或許,這個問題的情境正如一個電子工程師希望通過弄清電子元件的運作原理來推測計算機軟體的演算法編碼。答案可想而知。
當前,認知神經科學正以前所未有的速度發展,不可否認的是,通過諸多大腦研究技術,如大腦成像技術(如:fMRI,ERP, EEG)和大腦刺激技術(如:TMS, tDCS, tACS),我們對大腦的功能有了更近一步的瞭解。這些研究技術補充並完善了前人通過腦損傷病人研究所積累起來的知識,更擺脫了傳統大腦損傷實驗只能夠在其他動物(如大鼠或靈長類動物)身上施行的侷限。可是,上述所列的每一項技術在有明顯優勢的同時,也有明顯的劣勢。例如,fMRI雖有較好的空間解析度,但是它只能夠通過血氧訊號的變化間接反應神經活動的過程,更在時間解析度上明顯遜色於ERP技術。而後者,則在空間計算上遇到反向問題無解的難題,具有較差的空間解析度。面對不同技術的桎梏,認知神經科學研究者需要通過嚴格的實驗設計以及複雜的資料統計分析才能夠得出科學的解釋。BRAIN計劃在這種背景下誕生,將在技術上大大提高研究的效率,並且開發新的技術以克服這些問題。然而,無論測量可以多麼細緻、多麼精確,值得注意的是,這都是僅僅在物理實現層面增進我們對人類心智的認識。
5. 未來與展望
目前,我們寄希望於BRAIN計劃為大腦研究提供更加先進的技術支援。然而,也要清楚地意識到這並不意味著擁有了技術後關於人類心智與大腦的謎團都能迎刃而解。研究者應該謹慎地對待心理過程與機制的問題,區分表徵與演算法層次和物理實現層次的差異。可是,這並不意味著探明大腦資訊處理系統的物理實現不重要。相反,神經科學層面的探索本身也是科學的一大進步。另外,BRAIN計劃在臨床疾病篩查和早期診斷治療等方面,也可以提供強有力的技術支援。然而,對於認知心理學的核心問題,BRAIN計劃可能並不能達到預期的設想。
在可預見的未來,Marr所提出的認識資訊處理系統的三個層次將會越來越受到人們的重視(Carandini,2012)。它背後所帶來的爭論也將會越來越激烈。研究者應該注意到這樣的一種趨勢:認知神經科學取向在心理學研究上越來越占主導地位,但是它所面臨的批評也不斷增多。我們應該謹慎合理地採用認知神經科學技術解答相應的問題,避免跨層次的解讀,並且應該更加重視理論和視角上的創新,而不要過分依賴於技術本身。