人機互動與智慧的起源、本質
摘要:本文分析了人機互動與智慧的哲學起源及科學起源,梳理了古代四大文明關注的不同焦點,即人物、人神、人人、人與環境之間的關係,由此匯出了人機互動與智慧的本質,分析了現代人機互動與智慧中的一些重要概念,探討了人機互動與智慧中的自主性問題,研究了人機互動和智慧的瓶頸,並由此提出了深度態勢感知的概念,最後對人機互動與智慧的發展進行了總結和展望。
關鍵詞:人機互動,人工智慧,自主性,態勢感知,深度態勢感知
1.智慧與互動的起源
霍金曾說過,在過去的20年裡,人工智慧一直專注於圍繞建設智慧體所產生的問題,即在特定的情境下,可以感知並行動的各種系統,在這種情況下,智慧是一個與統計學,和經濟學相關的理性概念。通俗地講,這是一種做出好的決定計劃和推論的能力。那麼什麼是互動與智慧,我們將在下文中進行探討。
人工智慧或智慧科學,其概念最早發源於哲學,早期有一批偉大的哲學家,一直在討論什麼是智慧,什麼是知識。邁克·波蘭尼( MichaelPolanyi),他曾在20世紀60年代寫過一部著名的著作:《The Tacit Dimension》(《默會的維度》),提出“我們知道的越多,那麼我們知道的越少”。同時他還認為我們知道的遠比我們說出來的要很多(Wecan know more than we can tell)。波蘭尼這句話裡面,體現出了默會的知識、隱形的知識,在支配著我們不斷的向顯性的知識進行遞進、進行演化。
第二個人是弗里德里希·哈耶克。弗里德里希·哈耶克在經濟方面對世界的影響非常大,他曾拿過諾貝爾經濟學獎。他一生當中,涉列了政治、社會、經濟、文化、藝術、哲學和心理學,在認知科學方面,他有一本著作《The Sensory Order》(《感覺的秩序》)。在這本書中,他明確地提出了一個觀點“Action more than design”即行為遠比設計更重要,其大意即人的各種感覺,是通過行為來表徵出來的,而不是故意設計出來的,後來的演化造成了設計出現。維基百科的創立人很推崇《The Sensory Order》這本書,認為是這本書,點醒了他創立了維基百科。
第三個是卡爾·波普爾,他是一個偉大的哲學家,提出了三個世界的觀點,物理的、精神的、和人工的。他有一本非常經典的著作《科學發現的邏輯》,他提出科學不是證實是證偽,他認為科學是提出問題進行猜想,然後進行反駁,不斷的試錯,有科學的出現,而不是常規意義上的觀察歸納,然後證實的實證機制。在歸納裡面有很多的漏洞,因為歸納是不完全的歸納,波普爾就有針對性的對歸納進行了梳理。
人工智慧的科學起源,通常認為人工智慧的技術起源,是從1956年美國達特茅斯會議開始。但它的科學起源,可以最早追溯到曾任劍橋大學老師的查爾斯·巴貝奇,他是世界上做機械計算機的鼻祖,做了一臺機械的計算機,計算Sin和Cos數值的大小,從此人類拉開了計算的帷幕。另一個是劍橋大學的伯特蘭·羅素。羅素利用其哲學思想和他的數學基礎,創立了一個很重要的哲學分支——分析哲學。分析哲學的至高點是維特根斯坦,2005年左右曾有一次世界哲學家投票,排名第一即是維特根斯坦。維特根斯坦的前半期寫了一部重要的著作——《邏輯哲學論》。這部書裡提出,語言是哲學的重要的工具,也是哲學的切入點。在此之前,哲學的發展有兩個里程碑,第一個是關於世界本源的問題,即是物質的還是意識的,這個討論了一千多年,後來笛卡爾開始研究用什麼樣的方法來認識世界是物質的還是意識的,提出二元論。在此之後,人們找了很多方法來研究哲學,但收效甚微,直到維特根斯坦,他改變了哲學的軌跡。他前半生研究關於語言的人工性,所謂人工性的語言就是標準化的語言,格式化的語言,是流程性的程式化的語言,而他的後半期主要否定了自己前半期的工作,開始研究生活化的語言,自然性的語言。認為真正的哲學是通過生活化的語言,來體現出哲學的深奧和哲學的意義。
2.歷史中的智慧與互動
在人類的文明的歷史中,有過四大文明古國,在這四大文明古國裡邊最著名的,即古巴比倫和古埃及,這兩個文明,幾乎同時出現,它們是距今6000多年前,就已經有了國家、工具、文字出現,這兩個文明直接導致了歐洲文明的起源。這兩個文明主要是研究人和物之間的關係,例如水利、工具、一些制度、法律。這種人和物之間的關係,後來影響到了歐洲的一些地中海(希臘)文明,後來輻射到整個歐洲大陸,誕生了科學和技術,科學和技術的宗旨研究,就是人和物之間的關係。
除了這兩個最早的文明以外,第三大文明就是古印度文明。古印度文明裡面很重要的特質,就是研究人和神之間的關係。人神之間的關係,主要是人和抽象事物,不可掌控的一些事物之間的關係,在中東一帶,誕生了世界所有最主要的宗教,像伊斯蘭教、像基督教、印度教,佛教等等,都源於此,都是關於人和神之間關係的。
第四大文明是研究人和人之間關係,人和環境之間關係的一個重要的文明,即中華文明。目前世界上唯一一個儲存的較完整、較好的文明,就是中華文明。中華文明體現的不是人和物,人和神之間的關係,是人和人之間如何融洽,人和環境之間如何和諧,天、地、人之間如何共生的問題。
在距今2500年以前,西方公認的科學之祖和哲學之祖,是泰勒斯,他和中國的老子、孔子差不多出現在同一時代,其思想體現在他的一句箴言裡面即“water is best”(水是最好的)。水是一種物質,地球生物是海洋裡誕生出來的,然後水又滋育的和哺育了人類,所以西方的科學和哲學一開始就和物質密切相關,而我們的老子對水也有闡述“上善若水”,孔子的“逝者如斯夫”,也是對水的一種感嘆,但他們大多都拘泥於感性和倫理方面,所以東西方文明的差異從這幾個代表性人物語言裡邊大家可見一斑。
從上文可見在歲月的發展的歷史長河當中,人類四大文明分別聚焦於人物、人神、人人、人與環境,相互之間的關係,而科學和技術的發展,和人和物之間的關聯密切相關,所以,現代科學技術起源於歐洲,是順理成章的,也是可以理解的。但是,目前來看,隨著社會和人類不斷的進步,人和人之間、人和環境之間的關係,日益提到日程上來,所以,現在整個世界的焦點,逐漸從西方轉移到了以人人、人與環境為主的東方視角來。
3.智慧與互動的本質
人和物之間的關係,是西方一個重要的研究方向,機器是人造物,所以人機互動,也是起源於這個西方。人機互動的本質,是共在,即“Being together”。人把自己的優點,和機器的長處結合在一起,形成了一個互動的,互補性的聯結,未來人工智慧的發展方向,很可能是人機融合智慧或人機混合智慧,即把人的智慧和機器的智慧結合在一起,形成一個更有力的,支撐性的發展趨勢,這樣不但研究人機互動的脖子以下的,即生理的問題,而且還會研究脖子以上的,即心理的或者大腦的問題。其實,人機互動或人機混合智慧,都是不準確的詞,最準確的詞是人機環境互動系統,因為人和機器及物質,其互動是不完整的,是通過環境這個大系統,來進行溝通的,所以人機環境系統工程,可能是未來的,一個主要的研究方向。
那麼,人工智慧或智慧的本質是什麼?可以從人的成長經歷或發展上看出一些端倪。一般來說胎兒在母親腹中,就已經開始有了各種感覺,如聽覺、嗅覺、味覺、觸覺,已經開始和外部的環境及母親腹中的內部環境進行互動,已經產生了一個,很簡單的“我”的概念。然後,出生以後,因為視覺、聽覺等感覺發育得不是很完善,更多的是用觸覺來接觸世界,瞭解他周圍的一些事物,隨著自主能力的產生,會試圖擺脫大人的束縛,更願意自己爬,自己走,不希望別人去扶。可以看到,這時候已經開始否定了,否定別人的幫助。據國內外最新的研究結果,小孩形成語言的時候,無論東方還是西方,除了被不斷重複灌輸的爸爸、媽媽這種詞以外,自己先說出的,都是從第一個單詞--動詞“不”開始的,然後會發展到,說“沒有”還有“別”這些詞。“不”、“沒有”、“別”這些詞,就是孩子們成長的一個過程,在這個過程當中,就體現出人的智慧,是從否定開始的,否定外部,否定自己,否定很多事物,來產生了某種智慧性的東西。需要注意,在人工智慧裡邊,其否定機制,還遠遠沒有產生,所以人工智慧和人的智慧,有很大的差異。
我們在研究過程中發現,人工智慧的起點,第一個詞是“是”,being”,即存在,客觀的物質,這是西方的哲學的一個很重要的詞,世界是物質的還是意識的,其中物質就是“being”。然後,關於人的智慧和智慧,還存在著“Should”-應該。《三國演義》裡面的“義”,就是“Should”,“應該”的意思,“仗義”的“義”也是“應該”的意思,“應該”這個詞,在西方里邊非常重要,在東方里邊也很重視,這是東西方文明融合的一個交匯點。Should,翻譯成哲學語言,就是意識的指向,即awareness、consciousness。另外還有want,人有want,即想幹什麼,而機器不會want,機器只會按照程式、指令進行操作,而人還有一個“能(can)”的問題,即能做還是不能做。機器沒有這個問題,只是操作。
休謨在他的哲學體系裡邊,提出了很重要的“休謨之問”:“是”推不出“應該”,這句話的意思是從事實裡推不出價值觀。中國古代著名的一句話“天行健,君子必自強不息”是不成立的。天行健是一個事實,君子必自強不息,是一種價值觀,二者不能劃等號,這裡面涉及到一個很重要的詞--“change”,“變”,人會不斷的“change”,而機器則不能,只會按部就班、因循守舊、刻舟求劍。我們認為這五個詞是人工智慧和人類智慧很重要的差異。另外,人還有一個很重要的特質,即感知的恆常性,人在變化的外界環境當中通常能夠保留對這個事物的本來面目的感知,例如某種顏色。在不同的背景下,會改變這種顏色的影響,但是人卻會能夠在這種變化當中,找到不變的那種感覺,而機器不然,機器它對外部變化的顏色,會有一個實時的反應,很難找到那種不變的東西。
4.現代人工智慧與互動
任何新的事物都有其產生的源泉,人機融合智慧也不例外,人機融合智慧主要起源於人機互動和智慧科學這兩個領域,而這兩個領域起源都與英國劍橋大學有著密切的關係:1940年夏,當德國轟炸機飛向倫敦之際,人機互動與智慧科學的研究序幕就被徐徐拉開了…英國人為了抵禦德國人的進攻,開始了雷達、飛機、密碼破譯方面的科技應用工作,當時在劍橋大學聖約翰學院建立了第一個研究人機互動問題的飛機座艙(即著名的Cambridge Cockpit)以解決飛行員們執行飛行任務時出現的一些錯誤和失誤,另外劍橋國王學院的畢業生圖靈領導了對德軍“恩尼格瑪”密電文的破譯…事實上,早在19世紀,劍橋大學的查爾斯.巴貝奇和阿達.奧古斯塔(劍橋大學畢業生、詩人拜倫的女兒,世界第一位程式設計師)就開始合作機械計算機軟硬體的研製,20世紀之後,數學家羅素、邏輯學家維特根斯坦(圖靈的老師和朋友)都對智慧科學的起源和發展做出了重大的貢獻。
(劍橋最著名的老鷹酒吧是現代人機互動技術的發源地之一)
在現代的人工智慧的發展,劍橋大學也起到了非常重要的作用,其中有三個代表性的人物,第一個就是阿蘭·圖靈,他提出了圖靈測試和圖靈機的思想,然後影響了整個世界人工智慧發展的軌跡。第二個人就是著名的深度學習之父Geoffrey Hinton,他曾是劍橋大學心理系的本科生,後來到了加拿大,繼續做關於人工神經網路的研究,並提出了深度學習的概念和方法,人工智慧因此而得到了復興和現在的繁榮。第三個是AlphaGo之父Demis Hassabis,他是劍橋大學計算機專業的本科畢業生,對推動人工智慧的發展,也起到了非常重要的作用。
人機互動的研究始於二戰時期,當時主要研究因為各種不合理的設計導致的飛機故障,開始主要應用在航空航天領域,後來逐漸擴充套件的社會經濟的各方面。最近人機互動裡面有一個比較熱點的領域——態勢感知(situation awareness,也叫情景意識)由曾任美國空軍女首席科學家Mica R. Endsley提出。態勢感知或情景意識的提出,對整個人機互動產生了巨大的影響。Endsley對態勢感知的定義,是在一定的時間和空間內,對環境中的各組成成分,進行感知、理解,進而預測這些成分的隨後變化狀況。可以看出,在整個人類的發展過程當中,智慧科學是一個涉及交叉學科,涉及心理學、電腦科學、神經科學、哲學、語言學等等,這些學科構成的一個完整的學科體系,可以總稱為認知科學。
當前人機環境系統工程的發展迅猛,其定義為:人機環境系統工程,是研究在人、裝備和環境系統之間,實現最優匹配的一個領域,涉及到資訊的輸入、處理、輸出和控制,以及反饋,人機環境系統的整體設計,及其優化等方面的研究,研究的目的,是整個系統的高效、安全、健康、和諧、敏捷等。
當前在這一領域的研究中出現了很多分支,例如,人機互動、普適計算、情感計算等,併產生了很多相應的關鍵技術,如多模感知、上下文感知、情感智慧、環境智慧、認知智慧、多模介面、感性介面,這些技術用來實現一個最基本的目標,即自然的人機互動。在自然的人機互動中非常重要的一點是資料。所有智慧的產生與刺激和資料密切相關,所謂刺激,就是人感知到的外部的對映。所謂資料是機器接觸到的外部的輸入,通過這兩個來產生相應的融合、理解,進而進行相應的反應和規劃。
資料空間對計算機起著非常重要的作用,研究資料的多指向性(包括能指、所指)是當前人機領域的一個難點和瓶頸,同時資料的多指向性,是人機的難以有效融合的一個最重要的瓶頸,人可以理解一個數據的多指向,多含義,而機器不然,機器有規範,有規則,它只能從一個角度來看待這個資料。
當前人工智慧的發展有三大主要標誌:深藍、沃森和Alpha系列,這三個系統都和資料有關,它們都是在處理過去的大量的資料、規則、規劃。但是這三個最頂級的系統,都有一個很重要的問題,一個瓶頸問題,就是它只能“得形忘意”,而不能“得意忘形”。真正的人的智慧需要臨機決策、舉一反三,而不是像計算機及當前弱人工智慧按照套路去運算。人是算計,算計要比計算靈活的多,是一種可以橫跨主客觀引數的互動性泛計算。
5.智慧與互動中的自主性問題
未來的人機互動及人工智慧系統,有明確的發展方向,它包含四個方面:主動的推薦、自主的學習、自然的進化、自身的免疫。在這四個方面中自主性是非常重要的一個概念。
美軍有一個深綠系統,其目的是借鑑深藍系統的思想,將其對映到軍事指揮和控制領域。它通過指揮員助手、水晶球和閃電戰三個模組,整合出當前的和過去的戰場態勢,以及實時有效的指揮員輔助決策。這個系統裡最重要的是自主性和主動推薦。自主和主動是人工智慧或智慧科學一個很重要的研究熱點和難點。自主應該包括以下幾方面:
第一,自主應具有記憶的功能,而不是儲存,記憶是靈活的,能夠通過相關無關的事物產生直覺,而儲存則無法出現直覺,它只是符合邏輯的東西。
第二,自主應具有選擇性。選擇性是單向性的,即A選擇B。
第三,自主應具有匹配性。匹配和選擇最大的區別,就是匹配是雙向性的,A可以選擇B,B也可以選擇A。
第四,自主應可以控制。沒有控制和反饋,自主很難建立起來。
未來的人機互動及人工智慧系統,它至少是人機環境系統的自主耦合,形成了一個認知智慧環路系統。認知的意思就是資訊的流動過程,包括輸入、處理、輸出和反饋這幾個環節。
人工智慧的重要發展方向,是人機混合智慧。強人工智慧、遷移人工智慧、通用人工智慧,及類人人工智慧,實現還相對較遙遠,當前相對實現的途徑就是人機混合智慧。人機混合智慧就是研究如何在人、機及環境系統之間,實現最優的智慧匹配,人的智慧加上機器的智慧,涉及人機環境系統的整體設計,及其優化等方面的研究,研究的目的包括可靠、高效和敏捷等幾個方面。它最主要的涉及到兩個基本問題,一個是人的意向性和機器的形式化問題。所謂意向性,就是意識的指向。機器難以處理涉及到靈活、可改變的,甚至帶有矛盾悖論性的事物,但是機器的長處在於它不疲勞、儲存大、擅計算,並且能夠準確及時處理形式化、符號化的東西,而這是人所不擅長的。所以,如何把機器的長處和人的一些優點充分的結合在一起,這是一個很重要的命題,也是人機混合智慧的一個瓶頸,其中兩者之間何時/如何相互介入及介入的反應時、準確率是這個瓶頸中的關鍵問題。
在人工智慧和機器人領域有一個著名的悖論叫莫拉維克悖論,莫拉維克悖論指出:和傳統假設不同,對計算機而言,實現邏輯推理等人類高階智慧只需要相對很少的計算能力,而實現感知、運動等低等級智慧卻需要巨大的計算資源。說明當前人工智慧領域很多問題不是僅僅靠提高計算能力就能解決的,這個悖論用哈佛大學心理教授Steven pinker的一句話來說,就是困難的問題是簡單的,簡單的問題是困難的。
對於人工智慧這個最終的悖論而言,意向性、意識是整個智慧科學的瓶頸,可以看出,意識就是一種感知,這是情境感知。還有一種是非情境的感知,能夠穿越時空,這是人的意識,機器則不然。
對於意識,著名心理學先驅,美國第一屆的心理學協會的會長William James曾說過“人的智慧就是忽略的藝術”,人知道怎麼忽略一些不重要的事物,而把精力聚焦到一些重要的,一些關鍵之處/特徵之上,而機器不然,只擅長處理大資料,而不擅長處理小資料、假資料。
“自我”的產生是意識最重要的一個基礎,自我的概念實際上就是建立了一個座標系,“自我”即座標系的原點,人類都是以自我為原點度量周圍世界與事物的。意識的出現往往會造“無中生有”和“有中生無”。無中生有,往往是隻有外界的刺激所產生的資料形成數值,數值不但包括客觀的數量,而且還形成了主觀的賦值。比如說“1”裡邊,它既是一個單純的客觀的數值,同時“1”也是對自我有特殊意義的一個數,例如一杯茶,一條毛巾,裡面有很多主觀的一些情感化的賦予。第二,形成數值以後,需要提取有價值的東西即資訊。資訊就是有價值的數值或者資料,從資訊裡面可以獲取知識,從知識裡邊提煉邏輯,也就是從0到1,從1到n的過程,正應了中國古代道教所說的:道生一、一生二、二生三、三生萬物,它整個的過程就是無中生有的過程。有中生無,就是指邏輯產生意向,從意向性匯出意識,就是覺察覺知,從意識裡邊,沉澱出潛意識,從潛意識昇華為無意識的過程,也就是從n到1,從1到0的一個過程,萬物歸三、三歸二、二歸一、一歸道之歷程。
6.深度態勢感知
通過意識或態勢感知(情景感知)及情境化的東西和非情境化的東西的結合,我們提出一個新的概念,叫做深度情境意識,或深度態勢感知(Deep Situational awareness)。什麼叫深度的態勢感知,我們認為:這是一種人機智慧,既包括了人的智慧,也融合了機器的智慧,是能指和所指,所謂能指,就是指事物本身。所謂所指就是事物本身所包含的語義和內涵,即涉及事物的屬性。能指主要涉及到事物的感覺,又關聯它們之間的關係,所指包括它們的知覺。所謂感覺,就是指對屬性的這種對映,所謂知覺就是聯絡、理解。既能夠理解事物原本之意,又能夠明白弦外之音,是合情合理、通情達理的一個方式,是人機環境系統中各元素的主動的拓樸,處理跨情境的原型特徵的一個空間。與Endsley態勢感知概念的不同之處是,它關涉有限時空和資料/資訊資源環境下的人、機、環境系統之間的互動,包含人的態勢感知和機的態勢感知及其之間的有機融合。
深度態勢感知具體涉及的是感覺、知覺、規劃和反饋那麼四個環節,感覺,人的感覺和機器的這種輸入有所區別,人的感覺裡面包含了想象和真實的刺激,所以人的感覺是真實的和虛擬資訊的疊加,知覺就是把這些資訊串起來。所謂對事物的理解,就是看見了之間的各種聯絡。規劃和反饋則是控制方面的兩個重要術語。
另外,人的深度態勢感知或深度情境感知中有一個很重要的機理——彌聚,就是能夠把數理、地理、物理、生理、心理、倫理、法理、管理等方面的知識及時的準確的進行相應融合、分配、表徵、延展,而機器只是從一個角度進行梳理,所以人機的差異在深度態勢感知能力的彌聚效應。
人工智慧發展到今天,它解決的主要的途徑,就是形式化、符號化。當前人工智慧在知識表示、問題的求解、自動的推理、機器學習、自然語言理解和模式識別方面進行了諸多工作,也進行了統一的認知結構化的處理。但當前人們對人工智慧的未來,仍有很多的質疑和不滿,主要原因在於有兩個很重要的領域,尚未得到有效的開發,一個是神經科學,關於人類大腦的開發還沒有得到非常突破性的成果。第二是認知心理學,這個領域也沒有得到很好的發展。神經科學涉及到三個主要的方面,第一是神經的編碼,第二是計算的迴路,第三是神經的發育,這三個方面,都沒有得到有效的這種研究和表徵。認知心理學裡中概念的發展,學習和記憶,和知覺的加工,也沒有深刻的理解,所以,這種認知的滯後,進而對映到這個人工智慧裡面,產生了一些不良的反應,所以如何來實現這些學科的綜合協調的發展,人機環境系統,很可能是進行協調和整理一個有效的工具。
在這個感性和理性的過程中,有一個很重要的方向,就是大家所熟知的可計算性理論。在可計算性理論裡邊有一個對立面——可算計性理論。所謂可計算性理論,就是指運用事先規定的規則,將一組數值,變換為另一組數值的過程,就是可計算的過程。而可算計性理論不但要處理合理性,還要處理非合理性,包括非理性的東西。它不但要處理邏輯性的東西,而且要非邏輯性的東西;不但要進行計算,而且還要進行算計,這些對立面的整合,可能是算計性理論的一個基礎。在此基礎上,需要對學習、理解、知識和概念進行重新定義。例如理解的概念是看見了聯絡叫理解,看不到聯絡叫不理解。對於人的學習,學和習不同,學是由內而外發出的主觀性行為,習是練習,通過練習,來加強它的理解,而機器則不是學習,機器是輸入,是賦值,是規則。
總 結
本文中探討了人機互動和人工智慧的起源和瓶頸問題,人工智慧和智慧科學的發展,包括三個基本的階段,第一個階段是傳統的人工智慧,這個傳統的人工智慧已經有了遊戲規則,它的基本的特質就是數學形式化的東西,加上再某一領域的展開。這裡邊還涉及到一個自動化的問題,其實很多問題是自動化的問題,不是人工智慧的問題。自動化涉及的是結構化的資料處理,人工智慧是非結構化的資料處理。第二個大的階段是人機環境系統的互動領域,這個領域裡邊正在形成規則。這個規則主要體現在兩個方面,第一個方面就是自動化的處理,第二個方面是弱人工智慧。當前在這個領域裡,還要加上各個行業和各個研究的指向。第三個領域就是未來人機融合智慧系統領域,在這個領域裡面,目前還沒有遊戲的規則,它主要的體現在人的智慧加上未來的強人工智慧,或一些通用的人工智慧。這個領域,還需要進行一些積極的探討與多學科交叉研究。