如何深入地淺談人工智慧
啊繾的柚子:
很喜歡看科技袁人每期不落下;然而我今年九月入伍加入了海軍陸戰隊,以後我可能不會每次更新就看得到但是我有機會就會看的。
NVIDIA:
窩不是搞人工智慧的,但是跟搞人工智慧的舍友有交流過,他也贊同一個觀點:現在的多數人工智慧只能叫“智慧演算法”,其作用只是通過大量計算得到與人類思維相似的結果,但是並不能像人類一樣思考。所以人工智慧超過人,還得從根本模式上突破(-_-#)
蟲蟲v2:
看了這期節目,我要去去看看朱鬆純先生那篇文章,瞭解下人工智慧。沒有什麼根據,我就是感覺邏輯思考一定得建立在"自我"這個基礎上。否則無論AI能做到什麼,自主學習,自主判斷,還是自主決策。也不論演算法多麼高明,AI的學習實際上是機械學習、簡單學習,而烏鴉的學習是複雜學習。要進行復雜學習,AI最終要解決我和非我的問題。
大家好。這次我們要談的主題啊是一個超級熱的主題,也就是近年來整個科技界可以說最熱的一個關鍵詞,你肯定知道是什麼了吧?就是人工智慧。你也許要問了,那我以前為什麼不談人工智慧?原因很明顯,因為我完全不是一個人工智慧專家。我對於人工智慧所知甚少,那這一期為什麼要談一談呢?因為一方面是因為世界人工智慧大會要在中國上海市召開,這是全世界人工智慧界一個盛會。( 袁嵐峰博士應上海電視臺之邀探營世界人工智慧大會的視訊見科技袁人上一期,連結:
https://mp.weixin.qq.com/s/6rvnfJNlZPBxD8DeweeIvw)
為了準備這個事情,我也去諮詢了一些人工智慧方面真正的專家,麻省理工大學評出的中國“35歲以下科技創新青年35人”,朱明傑博士,一見面他就叫我師兄,哦這又是我們科大師弟,然後跟他聊起來好多做人工智慧的都是科大師兄弟。經常談到的,我的朋友風雲學會會員陳經,他就是做人工智慧研究的,他就是一個人工智慧的開發者。然後另外一位是我的科大師兄,加州大學洛杉磯分校的電腦科學與統計學教授朱鬆純老師。我以前向大家介紹過,朱鬆純老師寫過一篇4萬字非常長的一個對於人工智慧的非常全面介紹,這個文章呢叫做
你也許啊會在很多地方看到,說這個人工智慧馬上就要超過人了,甚至說要取代很多人的工作了,然後很多人關心人工智慧並不是因為他們對這個科技發展感到多麼歡欣鼓舞,而是出於一個憂慮:啊我的工作明天就沒了。就好像以前看到一個電視節目,這個撒貝南跟人工智慧專家座談。人工智慧專家就說我們非常有信心,五年之內很多的工作就會取代,然後撒貝南說那我的工作呢,他說你呢大概三年,然後小撒就一臉很悲壯的,啊我只剩三年了。實際上呢這都是開玩笑的,實際上你如果去問業界的專家,你會得到印象正好相反。他們真正關心的是人工智慧能做的事太少,而不是太多。
那種討論這個人工智慧取代人類,人工智慧消滅人類。這個種種哲學性的問題呢。他往往不是研究人工智慧的。比如說朱鬆純教授在他這個文章一開頭呢就說到,媒體現在對於人工智慧的誇大宣傳已經到了讓他們這些人非常吐血的程度。比如說經常被媒體拿出來說的人是霍金,當然霍金先生已經去世了。霍金他是幹什麼的?他是一個物理學博士,是研究黑洞的,研究宇宙學的。他從來沒有搞過人工智慧啊;而且他已經患漸凍人症那麼多年,本來他的科研就沒法做了,結果你把它當成一個人工智慧的專家出來,讓他大談特談人工智慧的危險,你不覺得這很搞笑嗎?
斯蒂芬·霍金
還有就是埃隆·馬斯克,馬斯克呢他也不是研究人工智慧的,所以你為什麼要把這些人的觀點看特別重要?其實你更應該看看那些真正研究人工智慧的人。如果去看那些真正研究人工智慧的人,你會發現他們有一種戒慎恐懼的心理。他感覺這個媒體把人工智慧說的太過了。實際上人工智慧呢在它發展歷程當中,已經經過了好幾次的高漲和好幾次的寒冬。實際上人工智慧是20世紀50年代開始出現的這麼一個學科,然後在這中間這個發展狀況,用朱鬆純的話說就是Boom and Bust。是西方經常這麼形容,就一哄而上,然後又一鬨而散,每次都是大家對他寄予一個過高的期望,然後一大堆人來了,然後過一段時間發現研究不出來,遠遠達不到期望,然後大家一會又全跑了。
比如說在朱鬆純80年代剛開始學人工智慧的時候,他是1986年上的科大,那時候呢人工智慧處於一個非常悲催的境地。那時候沒有人好意思說自己是搞人工智慧的,那你就說了那這些人當時在幹嘛呢?他們會自稱自己是搞電腦科學的,或者是搞數學的。然後你再問他具體幹什麼,他會說我是搞計算機視覺的,或者諸如此類一個非常具體的領域,他絕對不會告訴你他是搞人工智慧的。在那個時候人工智慧這個詞幾乎都被汙名化了。所以在這個行業裡面堅持到現在的人,忽然發現近幾年來人工智慧這詞變得如此之熱,然後許多外行都趨之若鶩,然後任何人任何企業都覺得只要沾一下人工智慧這個詞就變得高大上起來,市場估值就可以翻幾番。他會覺得非常不可思議,夢幻般的體驗。
實際上呢我在合肥市委黨校講課的時候,我去講量子資訊,結果講完之後,立刻就有一位非常熱心的學員起來提問,他問的是量子計算跟人工智慧是有什麼關係?量子計算能不能幫助人工智慧突破現在的弱人工智慧達到強人工智慧以至於達到將來的超人工智慧。我說:哇這個問題提得很好。確實是,當然任何人都能看出來,這兩者肯定是有關係的,如果量子計算機造出來了,當然是有助於人工智慧的實現,不過前提是你能造出來嘛。你得完全分清楚,這兩個技術不同的層次,量子計算這是一個有原理,但是實踐當中還有巨大困難的技術,還完全沒到實用階段,只是在一個實驗室演示的階段。
而人工智慧呢是一個真實在用的技術,大家都用了這麼多了,比方說AlphaGo在下棋,還有像無人駕駛很多技術都是真的能用的嘛。無論有沒有量子計算,人工智慧都會繼續發展。當然瞭如果有量子計算當然是個好事,不過前提是你得能造出來。所以啊那我們來講點乾貨,人工智慧的業界它實際是一種什麼發展狀況呢?
陳經就告訴我了。實際上大部分的人工智慧研究,應該說應用,就是你整天在媒體上看到說人工智慧又做到這個又做那個,下棋又贏了,打遊戲又贏了。這些事情都是一種比較簡單的技術路線,就是說收集大量的資料,比方說有很多人發動了幾百萬人去標註資料,搞那圖片識別的。然後大量的資料來訓練,然後去做一個,這實際上是相當於一個擬合的工作,就是有一個多元函式,然後你不知道這個函式結構長什麼樣的,但是沒關係,你從大量的資料去擬合,就是神經網路那個思想,然後最後擬合出來的結果,你可以對一個輸入給出一個很好的輸出,你可以識別出來,這是個什麼東西了,甚至比人的識別能力還要高。
這當然很好,但是這個前提是說因為你有個很大的資料,而且呢你也不知道因果關係,但是總體這樣是可以用的,很多時候你是可以超過人的。這是絕大多數的人工智慧研究是這麼做的。
陳經說呢這是一個比較低階的路線,現在出現了一種比較高階的路線,就是AlphaGo那種路線。他說這個大資料呢我們還是要用大資料,但是這個大資料不是靠人工標註了,不是去發動了全世界數以百萬計的研究生去做這個人工標註,而是讓機器自己跟機器博弈,然後讓它自動去生成資料。你看AlphaGo後來為什麼變得那麼強?
AlphaGo一開始是學習人類的棋譜,到後來呢它再次升級之後變成AlphaGoZero,為什麼叫AlphaGoZero呢。因為它不再學習人類棋譜了,它從頭開始,你唯一給它輸入的就是圍棋的規則,然後它根據規則自己跟自己對弈,然後很快就積累了資料,然後很快它就找到了這個圍棋最好的做法,然後超越了人類所有的棋手,這時人類棋手是遠遠地瞠乎其後。
現在都變成人類要向AlphaGo要向計算機的棋手來學習怎麼下圍棋。計算機棋手不需要向人類學習任何東西了,這是一個現在比較高階的技術路線。它對於研發能力要求是很高的,尤其是對於計算能力要求是很高的。但是AlphaGo這個團隊最大的貢獻,就是證明了這樣一條技術路線是可行的。
阿爾法Go與李世石
所以人工智慧確實是取得巨大進步,在很多行業都重新整理了以前記錄,都做到以前做不到的事情,比方說人臉識別。這個人臉識別本來應該是人的強項是吧?但很長時間,其實人臉識別大家已經做了幾十年了,很長時間,計算機是達不到人的水平的,它實際上就沒有多大用處。
但是像這個商湯科技湯曉鷗,他也是我們科大一位師兄。湯曉鷗呢是第一個做出一個演算法,使人臉識別,機器的這個識別率超過人。這樣突破這個臨界值了,然後人臉識別立刻就得到爆炸性的應用,現在比方說你去任何一個地方,你去一個賓館住店,他第一件事他都會掃一掃,讓你看一下攝像頭來識別一下你是不是就身份證上那個人,這些變成一個非常常用的技術。像這種啊你就並不需要他那個基本原理有多大突破,只需要他那個應用的指標突破了某個水平,比方說超過了人的水平,那他就非常重要的經濟上的意義了。但是這是不是就夠好呢?如果在研究人工智慧理論的人看來,這當然還遠遠的不夠好。
如說像朱鬆純教授,以及他在文章裡面多次引用的他的一些前輩,比如說Judea Pearl教授,他們就一再向大家指出,當前的所有的人工智慧其實在專家看起來完全沒有智慧。這當然要看你怎麼定義智慧了,但是這它實際的意思是說,當前這個人工智慧它唯一做的都是分析資料,都是你給他大資料,然後它從中去學習,然後最後學出來一套基於大資料,它做的超過人了,但是你覺得這是我們人類學習一個知識的方法嗎?
其實壓根不是啊。朱鬆純在他這文章裡面就舉了一個非常有意思的例子,說烏鴉和鸚鵡。大家知道這個烏鴉和鸚鵡呢是兩種鳥類,它們的體型和大小都差不多,但是朱鬆純告訴大家,烏鴉就比鸚鵡要聰明得多。為什麼呢?你說你看起來鸚鵡好像很有智慧,你就跟這個鸚鵡說話,然後把一句話重複幾次之後,鸚鵡就學會了,鸚鵡學舌嘛。鸚鵡可以模仿人類說話,說得也很好。但是你如果跟這個鸚鵡去對話,嘗試上幾次,你就會發現其實鸚鵡完全不知道自己在說什麼,因為它根本不理解它說的那些東西,它是一個機械的重複而已。
現在其實你可以看到很多所謂聊天機器人,你平時能夠見到唯一的在日常生活當中能夠見到的所謂人工智慧應用,就是這個聊天機器人。網上呢也會傳很多的聊天機器人的視訊啊、圖片啦、文字記錄啦,你乍一看的時候你會覺得非常的驚豔,你說哇這個聊天機器人這麼聰明啊。它是不是已經是具有人類自我意識了,它是不是已經通過圖靈測驗了?完全沒有啊。
比方說有人給我看一個說是英國開發的一個聊天機器人叫做索菲亞,這聊天機器人聊得這麼好,以至於沙烏地阿拉伯給了她一個沙烏地阿拉伯的國籍,當然是機器人的國籍。說這是歷史上第一次有一個機器人被授予了一個國籍的,然後給大家看,聊得很嗨啊。像這種你不能跟她多聊,聊的多了,你就會發現它其實就是東拉西扯,來回就那幾句,你可能就發現它其實並不知道自己在說什麼。
索菲亞在被授予沙烏地阿拉伯國籍的會上發言
那反過來說朱鬆純為什麼說烏鴉就非常聰明,他給大家舉個例子說,他說的烏鴉啊都是真實世界的烏鴉,都是有人拍下來的,比方說他看到有一隻烏鴉,這個烏鴉呢拿到一個堅果,它想吃到這個堅果裡面那果實,但是呢啄不開這個果殼,它怎麼辦呢?然後它就做了一個觀察,它發現啊這個堅果如果落在公路上面,有一個汽車壓過去,果實不就出來了嗎?好。它做出這個觀察,但是呢,然後它也意識到,這樣汽車在來來往往的時候,它不能去吃這個果實,因為太危險了,隨時它就掛了。然後它又做了一個觀察,它發現馬路上是有紅綠燈的,當紅燈的時候汽車就不走,這個時候它就可以去吃那個果實,就非常安全。然後它還需要做一個推論,就是在這個紅綠燈地方觀察到的事情,在另外一個紅綠燈那也能行。所以呢它最後就做出這麼一個決策,它把堅果叼到某個紅綠燈的地方,在綠燈的時候放下去讓汽車把它壓碎,然後在紅燈的時候下去吃,然後它就真的就吃到了。你說這是多麼聰明的一隻烏鴉。人看到這個例子會說:哇這個是表現出真正的智慧。但是烏鴉做事的正規化呢跟我們平時理解的人工智慧的那種做事正規化正好相反,朱鬆純就指出我們絕大多數做人工智慧的研究者都是大資料小任務,Big data Small task。
烏鴉學習歷程
烏鴉正相反,它是小資料大任務,你說烏鴉有什麼大資料呢?它只是觀察了屈指可數幾個例子而已,因為它的生命只有一次,它不能自己跑到紅綠燈那地方自己去多做幾次實驗,它早不知道被碾死多少次了。所以真正的智慧是能夠通過很小的資料,就能提煉出當中的規則,然後就能夠進化出,立刻就推演出一個非常好的做法。
它為什麼能夠做到這一點?因為它有因果關係,而傳統的人工智慧純粹是一個統計,它是做的一個相關性的分析。那比方說公雞打鳴,太陽就會升起,這兩者之間是一個相關性的關係,但是我們並不會認為這兩者之間是因果性的關係,對吧?假如你把全世界的公雞都給殺掉了,太陽也不會不升起,對吧?或者你強迫全世界所有公雞在半夜打鳴,太陽也不會半夜就升起,對吧?所以這樣的事情呢只是相關性不是因果性。
又比如說呢如果下雨那有很大的概率地面就溼了,OK但是假如我們反其道而行之,我們人工的去把這個地面打溼了,那你覺得會有很大概率下雨嗎?這好像完全不相關,對吧?所以像朱鬆純和他這位前輩JudeaPearl就向大家強調,因果的邏輯跟相關的邏輯是不一樣的。我們如果想真的達到一個智慧的程度,你應該用一種數學語言明確的把這種因果的邏輯描述出來。
但是這個因果和相關區別在什麼地方?他說這關鍵是在於因果性,我們是在討論一個帶有可能性的世界,是多個世界,而相關性是隻有一個世界,那個世界發生了什麼就是什麼,你不能去改變它,所以那只有一個世界。你可以對這個世界所有一切都瞭如指掌。但是由於你不能改變它,所以你沒法說這其中任何兩件事件有因果關係。
而一個因果性的世界是說我們可以介入,我們會做出一些反事實的推理,我們會說假如我們當初那麼做,那麼這個事情可能會發生什麼樣的變化。當我們能夠這麼設想,然後去做一些實驗去驗證的時候,我們才是在做一個因果性的推理。
朱鬆純建立一個非常浩大的人工智慧的一個框架性的思考,他說在這當中我們應該考慮兩件事,一個是這個物理規律,就是這個物理世界,那些自然界的規律,比如說一個東西要怎麼才能放得穩,它需要一個什麼樣的支撐。然後另外一個是人的動機,這個是來驅動人去做思考做事情的動力。比方說人做影象識別,他在識別什麼?其實最根本的識別是功能。比方說一眼就可以看出來,這個地方是廚房,那個地方臥室,那個地方是書房,他首先想到是這個地方是幹什麼的,從此出發,他立刻就能看出這個圖片的很多特徵。
比方說你可以看出一個現代人的廚房,跟一個古代人的廚房,雖然看起來外表相差甚遠,你如果要計算機去識別,它根本不會認為這兩個是同樣的東西,它模式識別,它怎麼都看不出來,但是人一眼就看出來,這玩意都是廚房,它的功能是一樣的。這是因為人能夠分出這背後的因果關係,然後以這兩個特徵朱鬆純就稱應該把牛頓和達爾文統一起來。牛頓就是物理世界的規律,達爾文就是生物世界的規律。然後你把這個物理世界的因果性跟這個生物世界的基於這種動機價值觀的因果性結合起來,這個才是關於人工智慧或者說的更廣泛一點,他希望把這個人工智慧提升到一個科學,就是關於智慧的科學The Science of Intelligence這樣一個程度,他覺得這應該是未來的人工智慧科學的一個思考的一個框架性的出發點。
古今廚房
我覺得這是非常高妙的一種思考。然後我就問陳經了,那你覺得我們的朱鬆純師兄說的這些怎麼樣?他說說的當然是很好,業界都是非常敬佩朱鬆純的,不過他說的也許在目前改變不了業界大多數人做法,就是說朱鬆純其實非常鄙視那些刷榜的人,就是說你下載了人家的軟體,下載人家程式碼,然後呢搞一個很大的資料集,然後搞一大堆人去調引數,然後最後呢你刷出來的結果,你把識別率又提高多少個百分點,然後超越別人。這業界發的絕大部分文章都是這種,他實際上很看不起這種,湊熱鬧,這個東西跟科研相去甚遠。但是朱鬆純說的再好也改變不了,大多數人還是會做這個事情,為什麼呢?
因為這個事情確實有用,你如果把人工智慧看成一個工程看成一個實踐,那麼這些事情就是當前最有用,而且確實非常有成果,而且主要它並不是人工智慧這個領域本身的人在孤芳自賞,是因為有很多其他領域存在這個現實的需求嘛。所以他們會希望大家用人工智慧應用去幫助他們做到各種各樣的事情,不管是醫療、影象識別、還是無人駕駛。很多領域它都有這個需求,所以人工智慧它的發展其實在當前這個階段,更多的是人工智慧專家跟各個行業的專家,大家來共同研討,做一個深入的溝通。知道每一個行業裡邊他們真正的問題是什麼,然後基於這個行業的專業知識跟人工智慧專業知識大家結合起來,然後這樣就可以一塊取得突破。
所以你可以理解為人工智慧幫助很多已經有深厚積累的領域做出了突破,那個功勞其實有一大半是那個領域自己的,但人工智慧幫它完成這個臨門一腳。這樣的工作確實非常有用,所以大家還會持續不斷做下去。朱鬆純說的可能一時半會不會改變這個狀況,不過呢我們應該這麼想,就是一個學科的發展,它是要有理論提供一個框架,然後有實踐去不斷來消化這個理論的成果。然後很可能消化一個理論需要很長很長時間,但是呢最終你整個學科能夠達到的上限,還是取決於你的理論框架。
比方說,我就聽到過這樣說法,說人類在20世紀初的時候做出了相對論和量子力學這兩大科學革命,然後直到現在呢相對論和量子力學都是人類兩個最最基礎的物理學理論。那有趣的事情就是人類直到現在都沒有充分的消化這兩個科學革命的後果。你看比方說量子科技,實際上指的是量子資訊啦,現在發展的還是非常方興未艾,或者按照他們比較業內人的說法,叫第二次或者是第三次量子革命。
那麼也就是說對於量子力學這個已經有一百多年曆史的理論,大家還在不斷地發掘出其中出人意料的以前沒有想到的新的內涵。就是說我們消化的還遠遠不夠呢。所以呢就有人猜想,我們現在還沒有出現一個新的科學革命,大概就是因為我們還沒有把上一次科學革命的那個成果消化殆盡吧。
但是說到底呢最最根本的你能夠達到上限還是取決於那個理論框架,這不就像三體裡面講那個基本的故事嗎?智子並不需要鎖死人類所有的科技發展,它只是需要鎖死那個最最基礎的高能物理學,或者說粒子物理學就足夠了,你就沒法再發現更深入的層次。
三體 智子
以當羅輯沉睡了數百年之後,醒過來,他發現乍一看好像覺得人類已經發展得非常先進了,結果他就問大史,大史其實也不懂什麼科學了,但大史立刻就指出,這沒有任何奇怪的,他們只不過突破了一樣東西,就是可控核聚變。相當於他有無限能源了,然後它通過無線輸電到處給你輸電,然後就看到好像能夠實現很多不可思議的事情,其實一點都不難。真正令人感到恐懼的是基礎物理理論沒有進展,比方說羅輯醒來一看,丁儀教授你還在教物理!你還是一個物理學教授,你沉睡了幾百年之後,你掌握的知識還是最高深的。這個其實是令人可悲的是吧?所以我們也認為像朱鬆純教授做的這種框架性的思考,這種引領未來的思考也是非常有必要的,將來我們需要更多的這種級別的思考。