1. 程式人生 > >對話浙大博導吳飛:人工智慧的前世今生

對話浙大博導吳飛:人工智慧的前世今生

前言

自古以來,人類對人工智慧就有持久、狂熱的追求,從語音識別到智慧音箱,從無人駕駛到人機對戰,人工智慧給人類社會帶來了一次又一次的驚喜,被人工智慧賦能的各行各業都在煥發新的生機。在人工智慧垂直領域商業化繁榮的背後,是基礎層的軟硬體支撐,以及技術層的語音識別/自然語言處理、計算機視覺等應用的漸入佳境。

2018年8月26日,百度為2018人工智慧創意賽集訓營邀請了中國高校計算機大賽人工智慧創意賽專家委員會主任、浙江大學計算機學院副院長、博士生導師吳飛教授,為你呈現人工智慧的前世今生。

圖片描述

注:以下為吳飛教授的演講實錄

回溯人工智慧的起源

人工智慧定義以機器為載體,實現人類智慧或生物質能,機器這個載體就是計算平臺,必須思考人工智慧所依賴的計算平臺的起因是什麼,什麼東西能實現人類智慧或者生物智慧,計算這個概念的產生可以回溯到20世紀30年代,當時的人們發現有很多問題是不可以計算的,也有大量的問題是可以計算的。

圖片描述

圖一:費馬大定理

比如費馬大定理,希望計算N等於2的時候直角線的平方之和等於斜邊,N等於2的時候存在無窮解。這裡成了數學家的夢魘,經過幾百年的努力,現在已經證明了當N大於等於3的時候,費馬定理不存在解。

這個時候也存在很多不可解的問題,或者需要我們去計算的問題,比如前陣子大家看到很多新聞報道,張教授證明了孿生素數的問題。相差2的素數對,例如3和5,5和7,是否存在無窮多個素數對,存在無窮多個,差小於7000萬的素數對,如果兩個素數之間的差小於7000萬,存在著無窮多素數對,這是一個孿生素數的證明。實際上我們再回看數學歷史三大猜想,第一個是費馬定理,這個通過數學家的努力證明了。第二個四色定理,一張地圖上只需要四種顏色,可以把不相鄰的國家用不同的顏色標明出來,四種顏色足夠多了,這個已經被證明了。最後一個是未得到證明的哥德巴赫猜想。這些問題的原因是什麼,我們講如果證明也是一種計算的過程,是否存在一種計算的裝置,可以把需要我們證明的問題或者計算的問題一步一步的按照機械的方式求解出來。

為了解決這個問題,在20世紀30年代同時產生三種計算平臺,分別概括為原始遞迴函式,圖靈機,這是英國計算機鼻祖圖靈提出的,還有lambda,這三種都是計算平臺,證明三種計算平臺的能力是一樣的,圖靈機能解決的問題,在原始遞迴函式和lambda積分都可以被解決,最終圖靈機成為了計算的平臺,也就成為計算機理論的模型的鼻祖。可以現在定義計算,什麼是可以計算的,圖靈機如果在若干步驟之後可以停下來給出答案本身,這個問題是可以被計算的,如果圖靈機永遠在計算,永遠給不出答案的本身,不停機,這個問題是不可計算的,也就是圖靈不可停機。

圖片描述

圖二:《論數字計算在決斷問題中的應用》

圖靈為了解決這個問題,說什麼是可以計算的,什麼是不可以計算的,在1937年發表一篇文章《論數字計算在決斷問題中的應用》。這篇文章裡圖靈提出了圖靈機的模型。他說任何可以被計算的問題,可以通過這套裝置原則性的像機械裝置一樣一步一步求解。機械裝置有哪些組成部分,一個是兩端無限長的紙帶,上面放上數字和程式指令,有一個控制器,有讀寫頭,讀寫頭每次讀入內容,按照控制器的指令或者對紙帶上的內容讀入,或者左移或者右移,如果有這麼一套裝置,任何可以被計算的問題均可以原則性的被這個裝置所完成。舉一個簡單的例子,比如1+2等於3,圖靈機怎麼完成,1+2被寫進去,圖靈機讀1這個數字,這是一個數字,不做任何操作,向右移動一個紙帶,發現+的符號,圖靈機的控制器說已讀入加法符號,相右尋找被加數,找到之後寫上3,其他數字就被刪除。這個過程把1+2計算出來了。

因此圖靈機現在變成現代計算機的理論模型,現在計算機所有的計算的步驟都是按照圖靈機的理論模型來進行實現的,因此圖靈成為計算機理論鼻祖。為了紀念他,1966年設立了圖靈獎。圖靈一生也是比較短暫的,只在人類的世界上存活了42年。雖然是計算機理論鼻祖,但他的去世是悲劇性的事件。去世的時候床頭留下了一個咬了一口的蘋果,自殺身亡。我們知道蘋果公司的logo也是咬了一口的蘋果,所以都希望蘋果公司出面解釋,為了紀念圖靈而把logo設定成咬了一口的蘋果,但蘋果公司從未對logo作出任何正面的解讀。圖靈的自殺身亡因為受到當時社會的不公正的待遇,英國首相在2009年向圖靈表示深深的歉意。

圖片描述

圖三:解碼器Enigma

圖靈在二戰期間有一個解碼小組,研製一個解碼器,解碼器直接破譯了德軍的密碼,將二戰的結束時間提前了三到五年。雖然在人類的歷史長河中圖靈存在的時間非常短暫,但他不僅創造了計算機理論模型,且在實際應用中也做出很大的貢獻。

人工智慧學科的誕生

人工智慧學科意義上的誕生,是在1955年登上人類歷史舞臺。1955年兩個很年輕的學者和兩個年長的學者他們一起給美國的私人基金會寫了一個專案申請書,專案申請書的題目叫做希望在夏天開展一個研究專案,專案的名字是有關AI。至此,AI這個單詞在1955年8月31日登上了人類的歷史舞臺。他們希望私人基金會資助一筆錢,在1956年的夏天有十幾個學者能開展有關人工智慧的研究,研究要讓機器像人那樣認知、思考和學習,即用計算機模擬人的智慧。

私人基金會批准這個專案,為了讓這個專案被批准,在報告裡列舉了人工智慧值得關注的七個問題,分別叫做自動計算機,計算機程式設計,神經網路,計算的複雜性,人工智慧演算法的智慧學習與提高,歸納與演繹,隨機與創造力。他們認為在1956年這七個問題是讓計算機模擬人的智慧活動所必須解決的關鍵問題。那前面四個問題是計算機理論科學正在如火如荼進行研究的問題。國家有863重點研發計劃叫高考機器人,題目叫做基於大資料的內容智慧的演算法,這個專案下面設九個課題,分別要去參加高考數學,高考語文,高考歷史和高考地理的高考,希望考進前20%的水平。九個課題已經驗收完畢。專家介紹,一旦涉及到這樣的題目,他們稱為自然語言類的題目,高考機器人無能為力。高考機器人只有對公式型的試題表現的能力非常強大,比如三角函式的分解,求某條直線,垂直於另外一個平面,對這樣的公式型的推導問題,高考機器人表現的能力非常強大,但是一旦碰到應用題或者語言類的題目,將無能為力。

舉個簡單的例子,比如雞兔同籠的問題,一個籠子裡面,雞和兔一共有幾條腿,問雞有幾隻,兔有幾隻。機器人必須知道雞有兩條腿,兔子有四腿。在不知道這些的情況下,高考機器人也無能為力。人工智慧提出來之後就邁上了征程,最初的征程是希望完全的替代人類,完全複製人類的大腦,但是從發展的歷史道路來看,我們發現人工智慧按照取代人類的部分工作的道路在不斷向前發展,比如用機器來進行定義的證明,去取代解題專家,進行機器的翻譯。大家看到廣告片,百度公司的機器翻譯做的非常好,獲得國家科技進步獎。這是用機器進行語言的翻譯,來替代我們的翻譯工作者,用專家系統,比如面向醫學的專家系統來替代醫生等。

人工智慧三種種類:領域人工智慧、通用人工智慧、增強人工智慧

從智慧角度對人工智慧進行三種不同的分類,第一種稱為領域人工智慧,這種人工智慧指任務導向,比如像Deep Blue和AlphaGo,計算能力非常強大,計算非常快,資料非常多,因此超越了人類。但這種超越只是在任務上面的超越,比如AlphaGo,戰勝了李世石,戰勝了人類,獲得九段的水平。但是讓AlphaGo做交通的預測,去做其他的工作,他無能為力。因為AlphaGo的成長是依賴於圍棋的大資料,並沒有把交通的大資料輸入給它,因此這種人工智慧就是弱人工智慧,是在目標比較明確的領域上面超越了人類。第二個通用人工智慧或跨領域人工智慧,這個只有人類所具有,人類具有很強的舉一反三,從經驗中學習的能力,我們人的大腦並不是靠大資料驅動,或者不完全靠大資料驅動,我們有很強的歸納能力,很強演繹能力,可以把大資料厚積薄發,歸納和演繹的能力非常強大,這是人類通用的人工智慧所具有的能力。

圖片描述

圖五:混合增強人工智慧

第三種是增強人工智慧,機器智慧有它的長處,人類的智慧有它的長處,能不能把人類智慧和機器智慧進行疊加,形成人機混合的形態,我們叫混合增強人工智慧。比如圖五中第三四張圖片達芬奇手術機器人,人類的醫生坐在機器人的後端操作施展複雜的外科手術,如它可以把一個葡萄皮剝開,再縫製成功。這種高超的外科手術可能人類醫生很難完成,但依靠工業級的前端的手術操作手,加上經驗非常豐富的人類醫生進行指揮,就可以把複雜的外科手術完成。

圖五的第二張圖片是巴西世界盃殘障人士,他的腳不能運動,但是科學家們給他裝上一個外骨骼機器人,探索他踢球的腦電波,外骨骼機器人利用腦電波進行提交,就開出巴西世界盃第一個球。本身這個腳已經失去了這個功能,但是有強大的機器和人類的意識形態的混合增強人工智慧疊加在一起,就完成了開球的動作。因此長遠來講,今後是人工智慧和機器智慧緊密的結合在一起,共同完成一些不可能完成的任務,如圖五第一張圖片裡的智慧城市,這個裡面人機物網是相互聯絡在一起,各方面的能力進行疊加,就演化成1+1大於2智慧行為的系統。這是人工智慧的歷史和發展。

人工智慧的今生:5G、IOT、晶片

圖片描述

圖六:鋼鐵、電力、硬體、軟體、軟/硬協同的歷史發展之路

在美國時間8月2號蘋果公司的股票市值已經突破了一萬億美元的大關,這是整個股票公司市值突破的比較關鍵的歷史關口。我們看到目前有關IT技術為主的美國的公司,在近十年來公司和市值都在不斷的增長, IT公司紛紛像百度一樣把人工智慧作為他們的首要的研究的方向,用人工智慧來提升他們的產品。我們也看到,在美國的股票市場上面,實際上經歷了幾次門檻的節點,比如圖六中1901年,美國鋼鐵公司股值超過10億美元,通用電氣公司超過100億美元,高股票值的公司從鋼鐵時代到電力時代到硬體時代到軟體時代的邁進,一萬億美元的超越,下一個十萬億美元的公司他們的主打產品可能是什麼,可能像計算服務的公司將是下一個時代可能會將超越十萬美元的公司。

人工智慧的生態是怎麼形成的?現在人工智慧正往雲網端芯生態逐漸形成,雲就是智慧雲,研究很多資料都放在雲端,資料傳送到雲端之後,雲端強大的計算資源把資料處理完畢再返回客戶端,或者終端。我們看到過去幾年,雲端計算這個概念在幾大公司正在持續的發力,像亞馬遜、微軟、谷歌、IBM在全球雲端計算上面的份額的分佈。第二個叫做網,網是涉及到兩方面,一個是5G時代的到來,第二個就是物聯網的滲透。5G的時代,從1G、2G、3G到4G,從簡單資料的傳輸到資料的互動能力,以及到5G時代,延時性的下降,可靠的提升,資料傳輸的能力不斷的增強,我們將迎來一個數據的快速的傳輸以及快速的互動,以及安全保障能力的提升,這就是一個網其中的一個方面。

第二個就是物聯網叫做IOT,所有的終端裝置將不可避免的因為具有IP地址被融入到大的物聯網的網路中。預計到2020年,智慧裝置的總數將超過200億臺,這些裝置將非常智慧,甚至無需一直連線到雲端,就能具備看、聽、推理和預測的能力。剛才片子裡面講的百度無人車,其實也是強大的終端的計算能力,能實時的識別馬路上的行人,交通端以及任何一種障礙物,快速的作出一些判斷,這些就是端計算的時代的來臨。我們也把它稱為邊緣計算,邊緣計算的特點就是快速反饋,能夠進行安全隱私的保護,能耗比較低。那麼我們現在看到非常多的IT公司,他們在打造他們的雲端計算的平臺的時候,也在關心邊緣計算的平臺,像亞馬遜、微軟、百度等,他們紛紛在不停的推出自己的雲端計算的平臺的同時,也在著眼邊緣計算的生態的形成。

我們也可以看到現在的深度學習的演算法快速的從雲端向邊緣計算的終端進行蔓延,一些更加高效的深度學習的演算法,從大量的以計算為主的大型裝置上,向以邊端,計算資源不是很豐富的邊緣時代進行邁進。那麼這裡也有一些從學術研究上面,為了加快終端的演算法的執行,有些軟體加速和硬體加速的方法,現在被快速提出來,這是邊緣計算的端為主的生態。那麼我們看到我們有云端計算強大以資料為中心的雲端的強大的計算能力,也有數以萬計的終端裝置需要通過高效計算原則,來搭建起來一些邊緣計算的推理能力。

最後一個就是晶片,那麼晶片的發展是以三個不同的階段,比如CPU是通用的晶片,然後出現了矩陣計算為核心的GPU的加速計算晶片的能力,又有半定製的FGPA的晶片,還有全定製的專用晶片的發展,最後就是要模擬人的大腦一樣的神經形態的晶片。現在的晶片的發展,正邁向從通用到專用,從計算到神經形態的邁向的階段。這些神經形態的晶片基本的原則是非常稀疏,人的大腦有60億神經元,並不是每時每刻都在運轉,如果每時每刻進行運轉,人的大腦一天不是20瓦的電力,可能大腦每時每刻都在冒煙,所有神經元都要高度計算,我們需要的電力是非常強大的。所以神經計算的宗旨就是稀疏化的計算。

人工智慧生態的形成正在按照從人和人的相連,到人和物的相連,再到物和物的相連,現在正邁向人機物相連的三元空間的時代,這個時代裡面,雲端、網端、終端和AI晶片的人工智慧的生態,從最近幾年來看,正在快速的成長和快速的形成。浙江大學建設人工智慧的載體,百度、德清和浙江大學一起協辦的高校計算機大賽人工智慧創新賽就是其中一個方面,我們還在像高中教材的編寫的工作,以及大學教材的編寫參加人工智慧創意賽的比賽。我們想人工智慧的生態還是有三個很重要的方面,一個就是要夯實基礎研究以形成創新之源,二是技術交叉以具備創新之力,第三則是面向場景AI以賦能社會所需,總結起來是能力源,這是生態形成過程裡面推進生態形成的比較清晰的思路。

----實錄結束-----

結語:擁抱人工智慧,享受智慧生活

人工智慧是一門多學科交叉的綜合性前沿學科,理論日趨完善,技術逐漸突破,應用上也在快速擴充套件和滲透,可以預見,在演算法、基礎設施發展的未來,人工智慧的發展和多樣化的生態將會改變所有人的生活。

吳飛,中國高校計算機大賽人工智慧創意賽專家委員會主任,浙江大學計算機學院副院長、浙江大學人工智慧研究所所長、浙江大學求是特聘教授,博士生導師。主要研究領域為人工智慧、跨媒體計算、多媒體分析與檢索和統計學習。視覺感知教育部-微軟重點實驗室(浙江大學)副主任。國家傑出青年基金獲得者(2016年)、教育部新世紀優秀人才支援計劃入選者(2011年度)。