“AI就是統計學”?阿里AI負責人金榕逐條駁諾獎得主薩金特
雷剛 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
“AI首先是華麗辭藻,其實就是統計學。”
這是2011年諾貝爾經濟學獎獲得者托馬斯·薩金特(Thomas J. Sargent)近期在中國公開演講時對AI的結論。
於是一石激起千層浪。
AI研究者紛紛坐不住了,其中,阿里AI負責人、阿里巴巴達摩院機器智慧技術實驗室主任金榕,決定逐條批駁薩金特的觀點。
也藉機正本清源,表達了對於AI發展現狀和未來的看法。
量子位將問答實錄編輯如下,最後也附錄了薩金特演講實錄,孰是孰非,一辯便明。
△ 阿里AI業務負責人金榕
金榕駁薩金特
問:薩金特說,“人工智慧其實就是統計學,只不過用了一個很華麗的辭藻,其實就是統計學。好多的公式都非常老,但是所有的人工智慧利用的都是統計學來解決問題。”
金榕:這位巨集觀經濟學家也許是習慣了用統計去尋找經濟的因果關係,因而認為AI也是這樣。即使是他提到的動態規劃(dynamic programming),也不屬於統計學範疇。
除了統計,AI中的“學習”“推理”和“決策”中還使用了代數、邏輯、最優化等許多其他學科知識與方法。此外,有了演算法後如何有效實現也非常重要。所以單純說AI就是統計學,或者說“所有的AI都是利用統計學來解決問題的”都是片面和不準確的。
在這裡我們首先需要定義什麼是人工智慧背後的核心技術。現在人工智慧技術的成功背後,是基於對海量資料的學習,因此大量的大資料處理、優化以及分散式計算基礎設施都扮演了非常重要的角色。
此外,AI還涉及到一個關鍵因素,就是如何實現最優的智慧決策(例如AI打遊戲)。一些理論和實證研究已經發現,神經網路就非常善於在複雜的條件下做出最優的決策。神經網路也不是統計學範疇。
還有,人工智慧在計算機視覺、語音識別等領域取得的突破,還得益於硬體的日趨成熟。類似智慧音箱天貓精靈、Echo的成功不僅來自於成熟的語音識別演算法,也源於麥克風陣列等硬體裝置變得越來越可靠。
那如何比較準確的表述統計學和AI的關係呢?應該說,統計學是人工智慧若干重要基礎之一,但遠不是全部。
就像我上文提到的除了統計學,AI的核心能力還來自於數學(博弈論、數值分析、邏輯學等)、運籌學(優化)、計算機科技(分散式計算、平行計算、CPU、NPU)、神經科學,甚至心理學。
問:AlphaGo為代表的這一波AI浪潮,跟統計學之間有直接關係嗎?
金榕:AlphaGo使用了蒙特卡洛樹搜尋、神經網路、增強學習等方法,因為演算法規模大,所以採用了分散式計算來實現。棋力更強的AlphaGo Zero沒有使用人類資料,而是從自我博弈中學習。
所以這更說明AI遠比統計學來得廣泛。所以推動這一波AI浪潮的正是神經網路的迅速發展,以及能夠讓大量資料發揮作用的演算法和算力。
問:托馬斯·薩金特也談到了交叉學科研究推動的科技進步,您是否認同?如何評價這種觀點?在這波深度學習為推動力的AI浪潮中,哪些學科的交叉起到了推動作用?
金榕:這一觀點我很認同,這也是很多學者的共識。就像我上面提到的,AI不是獨自成長起來的。1956年的達特茅斯會議(Dartmouth Conference)被學術界公認為是人工智慧的起源。
今天有人說現在是人工智慧的春天,其實這都源於我之前提到的一系列技術的發展與進步。特別是我剛剛提到的硬體,諸如麥克風陣列技術的成熟對語音識別的發展起到了重要作用。還有超強的算力,不論是GPU或者是雲端計算,都給我們帶來了強大的計算能力和靈活度。
我們在自然語言對話機器人的開發中,還會應用到許多心理學知識。所以說人工智慧的繁榮是諸多學科交叉相互影響,共同促進的結果。
問:下一波大的AI技術躍遷,您覺得會有賴於哪些領域/學科的交叉研究成果?
金榕:我認為首先可能來自於AI晶片、量子計算這些全新的計算基礎設施對算力的巨大提升上。
此外還有神經科學的一些重要突破,可能將揭示大腦中神經元如何處理資訊與做出決策的,這對人工智慧的發展也有重要意義。
問:人工智慧的概念提出已經60多年了,許多演算法和模型在幾十年前就曾提出了,但在過去的發展中,礙於計算力和資料的侷限,此前的發展並沒有像如今這樣迅速,這是不是從側面印證人工智慧也算是統計學的一種呢?
金榕:計算力和資料的增長是人工智慧發展的必要條件。AI的發展還要感謝Hinton,LeCun, Bengio等研究者的長期堅持。當然統計學也在發展,但由於深度學習的迅速發展,它們反而變得沒有以前那麼重要了。
除了統計學,對現在人工智慧發展起到舉足輕重作用的,神經網路的一些研究工作,也是在50年前進行的,但它被廣泛應用是從2010年後開始的。
在2010年前,許多上一代機器學習成果的確是基於統計學的,他們被歸類於統計機器學習。但技術是持續進步的,近幾年推動人工智慧進入發展快車道的深度學習技術,並不能歸因於統計學。
問:在您能看來,應該如何定義人工智慧,如果要跟大眾普及的話,應該傳遞一個什麼樣的概念?
金榕:我認為智慧化的目的,不是讓機器像人一樣。上一個世紀,在工業時代,我們基本上把人變得越來越像機器,而未來我們真正應該走的道路是,讓機器更像機器,人更像人。我們發明了機器,不一定要機器按照人的思考。
機器要有自己的學習方式、思考的方式、解決問題的方式,所以我們提出“機器智慧”。機器智慧不應該是,讓機器人複製人類的智慧,而是發展出自己獨特的智慧。我們應該讓機器做人類做不到的東西,讓機器去發展自己智慧的力量、尊重機器、敬畏機器。所以在阿里我們是以“機器智慧”為目標。
舉幾個例子,諸如人工智慧客服,它能7*24小時的工作,對海量使用者的接待能力遠超人類。人工智慧應用於城市大腦,通過智慧決策和管理能大幅縮短交通擁堵時間,甚至提高救護車到達現場的時間。
AI在工業領域的應用,諸如將計算機視覺應用於產品質檢,已經為許多製造企業節省了數十億元。這些都是AI比人類更擅長的領域。而在藝術、文學等創造性工作上,人工智慧可能永遠無法替代人類。
問:還有一種觀點是認為演算法、計算力和資料是人工智慧技術能否成功的三個關鍵,你是否也這樣認為?阿里AI在這三方面現狀如何?
金榕:歷史上人工智慧經歷了多次黃金時期。到了今天,我們迎來了新的一波熱潮。
那麼這次的人工智慧熱潮有哪些不一樣的地方呢。就是由於我們在演算法、計算力、資料上都有了重要突破。
首先人類首次擁有了超強的計算能力,不論是GPU還是雲端計算。給我們帶來了強大的計算能力和靈活度。這點阿里具有很大的優勢。阿里雲在中國擁有最大的雲端計算服務,同時我們也在積極探索量子計算。
其次,也是很重要的一點,就是大量的資料的產生。海量的資料使AI模型的大規模訓練成為可能。阿里巴巴積累了海量的資料與應用場景,這些資料將成為阿里在人工智慧領域快速突破的基礎。
最後,就是演算法領域的突破。深度學習等新技術已經在各個領域得到廣泛應用,比如計算機視覺、語音識別、自然語言處等,多點開花。阿里也在演算法領域做了很多探索。諸如在語音識別領域,阿里推出了新一代語音識別模型——DFSMN,不僅被谷歌等國外巨頭在論文中重點引用,更將全球語音識別準確率紀錄提升至96.04%(基於世界最大的免費語音識別資料庫LibriSpeech)。
而在機器翻譯領域,在此前結束的WMT2018國際機器翻譯大賽上,達摩院機器智慧-NLP翻譯團隊打敗多個國外巨頭與研究機構,在所有提交的5項比賽中,全數獲得冠軍。這5個專案包括英文-中文翻譯、英文-俄羅斯語互譯、英文-土耳其語互譯。短短一年時間,我們已經在20多個各領域的國際人工智慧大賽上獲得冠軍。
附:托馬斯·薩金特的演講全文
托馬斯·薩金特:1943年生,1968年獲哈佛哲學博士,先後執教於明尼蘇達大學、芝加哥大學和哈佛大學,2003年起任教紐約大學至今。
自70年代初以來,薩金特一直是理性預期學派的領袖人物,為新古典巨集觀經濟學體系的建立和發展作出了傑出貢獻。
2011年,薩金特與普林斯頓大學西姆斯教授一起獲得諾貝爾經濟學家,得獎理由是:“對巨集觀經濟中因果的實證研究”。
以下演講是薩金特在厚益控股&《財經》世界科技創新論壇上的演講全文:
首先我對剛才幾位嘉賓講的話非常感興趣,我想先談一談我的感受,然後再講講我的部分。
第一,能不能扮演上帝。作為科學家,很多領域的科學家,我們都需要用統計資料說話。其實在這個時候我們已經在扮演上帝的角色了。
什麼意思?有好多應用科學像工程學、物理學、經濟學都是應用科學,我們會建立一些模型模擬世界運營,我們的理論也是一樣,都是由一系列的等式所構成,有一些隨機組成部件。
我們的目的是希望解釋我們所觀察到的世界上的現象,而我們關鍵的工具是使用模型,然後放到電腦裡模擬。把模擬後的資料拿來,利用數學方法,去微調它的引數,希望儘量接近於現實。
在這個過程中,我們扮演上帝的角色。所以寫引數、模擬過程中是在假裝,我們是在假裝是上帝產生了這些資料。我們儘量想接近這個準確度。我們想接近或者模擬上帝的做法。
這個說起來容易做起來非常難,兩百年、三百年前人們認為這是個好主意,但是當年的人不知道怎麼操作。為什麼?因為比如說你寫下一個粒子的模型沒有辦法運算,算不出來。
但是到了二十世紀尤其是二戰結束以後,我們出現了一些技術的巨將,包括諾爾曼,來自於奧地利的一個移民。我的岳父泰勒是研究核彈的,他們發明了蒙特卡洛模型,都是50多歲的時候發明的。
但是三、四年以後統計學家來了,搞清楚了可以做統計分析。所以這時候來了一場革命,影響了各行各業的科學家的研究工作,這就是技術創新帶來的好處。其實這個過程中我們都在扮演上帝的角色。
我怎麼講到這兒來了呢?人工智慧首先是一些很華麗的辭藻。人工智慧其實就是統計學,只不過用了一個很華麗的辭藻,其實就是統計學。
好多的公式都非常老,但是我們說所有的人工智慧利用的都是統計學來解決問題。有一些新發展,過去二三十年,今天我們統計學的完成質量更高,首先電腦運算速度更快,有新的演算法,好多是源於物理學發展,還有統計力學等等,這是過去3到4年從物理學拿來,加速了我們做系列統計學方面的進步。
過去寫下來公式,但是沒有辦法求解,過去你放計算機,但是能力太差,做不了。後來有了AlphaGo,就是一個動態規劃,太大了。兩三年前的解決之道就是特別大、特別快的計算機,利用一塊一塊的演算法去運算。我覺得亞當斯密百分之百正確,多少年前說應該有專業分工,這是正確的。
今天有很多工具,如果統計學家一點也不懂物理學,很多人類科技進步就不能變成現實。所以我想作為企業家大家也應該做通才,我們應該去考慮來自不同技術的融合或者是相互促進,這就是為什麼有了阿爾法GO的成功。
還有一兩點,是剛才聽了前面發言人的一些感受。到底什麼是金融?金融的含義是什麼?問一個高中生什麼是金融,他覺得是太華麗的一個辭藻。
什麼是金融?金融就是有人存錢有人不存錢,有人花的多掙的少,有人想投資,人是不一樣的。什麼是儲蓄?什麼是金融?有一些人就是來做中介,存錢的和需要花錢的人做中介,這個業務就是金融。
這個業務包含以下幾方面。首先很容易受到欺詐侵害。第二很容易受到不信任的傷害。如果我攢了錢,把錢交給別人幫我打理,我交給的人是我信任的人,他沒有不還錢的動機。他為什麼還錢給我。金融體系要驗證,我把錢借給你之後會不會還我,這就是金融的關鍵。如何讓別人相信你?金融該是信任和驗證相關的活動。在這些方面是有技術發展的,就是驗證和信任的工具。
是誰作為主體,是國家做還是誰做?你以自己的生活為例,你和你的家人為例,家人之間也有很多的信任和驗證。
比如,阿里巴巴或者亞馬遜是“國中國”,因為他們的工作是創造交易平臺,人們可以參與買方賣方在他們的交易平臺上活動,無論是阿里巴巴還是亞馬遜都是發揮警察作用,既管理買方也管理賣方,相當於電子警察,他們開發技術,改良交易平臺的信任和驗證。
像20到25年前你們的工作。就是前沿的工作,當時就在講這樣的問題的理論,這個理論的技術不斷進步。
最後我還想一點,有新的領域的出現,我應該意識到演算法機制設計。這個涉及了幾個領域。
首先,它講的是如何運轉一個國家或者是運轉一個公司像阿里巴巴,或者運轉一個拍賣,如何保證人們付款。它結合了什麼?結合了電腦科學、博弈論、計算、數學運算,也就是說,上過這門課的人瞭解了好多東西。他要了解各種各樣的學科,所以說專家和通才一起開創新的領域,這些都是值得大家追蹤的新的領域。
— 完 —
加入社群
量子位AI社群19群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話介面回覆關鍵字“交流群”,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話介面回覆關鍵字“專業群”,獲取入群方式。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態