1. 程式人生 > >院士李德毅:大資料認知(演講全文)

院士李德毅:大資料認知(演講全文)

院士李德毅:大資料認知(演講全文)

 

摘要: 導讀:李德毅院士通過介紹作詩、語言翻譯、語音識別、保險、人臉識別,深入淺出地闡述了大資料認知的方法學。大資料標誌資料密集型科學的新時代的到來,大資料時代是小模型、小定律、交叉學科的時代。大資料認知的突破口在於聚類。

 

導讀:李德毅院士通過介紹作詩、語言翻譯、語音識別、保險、人臉識別,深入淺出地闡述了大資料認知的方法學。大資料標誌資料密集型科學的新時代的到來,大資料時代是小模型、小定律、交叉學科的時代。大資料認知的突破口在於聚類。提倡利用雲加端的形態和深度學習,研究製造神似形不似的雲機器人。介紹了駕駛服務雲機器人、語言機器人,提倡研發機器駕駛腦,展示了無人駕駛客車的研究成果,介紹了團隊正在進行的智慧車的六類試驗與評估,倡導研究者做實踐中的研究,少做研究中的實踐。

 

2015年8月14日,由中國科協、中國科學院指導,中國人工智慧學會發起主辦的第五屆中國智慧產業高峰論壇在上海長榮桂冠酒店順利召開。

 

中國工程院院士、中國人工智慧學會理事長李德毅在論壇上發表《大資料認知》報告,以下為報告全文:

 

認知科學跟人工智慧是什麼關係?我們爭取在這個問題得到一些認識。

 

1大資料認知的方法學

人工智慧最重要的就是知識表示,或者叫知識認知的形式化。我們有一個教授做了一個很有意思的工作,把李白的一生所寫的1010首詩碎片化,把他所有詩句進行“機械切割”,把這些切割後的字串構成資料集,變成了小資料。我們用 毛 澤 東生日18931226 作索引,所作的詩是:秀玉竟不還,西湖哀苦寒。鳳樓留不住,夜郎醉不眠。 通過這個例子告訴大家,數字是不同於物質和能量之外的人類的資產,資料就是新時代的石油。

 

 

 

我在十幾年前曾經帶過一個研究生,做過一個有關“野蠻翻譯”的碩士論文。大資料的認知方法告訴我們,要重新思考是先有語言學還是先有語言,翻譯問題如何形式化?

 

谷歌的成功主要是大資料下的搜尋引擎和排序演算法,充分利用了群體智慧的資料,各種語言之間的轉換服務,每天超過10億次,使用人數每月超過5億人,谷歌眼鏡可用7種語言對圖表或選單進行即刻的逼真翻譯。為什麼可以做到這樣?是由於對話模式由32種語言的翻譯機器人來回溝通,大資料造就了高度準確的自動實時翻譯和自學習。這一點是值得我們人工智慧學者深思的。

 

我們一直喜歡用DNA檢測,將來人臉識別和說話人識別聯合使用,實現金融支付,可望很快成為常態!我們用科大訊飛的語音解說中國人工智慧大會,讓已經退休的李瑞英女士為我們做廣播。

 

 

這就是大資料的力量。

 

所以從大資料的成功運用反思日本五代機的失敗,值得我們思考。今年 IEEE國際資料工程大會(ICDE)的最大亮點是將10年最佳論文授予2014年圖靈獎獲得者Michael Stonebraker的論文“One size fits all”。該論文回答了大資料時代的一個基本問題:“是繼續構建通用資料庫系統,還是構建特定負載面向特定目標的系統?”作者支援後者,所以我們一定要把大資料的資產用好。我們要不但享受網際網路帶來的方便,還要包含區別於物質的資料資源的價值發現和價值轉換,這裡麵人工智慧起著很大的作用。

 

大資料已經成為網路時代人類社會的重要資產,今天,移動網際網路支撐的手機可以低價或者免費,如小米手機;明天,物聯網支撐的空調機、電視機是否可以低價或者免費?後天,家裝、家居、汽車、家庭服務機器人等是否可以低價或者出租或者免費?

 

手機、電視機、汽車和聊天機器人等作為感測器,為網際網路商提供源源不斷的大資料資產。大資料本身,既不是科學也不是技術,是網路時代的一種客觀存在,各行各業的大資料,規模從TB到PB到EB到ZB,以3個數量級的階梯迅速增長,是用傳統工具難以認知的、具有更大挑戰的資料!

 

聚類是大資料使用的一個突破口。我覺得我們要研究大資料的聚類。

 

人類走過了幾千年的實驗科學、幾百年的理論科學、幾十年的計算科學之後,迎來了資料密集型科學的新時代。對於老一輩科學家來說,大資料的挑戰對於科學的震撼是地動山搖的。

 

我們是個產業會,智慧產業論壇。我們講一個保險公司在大資料面前,應該怎樣改變它的執行方式?保險,尤其是車險,傳統的是分為ABCD類:A類連續兩年沒有出車禍的、B類最近一年沒有出車禍的、C類過去一年出了一次車禍的、D類過去一年出了兩次及以上車禍的;如果經常出車禍,保險費就會高一些。但是隨著汽車成為雙駕雙控輪式機器人、成為大資料發生器以後,每一次駕駛,每一次維修,每一次行程,甚至每一次剎車,都記錄在案,利用大資料聚類,保險公司可對一個車況好、駕駛習慣好、常走線路事故率低、不勤開車的特定客戶,給於更大優惠,而對風險太高的客戶報高價甚至拒絕,總之,能夠給出包括保險費支付方式在內的個性化解決方案,這就顛覆了保險公司的傳統商業模式!大資料聚類成為保險公司的核心競爭力,精細化的為個性化服務。

 

刷臉是人的身份識別的一個方法。奧巴馬這張臉從幾何結構上分成1到10個距離特徵值,這樣的方式做起來太繁瑣。結構化人臉大資料聚類的侷限性,本質上僅僅是幾何結構的聚類而忽略了聚類的不確定性、多樣性、過程中簡單的群體互動性、聚類樣本的可獲得性、聚類結果的評價標準(群體認知的共性),尤其是表情、年齡、膚色、基因、性別、姻緣等太多因素。所以,智慧產業界的朋友們,如果能夠從一張全家福裡面找到兒媳婦或者女婿來,我覺得這個產業就能賺錢。

 

如果說幾千年、幾百年、幾十年的科學主要靠天才歸納而成,並取得共識,學科重點在解釋,形成邏輯推論,即公理系統的定理和推論,可以認為是“大定律、大模型、小資料”的時代,資料圍繞模型和程式轉。所以我說:這個改變是地動山搖的。

 

公理、模型、程式要圍繞資料傳,形成資料定義的系統。

 

所謂“創新”,在大資料時代就是要靠資料說話,要更多的依賴大資料,這些資料常常是交叉的,因此體現在交叉理論框架下建立的。如果說物理學和化學是傳統科學,也許我們可以研究物理化學,那裡更有可創新的地方。要學會理解程式和模型怎麼圍繞資料轉,要研究基於統計的可變視角和可變尺度。

 

2雲機器人認知

今天透露一個我個人的學術觀點,我們現在研究的重點,我想大家可以研究一下“雲機器人”。機器人與人,可以形似神不似,也可能神似形不似,當前應該更多研發的不是人型機器人,而是神似形不似的雲機器人。

 

雲機器人依託雲端計算優勢,重在認知,體現在端裝置上是感知和行動。先研發語言和影象豐富、認知複雜、動作相對簡單的特定認知域的雲機器人,如導航機器人,其智商和情商容易取得小眾的共識。研發雲機器人成為大資料認知的又一個突破口。

 

我從深圳買過兩個掃地機器人,在家用了不到一個月就散了,但是我現在買了一個日本的一萬多塊錢的機器人,用了很長時間。

 

如果我們的語言、文字、歌曲、劇本可以通過虛擬形象變成形象、情感、動作、語音、語調、風格的話,我們還可以研究一個林志玲、郭德綱同臺的導航板。

 

利用雲+端的形態和深度學習,湧現出太多的雲機器人雛形,它們和自然人相比神似形不似,太多的記憶認知和計算認知可從雲上獲得,當前的感知、互動、認知、行為控制和協調在端上,有自主學習和主動尋求幫助的能力,能夠滿足移動生活中的人群對特定領域工作的機器人的迫切需求。

 

假如我到這個機器人面前交流,我說:“我明天想買一部小米手機。”這個聊天機器人怎麼回答?說:還是買進口的。你會大吃一驚。啊,這個機器人還知道小米是國產的。假如我說:“我明天想買一部小米手機。”機器人回答:“找你媽要錢去。”這是一個什麼場景啊?我們搞自然語言理解和語音翻譯的人,以前太多的重視了語法和語構,而忽視了語境和語用。

 

在雲端計算資料中心,用成千上萬臺的CPU+GPU伺服器架構,通過大資料樣本做混合的大規模深度學習的並行訓練,可確定幾十億個引數的人工神經網路模型,用於語音識別、人臉識別等已經獲得明顯成效。

 

我個人認為深度學習實際上是一套靈活的、複雜而又簡單的形式化模型框架,依靠不同深度的神經網路中的大量引數的確定去處理不同的問題,引數量可高達十幾億個,引數的精度靠大資料量訓練得以保證,適合端到端的學習。

 

深度學習以卷積神經網路(CNN)為代表,相比早先的淺學習,它不但可以從區域性到全域性提取不同層次的特徵引數,還可以利用卷積的微分性質通過改變卷積核在更高階上提取特徵引數,是抽象認知能力的提升,而不僅僅是神經網路的寬度——神經元數目的增加。

 

網際網路、雲端計算、物聯網和大資料可以有力支撐雲機器人如何聽說、如何看、如何想,而解決機器人如何動作的“智慧製造2025”迎來了我國機器人的春天。我們希望我國的製造業趕快跨過3.0,走向4.0。

 

如果北京市80萬個攝像頭都變成“攝像頭+固化晶片”,把路口簡單的攝像頭改成路口機器人交警,只要限號開車,壓線就扣你分、罰你的款。產業界的朋友們,為什麼不做這件事情呢?何況我們國家不是一個北京啊。如果我們把高德導航機器人變成一個聊天機器人,變成一個導遊機器人多好啊。我們的汽車無人駕駛,你喝醉酒了,讓機器人代駕。你不會開車,讓機器人變成教練機器人,還可以做交通事故仲裁機器人。我們還可以做特種車輛服務機器人,所以我認為智慧產業有著巨大的創新空間。

 

如果我們解決了駕駛問題,坐在車裡可以享受移動生活,孩子們可以在移動的狀態下跟高考輔導聊天機器人聊天,我們喜歡詩人汪國真,我們編個機器詩人汪國真,喜歡鄧麗君的歌聲,我們編個歌手鄧麗君。也可以做手語互動機器人和痴呆症患者聊天的機器人。

 

如果這樣做下去的話,我們的機器人虛擬教師,使得搞翻譯的都會失業,真的機器人換人的時代到來了。

 

3大資料認知的實踐

這一篇我就不講了,8月28號我們要在鄭州聚集7輛車,從鄭州到開封做一次無人駕駛實驗。我們利用導航裝置和記憶認知實現了路口記憶,保證鄭州到開封27個路口怎麼過。有興趣的朋友們,歡迎你們8月28號鄭州相見。

 

我就講這麼多。

 

0?wx_fmt=jpeg

0?wx_fmt=gif

 

 

Q&A

0?wx_fmt=png

問:剛才你列舉的這些領域裡面,我們還需要做到?

李德毅:這個就是無人駕駛客車演示。好,你說。

 

問:我們還需要做哪些工作才能收集到我們所需要的大資料?

李德毅:我就講一講我自己的體會吧。我家在北京市萬壽路,萬壽路有一個十字路口。幾乎世界上沒有兩個路口是完全相同的,萬壽路口對於我來說太熟悉了。一個人真正開著車,他這輛車80%的時間走在20%的道路上。所以對於我們來說,我們先把萬壽路口的小資料解決。但是你知道一輛車是小資料,那麼多輛車就是大資料了。所以我認為,對於大資料,還是要從小資料建立起。

 

問:大資料的收集要有目的性的收集?

李德毅:對,這句話非常重要。

 

問:剛剛你講的機器人的事情,我有一點點不太認可。你說,把攝像頭都變成機器人。但是有一個問題,這些機器人只能在數字化的虛擬裡面發現問題,比如:有人闖紅燈了,原來有交警是可以處理。但是現在只有機器人,是沒有辦法處理肇事車輛的。所以我們今天是不是過多的考慮虛擬的東西,而我們要進入到真實的世界,就像您剛才說的智慧駕駛汽車這方面也需要加強。不知道您是怎麼看這個問題。

李德毅:美國工程院有一篇文章,告誡科學家“要多做實踐中的研究,少做研究中的實踐。”我不認為機器人僅僅是做虛擬的資料。現在的問題是,你要用周邊的大資料,這些大資料是生動活潑的大資料。我剛才講把一個攝像頭換成一個交警機器人,我是說作為一個特定問題的交警,僅僅觀察壓線和車牌號。如果解決了一個特定問題,兩個特定問題,三個特定問題,解決了千千萬萬個特定問題之後,再通過雲技術、物聯網加在一起,這些人的綜合也許可以變成一個人工生物腦的智慧。

 

問:如果過馬路是用機器人反應的話,是非常慢的,會不會有撞車的可能性。

李德毅:智慧車當今很紅火。我現在正在做一個“智慧駕駛評估”:1.智慧車電磁頻譜相容性評估。2.智慧車架構開放性評估。3.模組的獨立性評估。4.駕駛智慧魯棒性評估。5.人機互動友好性評估。6.智慧車自學習能力評估。