1. 程式人生 > >北大“人工智慧前沿與產業趨勢”課程整理01

北大“人工智慧前沿與產業趨勢”課程整理01

  1. 第五講:小米黃江吉-人工智慧硬體的發展
  2. 第六講:碳雲王俊-DNA是生命數字化的過程,AI改變生命科學
  3. 第七講:百度徐偉-AGI 2050年前實現可能性超50%
  4. 第八講:華為李航-自然語言處理的現象與挑戰
  5. 第九講:滴滴葉傑平-深度學習在交通領域應用潛力巨大

第五講:小米黃江吉-人工智慧硬體的發展

人工智慧三大前提:產品+大資料+機器學習;

以小米為例,從手機、電商、家庭路由器、電視雲平臺、互娛市場、生態鏈都不斷產生資料。這些資料都非常原始,需要清洗。之後是資料探勘,資料智慧

一定要把技術做到產品裡面,做到服務裡面,它的價值才可以最大化地發揮出來

第六講:碳雲王俊-DNA是生命數字化的過程,AI改變生命科學

碳雲智慧基於了三個基本假設:生命是可以數字化的;生命是可以被計算的;生命也是可以被網路化的

碳基:碳基的程式是迄今為止最高效儲存介質,全世界所有的資訊可以存在一公斤的DNA裡面,它可以儲存上億年,輕輕鬆鬆百萬年。我們現在沒有哪一種計算機的儲存介質可以放一百萬年,一個光碟放幾十年可能就不行了。DNA是迄今為止最高效的一個儲存介質。你要想弄懂生命這個程式,應該做的第一件事情就是把這個程式出來。

中國有一個很出名的計劃叫“百分之一計劃”,中國參與了人類基因的計劃,測定了其中的1%。這個計劃是全球三千多名科學家把一個人的基因圖譜序列,31個字母讀出來。現在一臺機器可以在一天內輕鬆讀取一個人的基因圖譜,一千美金。

這個過程是在十五年之內完成。十五年的時間,從原來一億美金測一個人的全部基因,到現在的一千美金。除了讀人的基因之外,也可以讀所有動植物的基因和圖譜序列。

每個人的基因都讀出來到底有什麼用?
1.第一個服務就是出生缺陷。這個世界上有差不多5%到6%的出生缺陷的孩子,出生缺陷的孩子裡面有相當大一部分都是跟基因有關。

2.第二個服務就是傳染源檢測。比如發燒,拉肚子,不知道到底是哪個病毒還是微生物感染,這件事情應該做的是把血液或者糞便裡面的DNA提取出來做測序,做完以後發現人體內有沒有哪一種微生物感染,或者哪種病毒感染。

3.第二個服務就是個性化用藥。因為每個藥的開發都是針對於某種基因,某一個代謝通路。腫瘤的發生是跟基因和代謝通路有關,我看我哪個地方的基因壞了,有沒有這個藥,對應性的來找一找,事實上是這麼一個應用的過程。

DNA其實現在已經發展到可以簡單拷貝,它是一個數字載體,就像計算機一樣,可以簡單的被拷貝,克隆就是這樣,把一個完整的DNA克隆到另外一個上面。比如說基因編輯,這段DNA31個字母,我想改哪個改哪個,我就把那個字母給它改一改。還有一個進行合成,我計算機裡面寫一段程式碼,那邊就從試管裡合成出來。

測一下基因就知道我得什麼病了,這聽起來好像很簡單的一件事,但生命的複雜程度遠遠大於這個,我測完了以後我是有了一個起點,但是我最終會怎麼樣我不知道,因為生命的過程當中有很多的起起伏伏。我怎麼才能瞭解生命本身,只有一個辦法就是做一個矽基世界的人工智慧的我,做一個數字化的我,能模擬碳基世界的我。在計算機裡面有個我,有個王俊,現實生活裡面有個王俊,那個王俊不斷在學習我這個王俊。如果我所有的特性全部數字化,全部給它,我的每一個輸出全部是我最後的訓練結果,我能動性的把那個我的數字生命(矽基世界的那個我)變得越來越像碳基世界的這個我,這是碳雲要做的一件事。

華大做的事情是讀基因,把基因越讀越便宜。碳雲智慧想做的事情就是懂生命。基因事業本身需要做很多東西,首先是建立在碳基裡面的一個學習系統,這個學習系統有很多輸入,也有很多輸出,很多東西要把它數字化。那我數字化什麼東西呢,先從DNA的中心法則做起,我的基因序列要知道,我的基因的甲基化要知道,我的RNA要知道,我的蛋白質要知道,我的代謝物要知道,我身體裡面,我抽個血,驗個尿,糞便裡面的各種各樣的分子生物學資訊全部都知道。一聽到這個就頭大,好多好多的東西。如果就做個基因還相對簡單,就測個序。現在一想這麼多資料,怎麼辦,很多的技術有沒有,存不存在,所以碳雲在成立之後去做了很多事。做了大規模的收購。

數字生命的程式裡,沒有一個人的程式是完美的,所有的人都有缺陷,但每一個生命程式都是特別的。你所需要做的事情是把它數字化,找到你最特別的地方,然後再找到你不完美的地方,用你特別的地方去幫助別人的不完美,這就是那個數字生命網路能夠達成的最好的東西,而這個東西現在是可以做的。加入這個網路的人越多,這個模型越精準,你能夠找到你的特別和你不完美的地方的可能性越大。

生命本身是個旅程,基因是起點,不是終點,在這個過程中,你是你自己的選擇,根據你的數字化生命模型做出最好的選擇。我希望每個人都能夠理性的做越來越好的選擇,讓身體更健康。

第七講:百度徐偉-AGI 2050年前實現可能性超50%

什麼是通用人工智慧(AGI)?

具備執行人類所進行的各種智慧任務的能力:感知、決策、推理、規劃、溝通。其核心是學習能力:漸進學習、自主學習、互動式學習。

強人工智慧具有很強的智慧,但並不具有意識?其實只要達到人的智慧就可以了,有沒有意識不重要。

人類意識究竟是一種對智力的超越,還是其實是智力範疇內的一個東西?其實很多時候我們做出了決策,但自己並不清楚是如何決策的。這似乎是一種非理性的決策,但從更高的層面來看,我們所有的決策都受到我們的歷史環境、經濟條件等因素的影響。其實你的大腦裡面還是有一個很大的函式的,一個F函式,你的歷史、環境、人際關係、收入等等綜合影響著你的決策。你拍腦袋的決定實際上並不是拍腦袋產生的。之前有一個研究,通過對一個人在社交媒體上點讚的分析,就能得到他的某種情緒模型。然後根據這個模型,可以對這個人對一些言論的反饋做出預測。預測準確度比他身邊的人還高。所以說,我們大腦的一些功能,比如人臉識別,可能是籠罩在我們大腦裡的極其複雜的運算,我們暫時無法解釋而已。但這並不表示它不是運算的結果,而是突然出現的某種神器的東西。比如讓人工智慧下圍棋,最早認為人工智慧不可能具有人類下圍棋時的那種大局觀。但是現在我們看到,人工智慧的大局觀比人類還好。有時候局面太複雜,人腦也算不出來了。但不管怎麼說,這還是一種運算,不管是基於貝葉斯還是基於技術經驗。當然這種運算的複雜度很高,人類現在還無法用一個函式把它描述得很清楚。當機器擁有了大量的資料、大量的運算能力後,有可能做得比我們更好,而且有可能每次都很好。人類的靈感不是時時產生的,神來之筆無法每次需要時都產生。當機器智慧達到很高的水平之後,這些事情會更大概率的出現。所以說它背後其實還是一種運算。它可能是我們大腦裡面一個很神奇的函式,它的最大值是我們的某種價值觀,比如個人的幸福感等等。一個人能根據環境、條件等等綜合做出一個選擇,背後其實是一個很理性的過程。以前我們無法界定什麼是幸福感,現在從腦科學的角度來看,它可能是你大腦裡某個機構發出了一個訊號,多巴胺分泌了一下,然後你就感到了幸福。它並沒有那麼多神奇的東西,最後還是大腦運算之後激活了一個地方,然後你就幸福了。

機器學習大部分是基於歸納的,人類有演繹和推理的能力,在推理方面,機器現在有沒有什麼進展?

推理目前還是一個不太成熟的方向,如果這方面的研究越來越好的話,人類能做的事情可能就越來越少了。

有沒有一個明確的定義,可以定義通用人工智慧達到了人類的水平?

通用人工智慧就跟人一樣,如果不單獨加任何跟開車有關的程式碼,直接讓它學開車,它如果學的速度跟人一樣快,或者說直接讓它去學數學,它也學的和人一樣快,這樣就是達到了人類的智慧水平。

有沒有一種理論能夠證明,深度學習模型比其他方法好,還是說這是一種實踐的結果?

最重要的還是來自於實踐。在實踐中取得了這麼好的效果後,一些研究者開始嘗試從理論上做出解釋,它的效果為什麼會這麼好。最近可能有一些這樣的研究,就是在一些特定的模型結構下,在一些假設的狀況下,來證明它能找到的解總是和神經網路的全域性最優解接近。不過這些研究還是很難解釋深度學習最近取得的成功。所以說目前還沒有非常完美的理論解釋。

第八講:華為李航-自然語言處理的現象與挑戰

我們所說的自然語言理解,學術界有兩個定義,一個是基於表示的,你說的話能被計算機對映到其內部的表示,我們認為計算機理解了;另外一個是基於行為的,計算機做出了你指示的行為,後者的定義往往是大家更喜歡採用的。

為什麼自然語言理解是非常困難的一件事?

1.語言是不完全有規律的,規律和意外並存,會出現功能冗餘,邏輯不一致等情況,如果不遵循規範,交流非常困難,而規範是非常錯綜複雜的。

2.語言是可以組合的,語言是能把詞形成句子,甚至是遞迴去組織句子,構建出非常複雜的表達。

3.語言的發明創造本身和比喻密切相關,語言的本質是開放的集合,人們可以去發明創造新的表達,一旦形成了以後大家會經常使用,產生新的語義,這是完全開放無窮無盡的。如網路中將“潛水”和沉默不語進行聯絡,使“潛水”一詞出現了新的語義。

4.語言要和世界知識相聯絡,瞭解相關的概念和事實。

5.語言的使用是在一個環境裡,語言是一種互動,是一個交流的工具。語言終極的理解要結合上下文,結合語境

自然語言處理最核心的想法是基於資料驅動,用機器學習實現,問題可以分為五大數學模型:

分類:將標籤分配給字串,文字分類和情緒識別;
匹配:匹配兩個字串,搜尋、問答、(產生式的)單輪對話;
翻譯:將一個字串轉換為另外一個,機器翻譯、語音識別、手寫識別;
結構化預測:將字串對映到結構,專名識別、詞性標註、文字句法分析、文字語義分析;
馬爾可夫決策過程:決定下一個狀態給予以前的狀態和行動,多輪對話;
自然語言處理,考慮是不是實用,一定程度上是看技術的上界和效能下界的關係。不同的使用者和場景對效能的要求不同,比如網際網路搜尋準確度不是極高,但使用者都認為很好。

當技術上界遇到使用者需求下界,就可以實用化,未來自然語言處理技術常見的應用有以下這些:

語音識別:已經比較實用;
單輪對話:這個方法往往把它變成一個分類問題,或者結構預測的問題;
多輪對話:還很不成熟,特定環境下才能做好;
單輪問答:已經開始實用化(不知道的時候說不知道,反而很有用);
機器翻譯:不斷提高接近人,但不能完全替代人,本質上和人的做法不同

趨勢

趨勢一:語音識別、機器翻譯已經起飛了,大家都在用,真正對話的翻譯還有很長的路要走,說不定能做到很好;
自動語音識別被廣泛應用於語言輸入

書面語言翻譯將在實踐中得到更廣泛的應用
口語翻譯將逐步得到利用和改進
還有待解決的問題,例如長尾挑戰(專有名詞,語音識別遇到中英文夾雜)
原因:深度學習往往基於統計,解決的是多次重複的東西。長尾現象是一個問題,完全徹底的解決還是比較困難,這是機器學習本質上的侷限。

趨勢二:單輪問答會越來越實用化,特別是場景驅動的。

趨勢三:多輪對話需要更多的研究。
多輪對話本質上是大量學習,人做多輪對話不需要重複很多,是天生能力、這種能否用現有技術模擬和近似,還不是很清楚。多輪對話因為資料不夠,不容易解決,這也是未來要研究的方向。多輪對話即使是任務特定,也比較困難,聊天機器人更難了。馬爾科夫決策過程都用不上。聊天機器人每一輪都是單輪對話,做不成很合理的多輪對話。多輪對話,如果有任務驅動和有更多資料,可能會越來越好。

總結:

1.自然語言理解很難。
2.自然語言處理現在用資料驅動的辦法去做五個最基本的問題,可以分到分類、匹配、翻譯、結構預測和馬爾剋夫決策過程這樣一些具體問題上。
3.有了資料我們可以跑這種AI的閉環,不斷提高我們系統的效能和演算法的能力。
4.深度學習在五個大的任務裡面的前四個,都能做的很好,特別是機器翻譯,基於任務驅動的單輪對話,應該也能做的越來越好。但是還有很多問題,比如多輪對話需要去研究和解決。

第九講:滴滴葉傑平-深度學習在交通領域應用潛力巨大

滴滴是12年成立的,先是有計程車,後來到14年有專車,然後15年之後有了快車順風車公交等等。現在每天訂單超過2000萬單,所以你要是做人工智慧做機器學習,那這個樣本量就一天是2000萬每天處理的資料是2000TB每天的路徑規劃是90億。現在這個平臺上有4億使用者

核心專案

ETA意思是從A到B大約需要多長時間,這是滴滴非常核心的一個功能。例如,使用者想6點40到達教室,那麼多久能打到車,司機接你大概幾分鐘,如果有預估,那麼使用者能夠更精準地去做決策。

智慧分單就是乘客搜尋司機。這個過程用時間來預估,越近越好,精準預測三公里之內哪個司機離你最近。第二是司機接到你,然後到目的地大概預估的價錢。預估的價錢本質上是由兩個原因決定,即距離和時間。從起點到終點應該怎麼走,這是一個非常複雜的問題,每秒要有成千上萬個計算,還有A到B的時間大概是多久。結合時間距離以及公式算出預估價,準確度非常重要,準確度對使用者也非常關鍵。滴滴平臺上隔5秒鐘後再去打車,情況可能完全不一樣,幾秒鐘狀態就可能發生很大變化,所以說智慧分單的挑戰性很大,需要做實時匹配。

Q&A

1.滴滴做的模型上線的時候,對效能的追求和運算質量如何平衡?
我們希望在訓練中建立最好的模型,精度越高越好,基礎平臺搭建了GPU叢集,增加計算量,減少計算時間。線上有壓力,我們希望模型不是特別複雜,只能挑一個。我們現在在做的,也是業界在研究的一個方向是:模型已經確定好,如何壓縮(當計算量大量減少時,儘可能精確)。這是我們探索的一個方向。這個問題部分代表了學術和產業的差異。我們學術上只做第一步,做最好的模型。第二點我們往往忽略,放到線上我們不可能用大量的資源進行計算,落地時,第二點比第一點還要重要,要考慮效率和付出成本。

2.未來五年,出行大交通,深度學習會怎樣影響產業,哪些技術帶來巨大貢獻,機遇和挑戰有哪些?
滴滴在智慧交通中和政府合作,政府共享了公交車,攝像頭等資料。最終希望各方把資料打通整合起來,才能更加完整刻畫交通全貌,做更多決策。這是第一點。第二點是智慧交通,如何把資料整合起來之後解決實際的交通問題,城市的規劃建設。滴滴已經在濟南實驗中看到巨大潛力,更大效率是多方配合合作,更精準反應路況。第三點是智慧交通,比如說物聯網:車是相連的,車和路上裝置也是相連的,做更精準的決策

3.滿意度理解?
這個叫NPS,滿意度是使用者調研。我們滴滴每天會做使用者調研,我們特別關注使用者滿意度體驗。這是今年最重要的發現,提升使用者體驗,滿意度上升下降城市的原因。我們成立了一個NPS團隊,專門做分析調研。我們能不能預測大家滿意度,我們能不能找出現在滿意度發生變化的原因,相對性去改進。其實有個大的人工智慧系統,做採集系統和實時預測,今年上半年,體驗有了非常大的提高。以前大家認為是運營營銷驅動,現在是體驗驅動

滴滴把NPS作為最核心的指標,它沒法用模型去優化,滴滴會做調研,後邊有大資料,對過程拆解,分析出影響NPS核心的幾個因素,哪些用模型專案抓手去優化,拆解到演算法。