1. 程式人生 > >北大“人工智慧前沿與產業趨勢”課程整理

北大“人工智慧前沿與產業趨勢”課程整理

  1. 第一講:人工智慧的發展與展望
  2. 第二講:餘凱-嵌入式人工智慧:從邊緣開始的革命
  3. 第三講:吳甘沙-智慧駕駛
  4. 第四講:漆遠-人工智慧驅動的金融生活服務

第一講:人工智慧的發展與展望

人工智慧發展的三要素:資料、運算能力、演算法;

人工智慧將影響所有產業:
1.服務機器人(掃地機器人、陪伴機器人、導購機器人、家庭助理)和人機互動;
2.工業機器人和智慧工廠;
3.自動駕駛(Google測試200萬英里,相當於300年駕齡;特斯拉已經開始在司機介入下大範圍使用;百度3年內可以商業化)與智慧交通;
4.智慧醫療和健康;IBM的癌症診斷輔助獲得FDA批准,Google&Stanford的面板癌診斷達專家水平。
5.智慧金融:Kensho,替代分析師的利器;芝麻信用,徵信分析。

人工智慧的發展與未來:
今天:全球前五大市值公司都是網際網路公司;
20年後:全球前五大市值公司都是人工智慧公司;

麥肯錫報告–AI在未來20年替代50%工作;
強人工智慧不會很快實現,特定場景、特定需求的弱人工智慧會成為主流。

第二講:餘凱-嵌入式人工智慧:從邊緣開始的革命

新摩爾定律

摩爾定律指每十八至二十四個月,計算機的成本會下降一半,效能則會提升一倍,使計算和應用不斷髮展。整個摩爾定律已經在按另外一個軌道在發展,已經不是每個單位面積上電晶體的數目,而是架構的改進,使得計算由邏輯運算向人工智慧運算演進。那麼就是這樣的問題:人工智慧運算是提升 CPU 工藝向前發展,還是設計一個新架構。

從中心到邊緣

我們可以看到從 PC 網際網路到移動網際網路到 internet of smart things,實際上對 AI 的要求越來越高。對 PC 網際網路來說,對 AI 的要求其實沒有那麼高,但在移動網際網路上,這種要求出現了。

邊緣計算要求是實時、低功耗、低成本的,並且是隱私受保護的。比如這在汽車上面,就是一個很大的一個應用場景——不可能前面有小孩子突然橫穿馬路,你還要把資料傳上資料中心,處理完了以後再傳回來,這是不可想象的。所以一定要本地計算,要實時處理沒有延遲。

很多移動裝置,比如 Amazon 的 Echo,就是把很多計算往邊緣裝置上去推。又比如監控攝像頭,中國去年一共部署了一億個。監控攝像頭的資料,其實存3個月就扔掉了。未來,對於所有這些攝像頭,都會有專門的處理器,去處理實時的視訊,這是一個大的趨勢。

邊緣的競賽

未來的5到10年,最具顛覆性的產業機會是什麼?通常來講,產業機會分成兩個階段,首先是一波2B的機會。2B的機會,就是 Enabling Technology,公司就是做 technology 本身的。它是提供槍炮彈藥的,給誰提供呢?給第二波的機會提供。第二波的機會是什麼呢?就是 Technology-enabled Business。當然這些都是2C的。2B就是給 Enterprise 提供服務。這些 Enterprise 再去捕捉 consumer-orient 的機會。這個 pattern確實在歷史上反覆發生。

舉一個例子,當年 PC 網際網路剛出現的時候,時間是在90年代末,那時沒有一家網際網路公司是掙錢的,大家都看到了這裡面存在機會,但在這個階段,首先要做的工作是把架構、網路給做起來吧? 所以 CISCO 這樣的公司會表現得更好。另外也會有一些2B的培訓師等等,這個階段整體上屬於為B端造槍造炮提供彈藥的階段,這算是一種曲線救國吧。

然後才有2C的大的網際網路公司的出現,比如 Google。再比如移動網際網路,首先要有 CDMA 這樣的軟體演算法,放在晶片裡面,使每個移動裝置 stay connected。然後才是 Apple 這樣的公司的崛起。中國的大部分投資者、創業者和企業家,他們看重的就是這樣一波機會。

在我們進入這個市場的時候,美國人把這些基礎技術已經做完了,從2000年開始到今天,我們是在享受上個世紀八九十年代科技成長的所帶來的的一個環境,然後我們去做了這些使用者導向的企業。

但今天我們去看這個整個這個創業環境,2C的這種創新其實代價已經非常的高昂,比如嘀嘀融了上百億美元,美團也有幾十億美元,這個投資其實越來越沉重。其實你想想看,當時 Google 只融了兩千萬美元就上市了,百度差不多也就是千萬美元,騰訊也是如此。在那個時候其實有大把的機會去捕捉。但是現在的話呢?八九十年代技術創新所帶來的這些能力其實已經被髮掘的差不多了,所以我們會發現創新越來越沉重。

第三講:吳甘沙-智慧駕駛

為什麼要做智慧駕駛

每年因為交通事故死亡140萬人,百公里的油耗產生廢氣,排放霧霾等一系列的問題。
停車難:第一,一輛車96%的時間是停著的,他而且需要兩個停車位;第二,在城市的商業中心CBD附近,35%的航行里程是與找停車位相關;第三,大城市15%以上的土地是用來停車的。
無論是搖號、限行、交通擁堵費,還是網約車,都沒辦法根本性上解決這些問題。

我們來看今天為什麼有那麼多問題——本質上因為車太多。例如北京,有接近六百萬私家車,而提供按需出行服務的計程車只有7萬輛左右。對於我們絕大多數人來說,首先打車很難,其次打車很貴。但是我們相信有了智慧駕駛之後,在10年之後,城市裡面車輛的總保有量可以減少一半,只有100萬輛私家車,還有200萬輛是計程車。而這些計程車是無人駕駛出租車。那麼根據大資料的運算規律,我們可以根據全城人群的分佈和出行的規律,把這200萬輛車分佈在城市的各個角落。保證每個人一叫車,兩分鐘之內就來車。而且,我們打車的費用可以降到今天的1/3

如今“滴滴出行”一天的峰值能夠達到2100萬單;這什麼概念呢?阿里巴巴全品類的電商相加一天大約是3000-5000萬單。美團、大眾點評吃喝玩樂住加起來一天大約1300萬單。因此,出行是相當剛性的、高頻的需求。
一旦有無人駕駛,一天達到5億單是完全沒有問題的,這將成為電商所有品類當中最大的交易量。而且,未來的車可能長得不太像車,其交通工具的屬性會降低,商業空間的屬性會增加。大家再一次腦補,在裡面放一臺咖啡機,它就是移動星巴克;放一塊大螢幕,它就是移動萬達影城;放塊小螢幕,它可以是移動的分眾傳媒;在裡面放一套辦公裝置,它就移動的寫字樓。未來你打車,可能就十來塊錢,但喝杯咖啡需要二三十塊錢,看場電影需要三四十塊錢。因此,整套新的商業體系就會呈現出來,因此也給我們帶來一個巨大的機會。

智慧駕駛中的AI

智慧駕駛裡面有一些什麼樣的AI技術?我認為,有三樣非常重要,我把它分成3種司機:第一種,叫新司機。想象一下,剛剛從駕校裡面考到了駕照,你懂得交通規則,能夠保證不去撞車和撞人;第二階段,你開著開著,變成了一個認路的司機,在任何情況下都不會迷路;第三個階段,就變成老司機。老司機體現在3個方面:一、開車開得非常好;二、你不肉,這個很有競爭性;三、碰到一些新的情況,你也不慌。

其實,智慧駕駛要達到這3個方面:一是感知和認知的理解部分;二是地圖和定位;三是認知的決策部分。先看感知和認知的理解,傳統上無人駕駛,他是從“鐳射雷達”開始。無論是樹,草坪,車輛,房子等等,鐳射雷達都能夠很準確地把模型建立出來。谷歌第一代、第二代、第三代無人駕駛車,上面有個鐳射雷達。百度的第一代、第二代車的頂上有鐳射雷達。兩邊和後面有3個小的鐳射雷達。頂上的鐳射雷達,在國內市價是70萬人民幣;3個小的鐳射雷達,每個大約是七八萬人民幣。這是錢堆出來的。我們做了一個低速車,上面其實也有一個鐳射雷達,就是七八萬人民幣。那麼顯然,這東西很貴,自然而然會讓大家去想我有沒有其他的解決方案——就是基於視覺以及毫米波雷達,超聲波等等這些輔助感測器啊。但是,最重要的還是視覺,視覺構建的不是一個幾何世界,是一個畫素世界。基於一個畫素世界,要去理解和預測,這是基於視覺的智慧駕駛。

那麼,我們拿在這一塊商業化最為成功的特斯拉為例。這輛特斯拉Model S上面就有一個單目攝像頭,作為它的主要的感測器;下面保險槓前面正中,有一個毫米波雷達;車週週邊一圈有12個超聲波感測器。大家可以看到這些小圓口都是超聲波感測器。它通過這3種感測器,能夠很好地達到新司機的要求,去理解規則,去感知這個世界。

還需要研究的點

SLAM技術的魯棒性:SLAM技術由於視覺質量技術,非常受限於在環境當中能夠發現的這些特徵點,比如說四處都是白牆時是很難獲取特徵點的。
多感測器融合:攝像頭、毫米波雷達、超聲波感測器聯合使用的演算法融合。
基於基礎高精地圖的地圖學習和更新:不但具備定位的功能,也能夠幫助地圖進行更新,那使用者始終會拿到最新的地圖。
無限提升準確率:1000-10000倍的標註資料(大規模眾包資料收集+基於機器學習的半自動標註)。
“老司機”的要求:第一步是開得很穩,很舒適;第二步是開的不肉,具有社會性和競爭性;第三步是怎麼去處理未知的情況,能夠開得萬無一失,一輛賓士S級轎車,上面的程式碼量是波音787夢想客機程式碼量的16倍。大家可以想見,要對一輛車進行很好的測試,要求非常高。但事實上,比程式碼更難的是資料和上面的隨機演算法機器學習

Q&A

1.汽車工程學會的定義將自動駕駛分為0到5級:0級就是全人駕駛;1級還是人駕駛,但是系統、機器有時會介入,比如說它看見你離前車太近,它會滴滴滴警告一下,甚至再近了,它給你踩一把剎車;2級就是在相當長的一段時間裡面自己去駕駛,比如說像特斯拉Autopilot,在封閉的結構化的高速公路上,駕駛員還需要把注意力放在路上,但是其實這過程中,車是自己在開。它自己能夠識別車道線,始終保持在車道的中間,甚至它還具備一定的全自動泊車功能;3級跟2級典型的差別,首先駕駛員不用全神貫注在路上,他可以做其他的事情,這個系統可以給予駕駛員八秒到十秒時間重新回到決策環中,這是一個非常明顯的要求,另外的話它會在自動型上面給予更多的一些好處,比如說不一定完全是在高速公路上,在一些更復雜的條件下也可以;4級幾乎就是無人駕駛,或者在某些情況下需要人干預,或者只能在一個特定的環境下做無人駕駛。比如有的場景特別簡單,就不需要干預;5級就是全天候、全區域、全速度的無人駕駛。

2.從國際主流車廠和科技公司的路線圖來說的話,到2021年會有4級的車上路。

3.未來10年以內出現人車分流,也就是人開的車和自動駕駛的汽車分開車道行駛。一統計資料:當自動駕駛在城市裡面超過交通運量25%以後,就值得為它單開車道。

4.5G有兩個任務:第一實現關鍵任務下的通訊,延遲做到個位數毫秒級別,關鍵任務就包括無人駕駛和遠端手術等等。第二頻寬變得很大,可以將一部分工作拿到雲上去。

5.汽車這個領域是值得專門去定製晶片的,且晶片應該是可程式設計的。

6.傳統汽車廠商和網際網路為代表的公司博弈:第一是汽車廠必須跟出行業務結合起來;第二是汽車廠不再滿足於只做一個整合商,他現在希望能夠更多地去擁有技術。第三是科技公司需要傳統車廠的硬體合作。

第四講:漆遠-人工智慧驅動的金融生活服務

金融生活服務的各種各樣的場景:醫療,繳費,教育,乘坐高鐵、地鐵、汽車,交罰款,查稅等。在美國信用等於財富,在國內如何產生信用分?這是個技術活,我們需要從資料,從各個角度、維度來判斷一個人的信用。當然不光是人,還有小微企業。希望運用大資料的技術,通過智慧的技術把它自動化,降低成本。比如智慧助理營銷、保險
1.智慧助理:需要非常好的落腳點。比如智慧客服有海量的電話要接,海量的問題要回答。還有基金銷售,理財顧問,保險顧問,稽核等,在這一系列的環境中,智慧助理是一個非常落地的場景。
2.營銷:營銷從任何商業角度來講都是非常重要的。比如需要做一個營銷策略,可通過大資料、雲端計算使成本急速降低,保證風控的質量,才能大規模,低成本。
3.保險:保險本身是一個數據驅動的應用,從營銷到保險的個性化定價,到新的基於網際網路的場景,新保險類別的開發等等,其實都離不開資料。

案例1-螞蟻智慧客服

今年我們的目標已經不是自助率,而是問題解決率。到今年夏天,我們的智慧客服的問題解決率從百分五十幾,到現在快70%,而人工的使用者問題解決率是71%到72%左右,我們的目標就是要超過人工。超過這個意味著什麼?其實我不光能夠自助,我回答問題比人還準。那其實這個代表什麼?不到一年,我們為公司省一億,除去人的成本和GPU的成本。我們客服部門去年其實裁了100人。減少的100人去做遞推,做口碑業務,這部分大量的人力就省下來了,這就是AI真實的案例。

異常檢測:出現問題是即時定位並解決。核心思想有幾部分:一部分就是實時計算,要把資料實時性提高,做到秒級定位。原來一個流程發現一個問題,到電商的商務異常處理,需要兩小時。從發現問題13分鐘,到響應介入50分鐘,到異常環節75分鐘,到最後環節要兩個多小時,125分鐘,這是以前的過程。現在的話,我們秒級解決問題,就是零分鐘預知,解決問題不到半個小時。這樣的一個例子其實省下了快1000通電話,而這個例子有很多,就省下無數的電話。

案例2-個性化產品和資訊推薦

跟傳統只做推薦不太一樣,阿里是一個生態系,那生態系裡面其實各個資料都會進來。我不是說因為你看過的文章,又推一篇文章,這是頭條的經典模式。那有各種各樣的,比如電商的購買行為能否助力財富和保險,我們叫遷移學習,或者叫資訊整合。

螞蟻DNA:就是一個編碼技術,把這個使用者實體包括產品,文字和外面的article,我們做一個統一空間裡embedding,轉來轉去有很多點。然後,把這個人在這個點裡邊直接表達出來。它的好處,比如說加密,如果你只看著點,你是不知道什麼意思,但是很多合作方,比如說,我們保險公司合作,把這個使用者的資料加密,非常關鍵的一個問題。

案例3-螞蟻安全大腦

從眼紋到人臉到聲紋等整個結合,用來證明“你就是你”這樣的問題。這個其實有非常大的價值。比如健康險,我們通過新的資料來源融合進來能夠反欺詐,更好地理解健康的風險;比如說場景險,就是完全網際網路化的一個場景險:穿緊身褲的很多人,在淘寶天貓上購買手機新螢幕服務,乾脆直接給你做個保險,這個保險呢,就是碎屏險。

案例4-微貸

基於大資料和機器學習的信貸模式是螞蟻微貸的優勢,在這個模式下,客戶立即申請立即獲貸,不良率低,可以解決小微企業和個人貸款難的問題:金額高、流程長、授信難。