為什麽今天的L4無人駕駛無法到達終局(轉)
本文來自於公眾號馭勢未來,是馭勢科技的微信公眾平臺,本博客收錄的這篇文章版權作者吳甘沙,博客中僅對部分內容進行編輯。
作者:吳甘沙
原文鏈接:here
聲明:文中的觀點只代表版權作者的觀點,本轉載不涉及商業利益,只作為學習交流使用,並在此感謝作者無私的分享。
——————————————————————————正文分割線——————————————————————————
很多場合,“智能駕駛”和“無人駕駛”被混為一談,而後者顯然更為大眾所喜聞樂見。更加專業的群眾,願意用“L4”、“L5”來說事。“L5”的車就像變形金剛汽車人,降落到世界任何一個地方,馬上能熟練地匯入滾滾車流,這顯然仍是遙遠的傳奇。於是“L4”成了圈子裏所有人的寄托。當然,每個圈子裏都有所謂的鄙視鏈,比如這個圈子裏:
-
L4的看不起L3,殊不知L3的極限能力與L4相差無幾,從L3出現意外狀況、到駕駛員接管前的10幾秒,需要無人狀態的fail operation(比如減速靠邊、停到安全區域),這種能力已經非常接近L4。
-
在大馬路上練的L4,看不起各種特殊場景的L4。這裏也有幾個誤解:
-
第一,如果跑來跑去只在幾條大馬路上,那幾條大馬路也與“限定場景”無異(機器學習裏叫overfit)。你馬上挑出幾條新的馬路來,估計谷歌Waymo也夠嗆。
-
第二,很多特殊場景也是開放環境。比如大商場的停車場有社會車輛、出沒不定的行人和擁擠的十字路口,與大馬路相比,主體算法的難度是類似的,差別只是在於訓練數據和反應速度
-
第三,很多特殊場景是需要A照司機的,這些場景需要“C照馬路小白”所不具備的駕駛技巧。
-
第四,很多人看好的大馬路L4,卻是在3、5年內很難真正無人駕駛的(需要坐安全測試員),而很多特殊場景的L4,卻是在1、2年內可以商業化的。
-
更要命的是,今天的L4算法(包括大馬路和特殊場景),很可能都無法到達終局。換言之,滿城盡跑無人車時,他們大概率是不同的物種,跑不同的人工智能算法。
最後一點似乎是故作驚人之語,這裏不妨科學論證一下。
且看這張圖。
圖中X軸是需要幹預或出現事故的平均裏程數。Waymo在2017年的水平是每自動駕駛5596英裏(9006公裏)才有1次人的幹預,遙遙領先於其他選手。然而再推敲下去,細思極恐。
第一,Waymo的水平離美國人類駕駛員的平均水平,差距巨大。後者是每16.5萬英裏出一次普通事故,每9000萬英裏才出一次致命事故。這個數據是基於加州城郊公路的30多萬英裏,交通場景總體不算特別難。
第二,Waymo的提升速度在減緩。其2015年的水準是1300英裏一次幹預,到2016年提升了近3倍,但2017年相較去年只提升了10%出頭。再看月度的數據,2017年除了年底出現了令人驚異的增長,其他月度還是起伏不定。年底出現躍升,前年也有過,也許跟假期車少有關?無論怎樣,2018年是否能有顯著增長,還不好說。
第三,Waymo的算法(以及今天幾乎所有L4的算法)都是數據驅動的,見過的大概率會,沒見過的大概率不會,所以Waymo領先主要是領先在數據積累,去年底的時候已經有640萬公裏的實測數據。然而,對Waymo來說,通過路測方法收集數據已經變得異常昂貴:2017年的63次幹預中大致有2/3是因為算法問題,而針對每個問題,要花1萬多公裏的油費和測試駕駛員人工費用,才能獲得1個高價值數據。
離人的水平還遠,數據的平均價值密度越來越稀疏、采集成本越來越高,今天的方法,要到達明天,看似不可能的任務。
有人會問,Waymo不是最近宣稱要在鳳凰城實施前排無安全員的運營了嗎?如果是5596英裏的平均事故率,Waymo是不可能大規模商業化的,他們的做事態度還是比優步/Otto的“安全第三”靠譜,要知道,出一起人命事故,可能就失去顧客對其的信任。我想可能是幾個原因:1. 鳳凰城的路況比加州城郊公路簡單,這個從Waymo的宣傳視頻可以看出來,鳳凰城可以說氣候宜人,人煙稀少。2. 鳳凰城的區域更小,算法已經overfit。3. 無獨有偶,Waymo也在加州申請了前排無人的測試車牌照,但有遠程遙控。因此,不排除在鳳凰城也有遠程遙控作為最後的冗余。
加州的亞軍獲得者,通用汽車2017年的水平是每1200英裏有一次幹預,考慮到是在舊金山的更復雜路況中獲得,讓人刮目相看。為此,他們還專門diss了一下Waymo,在各項指標的復雜度上,舊金山是鳳凰城的1.6到46.6倍。但是,最近的一篇文章顯示,通用汽車在舊金山也是撿了些簡單的道路,隧道、掉頭、單車道、一些十字路口和環狀交叉路口都刻意避過了。去年說好了要去紐約,現在卻發現舊金山的很多經驗幾乎很難用在紐約。
那麽,是否今天的L4就完全沒有價值了呢?下面該怎麽走才能到達明天?
對此,馭勢科技做了一系列的戰略規劃,現與大家一起探討。
首先是探索多場景融合後的算法泛化能力。用人話說就是,熟讀唐詩三百首,不會做詩也會吟。
做無人駕駛,需要廣度(大跨度的多種場景)和深度(每個場景下特定技術的深入研究)雙管齊下,其中開放道路L4也是場景的一種。所有場景的無人駕駛都實現了,全場景無人駕駛才會實現。一方面每種場景都有其獨特的算法需求,另一方面不同場景下無人駕駛系統大部分的功能是共用的,技術之間的泛化是可行的。
馭勢科技從去年開始嘗試多種場景的L4,包括機場滑行道、機坪和航站樓的無人駕駛(需要A照特殊訓練的司機,與飛機會車、穿過長隧道、上下立交橋),微循環的無人駕駛(開放的嘈雜環境、非結構化道路),大型停車場的無人駕駛(開放的狹窄環境、多層室內的精準定位)等。不同的場景著重訓練了駕駛智能的不同能力,比如下面視頻是自動代客泊車在室內停車場的表現:
視頻地址
視頻中,在某個主機廠客戶的現場監督下,該車連續做遠距離的自動代客泊車,每一次完成後都用紅色膠帶記錄了泊車位置,完成20次後,對記錄位置的誤差進行測量,在沒有啟用庫位線相對定位的前提下,絕對定位誤差區間是左右7厘米、前後10厘米。考慮到其中包括了定位和控制的誤差(車上安裝的是還未量產化的低成本線控系統),而且車上沒有激光雷達,這個基於視覺的定位系統基本達到了室內停車場高精度自動代客泊車的產品化要求。
隨後的一個重要發現是,在多種異質的場景裏交叉訓練,比在一種場景裏(比如熟悉的幾條大馬路)訓練更有用。停車場的系統在機場和微循環的場景中經過了大量的訓練和驗證。
緊接著,我們做了一個大膽的嘗試,把算法轉移到1輛新的、裝備同樣軟硬件系統的車上,經過短短1個星期的適配和訓練,這輛車已然具備了相當強的復雜城市環境L4能力。請看下面這個一鏡到底的視頻:
視頻地址
這條路覆蓋了結構化城市道路、國道、環島、隧道、換道、城鎮道路,既有簡單的單向車道,也有雙向車道,既有大貨車,更有人車混行。在大約10公裏的開放道路上,無論途經隧道光線發生劇烈變化且丟失GPS信號時,還是被大貨車環繞時,或者在環島快速轉向時,甚至因為季節變化導致的環境變化中,視覺系統都全程提供了穩定的不亞於高精度導航系統的定位結果。之所以視覺系統能夠作為主傳感器,源於上面在停車場、機場和微循環的積累。
必須說明,這輛車本來是做自動代客泊車的,線控的限速在40公裏左右,也沒有64線激光雷達,但是它在短短1個星期所呈現出來的能力,遠超我們的預期。目前,北京、上海等地已經頒布開放道路測試細則,我們將與主機廠合作,基於去年的積累,積極申請牌照,繼續探索泛化能力的極限。
其次,探索新的人工智能方法。為什麽人能夠在駕校學習幾十個小時、上路開了幾千公裏,就能夠達到“L5”?如何讓今天的弱人工智能去適應開放、動態、不確定的環境?如何提升人工智能對未知輸入和欺騙性輸入(或者更專業的“對抗輸入”)的魯棒性?要回答這些問題,必須在科技的前沿尋找思路。馭勢科技跟包括加州大學伯克利分校在內的國際國內多所頂尖大學展開了合作,短短1年中,我們對未來的道路看得更加清晰了。不妨摘錄一些加州大學伯克利分校的科研項目以饗讀者。
方向在這些標題裏面,全新場景的處理,對不確定性的容忍度,自我學習提升,和跨領域的遷移學習(比如不同城市,或從仿真環境向真實場景遷移)。
最後,假設有新的算法被不斷研發出來,如何證明新算法是安全的呢?
有一段軼事,2016年5月的特斯拉致命車禍,導致了大眾對自動駕駛的信任危機。馬斯克頗為不忿,他指出Autopilot在此次事故之前安全行駛了1.3億英裏,而美國人類駕駛員的平均水平是9000萬英裏,已然超越了人類。他這個論證中有兩個謬誤。一是Autopilot是輔助駕駛,還有人類駕駛員在糾正Autopilot的錯誤,所以這個1.3億英裏是有水分的。第二,這個數據的統計置信度是不夠的,因為裏程樣本實在太小了,如果把先前在中國邯鄲發生的那起致命事故算上,其安全裏程一下子從1.3億降到了1.3億除以二,6500萬英裏。
那麽,到底需要多少裏程,才能有足夠的置信度做孰優孰劣的判斷呢。美國著名的智庫蘭德公司做了幾個數學模型,結論如下圖:
挑其中1個結論來說,如果要有95%的置信度判斷無人駕駛比人類水平(9000萬英裏/致命事故)好20%,需要跑110億英裏。如果說你有一個100輛車的車隊來跑,平均40公裏的時速,需要連續不停跑500年。考慮到全世界最大的車隊Waymo去年也就600臺車,9年跑了400萬英裏,這看起來是不可能實現的任務。況且,除了谷歌之外,常見的開放道路L4測試車在配全傳感器後,要好幾十萬美元,100臺車的車隊已經是天價。
那麽,只剩下1條路了,想辦法把算法裝到至少100萬臺不那麽昂貴的車上,讓每臺車跑1.1萬英裏,110億英裏就實現了。
首先,這些車必須是增量的車,不可能找現有的車改裝,因此算法公司必須與大車廠進行合作。
其次,這些車不可能無緣無故裝一些還在驗證的算法,必須是裝了成熟的、有用的智能駕駛功能,這樣才可能賣掉100萬臺。
第三,這個功能具備某些場景的智能駕駛能力,但在大量的場景仍然需要人來駕駛。那麽,在有人駕駛狀態下,系統切換到“影子模式”,用來跑新型算法、對其進行驗證。算法在“影子”中持續做模擬決策,並且把決策與人的行為進行對比,如果兩者顯著不同,那麽有兩種情況:一,如果算法有高置信度的把握人開錯了,將給予人警告(類似ADAS);二,算法判斷人做得更好,或場景數據在感知、定位方面也具有高價值,那麽這些數據將自動傳回,後臺工程師判斷是否有利於提升算法。
這裏的核心問題是,車上裝什麽樣有用的系統?而這個系統如何能夠跑新型L4算法?在這一點上馭勢的嘗試是非常令人鼓舞的,上面我們展示的兩個視頻,自動代客泊車和L4城市開發道路都是基於同一個車型和系統配置,能夠在兩種模式之間切換。
今天多數L4系統采用昂貴的傳感器和計算資源(最近百度Apollo在轉向低成本方案),而且只適配少數幾款車型(比如林肯MKZ加AutonomousStuff的線控)。我們從一開始選擇低成本思路,不使用高線數激光雷達、高端GPS和慣導系統,攻堅關鍵零部件和底層線控能力(雖然執行器性能難稱完美),堅持機器視覺為主、其他傳感器為輔的思路,並且對算法和系統進行深度優化、使之能夠運行在普通計算資源上。這意味著我們多數的無人駕駛SKU具備“影子模式”跑開放道路的能力。
未來的3-5年,我們期待與主機廠合作,將自動代客泊車和L3系統裝在至少100萬臺車上,與此同時,下一代的駕駛智能算法將橫空出世,以“影子模式”的驗證方式快速叠代。
最後做個總結:
一,今天僅僅在大馬路上跑L4,無法商業化,而且在大概率上是到達不了終局的;
二,在很多特殊場景中訓練L4,不僅可以實現商業化,而且多種場景融合的泛化能力超預期,在開放道路L4上展現了巨大潛力;
三,需要研發適應開放、動態、不確定環境的新型L4算法;
四,新算法和商業化的算法(比如自動代客泊車和L3)必須能夠同時跑在同一套系統上,裝在至少100萬臺車上,通過“影子模式”實現高置信度的快速驗證。
為什麽今天的L4無人駕駛無法到達終局(轉)