1. 程式人生 > 資訊 >一文看懂特斯拉年度 AI 開放日:推出全球最快 AI 計算機,釋出人形機器人

一文看懂特斯拉年度 AI 開放日:推出全球最快 AI 計算機,釋出人形機器人

全球最快的 AI 訓練速度王座,剛剛易主了。

不是英偉達 GPU,也不是谷歌 TPU……

馬斯克治下的特斯拉,自研 AI 訓練晶片 D1,自研 AI 超級計算機 Dojo ExaPod,首秀即巔峰,登場就是全球第一。

此外,馬斯克還帶來了另一個特斯拉新品:

汽車機器人,搭載了特斯拉包含晶片在內的軟硬體系統,但跟百度的不同,不像汽車更像人。

這就是特斯拉年度 AI 開放日上,馬斯克再次帶來的一系列激動人心的大進展。

特斯拉自研 AI 訓練晶片 D1 釋出

馬斯克說:要有一個超快的計算機來訓練 Autopilot 在內的整個自動駕駛系統。

於是 DOJO 誕生了。

DOJO,取名源自日語裡“練武”專用的道場,顧名思義,DOJO 就是特斯拉 AI 不斷精益功夫的道場。

DOJO 是一種通過網路結構連線的分散式計算架構。它還具有大型計算平面、極高頻寬和低延遲,以及分割槽和對映的大型網路。

實際上,在 CVPR 2021 現場,特斯拉就已經劇透過 DOJO 的相關效能。

當時總算力達 1.8EFLOPS,讀寫速度高達 1.6TBps,一度被認為超越全球排名第一的超級計算機富嶽,創造超算新紀錄。

但那時 DOJO 用的是英偉達的 A100 GPU,單卡算力 321TFLOPS,共計 5760 張,節點數高達 720 個。

而現在,DOJO 更進一步,自研了“心臟”晶片。

特斯拉首款 AI 訓練晶片 D1,正式釋出。

7nm 工藝,單片 FP32 達到算力 22.6TOPs,BF16 算力 362TOPs。

特斯拉釋出會現場,還用圖展示效能,拳打英偉達 GPU,腳踢谷歌 TPU。

一句話概括,比現在市面上任何晶片都強。

特斯拉也用“Pure Learning Machine”,純學習機器,來稱呼 D1 晶片。

此外,D1 晶片強的不只是單兵作戰能力,還有集團軍作戰能力,它們可以無縫融合,變成超大規模計算陣列。

能有多大,接下來,特斯拉就揭曉了之前預熱海報上的“神祕物種”:

集合了 25 塊 D1 晶片的訓練模組!

這也是特斯拉首個訓練模組,而把多個模組集合,就能形成更大算力的訓練陣列:

至此,特斯拉自研超算 DOJO 完整真身亮相!

超過 50 萬個訓練節點。每個模組算力為 9 petaflops,頻寬為 36TB/s。

DOJO 的可怕之處在於,不同於世界其他超算需要承擔多種不同任務,DOJO 的唯一使命就是 AI 訓練,或者可以說聚焦到自動駕駛演算法的訓練。

因為專注,所以首秀即巔峰。

AutoPilot、FSD,特斯拉的其他 AI 訓練任務,都能在 DOJO 裡更高效練就。

另外,特斯拉官方還繼續劇透:這不是終點,下一代 DOJO 還會有 10 倍效能的提升!

所以到這裡就完了?拿衣服。

最後也是最強,特斯拉 D1 支援下的終極大殺器登場:

ExaPOD,整合 120 個訓練模組,包含 3000 個 D1 晶片,超過 1 百萬個訓練節點。算力達到 1.1EFLOP。

而且每單位能耗下的效能比當今最強超算高 1.3 倍,但碳排放僅為 1/5。

速度和效能,冠絕業內。

於是特斯拉明確:這就是全球最快的 AI 訓練計算機。

有意思的是,2019 年美國能源部曾放言要花 6 億美元建 E 級算力的超算,2023 年問世……

萬萬沒想到,這個目標被“車企”特斯拉率先實現了。

最強“煉丹爐”為誰而建?

所以問題來了,自研 D1 晶片有了,最強 AI 訓練超算 DOJO ready 了,接下來特斯拉會有怎樣的改變?

特斯拉 AI 技術主管 Andrej Karpathy(李飛飛高徒)登場,介紹了 D1 晶片和 DOJO,主要服務的物件 —— 特斯拉的在自動駕駛方面領先所有對手的“靈丹妙藥”:純視覺方案。

事故頻出,爭議四起,甚至中國絕大部分玩家都轉向了視覺 + 鐳射雷達的綜合方案,但特斯拉依然堅持。

Karpathy 詳細介紹了特斯拉高純視覺方案的思路,和現行 8 攝像頭方案的特點,以及它為什麼能 work。

特斯拉純視覺方案,基本構建原則是把自動駕駛系統看作一個生物,有眼睛、有神經、有大腦。

目前的方案有八個攝像頭,背後是被稱為 HydraNets——“九頭蛇網路”的多工學習神經網路。

“九頭蛇網路”可以同時處理目標檢測、交通標誌識別、車道預測等等任務,其關鍵在於對各種資料的特徵提取,包括不同種類資料的特徵共享、對不同任務的分別調參,以及引數快取,用來加快調參速度。

這也是實現 FSD 敏捷開發,半年內迭代 2-3 個版本的關鍵。

接下來,Karpathy 描述了純視覺方案的歷史,以及方案發展到今天的邏輯,他展示了一段特斯拉處理其影象資料的視訊。

他說過去 的 FSD 雖然很好,但事實證明這樣的系統不夠完善,每個攝像頭能夠檢測到工程師預期的目標,但背後神經網路的向量空間是不夠的。

於是,特斯拉如重新設計了神經網路,就是上面的“九頭蛇”。

另外相機校準、快取、佇列和優化等等環節都做了最大程度簡化。

特斯拉方面還比較了多攝像頭方案和單攝像頭方案的差別,相同的場景下,單攝像頭方案識別率明顯低於多攝像頭方案。

特斯拉車輛上的 8 個攝像頭獲取原始輸入後,系統會建立各種解析度的影象,用於各種功能和目的。

這些不同的影象會被分別餵給處理不同任務的神經網路,作為整個自動駕駛系統的決策依據。

接著,Karpathy 介紹了特斯拉的“終極建築師”,即車輛在行駛過程中可以實時對車道、環境建模。

車道線實時建模,其實就是特斯拉自己的高精地圖能力。

中國自動駕駛玩家,強調“高精度地圖”的不少,但特斯拉的思路,“現成資源”不是本質能力,本質能力應該是“創造資源”的能力。

最後,Karpathy 談了 AI 公司常見的資料標註問題,他認為,把資料外包給第三方去做手工標註並不好,所以特斯拉選擇自建團隊來給資料打標,目前已經從 2D 影象標記升級到 4D 向量空間的標記。

這也是特斯拉自動駕駛不斷快速進化的核心所在。

依靠人工標註,顯然無法應對量產車上路後的大規模資料,所以只有自動化標註,才能形成資料閉環。

開放日上,特斯拉也展示瞭如何從車道線、2D 影象…… 一點點躍遷至 4D 標註和建模的。

行人、車輛、樹木,建築物…… 清清楚楚,而且還有意圖識別。

特斯拉方面也強調,基於類腦一樣的感知系統、自動化標註能力,以及模擬,確保了特斯拉為什麼可以基於純視覺實現更高維度的自動駕駛。

模擬,簡單講就是利用現實資料,將真實世界的實時動態景象,在計算機系統實現重新構建和重現。

這套模擬程式,用特斯拉的話說,就是一個以自動駕駛為玩家的視訊遊戲。

在這套系統裡,任何要素都可以被新增其中,包括奇葩的極端場景。

比如這裡,人太多導致目標難以標註,車輛極多:

特斯拉這裡還不忘補刀一下毫米波雷達 —— 純視覺也能做很好,所謂的雷達冗餘作用有限。

特斯拉方面還披露,現在標註和模擬系統,可以模擬數量高達 3.71 億的資料及場景。

當然,自動駕駛最後還得解決從位元世界走向原子世界應用的問題。

這次特斯拉主要披露了控制和規劃方面的進展。

特斯拉自動駕駛總監 Ashok Elluswamy,分享了特斯拉針對複雜場景的規劃方案 ——“混合規劃系統”。

主要思路和技術方法是基於蒙特卡洛樹搜尋,實現最佳路徑規劃。

最後,整個特斯拉自動駕駛從感知到決策規劃,一圖概括如下:

One more thing:特斯拉“機器人”

最後的最後,就在大家都以為釋出會完全就是自動駕駛相關內容之際……

“簡短茶歇”環節,竟然來了一段“機器人熱舞”—— 宛如衣服 Model 一樣的穿著,樣子非常“矽基”。

這是特斯拉的行為藝術?

不不不,再次出乎意料。

馬斯克再次登臺,然後鄭重其事發布:特斯拉機器人。

身高 5 英尺 8 英寸,約為 172cm;重量 125 磅,約為 56.7kg;承載能力為 45 磅,約為 20kg。

它的面部是一個顯示屏,用來顯示重要資訊。

從外形上看,四肢和人類一樣。

為了實現平衡性和敏捷性,四肢使用了 40 個機電推杆。

同時,特斯拉各項 AI 和晶片技術,都會應用其中。

比如使用 Autopilot 的攝像頭充當感知系統,胸腔裡內建特斯拉自研晶片 ——FSD 同款,還會加持多項特斯拉已開發出的技術,如多攝像頭視訊神經網路、規劃能力、標記。

而且馬斯克強調,這不是玩具周邊,它會最終實現 —— 可能明年就會正式推出,這是特斯拉電動車的下一步。

矽谷鋼鐵俠還說,他會是一個非常有用的機器人,由人打造,為人服務,而且會確保一直對人友好,能把人從危險的、重複的,無聊的任務中解放出來。

甚至還能跟已經高度自動化的特斯拉車輛生產進一步結合協作。但按照馬斯克的意思,首要的應該是“做家務”。

有意思的是,隨著特斯拉這個“機器人”釋出,太平洋兩岸都把“機器人”作為了智慧車變革的下一步。

中國這邊,百度李彥巨集剛剛推出了一款“汽車機器人”,不過更像“汽車”而不是“人”。

美國那頭,馬斯克的特斯拉機器人,更像“人”而不是“汽車”。

這種區別,也可能跟馬斯克的那個江湖綽號有關。

伊隆・馬斯克,不就是現實版鋼鐵俠嗎?