1. 程式人生 > 實用技巧 >英偉達的DPU,是想在資料中心奇襲英特爾?

英偉達的DPU,是想在資料中心奇襲英特爾?

最近幾年,經常關注科技圈的朋友們總會發現,每次遇到廠商有重大發布,就總能看到“顛覆”、“極致”、“革命性”等概念出現在釋出會上。

前幾天,iPhone12的釋出現場,蒂姆庫克就用上了“新紀元”的字眼,準確地說應該是iPhone正式地步入了5G時代新紀元。但國內消費者對5G已經是見怪不怪了。蘋果自嗨的劃時代產品因為沒有達到市場的預期,當日股價就跌去3800億個小目標,後面就要靠銷量來證明蘋果自己有沒有跨入“新紀元”了。

相比較於關注度高的消費電子領域,本文要把重點放在大多數人不太熟悉的資料中心產業,及其更上游的資料中心計算晶片上面。因為我們看到隨著雲端計算的大規模普及和AI計算的指數級增長,資料中心被提到前所未有的重要位置。

最近在參加一個有關數字通訊產業的論壇上,聽到一位中國信通院的專家的觀點是:資料中心,將成為和5G技術並肩,下一個數字技術的制高點。類似的觀點,我們也在英偉達線上2020年GPU技術大會,從黃仁勳那裡聽到:資料中心已成為全新的計算單元。

黃仁勳之所以有這樣的底氣,就在於這次釋出會上推出了一款全新處理器DPU,以及圍繞該處理器的軟體生態架構DOCA。據英偉達的介紹,DPU可以和CPU、GPU相結合,構成完全可程式設計的單一AI計算單元,實現前所未有的安全性和算力支援。

那麼,DPU能否真正承擔起與CPU、GPU一樣的計算重要性,實現資料中心的一次巨大革新?其創新點到底在哪裡?這些仍然是我們要去回顧和考察的問題。

英偉達DPU的過“芯”之處

從英偉達在GTC的介紹上來說,DPU(Data Processing Unit)處理器,其實是一種SoC晶片,其中集成了ARM處理器核、VLIW向量計算引擎和智慧網絡卡的功能,主要應用在分散式儲存、網路計算和網路安全領域。

DPU的主要作用就在於替代了資料中心原本用來處理分散式儲存和網路通訊的CPU處理器資源。在DPU之前,智慧網絡卡(SmartNIC)正在網路安全和網路互連協議方面逐漸取代CPU。而現在DPU的出現,相當於是智慧網絡卡的升級替代版本,一方面增強了智慧網絡卡對網路安全和網路協議的處理能力,一方面又整合和加強了分散式儲存的處理能力,從而在這兩個領域更好地替代CPU,從而釋放CPU的算力給到其他更多應用。

英偉達在DPU上的技術突破,來自於去年收購以色列晶片製造公司Mellanox之後,在這家公司的硬體基礎上開發出BlueFeild系列的兩款DPU——英偉達BlueField-2 DPU與BlueField-2X DPU。

據介紹,BlueField-2 DPU具有英偉達Mellanox Connext-6 SmartNIC的所有特點,與8個64位的A72ARM處理器核心一起,實現可完全程式設計,並能提供每秒200千兆位元的資料傳輸速率,從而加速關鍵資料中心的安全、網路和儲存任務。

最核心的一點是單個BlueField-2 DPU可以提供相當於消耗125個CPU核心所提供的資料中心服務,從而有效釋放CPU核心的算力資源。

而BlueField-2X DPU則擁有包括BlueField-2 DPU的所有關鍵特性,其特效能夠通過英偉達安培GPU的AI功能得以增強。而在英偉達的路線圖裡,未來的Bluefield-4 將會引入CUDA 和 NVIDIA AI,極大加快網路中計算機視覺應用處理的速度。

另外一個值得注意的是英偉達提出配合DPU處理器的軟體開發工具包——DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英偉達的專家將DOCA類比為資料中心伺服器領域的CUDA,其意圖在於幫助開發人員在DPU加速的資料中心基礎設施上構建相應的應用程式,從而豐富DPU的應用開發生態。

從以上介紹我們看出英偉達的兩個野心,一個是DPU試圖再一次複製“GPU替代顯示加速卡成為通用顯示晶片的路徑”,在一個是DOCA試圖再一次複製“CUDA在GPU通用化過程中所起到的開創生態之功”。

如果和不久前英偉達收購ARM的訊息結合起來,我們看到英偉達的一個重要考量,就是以ARM架構的CPU為核心,從伺服器的應用加速擴充套件到伺服器的全部應用場景,從而實現在資料中心伺服器領域的更大突破,目標自然是劍指英特爾CPU為代表的X86伺服器生態。

而在考察DPU挑戰CPU霸主地位的可能性之前,我們可以簡單來了解下英偉達在資料中心的佈局。

英偉達的資料中心“野心”

在經歷過遊戲顯示卡業務的增速放緩,以及加密貨幣退潮後帶來的顯著業績下滑的影響之後,幾經波折的英偉達終於堅定地將未來押注在了AI計算和資料中心的產業佈局上面。

2017年,英偉達的資料中心業務季度營收首次超過了5億美元,同比增長了109%,這使得黃仁勳在一次大會上大力肯定了資料中心業務的價值。

英偉達早在2008年,最初就是通過最早的Tesla GPU加速器和初級的CUDA程式設計環境來為資料中心進行GPU計算,試圖將更多的平行計算從CPU解除安裝到GPU上。這成為英偉達GPU之後進化之路的一條長期策略。

此後隨著AI計算需求在資料中心當中的爆發式增長,AI硬體正成為越來越多資料中心擴容建設的關鍵所在。當超強AI算力成為資料中心的剛需,英偉達GPU憑藉強大的平行計算和浮點能力,突破了深度學習的算力瓶頸,成為AI硬體的首選。這一契機才使得英偉達能夠在資料中心的硬體版圖上站穩腳跟,當然,英偉達的野心遠不止於此。

英偉達最主要的佈局就在於2019年3月,花費69億美元收購了以色列晶片公司Mellanox,而這家公司所擅長的正是為伺服器、儲存和超融合基礎設施提供包括乙太網交換機、晶片和InfiniBand智慧互連解決方案在內的大量的資料中心產品。而英偉達的GPU與Mellanox的互連技術結合,可以使得資料中心工作負載將在整個計算、網路和儲存堆疊中得以優化,並能實現更高的效能、更高的利用率和更低的運營成本。

當時,黃仁勳把Mellanox的技術看作是公司的“X因素”,也就是把資料中心改造成一個可以解決高效能運算要求的大型處理器架構。而如今我們看到DPU的出現,已經是具有這一架構雛形的一種嘗試了。

今年,英偉達花費400億美金的天價從軟銀手中收購半導體設計公司ARM,其意圖之一就是要把ARM架構的CPU設計應用到英偉達所要搭建的未來計算模式中,主要佈局的領域就有超算、自動駕駛和邊緣計算模式。其中,基於英偉達GPU的AI運算平臺與ARM的生態系統結合,將不僅能夠強化英偉達高效能運算(HPC)技術能力,又可以帶動英偉達資料中心業務營收持續創高。

可以說,英偉達在資料中心領域的成功與否,都與能否實現資料中心的規模化運算有關,從發展自研的DGX系列伺服器到整合Mellanox的技術,再到藉助ARM生態發展全新的資料中心計算架構,都是為轉型資料中心業務所作的準備。

當然,想要實現這一目標,還要看下英特爾是否答應了。

英偉達挑戰英特爾,距離還有多遠

目前來說,資料中心當中,95%左右的GPU仍然還是連線到x86 的CPU之上,英偉達如果單純只是做GPU的增量,仍然無法撼動英特爾在資料中心伺服器的霸主地位。現在,英偉達顯然已經不滿足於抓住增量市場,而是更希望能切入資料中心的存量市場,即設法用自己的晶片產品去取代英特爾(以及AMD)主導的X86 CPU。

自從英偉達開始收購ARM,外界能夠看到英偉達已經多次顯示出其試圖利用ARM處理器進一步佔領資料中心伺服器市場的決心,而集成了ARM核心的DPU將成為其打入資料中心存量市場取代X86 CPU的第一個切入點。

英偉達推出DPU來切入這個市場,而非直接用ARM核心CPU來與X86 CPU直接競爭,其實是一種比較討巧的做法,相當於用集成了網路、儲存、安全等任務的下一代CPU產品來達到逐漸替換CPU的目的,即使其中所內涵的ARM CPU效能無法對標同一代的X86 CPU,但是整體機由於在DPU SoC上集成了專用的處理加速模組,因此總體效能一定是超過X86 CPU的。這種有點“田忌賽馬”味道的策略,很可能成為英偉達開始替代低端X86 CPU的開始。

但是英偉達想要在中高階處理器市場來挑戰英特爾,還要面臨一系列的困難。

首先,正是英偉達的GPU與X86 CPU已經形成一種非常穩定的強互補關係。英偉達想要採用基於ARM架構的處理器做高階伺服器,還需要ARM處理器效能出現大幅的提升,而現在,這一程序並不明朗。

再一個是英特爾早已為應對英偉達的種種挑戰進行了相應的迴應和佈局。早在2017年,英特爾就宣佈要開發全棧的GPU產品組合,而預計明年英特爾的首批GPU將在使用GPU的各個市場上釋出。

為阻擊英偉達在AI計算和自動駕駛領域的擴張,英特爾也先後收購了收購了Nervana和Movidius作為邊緣AI計算的佈局,收購了Mobileye作為自動駕駛的佈局。並且,英特爾還在2018年宣佈,將開發一個用於異構計算的全棧開放軟體生態系統OpenAPI計劃,來應對CUDA生態的擴張。也就是說,英特爾不僅在英偉達的後院搞事情,同時也在建立自身的X86伺服器的生態系統。

資料中心業務對於英特爾來說,也正在成為其最核心的業務組成。2019年Q4英特爾的資料中心業務超越PC業務,成為其收入的主要來源;而在今年,英特爾對其技術組織和執行團隊的重組,也被外界視為全面轉型資料中心業務的開始。

可以想見在未來的資料中心處理器業務上,英偉達將迎來英特爾最為強勁的保衛戰和反擊戰,而廣大的伺服器整合商或將成為這場角力賽的受益方。

螳螂捕蟬黃雀在後,英偉達還要面對ADM這一新對手的追趕。不久前ADM曝出要花費300億美金收購賽靈思,就被砍作是叫板英特爾,阻擊英偉達的雙戰略。

除此之外,英偉達還要在資料中心處理器業務中面臨來自客戶自研晶片的挑戰。雲服務商本身也不願意完全將自身的計算核心完全交給英偉達,無論是AWS、還是谷歌、阿里巴巴、華為,都已經在佈局自己的雲端處理器。

不管怎麼說,資料中心已經成為英特爾、英偉達、AMD這些老牌晶片巨頭未來爭奪的主戰場,而英偉達如何能夠在X86的如日中天和雲端計算客戶的自研路線中,找到一個切入到中高階伺服器處理器的關鍵點,剛剛釋出的DPU也只能算作一個初步的嘗試。

未來資料中心的博弈,將圍繞AI、超算等所有領域全面展開,英偉達在前有強敵,後有追兵,盟友擁兵自立的境遇下,其資料中心的征程仍然任重而道遠。