“炫技”還是“真硬核”,揭祕阿里倚天 710 晶片
一年一度雲棲大會,又到了阿里在技術上“秀肌肉”的時刻。
自 2019 年釋出首款 RISC-V 玄鐵處理器,到去年釋出 AI 晶片含光 800,再到今年釋出的通用伺服器晶片倚天 710,阿里旗下半導體公司平頭哥在晶片上實現了“年更”。
在半導體領域被“卡脖子”的當下,阿里在晶片設計上的進展格外引發關注。
頂配?
對比之下,本次最新發布的倚天 710 晶片,是目前引數表現最為亮眼的一個:5nm 製程、單晶片容納 600 億電晶體、採用最新的 ARMv9 架構、DDR5 記憶體頻寬、PCIe 5.0 介面,每一項都是 2020 年才啟動的新技術,也是各自技術領域的“頂配”。跑出的 SPECint2017 440 分,也是同類晶片中的最高成績。
在採用各項新技術的同時,倚天 710 的在面世前各個環節的進展也十分順利。
阿里雲智慧總裁、達摩院院長張建鋒在接受包括搜狐科技在內的媒體採訪時表示,倚天晶片研發進展超過預期,在行業內普遍需要兩次流片(像流水線一樣通過一系列步驟製造晶片)的情況下,倚天 710 僅在 7 月進行一次流片,就已經基本符合需求。
出色的引數顯然拔高了人們對於阿里這款晶片的期待。
從阿里公開披露的資訊中,倚天 710“效能較業界標杆高 20%,能效比高 50%”的表述格外值得注意。
一位不願具名的分析師對搜狐科技表示:“如果對標的是同為 5nm 的晶片,那麼 20% 的效能提升是一個非常不錯的成績,但如果對標的是 7nm 晶片,則 20% 只能算是一個正常的提升
效能和能效比是衡量一款晶片好壞與否的重要引數。製程、架構、核心數對此都有影響。
張建鋒坦承,由於是最新發布的產品,倚天 710 在表現優秀的同時,也必然存在技術紅利。有業內人士也表示:“在這些最新的技術尚未成熟時提前佈局,是阿里敢於承擔風險的表現,且使用新技術也付出了更高的成本。”
不過,需要澄清的是,上述這些看似高超的技術大多是由外部授權提供。
如晶片架構可分為指令集架構和微架構等。通常廠商會對微架構進行調整,以適配產品,並側面證明自己的研發實力,但此次倚天 710 並未對微架構進行技術改造,而是全盤採用了公版授權。相比之下,華為鯤鵬 920 晶片雖然早 2 年釋出,基於的也是舊版的 ARMv8.2 架構,但卻對微架構進行了自行設計。
在自研方面,阿里在對外宣傳中著重強調了該晶片對雲應用場景的適配。如解決雲端計算高併發條件下的頻寬瓶頸。“倚天 710 針對片上互聯進行了特殊優化設計,通過流控演算法緩解了系統擁塞問題。”
考驗
從實際投產商用的角度來看,倚天 710 也面臨著諸多考驗。
首先是晶片質量的穩定性。國際調研機構 Wit Display 首席分析師林芝稱,由於是首次亮相,這款晶片的良率、穩定性以及可靠性都並沒有獲得市場的驗證,在這個時間點來判斷這款晶片的實際表現,為時尚早。
有業內人士也表示,目前的國產伺服器晶片,大多表面數據好看,核多,記憶體通道多,但實際使用體驗很差,在外設的相容性等等方面的指標上和英特爾晶片還不在一個級別。
另外,由於採用了最先進的工藝,倚天 710 在生產製造上也面臨難度。
“5nm 晶片在工藝上比較成熟的只有臺積電、三星,目前主要生產消費級 5nm 晶片(如手機),能給到阿里伺服器晶片的產能十分有限。”林芝表示。
除此之外,由於全部自用,這款晶片所能帶來的利潤難以量化,也更難證明它的商業價值。
相比之下,同樣在大力發展雲端計算的華為,早在 2019 年就推出了基於 ARM 架構的 7nm 伺服器晶片“鯤鵬 920”和伺服器“泰山”。2020 年 6 月,泰山伺服器先後中標三大運營商的伺服器採購專案。
變局
倚天 710 晶片的釋出,除了對阿里雲業務自身產生影響外,還有可能因為規模效應,給伺服器晶片市場帶來變局。
有業內人士對搜狐科技評估表示,倚天 710 的研發成本在十幾億元左右,包括架構授權及幾千萬美元的流片費用,這相當於阿里雲在今年上半年利潤總額的 2-3 倍。
值得注意的是,經歷了長達 12 年發展和投入,阿里雲直到今年才開始正式盈利。
巨大的成本付出,對應的是潛在且更大的商業回報。關於這款晶片在未來所能帶來的利潤回報,張建鋒並未給出明確答案。
不過,阿里雲目前已經擁有超過 150 萬臺伺服器,具備極強的規模效應,相比於外部採購,自研所能節省的成本相當可觀。據瞭解,倚天 710 晶片將搭載在同期釋出的磐久伺服器上,並在今年開始部署。
林芝對搜狐科技表示,自研晶片不僅可以為阿里的雲端計算服務降低成本,從而提供更高的競爭力,甚至有可能會改變伺服器晶片市場的競爭格局。
放眼整個整個伺服器晶片市場上,X86 晶片佔據主導地位,其中英特爾的晶片佔據了 90% 以上的市場份額。
“英特爾的一款 10nm 製程的 X86 晶片,主頻能達到 3.4GHz;AMD 7nm 製程的 X86 晶片,主頻可以達到 3.5GHz”,林芝介紹道:“而阿里的這款晶片,儘管是 5nm 工藝,但由於採用了 ARM 架構,主頻只有 3.2GHz。”
這主要是受架構的影響。相比於 X86 架構,採用 ARM 架構的晶片在效能上雖不佔優勢,但在功耗和價格上都更低,對於用電量和採購量都十分龐大的雲端計算公司來說,是個不錯的選擇。
同時,由於可以不完全依賴 X86 架構的伺服器,也可以應對潛在的單一供應商風險。
2018 年,亞馬遜開啟了使用 ARM 架構自研伺服器晶片的先河,並在接下來兩年內釋出兩款命名為 Graviton 的伺服器晶片。隨後華為鯤鵬晶片、Ampere 的 Altra 晶片都採用了 ARM 架構。
隨著多家雲端計算嘗試 ARM 架構晶片自研業務,這個擁有 7000-8000 億規模的市場或許也將迎來新的變化。
溯源
時間回到 2018 年 4 月,阿里巴巴全資收購當時大陸唯一一家自助嵌入式 CPU IP Core 公司中天微系統有限公司,開啟了自研晶片之路。
在此之前,阿里巴巴已經先後投資了多家晶片公司,如寒武紀、Barefoot Networks、深鑑、耐能(Kneron)、翱捷科技(ASR)等等。馬雲也被媒體稱為“要買下大半個晶片產業”。
馬雲表示:“阿里投入數十億美金研發晶片並不是為了控制技術,而是想讓每個年輕人,每家小公司都能以價效比更高的方式分享這項技術。”
關於自研晶片的目的,張建鋒表示,主要是為了更適配雲服務場景。“原來 CPU 並不完全為了雲上負載來設計的,難以完全適配大規模、高併發的的雲端計算需求。”
不過,對於外界猜測的阿里是否打算涉及更為核心的晶片製造業務,張建鋒表示否認。
“產業有分工,像我們伺服器最大的提供商是浪潮,交換機最大提供商是銳捷,還有很多大大小小的廠商。他們不僅滿足了我們自己的需求,也給產業帶來更大的空間。”
目前,平頭哥擁有處理器 IP、AI 晶片及通用晶片等產品家族,旗下玄鐵系列處理器出貨量已達 25 億顆;兩年前問世的阿里第一顆晶片含光 800 已實現規模化應用,通過阿里雲服務了搜尋推薦、視訊直播等行業客戶。截至目前,阿里雲已經完成了從晶片、部件到整機的雲基礎設施閉環。