1. 程式人生 > 資訊 >大舉攻向資料中心市場,Arm 新伺服器晶片設計效能提升 50%

大舉攻向資料中心市場,Arm 新伺服器晶片設計效能提升 50%

4 月 28 日報道,今日,英國晶片設計公司 Arm 公佈了 Neoverse V1 和 N2 伺服器晶片平臺的最新效能資料,其處理能力比上一代 N1 提高了 40%~50%。

Neoverse V1 平臺首次支援可伸縮向量擴充套件(SVE),N2 平臺則率先採用全新 Armv9 架構的平臺,擁有比 N1 更高的核心數、效能和能效。兩者都支援新的資料型別和指令集,並針對高效能運算和 AI 等工作負載做了優化。

去年 9 月,Arm 釋出新的 Neoverse N2 和 V1 平臺,但並未提及詳細效能。如今 Arm 正式公開兩款全新平臺的效能、能效、總擁有成本等細節,以及騰訊、阿里等合作伙伴採用該設計的案例,並宣佈基於 N2 的晶片預計將在今年下半年推出。

儘管 Arm 並未直接對比 Neoverse 平臺與英特爾、AMD 產品的效能,但從圖中可以看到,Neoverse 系列晶片已經非常有競爭力。

同時,Arm 也釋出了構建基於 Neoverse V1 和 N2 平臺高效能 SoC 的關鍵部件 ——CMN-700。

Arm 基礎設施事業部高階副總裁兼總經理 Chris Bergey 稱,Arm 想改變行業對部署基礎設施的思維,每一個創新者都不應該被要求在效能與能耗之間進行抉擇,而 Neoverse 平臺提供了兩者兼得的最佳解決方案。

一、Arm Neoverse 已走過十年曆程

Arm 基礎設施業務高階副總裁 Chris Bergey 說:“現在是時候讓 Neoverse 跨越所有基礎設施了。”

從起步至今,Arm Neoverse 已經走過十年曆程。

早期其基礎設施核心是 Cortex-A72,有出色的能效比、媲美競爭對手的單核效能表現,通過合作伙伴的智慧網絡卡、DPU、物聯網晶片在網路及邊緣應用場景中發揮價值。

隨後,2019 年,Neoverse N1 和 CMN-600 Mesh 網路將線性效能擴充套件到非常高的核心數量,更加適合雲服務。據其分享,N1 單核效能已經比肩或超過傳統 SMT 執行緒的效能。

Arm 技術專家稱,儘管其競爭對手陸續推出新的晶片,但它們仍無法與 N1 的單執行緒效能匹敵。

通過 Neoverse V1 和 N2,Arm 想進一步改變業界對部署基礎設施的看法,使得大家無需在效能與能效之間做選擇,而是兩者兼得。

Arm 還將幫助合作伙伴在單晶片或多晶片封裝中,都能以同質或異質的方式提供解決方案。

據 Arm 技術專家介紹,Arm 與領先的晶圓代工廠深入合作,在多個先進的工藝節點上開發出了效能和功耗優化的 POP IP。

隨著 Project Cassini 和 Arm SystemReady 啟動,Arm 的標準和認證專案計劃正持續推進,並逐步擴充套件到基礎設施和物聯網邊緣。

今天,Arm 正式揭曉 Neoverse V1 和 N2 平臺的技術細節。

二、Neoverse V1:機器學習工作負載可提升 4 倍

Neoverse V1 是 Arm 強調效能優先的新型計算系列的第一個平臺,客戶可基於該架構靈活地為大型資料中心伺服器設計晶片。

這是 Arm 迄今設計的最寬微架構,Arm 預期它在多核配置中能勝過市場上其他產品。

Arm 為其加寬了微架構,並增加了緩衝區和佇列的深度,因此在執行中能容納更多執行中的指令,支援高效能和百萬兆級計算等市場應用。

與 N1 相比,Neoverse V1 帶來了 50% 的效能提升,在各種向量工作負責中效能優化約 1.8 倍,通過各種新的指令,機器學習工作負載最高可優化 4 倍。

客戶可以自由選擇適當的 IO 尺寸,並利用晶片集和多晶片功能來提高核心數量和效能,不過採用的方法是組合可提高良品率、降低成本的小型晶片。

法國晶片公司 SiPearl 和韓國電子通訊研究所( ETRI)的高效能運算(SoC)均可展現這些設計元素的優勢,這被 Arm 看作是高效能運算的發展方向。

V1 新增的一個關鍵功能是 SVE,可使其在每核效能方面領先,使用 SVE 的程式碼壽命更長,併為 SoC 設計者提供更好的靈活性。

SVE 為開發者提供了一套全新的向量程式設計和資料操作工具,能直接取用相同程式碼進行自動向量化,處理速度相比 NEON 可提高 3.5 倍。

由於 SVE 與向量長度無關,因此相同程式碼不加修改即可在 V1 上執行,如果在 V1 上加倍 SVE 向量的寬度,對應處理速度也幾乎提速 1 倍。

三、Neoverse N2:單執行緒效能提升了 40%

另一種晶片微架構 Arm Neoverse N2 平臺,是第一個基於 Arm 公司最新 Armv9 架構的核心,也是第一個具備 SVE2 功能的平臺。

Neoverse N2 在安全性、能耗以及效能方面都有全面提升,並能為使用者減少 TCO 的每瓦效能表現。相比於 N1,N2 在保持相同水平的功率和麵積效率的基礎上,單執行緒效能提升了 40%。

N2 具備良好的可擴充套件性,可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣和 5G 應用場景,並在這些應用中帶來優於 N1 的表現。例如,在雲端上提升 1.3 倍的 NGINX,在 5G 邊緣應用上提升 1.2 倍的 DPDK 資料包處理。

SVE2 是 Armv9 的重要特性之一,能顯著提升從雲到邊緣的效能效率、可擴充套件性及安全性。

和 SVE 一樣,SVE2 也屬於與向量長度無關的指令集,使用者只需編寫、編譯一次程式碼,即可在各種硬體上執行,還能充分利用可用的向量頻寬。

在機器學習、數字訊號處理、多媒體、5G 系統等廣泛應用場景中,SVE2 不僅帶來大幅效能提升,還帶來了 SVE 具備的程式設計簡易性及可移植性等優勢。

四、新 Mesh 互連技術助力打造異構 SoC

構建基於 V1 和 N2 高效能 SoC 的關鍵要素,就是 Arm Neoverse CMN-700 Mesh 互連技術。

CMN-600 為可擴充套件、高核心數、高效能 SoC 奠定了基礎,在此基礎上,新一代 Arm Neoverse CMN-700 被 Arm 稱作是業界最先進的 Mesh 互連技術,在每個向量上進一步提升了效能 —— 從核心的數量、快取的大小,到附加記憶體和 IO 裝置的數量和型別。

對於基於 V1 的高效能運算平臺而言,支援高頻寬 DDR5 和 HBM 記憶體系統至關重要,而 CMN-700 即可實現這一點。

其另一個關注重點是對多晶片功能的助益,以便為資料中心資源池化的增長提供更多定製選項。CMN-700 中還增加了 CXL 功能,可為記憶體擴充套件和智慧一致性加速器構建主機或端點裝置。

多晶片功能的一項重要升級是針對傳統多插槽設計和新的晶片集或多晶片整合提高效能和優化功能,這為突破傳統的矽掩膜版限制提供新的機遇,同時也使得緊密耦合的異構計算能擁有更大的靈活性。

五、騰訊、阿里均已測試 Neoverse 平臺,伺服器效能提升明顯

基於 Neoverse 平臺的新功能,Arm 合作伙伴及客戶能更加順利地實現從雲端到邊緣的部署。

Honeycomb.io 證實說,他們在 15 小時內便完成將其接收量應用程式移植到 AWS Gravition2 上,同時工作流程的例項使用量減少了 30%。

在雲服務方面,騰訊與 Arm 持續合作,騰訊在硬體測試和軟體支援方面持續投入,使其在雲應用上能採用 Arm Neoverse 技術,每瓦效能表現出色,軟體部分既支援已編譯和解譯的程式碼庫,也支援為這些程式碼庫提供支撐的微服務框架。

騰訊專項測試技術中心總監黃聞欣(Victor Huang)說,通過 TencentBench 測試框架發現,得益於更多可擴充套件的 CPU 核心數,Arm 伺服器比傳統的伺服器效能表現更強勁,尤其在 AI 推理和圖片處理領域優勢非常明顯。

阿里雲在即將上線的基於 Arm 架構 ECS 例項上完成了測試,並在 SPECjbb 測試資料中表現出色,通過雙方緊密合作,基於 Arm 架構執行的 DragonWell JDK 效能提高了 50%。使用者及開發者現可到阿里雲網站上註冊,獲取 Arm 系列例項的受邀測試。

亞馬遜雲科技(AWS)通過收購 Annapurna Labs 部門成為 Arm Neoverse 的早期使用者,其自研伺服器晶片 AWS Gravition 正快速布建於 AWS 的各個服務區域。而過去 AWS 推出的新例項中,有近一半是基於 Graviton2 平臺的。

除了在主流應用用例中,Graviton2 和 Neoverse 也被應用於更多專用處理的應用場景。例如在 EDA 方面,Arm 獲得了所有主要工具供應商的支援,並且詳細計劃了 Arm 如何將 EDA 的工作負載移上雲端。

甲骨文(Oracle)已宣佈計劃在 Oracle 雲基礎設施上採用 Ampere Altra CPU,為各種工作負載提供最佳的價效比。

在高效能運算(HPC)方面,今年 4 月,印度電子資訊科技部(MeitY)宣佈將加入法國晶片公司(SiPearl)和韓國電子通訊研究所(ETRI)的行列,採用 Neoverse V1 驅動國家級百萬兆級高效能運算專案。

在通訊方面,Marvell 釋出了基於 Neoverse N2 的 OCTEON 系列網路解決方案,預計將於 2021 年底前試產,比上一代 OCTEON 的效能提升 3 倍。

結語:Arm 正大舉攻向伺服器晶片市場

對於目前執行的各種工作負載和應用程式,Arm 正嘗試推出能兼顧高算力和低功耗的計算解決方案,這對於主導 x86 架構的伺服器處理器供應商英特爾和 AMD 無疑正造成新的衝擊。

但 Arm 表示,意味著,“一刀切”計算方法不再是合適的解決方案。這是對使用 x86 架構的主要伺服器供應商英特爾和 AMD 一次攻擊。

今天 Arm 新公佈的訊息還只是冰山一角。總體來看,Arm 正在提高其在計算機市場的競爭力。隨著 Arm 處理器大量走向雲端伺服器,已經壟斷絕大多數手機處理器市場的 Arm,將會無處不在。