全球權威MLPerf基準測試再發榜，浪潮AI伺服器創18項AI效能紀錄

阿新 • • 發佈：2020-10-23

美國東部時間10月21日，全球備受矚目的權威AI基準測試MLPerf公佈今年的推理測試榜單，浪潮AI伺服器NF5488A5一舉創造18項效能紀錄，在資料中心AI推理效能上遙遙領先其他廠商產品。

MLPerf是當前全球最具影響力的AI計算基準評測組織，由圖靈獎得主大衛·帕特森（David Patterson）聯合谷歌、斯坦福、哈佛大學等單位共同成立，每年組織全球AI訓練和AI推理效能測試併發榜。此次MLPerf的AI推理基準測試有全球23家公司和單位參與，在資料中心及邊緣等場景進行AI計算產品的效能比試。今年MLPerf訓練榜單已於7月公佈。

浪潮NF5488A5獲資料中心AI效能絕對優勢

此次浪潮NF5488A5一舉創造18項MLPerf推理效能紀錄，成為創紀錄最多的AI伺服器。今年的測試中，資料中心AI效能最受關注，全部參與機構提交了507項效能測試資料。浪潮NF5488A5創下了資料中心22個賽項中的13項效能紀錄以絕對優勢領先，NVIDIA DGX取得了5項資料中心效能紀錄。而在此前的MLPerf訓練榜單中，NF5488A5在最核心的Resnet50訓練任務中也創下了效能紀錄，單機效能高居榜首。

效能大幅提升3倍，全棧AI能力優勢凸顯

在此次基準測試中，浪潮AI伺服器NF5488A5在開放優化(Open)和固定任務(Closed)的ResNet50基準效能測試中，均表現優異，相比2019年MLPerf推理榜單的伺服器最好效能提升高達3倍。

**MLPerf ResNet50** **推理效能** **2019 VS 2020** 對比

NF5488A5是浪潮自研的新一代AI伺服器，是此次MLPerf全球競賽中唯一可以在4U空間內支援8塊安培架構A100晶片實現NVLink高速互聯的AI伺服器。浪潮NF5488A5在系統拓撲上採用了超低延遲設計，支援PCIe 4.0全鏈路極致優化，高頻通訊單元採用一級拓撲最近連線，最大限度提升處理器到AI晶片間的通訊效能。同時，通過配置NUMA節點，確保每顆處理器與其直連的GPU之間通訊效能最優，最大限度降低通訊延遲。此外，NF5488A5通過深度優化系統結構設計，確保裝置可在高溫環境下穩定執行。

本次基準測試中，浪潮展示出了卓越的AI計算軟硬體協同優化能力。在硬體層面，通過對CPU、GPU硬體效能的精細校準和全面優化，使CPU效能、GPU效能、CPU與GPU之間的資料通路均處於對AI推理最優狀態；在軟體層面，結合GPU硬體拓撲對多GPU的輪詢排程優化使單卡至多卡效能達到了近似線性擴充套件；在深度學習演算法層面，結合GPU Tensor Core 單元的計算特徵，通過自研通道壓縮演算法成功實現了模型的極致效能優化，在精度無損的情況下效能提升近2倍。

**各伺服器** **MLPerf AI** **推理效能對比（以浪潮** **NF5488A5** **為基準，越高越好）**

浪潮是全球領先的AI計算領導廠商，其AI伺服器在中國的市場份額已連續三年保持在50%以上。浪潮致力於AI計算平臺、資源平臺和演算法平臺的研發創新，並通過元腦生態與AI領先企業共同推進AI產業化和產業AI化程序。

全球權威MLPerf基準測試再發榜，浪潮AI伺服器創18項AI效能紀錄

浪潮NF5488A5獲資料中心AI效能絕對優勢

效能大幅提升3倍，全棧AI能力優勢凸顯

全球權威MLPerf基準測試再發榜，浪潮AI伺服器創18項AI效能紀錄

MLPerf 基準測試顯示：全球計算機制造商採用英偉達 AI 創下多項紀錄

影象註釋，AI比人類更精確？微軟新演算法重新整理影象註釋基準測試紀錄-1

全球首個活體機器人再升級：5 分鐘自愈嚴重傷口，具備 “記憶”功能

寧德時代獲得大眾汽車集團電芯測試實驗室認證，為全球首家

A_05 效能調優：採用BenchmarkDotNet對c#程式碼進行基準測試，

NFT 再臨，支付寶付款碼《白蛇 2：青蛇劫起》面板首發：全球限量

Debian 11“bullseye”系統基準測試，在某些應用中效能快 2 倍

效能基準測試：英特爾 12 代 Alder Lake 臺式桌面級晶片比蘋果 M1 Max 更快，耗電量也大增

基準測試：在英特爾 12 代 Alder Lake-S 酷睿 i9-12900K 電腦上，微軟 Win11 執行比 Linux 更快

旗艦再躍升，聯發科詳解全球首款 7nm 電視晶片 Pentonic 2000

英特爾 i9-13900K 現身《奇點灰燼》基準測試，24 核 32 執行緒

3DMark 與聯想合作，推出 Speed Way GPU 基準測試程式

Geekbench 指責三星操縱基準測試，將過去四年的 Galaxy 旗艦機除名

英偉達：在 Blender 基準測試中，RTX 3060 Studio 設計本渲染速度比 M1 Max MacBook Pro 快 3.5 倍

Gartner：2021 年全球半導體營收大漲 26%，三星電子力壓英特爾再奪第一，AMD、聯發科大爆發，華為海思無奈跌出前 25 名

測試人生 | 從跨專業手工測試轉崗外包，再到 Python 測試開發，跳槽漲薪 85%！

應用效能測試神器 Gatling，你用過嗎？

探索ElasticSearch-基準測試BenchMark（五）

Mysql常用基準測試命令總結

全球權威MLPerf基準測試再發榜，浪潮AI伺服器創18項AI效能紀錄

浪潮NF5488A5獲資料中心AI效能絕對優勢

效能大幅提升3倍，全棧AI能力優勢凸顯

相關推薦