1. 程式人生 > 實用技巧 >全球權威MLPerf基準測試再發榜,浪潮AI伺服器創18項AI效能紀錄

全球權威MLPerf基準測試再發榜,浪潮AI伺服器創18項AI效能紀錄

美國東部時間10月21日,全球備受矚目的權威AI基準測試MLPerf公佈今年的推理測試榜單浪潮AI伺服器NF5488A5一舉創造18項效能紀錄,在資料中心AI推理效能上遙遙領先其他廠商產品。

MLPerf是當前全球最具影響力的AI計算基準評測組織,由圖靈獎得主大衛·帕特森(David Patterson)聯合谷歌、斯坦福、哈佛大學等單位共同成立,每年組織全球AI訓練和AI推理效能測試併發榜。此次MLPerf的AI推理基準測試有全球23家公司和單位參與,在資料中心及邊緣等場景進行AI計算產品的效能比試。今年MLPerf訓練榜單已於7月公佈。

浪潮NF5488A5獲資料中心AI效能絕對優勢

此次浪潮NF5488A5一舉創造18項MLPerf推理效能紀錄,成為創紀錄最多的AI伺服器。今年的測試中,資料中心AI效能最受關注,全部參與機構提交了507項效能測試資料。浪潮NF5488A5創下了資料中心22個賽項中的13項效能紀錄以絕對優勢領先,NVIDIA DGX取得了5項資料中心效能紀錄。而在此前的MLPerf訓練榜單中,NF5488A5在最核心的Resnet50訓練任務中也創下了效能紀錄,單機效能高居榜首。

浪潮NF5488A5創造18項MLPerf推理效能紀錄

效能大幅提升3倍,全棧AI能力優勢凸顯

在此次基準測試中,浪潮AI伺服器NF5488A5在開放優化(Open)和固定任務(Closed)的ResNet50基準效能測試中,均表現優異,相比2019年MLPerf推理榜單的伺服器最好效能提升高達3倍。

MLPerf ResNet50 推理效能 2019 VS 2020 對比

NF5488A5是浪潮自研的新一代AI伺服器,是此次MLPerf全球競賽中唯一可以在4U空間內支援8塊安培架構A100晶片實現NVLink高速互聯的AI伺服器。浪潮NF5488A5在系統拓撲上採用了超低延遲設計,支援PCIe 4.0全鏈路極致優化,高頻通訊單元採用一級拓撲最近連線,最大限度提升處理器到AI晶片間的通訊效能。同時,通過配置NUMA節點,確保每顆處理器與其直連的GPU之間通訊效能最優,最大限度降低通訊延遲。此外,NF5488A5通過深度優化系統結構設計,確保裝置可在高溫環境下穩定執行。

本次基準測試中,浪潮展示出了卓越的AI計算軟硬體協同優化能力。在硬體層面,通過對CPU、GPU硬體效能的精細校準和全面優化,使CPU效能、GPU效能、CPU與GPU之間的資料通路均處於對AI推理最優狀態;在軟體層面,結合GPU硬體拓撲對多GPU的輪詢排程優化使單卡至多卡效能達到了近似線性擴充套件;在深度學習演算法層面,結合GPU Tensor Core 單元的計算特徵,通過自研通道壓縮演算法成功實現了模型的極致效能優化,在精度無損的情況下效能提升近2倍。

各伺服器 MLPerf AI 推理效能對比(以浪潮 NF5488A5 為基準,越高越好)

浪潮是全球領先的AI計算領導廠商,其AI伺服器在中國的市場份額已連續三年保持在50%以上。浪潮致力於AI計算平臺、資源平臺和演算法平臺的研發創新,並通過元腦生態與AI領先企業共同推進AI產業化和產業AI化程序。