1. 程式人生 > 資訊 >衡量算力有多強,除了數值還要看什麼

衡量算力有多強,除了數值還要看什麼

今天,數字技術開始深入生產生活的每一環節。

然而要推動數字產業的高水平發展,首先要確保擁有處理巨量資料的能力。隨著資料被列入生產要素,算力已成為重要的生產力。根據 IDC 釋出的《2020 全球計算力指數評估報告》,一國的算力指數每提高 1 個百分點,數字經濟和 GDP 將分別增長 3.3‰和 1.8‰

數字經濟對算力的需求日益增大,加之新基建的東風,作為算力基礎設施的資料中心、超算中心、智慧計算中心也邁入加速發展階段。工信部資料顯示,截至 2020 年底,我國在用的資料中心機架超過 400 萬架,年均增速超 30%。

算力 "突飛猛進" 的同時,市場認知卻嚴重滯後。大多數人仍然對算力相關的概念比較陌生 —— 算力如何衡量?不同算力等級間有何區別?算力與應用場景如何匹配?

1. 看算力水平,精度比數字重要

超級計算機被譽為 "國之重器",代表國家算力的最高水準,也是一國科技實力的重要體現。理解超級計算機的峰值算力,首先需要知道算力的計量單位 FLOPS(Floating-point operations per second)。

FLOPS 表示每秒浮點的運算次數。具體使用時,FLOPS 前面還會有一個字母常量,例如 TFLOPS、PFLOPS。這個字母 T、P 代表次數,T 代表每秒一萬億次,P 代表每秒一千萬億次。

除了運算次數,衡量算力水平時還要看算力精度。例如,1000FLOPS 的 AI 計算中心所提供的的算力,與 1000FLOPS 超級計算機提供的算力,雖然數值相同,但由於精度不同,實際算力水平也是天壤之別。

根據參與運算資料精度的不同,可把算力分為雙精度算力(64 位,FP64)、單精度算力(32 位,FP32)、半精度算力(16 位,FP16)及整型算力(INT8、INT4)。數字位數越高,意味著精度越高,能夠支援的運算複雜程度就越高,適配的應用場景也就越廣。

超級計算機常被用於需要大量運算的工作,譬如天氣預報、運算化學、分子模型、天體物理模擬等,是為高精尖科學領域提供極致算力的服務。由於這類科學領域的計算對資料精度要求高,因此通常的超算系統以雙精度數值計算為主。

近年來,AI 在國內獲得快速發展,為匹配 AI 訓練與推理的特殊需求,AI 超算系統應運而生。不同於傳統超算,AI 超算系統大多用於語音、圖片或視訊的處理,浮點計算下的低精度計算甚至整型計算即可滿足相應需求。

要確定不同精度算力的效能,需通過各自領域內的專用測試程式來測試。例如,用於測試超級計算機效能的 Linpack 測試專注於雙精度算力;用於智慧計算機效能的 Resnet-50 則專注於半精度算力。

如果將參與運算的資料比作貨物,那麼雙精度算力就可以看作重型卡車,低精度算力可以看作是小型貨車。重型卡車也可以承擔小型貨車的任務,但功耗過高,會造成浪費。而小型貨車由於自身效能限制,無法承擔重型卡車的任務。

同樣,超級計算機的雙精度算力即可以看作是重型卡車,是一種 "通用算力",可以承擔各種計算任務;而單精度、低精度算力作為小型貨車,則是一種 "專用算力",是專門為 AI 的訓練和推理設計,無法承擔超級計算機的計算任務。

" 超級計算機設計的目標是為做更復雜的計算,所以即使只是做簡單的計算,它的功耗還是很高。" 中國科學院計算技術研究所研究員張雲泉此前曾對媒體表示,AI 計算擅長於推理或訓練,但多數不具備高精度數值計算能力,這也限制其在 AI 計算之外的應用場景使用。

2. 尋找 "有效算力"

隨著數字化與千行百業的深度結合,每個行業、每個企業都面臨著選擇算力的問題。需要注意的是,僅關注理論層面的最高算力並無太大意義,落到實際應用場景裡,還需要綜合考慮使用者應用、成本、算力相容性等多方面因素,尋找效率更高且經濟適用的有效算力。

在選擇晶片與算力時,首先需明確應用場景和優先任務。在早期規劃階段,地方政府即需要重視區域內的優勢產業、明確資料中心的應用目標。智算中心融合了 AI 技術與專用算力,在影象分類、自然語言處理、迴圈翻譯等場景下較有優勢;超算中心則作為尖端科技領域的強大戰力,服務於行星模擬、分子藥物設計、基因分析等需要高精度資料處理的領域,應用領域更為廣闊。

在追求最佳算力時,成本也是關注重點。一方面,算力基礎設施的建設成本極高,在前期規劃時,需要關注市場邏輯,重視經濟可行性。粵港澳大灣區曾出現過同一地區的兩個智慧計算中心,同精度算力單價相差近 4 倍的情況。為避免出現 "高價高數值,低能低價效比" 的情況,引入算力中心時應重考察算力單價,關注算力的實際效益。

此外,加強算力基礎設施的頂層設計和總體規劃,倡導開放、多元、相容的新型算力基礎設施,能使基礎設施的利用率大幅提升。底層基礎設施搭建開放性架構,不僅能夠提供多種算力、提升基礎設施的易用度和適用度,還能夠支撐更加豐富的應用場景,同時賦能社會治理和產業應用。