GPU必知 | 不為RTX 30設限,這般配置發揮每一分能力
隨著新一代RTX 30系列GPU的火爆開售,近期很多人都在問什麼樣的CPU才能帶的動RTX 3080甚至RTX 3090。那麼這個帶的動到底是什麼意思呢?一般認為帶得動就是不會給GPU製造瓶頸。接下來我們通過一系列評測看下比較適配的算力定製方案。
最新GPU深度學習效能排行
下圖展示了當前熱門的Nvidia GPU在深度學習方面的效能表現(以RTX 2080Ti為對比基準)。從圖中可以看出,A100(40GB)在深度學習方面表現最為強勁,是RTX 2080 Ti 兩倍還多;新出的RTX 3090(24GB)排第二,是RTX 2080 Ti 的1.5 倍左右。但比較良心的是,RTX 3090 的價格只漲了15%。
排在天梯圖頂端的GPU確實是香,其次是價效比選擇,建議依據各種任務的大致記憶體需求,結合上圖進行細分篩選:
-
使用預訓練 transformer 和從頭訓練小型 transformer:>= 11GB
-
訓練大型 transformer 或卷積網路:>= 24 GB
-
原型神經網路(transformer 或卷積網路):>= 10 GB
-
Kaggle 比賽:>= 8 GB
-
應用計算機視覺:>= 10GB
高頻CPU避免成為GPU瓶頸
CPU作為通用處理器需要計算電腦中的每一個細節,3D畫面配合輸出,單位運動軌跡計算,後臺程式保持執行,還有音訊、網路訊號不斷交換處理。
上圖為主流CPU搭配RTX 3080在1080P下的測試資料,很明顯,銳龍7 3800X或更低的CPU沒有發揮出RTX 3080顯示卡的真正實力,也就是成了這套系統在1080P解析度下的“瓶頸”。i9-9900K或銳龍7 3800XT及更高的CPU更適合RTX 3080組成系統。
再來看下3DMark理論效能測試,結合上圖篩選,在測試中我們選擇了Intel和AMD平臺的最強的處理器銳龍9 3900X和i9-10900K。
總結一下,主要用1080P~2K解析度的話,PCIe 3.0和4.0差別不大。4K起步的話,要想壓榨出RTX 30的每一分能力,就真的應該考慮PCIe 4.0,還可以搭配最能發揮RTX IO功能的PCIe 4.0 SSD。
同時電源功率要夠大,Nvidia官方給的資訊是RTX 3070配650W,RTX 3080/3090配750W即可,但實際850W以上也挺好的。
定製RTX 30系列工作站
高校科研使用者可領專屬補貼
Cloudhin®雲軒專注Deep learning和高效能運算伺服器定製,針對主要深度學習框架(如TensorFlow、Caffe 2、Theano或Torch)進行了優化和設定,為計算系統提供強大的深度學習功能。
工作站CPU可選R7-3700X/R7-3800XT/R9-3900XT/R9-3950X等多執行緒處理器,7nm先進製程工藝,功耗更低,效能更強,頻率更高,同步多工更快速。支援更強PCIe 4.0介面,32GB/s頻寬,資料傳輸更迅猛,擴充套件能力更強。
PCIe 4.0兩倍於過去的CPU通訊頻寬,可以帶來更好的GPU計算能力,NVIDIA新一代RTX 30系列GPU,全系支援PCIe 4.0 ,助力開發者們構建並加速HPC、基因組學、計算金融、資料科學、人工智慧、影視後期等領域的應用。
專業勤修,銳意進取。雲軒技術工程師畢業於NVIDIA深度學習研究所,豐富經驗,值得信賴。更多定製方案請聯絡客服,我們將實時響應您的定製需求。
聯絡我們
如果您有合作需求或寶貴建議,歡迎來信。
合作熱線:021-5415 5559