深度學習工作站推薦一下
之前自己DIY了一臺服務器,大家都問了我不少問題,後來給朋友采購一臺GPU服務器,輾轉於各大廠商。甚是心累。自己DIY想的問題少一些,正式采購GPU服務器還是要考慮很多問題的。比如說性價比就有幾個方面:
1、一臺服務器多張卡(8張 or 10張)好,還是一臺服務器搞兩張卡多臺服務器好,這個問題後來咨詢了多個廠家,以前GPU卡都是通過SLI建立P2p access的,最大只能並行4張卡,現在有些廠家自己琢磨了一個小黑科技,通過增加一塊擴展主板,8張或者10張卡全部放擴展板上,這樣達到了8張卡同時建立p2p access,而不通過SLI了。從而1顆CPU可以控制8張顯卡了。加速比大概是7.3倍左右。比多臺服務器要好不少。
2、多臺服務器建立GPU集群是一個什麽模樣:一臺主控master節點(不需要GPU),一臺數據節點(不需要GPU),然後根據需要配備GPU服務器做計算節點,整個集群要配一個千M還是萬M的交換機(這個交換機的我記不清楚,反正是要一個專用的數據交換設備的),適合於大廠,就是說你一臺8卡的GPU或者10卡的GPU都不能滿足需求了才配集群。集群的加速比一般般,大概是3個計算節點可以達到2.1倍的樣子,因為深度學習並行化本來就比較麻煩,他的模型參數交換量大,訓練過程也較復雜。這一塊我當時畢業論文還專門研究了。如果想要直接上集群,然後自己家的運維團隊還沒建起來,那必須找個專業廠家好好規劃一下的。否則自己瞎折騰會得不償失。
3、一般的小廠我覺得搞個8塊的 gtx1080TI的服務器比較合適,便宜。貴一點的推薦搞個8卡的pascal的titan x。其它卡也有其它卡的功效,我個人認為這兩個卡比較合算。搞個一臺服務器也要考慮不少問題的,比如說GPU卡的散熱,光靠nvidia的那個風扇散熱是不夠的,需要搞一個專業的服務器機箱來散熱的,八張卡搞在一塊你散熱沒搞好幾個月就會燒壞卡。其次需要好的主板,主板是數據流動各種支撐,很重要,然後就是CPU,這些東西網上京東買不合適,還是需要專業廠家給你配的。還有就是之前說的幾張卡如何建立P2p access的問題。七七八八的,要搞明白還是要些精力的,不然心裏不踏實。
4、 可以省錢的地方我覺得就是不需要廠家給我裝深度學習編程框架,我自己搞個tensorflow 或者caffe 分分鐘的事情。這個我沒有要廠家的服務。
好了,我知道的基本講完了。上一個推薦的服務器列表,這個是我跟廠家軟磨硬泡拿到的價格,廠家說給我50個團購的名額,轉發給大家。我也不知道是不是廠家促銷的心機,反正覺得還算合適吧。需要的記得報上櫻園玻爾茲曼機的名字。
LTHPC深度學習靜音工作站 LT-7048A
系統規格參數
單精度22TFLOPS
GPUs 2顆公版NVIDIA Titan X PASCAL
GPU內存 每顆GPU 12GB
CPU 雙路 8核英特爾至強E5-2620 v4 2.1GHz
NVIDIA CUDA核心數量7168
系統內存 128 GB 2400 MHz DDR4
存儲空間 1塊800GB固態硬盤 一塊10TB企業級氦氣硬盤 最大支持130TB
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 648x 寬 452 x 高 178 (mm)
電源最高要求 1200W
工作溫度範圍 10 - 35°C
含稅人民幣63999元
LTHPC深度學習一體機 LT-7048GR
系統規格參數
單精度43.2TFLOPS
GPUs 4 顆 公版GTX 1080Ti
GPU 內存 每顆 GPU 11 GB
CPU 雙路 8核英特爾至強E5-2620 v4 2.1GHz
NVIDIA CUDA核心數量14336
系統內存 128 GB 2400 MHz DDR4
存儲空間 1塊800GB固態硬盤 一塊10TB企業級氦氣硬盤 最大支持130TB
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 673x 寬 438 x 高 176 (mm)
電源最高要求 2000W
工作溫度範圍 10 - 35°C
含稅人民幣76999元
LTHPC深度學習一體機 LT-7048GR
系統規格參數
單精度44TFLOPS
GPUs 4 NVIDIA Titan X PASCAL
GPU 內存 每顆 GPU 12 GB
CPU 雙路 8核英特爾至強E5-2620 v4 2.1GHz
NVIDIA CUDA核心數量14336
系統內存 128 GB 2400 MHz DDR4
存儲空間 1塊800GB固態硬盤 一塊10TB企業級氦氣硬盤 最大支持130TB
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 673x 寬 438 x 高 176 (mm)
電源最高要求 2000W
工作溫度範圍 10 - 35°C
含稅人民幣102999元
LTHPC深度學習一體機 LT-7048GR
系統規格參數
雙精度18.8TFLOPS/單精度37.2TFLOPS/半精度74.8TFLOPS
GPUs 4 NVIDIA Tesla P100
GPU 內存 每顆 GPU 16 GB
CPU 雙路 12核英特爾至強E5-2650 v4 2.2GHz
NVIDIA CUDA核心數量14336
系統內存 256 GB 2400 MHz DDR4
存儲空間 1塊800GB固態硬盤 一塊10TB企業級氦氣硬盤 最大支持130TB
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 673x 寬 438 x 高 176 (mm)
電源最高要求 2000W
工作溫度範圍 10 - 35°C
含稅人民幣299900元
LTHPC深度學習一體機 LT-4028GR
系統規格參數
單精度88TFLOPS
GPUs 8 NVIDIA Titan X PASCAL
GPU 內存 每顆 GPU 12 GB
CPU 雙路 12核英特爾至強E5-2650 v4 2.2GHz
NVIDIA CUDA核心數量14336
系統內存 256 GB 2400 MHz DDR4
存儲空間 4塊800GB固態硬盤
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 737x 寬 437 x 高 178 (mm)
電源最高要求 3200W
工作溫度範圍 10 - 35°C
含稅人民幣201900元
LTHPC深度學習一體機 LT-4028GR2
系統規格參數
單精度110TFLOPS
GPUs 10 NVIDIA Titan X PASCAL
GPU 內存 每顆 GPU 12 GB
CPU 雙路 12核英特爾至強E5-2650 v4 2.2GHz
NVIDIA CUDA核心數量14336
系統內存 256 GB 2400 MHz DDR4
存儲空間 4塊800GB固態硬盤
網絡 雙千兆以太網 可選萬兆 高速IB
軟件 Ubuntu 16.04 操作系統、專用的 GPU 驅動程序(用於測試工作站是否安裝正確)
最大系統重量 28KG
系統尺寸 深 737x 寬 437 x 高 178 (mm)
電源最高要求 4000W
工作溫度範圍 10 - 35°C
含稅人民幣229900元
關註公眾號 “櫻園的玻爾茲曼機” 留言回復
‘’服務器‘’
三個字。
獲取商談密鑰。
深度學習工作站推薦一下