初學者深度學習工作站配置
本文使用人群為:
- 深度學習小白或者入門者
- 配置工作站預算不高者(1w內)
- 窮書生
本人是某窮實驗室搬磚學生,想學習深度學習只能自己配置工作站,由於自身也資料深度學習初學者,因此也不敢配太好的電腦,本著一顆學醫不成當遊戲機的心態,組裝了人生第一臺電腦
先列出個人配置,建議大家可以通過pcpartpicker.com建立自己的配置清單,這個網站可以檢測你的配件是否會存在相容性的問題
- CPU:I5 7500散片 ¥1189
- CPU散熱器玄冰300:¥78
- GPU:微星 MSI GTX 1080 8G DUKE 闇黑龍爵 256BIT 8GB GDDR5X PCI-E3.0 顯示卡¥3999
- 主機板: 華碩PRIME B250M-PLUS ¥619
- 固態SSD:Intel 600P 256G ¥789
- 機械硬碟:西部資料藍盤7200轉2T ¥429
- 記憶體: 金士頓(Kingston)駭客神條 Fury系列 DDR4 2400 8G 桌上型電腦記憶體¥449
- 機箱: 先馬(SAMA)塔裡克側透版黑 遊戲電腦機箱 ¥159
- 電源: 航嘉(Huntkey) 額定500W jumper500 電源 ¥289
共¥7980
1.CPU
最好選擇越多PCI-e lanes的CPU越好,由於酷睿i5-7500的通道數只有16個,所以未來拓展顯示卡會有瓶頸。由於獨顯都是通過PCI-e 通道進行連線,而GPU可以通過x4、x8、x16通道進行驅動。由於i5-7500本身具有整合顯示卡,以及m.2介面的ssd會佔據4條通道,因此16條通道會分配成 1X8、2X4,因此基本使用了i5-7500的通道數限制下無法進行GPU拓展。8個通道分配給1080,4個通道分配給整合顯示卡,4個通道分配給ssd
個人考慮到目前只是入門級別,而且硬體的更新換代比較快,並且整體預算不高,想著目前想用一塊1080顯示卡玩一玩,就沒考慮多通道的CPU。
如果是想要未來能夠拓展更多的顯示卡,可以通過以下方式選擇E5 CPU,若預算不夠可選擇上一代的,或者選擇雙路CPU。
查詢intel官網,發現大部分i5和i7的PCI-e通道只有16,i7至尊系列能達到40通道,不過此時的你需要考慮下預算問題。退而求其次,可以選擇上代E5系列產品,可以淘寶搜尋相關產品,不過都是幾年前的CPU了,效能上可能會有所欠缺,但是如果不是拿來做遊戲機只是拿來做深度學習的話是可以用的。不過淘寶水很深,得自己辨別
2.GPU
顯示卡基本上推薦至少1080以上的顯示卡。顯示卡才是關鍵的要素,組機器來搞深度,就是為了獲得足夠的CUDA單元,以及配套的視訊記憶體資源。所以數CUDA個數和單個CUDA可用的平均視訊記憶體量就是衡量整體能力的基本考量方法。
可對比目前幾塊消費級具有CUDA計算單元的顯示卡對比
最新2017三月份上市的1080ti堪稱價效比之最,11.5TFLOPS,11GB視訊記憶體,苦於窮,最終只是入手了1080
TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮點運算次數)
CUDA Cores
視訊記憶體
3.主機板
主機板也是選購的關鍵,若預算足夠或者足夠折騰,儘量選擇足夠多的PCI-e插槽,切勿選擇一些小板,只有2個記憶體插槽或只有一個PCI-e,待你需要拓展記憶體和顯示卡時只能夠整體換掉。上面有提到GPU主要是通過PCI-e插槽連線,板子上只有有足夠多的x4/x8介面就已經足夠了,x8與x16的效能基本相差不大,x8與x4介面效能理論上相差近20%。
整體選擇原則是:儘可能多的PCI-e插槽,如果主機板長下面樣子那會是非常喜人的
當然主機板的預算也會和PCI-e插槽的數量成正相關
在這裡需要提醒的是,請先了解清楚CPU的PCI-e通道數(可通過晶片官網查詢),如果CPU沒有那麼多通道,主機板上再多插槽也沒有作用
這次我選擇了話說B250M-PLUS的板子,這個是B150M的更新換代版本。具有2個PCI-e x16的插槽,並且支援M.2的SSD插槽,有4個記憶體條插槽,對於目前我來說夠用了。價格也不貴,基於以上考慮就選擇了這個板子。
4.硬碟
SSD最好選擇M2介面的盤,注意主機板是否支援相應介面,使用SSD存放訓練資料會提升訓練速度,注意實際訓練時,把資料從硬碟複製到SSD再開始,平時請及時騰出SSD空間,SSD的效能是和容量同步的。SSD切勿買SATA介面的,直接上M2的盤,用下面這種轉接裝置可以獲得超過6Gbps以上的傳輸速度,缺點就是佔用PCI-e.因此CPU的PCI-e通道也會被ssd所佔據。另外Log和Data存放在機械硬碟就好。當然SSD的話看個人預算,越貴越好
5,記憶體
保證至少是你所有GPU加起來的兩倍即可,注意確認主機板支援的記憶體型別,目前我只使用了一個8G視訊記憶體的1080,因此記憶體先購買8G的,若以後需要可以繼續拓展,B160M-PLUS總共支援共4個DDR4口,共可以拓展64G記憶體
6.電源
電源在50%負載情況下轉換效率最高,因此可以將CPU和GPU以及其他配件的TDP相加獲得一個大概的負載功耗數值。CPU和GPU是耗電大戶,1080 GPU的功耗為180W, i5-7500的功耗為65W,其他配件功耗不高,具體大家可以網上查一查。我的接近300W並且考慮到有時候GPU以及CPU滿載情況下超過了額定功耗,防止功耗不足,因此我選擇了一個500W的電源。選擇電源時注意選擇具有80PLUS認證的電源。
以上,就是我在配置個人的工作站的一些選擇,對於深度學習入門者來說是一個參考,至於大神級別的要拓展4塊/8塊顯示卡的,自認為短時間內技術水平達不到需要那麼多快視訊記憶體來能完成例項的水準,並且更多得支援深度學習的硬體平臺也在不斷更新迭代,況且還有AWS可以用,因此目前一塊顯示卡的配置已經適合自己目前入門玩玩了。如果真正得想要一次到位:建議參考開頭推薦的幾個帖子慢慢琢磨。
第一篇博文,發現要把所有了解到的東西慢慢說清楚實在是不簡單,要有足夠得耐心以及知識整理能力。還是得慢慢堅持下來寫部落格這件事,以此鼓勵自己在深度學習的這個坑上越挖越深。