動手學深度學習 | 單機多卡並行 | 32

阿新 • • 發佈：2021-10-03

單機多卡並行
QA

單機多卡並行

這裡圖片是4張980，但是因為GPU靠的太近了，一個月後就燒了一塊GPU。這是沐神第一次裝多GPU犯的錯誤。

一般都是進行資料並行。

什麼使用使用模型並行呢？就batch_size=1的時候，一個GPU都不能計算的話，那麼就會考慮進行模型並行，將模型分割到多個GPU來做，比如transformer的模型直接有100個G。

QA

我在4塊GPU訓練，後來我有兩塊更大視訊記憶體的GPU，那我什麼都不變，換成2塊視訊記憶體的GPU訓練，會有什麼影響嗎？

你可以每次分配多點資料給效能更好的GPU，一般框架也是允許這個操作的。

小批量分到多GPU計算後，模型結果怎麼合到一塊？

一般是說把梯度給加起來，梯度加起來之後就會得到完整梯度，在模型更新的時候，其實模型就只有一份，模型基本可以把保證是一致的。

資料並行的時候，不同gpu也是拷貝了同一個模型嗎？那是不是資料並行才是真正的並行，模型並行只是模型切塊，本質上還是序列。可以這麼理解嗎？

資料並行確實是在每張卡中拷貝同一個模型。

模型並行實際上也是並行，只不過並行的程度會低一些。

動手學深度學習 | 單機多卡並行 | 32

目錄單機多卡並行QA 單機多卡並行這裡圖片是4張980，但是因為GPU靠的太近了，一個月後就燒了一塊GPU。這是沐神第一次裝多GPU犯的錯誤。

動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

技術標籤：深度學習深度學習神經網路機器學習人工智慧python 動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

動手學深度學習 | 多層感知機+程式碼實現 | 08

目錄感知機多層感知機多層感知機從零開始實現多層感知機簡潔實現QA 感知機

動手學深度學習基礎

第一次作業：深度學習基礎 1. 影象處理基本練習展示不同通道上的影象 # 展示三通道影象

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

《動手學深度學習Pytorch版》之AlexNet預測結果展示

技術標籤：Pytorch深度學習python深度學習《動手學深度學習Pytorch版》https://github.com/ShusenTang/Dive-into-DL-PyTorch 為了檢視預測結果，在原Demo上加了預測顯示程式碼。注意：

程式如何在兩個gpu卡上並行執行_單機多卡並行訓練的程式編寫

技術標籤：程式如何在兩個gpu卡上並行執行本文采用的方法為作者獨自設計，未參考其他框架的思路。如有雷同純屬巧合。

《動手學深度學習》(TF2.0版)第二章

技術標籤：深度不學習第二章 import tensorflow as tf print(tf.__version__) 檢視TF的版本 2.2資料操作

動手學深度學習 | 目錄 | 00

動手學深度學習 | 資料操作+資料預處理 | 02

目錄資料操作資料操作實現資料預處理實現QA 資料操作圖片是三維的： w*h*channel

動手學深度學習 | 線性代數 | 03

目錄線性代數線性代數實現按特定軸求和QA 線性代數其實我們不需要太多線性代數的知識，但是還是稍微講一下作為一個數學上的入門。

動手學深度學習 | Softmax迴歸+損失函式+圖片分類資料集 | 07

目錄Softmax迴歸損失函式圖片分類資料集Softmax迴歸從零開始實現Softmax迴歸簡潔實現QA

動手學深度學習 | 模型選擇+過擬合和欠擬合 | 09

目錄模型選擇過擬合和欠擬合QA 模型選擇我們其實關心的是泛化誤差，並不太關心訓練誤差。

動手學深度學習 | 使用和購買GPU | 15

目錄使用GPU購買GPU整機配置QA 使用GPU 其實如果沒有錢買GPU的話，使用Google Colab也是一個不錯的選擇，大概是10 dollar一個月。

動手學深度學習 | 預測房價競賽總結 | 16

目錄競賽總結QA 競賽總結我們講知識，也不可能所有東西都cover到，讓大家競賽不是讓大家去學某個特定的知識，而是說大家遇到一個問題，怎麼去找一個解決方案。這一次的解決方案和下一次的會不一樣，但是問題是你

動手學深度學習 | 語言模型 | 53

目錄語言模型程式碼QA 語言模型一隻猴子打字，就算是打到宇宙毀滅，他也打不出莎士比亞的文章。

動手學深度學習 | 網路中的網路NiN | 24

目錄NiN程式碼QA NiN NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

動手學深度學習安裝環節

以下均在linux中執行，建議學習的同學都選擇ununtu18.0以上版本OS。 1.minicanda的安裝：

動手學深度學習 | 單機多卡並行 | 32

單機多卡並行

QA

相關推薦