深度學習框架中的並行

阿新 • • 發佈：2021-08-04

深度學習框架中的分散式通訊運算元和並行訓練

(1)首先要了解有哪些並行的種類。

(a)資料並行

(b)層內模型並行，這裡有Fully Connected模型並行，Group Convolution並行等等。

(c)層間模型並行，這裡包括一些流水線並行，，手動checkpoint和GPipe的知識。

(2) 常見的通訊運算元

首先要知道，集合通訊(Collective communication)有一對多，多對多。還有點對點通訊，Point-to-Point通訊。這些通訊運算元都是求導完備的通訊運算元。

a. broadcast， one sender, multiple receiver。

b. reduce，combine data from all senders。

c. all-reduce, Combine data from senders, deliver the result to all participant.

d. gather， multiple sender， one receiver

e. all-gather，gather messages from all, deliver messages to all participants.

f. all-to-all, a transpose. internal implementation is complex. 原本是資料切分，現在可以編成模型切分。

g. scatter， inverse to gather.

h. all scatter.

(3)介紹一下簡單引數並行。

首先，資料並行就是，模型複製多次，拆分資料。現在的簡單引數並行就是拆分模型，在需要進行線性操作之前，用all-gather收集資訊。在反向傳播之前進行一次reduce-scatter。

資料並行和模型並行的區別。資料並行在進行操作的時候(只針對前向來說)，是不需要通訊的。比如矩陣乘可以一直往前面走，而模型並行需要一次all-gather。

層內模型並行。

如何實現由模型並行到資料並行的轉換呢？就是一個比較重要的運算元的功能了。all-to-all。all-to-all配合上all-gather就可以實現模型的各種並行操作了。

場景一：

Fully Connected模型並行。在人臉場景下，由於feature只有1k左右，但是由於人的id眾多，可能到幾百萬，所以最後一層模型就上G。為了handle這種情況，肯定是要模型並行的。如果覺得之後比較難算loss，可以進行一次all-to-all，但是實際上是不需要的，這裡涉及到一個softmax函式的性質(我不會)。

場景二：

group convolution：

組卷積，其實只需要一次通訊，所以可以判一次開頭和結尾。

流水線並行(Pipeline Parallelism)

由於在原來的流水線中，只有等上一塊卡做完之後，下一塊卡才能開始工作，這顯然是不怎麼科學。所以就可以把資料拆一拆，算一個部分之後，立馬交給下一張卡去進行計算。

手動checkpoint與Gpipe。

在流水線並行的這個過程當中，由於在反向傳播的時候可能需要保留中間結果，這意味著更多的視訊記憶體佔用。所以可以設計一個策略，在需要進行反向傳播的時候，我們再重新進行一次前向傳播。

深度學習框架中的並行

深度學習框架中的分散式通訊運算元和並行訓練 (1)首先要了解有哪些並行的種類。

Torchkeras，一個原始碼不足300行的深度學習框架

Torchkeras 瞭解過深度學習框架的都知道，Tensorflow是早期的主流框架，而後又出現了Keras,keras對Tensorflow進行了封裝，使得搭建深度學模型的過程簡化到了幾個簡單的步驟：summary、compile、fit、evaluate、 pre

藉助北外映象用miniconda從零開始搭建深度學習框架pytorch和tensorflow

藉助北外映象搭建深度學習框架pytorch或tensorflow 前言北外映象安裝anaconda在conda中搭建pytorchpytorch安裝後使用程式碼驗證安裝tensorflow總結

《深度學習框架PyTorch入門與實踐》示例——利用LeNet進行CIFAR-10分類

平臺及框架：python3 + anaconda + pytorch + pycharm 我主要是根據陳雲的《深度學習框架PyTorch入門與實踐》來學習的，書中第二章的一個示例是利用卷積神經網路LeNet進行CIFAR-10分類。

三種Js深度學習框架介紹

談到機器學習，我們腦海首先蹦出的程式語言是什麼？一定是python。其實除了python，JavaScript也是不錯的選擇。都說現在是大前端時代，從移動開發、伺服器端，甚至桌面軟體開發（比如大名鼎鼎的VS Code），都有JavaS

《深度學習框架PyTorch入門與實踐》示例——AI插畫師：生成對抗網路

執行環境：Anaconda3 + PyCharm + PyTorch + python3 這是《深度學習框架PyTorch入門與實踐》的第七章示例，利用生成對抗網路生成動漫人物頭像。

tensorflow實戰google深度學習框架學習筆記（第三章）

技術標籤：Tensorflow筆記tensorflow機器學習python tensorflow實戰一、Tensorflow計算模型——計算圖

《深度學習框架PyTorch入門與實踐》示例——AI藝術家：神經網路風格遷移

這是我在學習《深度學習框架PyTorch入門與實踐》第九章的筆記。原書實現了Fast Neural Style，實現將輸入圖片轉換為對應圖片風格的型別。

影象去霧畢業論文準備09-深度學習框架（tensorflow2.0）——超級詳細（手寫體資料載入、獨熱編碼one-hot）

技術標籤：Python-opencv專欄去霧畢業論文python #!/usr/bin/python3.6 # -*- coding: utf-8 -*-

搭建深度學習框架（五）：神經網路框架的安裝和使用

技術標籤：深度學習框架搭建深度學習神經網路python 上一節，已經講解了框架的釋出過程，這一節將講解框架的安裝和使用方法。一、安裝輸入命令：

從零開始開發自己的類keras深度學習框架2 ：實現全連線層

技術標籤：深度學習神經網路神經網路深度學習認真學習，佛系更博。上一章簡單介紹瞭如何實現資料的讀取功能，本章將詳細介紹如何實現神經網路最基礎的層：全連線層。

深度學習框架 MindSpore —— 華為出品的AI計算框架， docker 安裝

深度學習框架 MindSpore —— 華為出品的AI計算框架官網地址： https://www.mindspore.cn/

動手學深度學習 | 網路中的網路NiN | 24

目錄NiN程式碼QA NiN NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

Web 上執行深度學習框架模型 - MegEngine.js

看社群開發者如何以一人之力， 3 個月完成 MegEngine javascript 版本，實現在 javascript 環境中快速部署 MegEngine 模型~

實戰Google深度學習框架：TensorFlow計算加速

要將深度學習應用到實際問題中，一個非常大的問題在於訓練深度學習模型需要的計算量太大。比如Inception-v3模型在單機上訓練到78%的正確率需要將近半年的時間，這樣的訓練速度是完全無法應用到實際生產中的。為了加

簡易的深度學習框架Keras程式碼解析與應用

總體來講keras這個深度學習框架真的很“簡易”，它體現在可參考的文件寫的比較詳細，不像caffe，裝完以後都得靠技術部落格，keras有它自己的官方文件（不過是英文的），這給初學者提供了很大的學習空間。

深度學習框架之一：Theano | Lasagne簡單教程

參考Lasagne官網(http://lasagne.readthedocs.io/en/latest/)tutorial進行總結而來。 01 簡介 Lasagne is a lightweight library to build and train neural networks in Theano.

windows10 tensorflow（二）原理實戰之迴歸分析，深度學習框架（梯度下降法求解迴歸引數）

深度學習中的常見啟用函式

1 sigmoid 1.1 sigmoid函式的公式 1.2 sigmoid函式的導數公式 1.3 sigmoid函式程式碼實現 class SigmoidActivator(object):

盤點深度學習中常見的損失函式

損失函式度量的是訓練的模型與真實模型之間的距離。一般以最小化損失函式為目標，對模型進行不斷優化。

深度學習框架中的並行

相關推薦