【AI系列】<3>生成神經網路以及初始化詳細過程

阿新 • • 發佈：2018-11-15

內容簡介

本文將會介紹神經網路的生成過程，通過生成一個[2, 5, 3, 1]的神經網路，詳細講解每一步驟的運算過程。[2, 5, 3, 1] 表示：兩個輸入，第一層 5各神經元，第二層3個神經元，第三層 1個神經元。

網路結構

生成輸入資料

np.random.seed(1)
#畫一個圈
train_X, train_Y = sklearn.datasets.make_circles(n_samples=300, noise=.05)
# Visualize the data
plt.scatter(train_X[:, 0], train_X[:, 1], c=train_Y, s=40 
, cmap=plt.cm.Spectral);

我們假設輸入是一個點（x1,y1）.共有300個點，這些點隨機分佈呈橢圓形。這些點組成一個矩陣就是所有輸入引數，我們用你X表示。
這裡寫圖片描述
這裡生成的X是一個300*2的矩陣。如下：

對X進行轉置，得到一個2*300的矩陣，如下

整個網路權值初始化為0

def initialize_parameters_zeros(layers_dims):
    """
    Arguments:
    layer_dims -- python array (list) containing the size of each layer.

    Returns:
    parameters -- python dictionary containing your parameters "W1", "b1", ..., "WL", "bL":
                    W1 -- weight matrix of shape (layers_dims[1], layers_dims[0])
                    b1 -- bias vector of shape (layers_dims[1], 1)
                    ...
                    WL -- weight matrix of shape (layers_dims[L], layers_dims[L-1])
                    bL -- bias vector of shape (layers_dims[L], 1)
    """ 

    parameters = {}
    L = len(layers_dims)            # number of layers in the network
    """
    l = 1
        W1: 5行 2列
    l = 2
        W2: 3行 5列
    l = 3
        W3: 1行3列
    """
    for l in range(1, L):
        parameters['W' + str(l)] = np.zeros((layers_dims[l], layers_dims[l-1]))
        parameters['b' 
 + str(l)] = 0
    return parameters
#生成網路
X = train_X.T
layers_dims = [X.shape[0], 5, 3, 1]   #[2, 5, 3, 1]
parameters = initialize_parameters_zeros(layers_dims)

到這裡我們將每一層的權值都初始化為零了。現在我們來分析一下現在每一層的權值詳細情況。
第一層 W1： 5*2的矩陣
b1 ：5*1 列向量
第二層 W2：3*5 矩陣
b2 ：3*1
第三層 W3：1*3 矩陣
b3 : 0
前向傳播計算過程
這裡寫圖片描述

前向傳播程式碼以及註釋

def forward_propagation(X, parameters):
    """
    Implements the forward propagation (and computes the loss) presented in Figure 2.

    Arguments:
    X -- input dataset, of shape (input size, number of examples)
    Y -- true "label" vector (containing 0 if cat, 1 if non-cat)
    parameters -- python dictionary containing your parameters "W1", "b1", "W2", "b2", "W3", "b3":
                    W1 -- weight matrix of shape ()
                    b1 -- bias vector of shape ()
                    W2 -- weight matrix of shape ()
                    b2 -- bias vector of shape ()
                    W3 -- weight matrix of shape ()
                    b3 -- bias vector of shape ()

    Returns:
    loss -- the loss function (vanilla logistic loss)
    """

    # retrieve parameters
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]
    W3 = parameters["W3"]
    b3 = parameters["b3"]

    # LINEAR -> RELU -> LINEAR -> RELU -> LINEAR -> SIGMOID
    z1 = np.dot(W1, X) + b1   #W1: [5, 2]  X[2, 300]，矩陣乘法可乘條件：前者 列= 後者行  z1:[5,300]
    a1 = relu(z1)          #啟用函式
    z2 = np.dot(W2, a1) + b2  #W2:[3, 5]  a1[5,300]  z2:[3,300]
    a2 = relu(z2)          
    z3 = np.dot(W3, a2) + b3  #W3:[1,3]  a2:[3,300]  z3:[1,300]
    a3 = sigmoid(z3)
    cache = (z1, a1, W1, b1, z2, a2, W2, b2, z3, a3, W3, b3)

    return a3, cache  #a3 即是最後的記過Y’值，之後根據提前期望的Y值，進行誤差反向傳播。

神經網路層數與權值W 的矩陣形式有以下對應形式：
假設神經網路是 [2, 10, 20, 5, 1], 很明顯這是一個2分類問題。
那麼
W1 就是 10*2 的矩陣 b1 ： 10*1
W2: 20*10 b2: 20*1
W3: 5*20 b3: 5*1
W4: 1*5 b4: 1*1
相信規律已經很明白了。這裡W看做與神經元連線的每一條線，b看做每一個神經元。

【AI系列】<3>生成神經網路以及初始化詳細過程

內容簡介

【AI系列】<3>生成神經網路以及初始化詳細過程

【紫書】例題3-5 生成元（Digit Generator, ACM/ICPC Seoul 2005, UVa1583）

【GAN ZOO翻譯系列】基於能量的生成對抗網路 Energy-Based Generative Adversarial Networks

【deeplearning.ai】第二門課：提升深層神經網路——權重初始化

【TensorFlow-windows】學習筆記七——生成對抗網路

【深度學習】Tensorflow——CNN 卷積神經網路 2

【深度學習】Tensorflow——CNN 卷積神經網路 1

【深度學習】Python實現2層神經網路的誤差反向傳播法學習

【深度學習】基於Numpy實現的神經網路進行手寫數字識別

【Numpy基礎】矩陣陣列相乘與神經網路的實現

【Deep Learning】tensorflow實現卷積神經網路(AlexNet)

【opencv學習】矩陣CvMat的兩種宣告和初始化方法

【深度學習】全面直觀認識深度神經網路

神經網路學習（3）————BP神經網路以及python實現

【java】<Jsoup>獲取網頁中的圖片

【HTML】向網頁<Title></Title>中插入圖片以及跑馬燈

【網絡】<網絡是怎樣連接的>筆記

【算法競賽入門經典】7.3子集生成【增量構造法】【位向量法】【二進制法】

【原創】<Debug> not positioned on a valid record

【原創】<Debug> “duplicate connection name”

【AI系列】<3>生成神經網路以及初始化詳細過程

內容簡介

相關推薦