[手把手系列之二]實現多層神經網路

完整程式碼：>>點我歡迎star,fork,一起學習

網路用途

或者說應用場景：使用單層神經網路來識別一張圖片是否是貓咪的圖片。

數學表示

給定一張圖片 $X$ 送到網路中，判斷這張圖片是否是貓咪的照片？

網路架構

多層神經網路處理過程：

X –> $[l i n e a r + r e l u]^{(L - 1)}$ —>[linear + sigmoid] —> $\hat{y}$

數學表示

訓練集: $X = [x^{(1)}, x^{(2)}, . . ., x^{(i)}, . . . ., x^{(m)}]$

)] ;對應標籤:

Y = [y^{(1)}, y^{(2)}, . . ., y^{(i)}, . . ., y^{(m)}]

;

對於訓練集中的每張照片 $x^{(i)}$ 的處理過程：

repeat:

$z^{(i)} = w^{T} x^{(i)} + b$

${\hat{y}}^{(i)} = a^{(i)} = g (z^{(i)})$

$L (a^{(i)}, y^{(i)}) = - y^{(i)} l o g (a^{(i)}) - (1 - y^{(i)}) l o g (1 - a^{(i)})$

成本函式：

$J = \frac{1}{m} \sum_{i = 1}^{m} L (a^{(i)}, y^{(i)})$

J = \frac{1}{m} \sum_{i = 1}^{m} L (a^{(i)}, y^{(i)})

最後通過反向傳播演算法，計算引數 $W$ 和 $b$ 。

模型定義

模型定義步驟

定義模型結構（如輸入向量的特徵數目）
初始化模型引數；
迴圈：
- 前向傳播，計算loss；
- 反向傳播，計算梯度；
- 梯度下降，更新引數；

程式碼實現

啟用函式

sigmoid 啟用函式及其反向傳播過程

def sigmoid(Z):
    """
    sigmoid啟用函式;
    :param Z:
    :return:
    - A: 啟用函式值sigmoid(z),
    - cache: (儲存Z值，方便反向傳播時直接使用)
    """ 

    A = 1.0/(1+np.exp(-Z))
    cache = Z
    return A, cache

def sigmoid_backward(dA,cache):
    """
    啟用函式的反向傳播
    :param dA: loss對A的導數
    :param cache:前向傳播中快取的sigmoid輸入Z；
    :return:dZ
    """
    Z = cache
    s = 1.0/(1 + np.exp(-Z))
    dZ = dA * s * (1-s)
    return dZ

relu啟用函式及其反向傳播過程

def relu(Z):
    """
    relu啟用函式；
    :param Z:
    :return:
    - A:
    - cache:
    """
    A = np.maximum(0,Z)# max適合單個數值間的比較
    cache = Z
    return A, cache

def relu_backward(dA,cache):
    """
    relu 反向傳播計算方法；relu = np.maximum(0,A)；導數值：1 or 0.----> dZ= dA or 0
    :param dA:
    :param cache:
    :return: dZ
    """
    Z = cache
    dZ = np.array(dA, copy=True)

    #當Z<=0時，dZ=0
    dZ[Z <= 0] = 0
    assert(dZ.shape == Z.shape) #確保維度相同
    return dZ

引數初始化

權重係數 $W$ 和 $b$ 全都初始化為0.

def initialize_parameters_deep(layer_dims,type='he'):
    """
    深度神經網路係數初始化函式
    :param layer_dims: 神經網路各層神經元列表, eg:[12288,100,10,1]
    :param type: 係數初始化方法：zeros,random,he;
    :return: parameters:係數字典
    """
    np.random.seed(10)

    parameters = {}
    L = len(layer_dims)

    if type == "zeros":
        for i in range(1, L):
            parameters['W'+str(i)] = np.zeros((layer_dims[i], layer_dims[i-1]))
            parameters['b'+str(i)] = np.zeros((layer_dims[i], 1))

            assert (parameters['W' + str(i)].shape == (layer_dims[i], layer_dims[i - 1]))
            assert (parameters['b' + str(i)].shape == (layer_dims[i], 1))
    elif type == "random":
        for i in range(1, L):
            parameters['W'+str(i)] = np.random.randn(layer_dims[i],layer_dims[i-1]) * 0.01
            parameters['b'+str(i)] = np.zeros((layer_dims[i], 1))

            assert (parameters['W' + str(i)].shape == (layer_dims[i], layer_dims[i - 1]))
            assert (parameters['b' + str(i)].shape == (layer_dims[i], 1))
    elif type == "he":
        for i in range(1, L):
            parameters['W'+str(i)] = np.random.randn(layer_dims[i], layer_dims[i-1]) / np.sqrt(layer_dims[i-1])
            parameters['b'+str(i)] = np.zeros((layer_dims[i], 1))

            assert (parameters['W' + str(i)].shape == (layer_dims[i], layer_dims[i - 1]))
            assert (parameters['b' + str(i)].shape == (layer_dims[i], 1))

    return parameters

前向傳播

前向傳播過程

訓練集:

X = [x^{(1)}, x^{(2)}, . . ., x^{(i)}, . . . ., x^{(m)}]

[手把手系列之二]實現多層神經網路

網路用途

數學表示

網路架構

數學表示

模型定義

模型定義步驟

程式碼實現

啟用函式

引數初始化

前向傳播

前向傳播過程

[手把手系列之二]實現多層神經網路

人工智慧（4）- 實現多層神經網路

六天搞懂“深度學習”之三：多層神經網路

深度學習實踐（二）——多層神經網路

跟著吳恩達學深度學習：用Scala實現神經網路-第二課：用Scala實現多層神經網路

Halcon實戰之基於MLP多層神經網路的訓練學習

Python20行程式碼實現多層神經網路的學習

TensorFlow實戰4：實現簡單的多層神經網路案例

深度學習DeepLearning.ai系列課程學習總結：8. 多層神經網路程式碼實戰

【深度學習】Python實現2層神經網路的誤差反向傳播法學習

TensorFlow 高階之二（卷積神經網路手寫字型識別）

TensorFlow 訓練 MNIST （2）—— 多層神經網路

深度學習-基於spark的多層神經網路

python實現淺層神經網路預測貓狗

tensorflow例項(7)--建立多層神經網路

Tensorlayer學習筆記——多層神經網路

tensorflow實現兩層神經網路 (附程式碼)

理解神經網路，從簡單的例子開始（2）使用python建立多層神經網路

一個簡單的matlab專案實現三層神經網路的簡單應用

deeplearning系列（二）自編碼神經網路