神經網路引數初始化問題程式碼測試

阿新 • • 發佈：2019-01-30

背景:

神經網路的引數初始化，一般是採用隨機初始化的方式。如果是初始化為全0，會導致每層的多個神經元退化為一個，即在每層中的多個神經元是完全失效的。雖然層與層之間仍然是有效的，但是每層一個神經元的多層神經網路，你真的覺得有意思？有什麼想法，歡迎留言。

程式碼測試：

2層神經網路的全0初始化

# -*- coding: utf-8 -*-
__author__ = 'jasonliu'
#探究神經網路初始化值的影響
#初始化為0
#初始化為相同值，但是不為0

import numpy as np

def nonlin(x,deriv=False):
    if(deriv==True 
):
        return x*(1-x)

    return 1/(1+np.exp(-x))

X = np.array([[0.5,0.9,1],
            [2,1,1],
            [0.3,0.6,1],
            [1.5,0.9,0.6]])

#此時X是在行方式疊其樣本數

Y = np.array([[1],
            [3],
            [2],
            [0]])

#此時Y是在行方向疊其樣本數
np.random.seed(1)

# randomly initialize our weights with mean 0 

# syn0 = 2*np.random.random((3,4)) - 1
# syn1 = 2*np.random.random((4,1)) - 1
W1 = 2*np.zeros((3,4))# + 1
W2 = 2*np.zeros((4,1))# + 1

for j in range(60000):

    # Feed forward through layers 0, 1, and 2
    A0 = X
    Z1 = np.dot(A0, W1)
    A1 = nonlin(Z1)
    Z2 = np.dot(A1, W2)
    A2 = nonlin(Z2)

    # how much did we miss the target value? 

    dZ_2 = Y - A2#Loss

    if (j% 10000) == 0:
        print("Error:" + str(np.mean(np.abs(dZ_2))))

    # in what direction is the target value?
    # were we really sure? if so, don't change too much.
    l2_delta = dZ_2*nonlin(A2, deriv=True)#dZ_1

    # how much did each l1 value contribute to the l2 error (according to the weights)?
    l1_error = l2_delta.dot(W2.T)

    # in what direction is the target l1?
    # were we really sure? if so, don't change too much.
    l1_delta = l1_error * nonlin(A1, deriv=True)

    W2 += A1.T.dot(l2_delta)
    W1 += A0.T.dot(l1_delta)

print("Output After Training:")
print("W1=", W1)
print("W2=", W2)
#從結果可以看出，W1在列方向是重複的。
#注意行和列方向的維度資訊，也注意樣本是在行方向的排列還是列方向

輸出結果：

Error:1.25
Error:1.0000091298568936
Error:1.0000044798865095
Error:1.000002957418707
Error:1.0000022037278755
Error:1.0000017545861548
Output After Training:
W1= [[0.58078498 0.58078498 0.58078498 0.58078498]
 [0.72845083 0.72845083 0.72845083 0.72845083]
 [1.33742659 1.33742659 1.33742659 1.33742659]]
W2= [[3.52357914]
 [3.52357914]
 [3.52357914]
 [3.52357914]]

可以看出，出現了重複，W1在列方向是重複的，即該層的每個神經元的權重是相同的。

2層神經網路的全2初始化

輸出結果如下：

Error:1.0001879134151608
Error:1.0000064142342748
Error:1.0000032676762678
Error:1.0000021930282932
Error:1.0000016505669969
Error:1.0000013233782656
Output After Training:
W1= [[2.0085157  2.0085157  2.0085157  2.0085157 ]
 [2.02205683 2.02205683 2.02205683 2.02205683]
 [2.03953857 2.03953857 2.03953857 2.03953857]]
W2= [[3.30069379]
 [3.30069379]
 [3.30069379]
 [3.30069379]]

結果是類似的，在列方向的神經元都是一樣的。這種對稱性依然存在。

隨機初始化

W1 = 2*np.random.random((3,4)) - 1
W2 = 2*np.random.random((4,1)) - 1

輸出結果：

W1= [[ 0.08581783  1.08039398 -1.16536044  0.27396062]
 [-0.48584844  0.29602972 -0.86136823  0.54469744]
 [ 0.24509319  2.23500284 -0.5412316   2.23673393]]
W2= [[1.23731123]
 [6.40888963]
 [0.09966753]
 [5.78541642]]

神經網路引數初始化問題程式碼測試

背景: 神經網路的引數初始化，一般是採用隨機初始化的方式。如果是初始化為全0，會導致每層的多個神經元退化為一個，即在每層中的多個神經元是完全失效的。雖然層與層之間仍然是有效的，但是每層一個神經元的多層神經網路，你真的覺得有意思？有什麼想法，歡迎留言。程式碼

神經網路引數初始化

神經網路引數的初始化，在網路層數很深的情況下變得尤為重要。如果引數初始化的過小，很可能導致網路每一層的輸出為都接近於0，那麼可以這樣認為每一層的輸入都會很接近於0，在進行反向傳播的時候，假如我們要更新某一層的引數W，該層的輸出是g（WX）暫且先不考慮偏置項，則求W的梯度就

深層神經網路引數初始化方式對訓練精度的影響

本文是基於吳恩達老師《深度學習》第二週第一課練習題所做，目的在於探究引數初始化對模型精度的影響。文中所用到的輔助程式在這裡。一、資料處理本文所用第三方庫如下，其中init_utils為輔助程式包含構建神經網路的函式。import numpy as np import matp

【AI系列】<3>生成神經網路以及初始化詳細過程

內容簡介本文將會介紹神經網路的生成過程，通過生成一個[2, 5, 3, 1]的神經網路，詳細講解每一步驟的運算過程。[2, 5, 3, 1] 表示：兩個輸入，第一層 5各神經元，第二層3個神經元，第三層 1個神經元。生成輸入資料 np.random.s

【deeplearning.ai】第二門課：提升深層神經網路——權重初始化

一、初始化合理的權重初始化可以防止梯度爆炸和消失。對於ReLu啟用函式，權重可初始化為：也叫作“He初始化”。對於tanh啟用函式，權重初始化為：也稱為“Xavier初始化”。也可以使用下面這個公式進行初始化：上述公式中的l指當前處在神經網路的第幾層，l-1為

網路引數初始化

參考：《解析深度學習——卷積神經網路原理與視覺實踐》網址：http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf 實際應用中，隨機引數服從高斯分佈或均勻分佈一、Xaiver引數初始化方法和He引數初始化方法（1）Xaiver引數初始化方法

CNN筆記(2)--網路引數初始化

7網路引數初始化 7.1 全零初始化網路收斂到穩定狀態時，引數（權值）在理想情況下應基本保持正負各半，期望為0 全0初始化可以使初始化全零時引數期望為0 但是，全0初始化不能訓練 7.2隨機初始化仍然希望引數期望接近1 隨機引數服從高斯

深度學習-網路引數初始化Xavier與MSRA

權值初始化的方法主要有：常量初始化（constant）、高斯分佈初始化（gaussian）、positive_unitball初始化、均勻分佈初始化（uniform）、xavier初始化、msra初始化、雙線性初始化（bilinear）。可參考部落格。重點介紹xavier

利用Python實現卷積神經網路的視覺化（附Python程式碼）

對於深度學習這種端到端模型來說，如何說明和理解其中的訓練過程是大多數研究者關注熱點之一，這個問題對於那種高風險行業顯得尤為重視，比如醫療、軍事等。在深度學習中，這個問題被稱作“黑匣子（Black Box）”。如果不能解釋模型的工作過程，我們怎麼能夠就輕易相信模型的輸出結果呢？以深度學習模型檢測

吳恩達改善深層神經網路引數：超引數除錯、正則化以及優化——優化演算法

機器學習的應用是一個高度依賴經驗的過程，伴隨著大量的迭代過程，你需要訓練大量的模型才能找到合適的那個，優化演算法能夠幫助你快速訓練模型。難點：機器學習沒有在大資料發揮最大的作用，我們可以利用巨大的資料集來訓練網路，但是在大資料下訓練網路速度很慢；使用快速的優化演算法大大提高效率

簡單神經網路預測結構化資料關係___測試集（改良）

# coding: utf-8 import random import csv import tensorflow as tf import matplotlib.pyplot as plt from sklearn.preprocessing import

一圖抵千言：帶你瞭解最直觀的神經網路架構視覺化

一張好的圖抵得上一千個等式。神經網路是複雜、多維、非線性的陣列運算。如何在避免過於複雜或重複的情況下呈現深度學習模型架構的重要特徵呢？又該以何種方式清晰直觀、啟發性地呈現它們呢？（好看也是加分項！）無論研究還是教學專案對此都沒有固定標準。本文我們就來了解一下視覺化整個

java 類的成員之四初始化程式碼塊(程式碼塊)的使用

java 類的成員之四初始化程式碼塊（程式碼塊）的使用 1.java類的成員有四個 2.非static（非靜態）程式碼塊（初始化塊）的使用 3.static（靜態）程式碼塊（初始化塊）的使用 4.java初始化塊面試題

深度學習－網路Xavier初始化方法

參考：深度學習－網路Xavier初始化方法通過方差分析詳解最流行的Xavier權重初始化方法在 Xavier Glorot 和 Yoshua Bengio 2010 年的論文 Understanding the difficulty of training deep feedf

26種神經網路啟用視覺化

在網上發現兩個很好的資源，將我們常常使用的啟用函式進行了視覺化的說明，並且說明了各種啟用函式的特性。通常針對某些特殊的特徵，一些不常用的啟用函式會有較好的效果。通常也有助於對於啟用函式的理解。網址如下： https://dashee87.github.io/deep learning/vi

「開源」TensorSpace.js -- 神經網路3D視覺化框架，在瀏覽器端構建可互動模型

TensorSpace是一套用於構建神經網路3D視覺化應用的框架。開發者可以使用類 Keras 風格的 TensorSpace API，輕鬆建立視覺化網路、載入神經網路模型並在瀏覽器中基於已載入的模型進行3D可互動呈現。 TensorSpace 可以使您更直觀地觀察神經網路模型，並瞭解該模型是如何通過

TensorFlow神經網路：模組化的神經網路八股

1、前向傳播：搭建從輸入到輸出的網路結構 forward.py: # 定義前向傳播過程 def forward(x, regularizer): w = b = y = return y # 給w賦初值，並把w的正則化損失加到總損失中 def g

TensorSpace：一套用於構建神經網路3D視覺化應用的框架

作者 | syt123450、Chenhua Zhu、Yaoxing Liu （本文經原作者授權轉載）今天要為大家推薦一套超酷炫的，用於構建神經網路 3D 視覺化應用的框架——TensorSpace。有什麼用途？大家可以使用類 Keras

NN模型設定--引數初始化

引數初始化的原理權值初始化對網路優化至關重要。早年深度神經網路無法有效訓練的一個重要原因就是早期人們對初始化不太重視。模型對初始的引數是很敏感的，如果引數都很大，那麼經過wx+b這個線性函式時，輸出的值也會很大，若是經過tanh這個啟用函式，輸出的結果絕對值都幾乎接近於1，也

神經網路正則化方法

正則化方法：防止過擬合，提高泛化能力在訓練資料不夠多時，或者overtraining時，常常會導致overfitting（過擬合）。其直觀的表現如下圖所示，隨著訓練過程的進行，模型複雜度增加，在training data上的error漸漸減小，但是在驗證集上的error卻

神經網路引數初始化問題程式碼測試

背景:

程式碼測試：

2層神經網路的全0初始化

2層神經網路的全2初始化

隨機初始化

相關推薦