深度學習一：搭建簡單的全連線神經網路

阿新 • • 發佈：2018-12-28

深度學習一：搭建簡單的全連線神經網路

新手入門學習神經網路，嘗試搭建淺層的全連線神經網路，廢話不多說，上主題（文章左後會貼上全部程式碼）：

實驗環境：Python3+Pycharm

一個神經網路分為輸入層、隱藏和輸出層，先實現一個單隱藏層的神經網路，輸入為隨機向量x，通過神經網路，擬合隨機向量y。將神經網路的訓練拆成兩部分，即向前傳播和反向傳播，分別用函式實現。

首先是引入：

import numpy as np
import matplotlib.pyplot as plt

使用numpy來做多種運算，使用matplotlib來畫圖

向前傳播：

輸入input向量x、引數w1、w2和偏置b1、b2，z1是隱藏層的中間輸出，A1是經過sigmoid啟用後的輸出。

將A1送入輸入層，輸出的A2便是最終輸出。

假定輸入x的維度為n*m，w1的維度為h*n（表示該層的神經元為h個），w2的維度為1*h，最終輸出的A2維度為1*m。使用numpy中的dot（）函式來做矩陣運算。

def forward(X, w1, w2, b1, b2):
    z1 = np.dot(w1, X) + b1  # w1=h*n     X=n*m      z1=h*m
    A1 = sigmoid(z1)  # A1=h*m
    z2 = np.dot(w2, A1) + b2  # w2=1*h   z2=1*m
    A2 = sigmoid(z2)  # A2=1*m
    return z1, z2, A1, A2

這裡需要先定義一下啟用函式：

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

反向傳播：

計算引數的偏導數

def backward(y, X, A2, A1, z2, z1, w2, w1):
    n, m = np.shape(X)
    dz2 = A2 - y  # A2=1*m y=1*m
    dw2 = 1 / m * np.dot(dz2, A1.T)  # dz2=1*m A1.T=m*h dw2=1*h
    db2 = 1 / m * np.sum(dz2, axis=1, keepdims=True)
    dz1 = np.dot(w2.T, dz2) * A1 * (1 - A1)  # w2.T=h*1 dz2=1*m z1=h*m A1=h*m dz1=h*m
    dw1 = 1 / m * np.dot(dz1, X.T)  # z1=h*m X'=m*n dw1=h*n
    db1 = 1 / m * np.sum(dz1, axis=1, keepdims=True)
    return dw1, dw2, db1, db2

定義完了訓練的向前傳播和反向傳播，還需要定義一個損失函式：

def costfunction(A2, y):
    m, n = np.shape(y)
    J = np.sum(y * np.log(A2) + (1 - y) * np.log(1 - A2)) / m
    # J = (np.dot(y, np.log(A2.T)) + np.dot((1 - y).T, np.log(1 - A2))) / m
    return -J

ok，到這裡一個神經網路的框架基本有了，在開始訓練之前，還需要定義一下各個引數並初始化。

首先是輸入x和擬合數據y：

X=np.random.rand(100,200)
n, m = np.shape(X)
y=np.random.rand(1,m)

由於是初步搭建，這裡的x和y均採用隨機變數，大概體驗一下神經網路即可。隨機初試化一個維度為[100,200]的x和[1,200]的y。

接下來，定義各個引數：

n_x = n  # size of the input layer
n_y = 1  # size of the output layer
n_h = 5  # size of the hidden layer
w1 = np.random.randn(n_h, n_x) * 0.01  # h*n
b1 = np.zeros((n_h, 1))  # h*1
w2 = np.random.randn(n_y, n_h) * 0.01  # 1*h
b2 = np.zeros((n_y, 1))
alpha = 0.1
number = 10000

定義隱藏層的神經元個數為5，隨機初始化w1、w2、b1和b2，定義學習率alpha為0.1，迭代次數為10000

之後，便可以開始訓練了：

for i in range(0, number):
    z1, z2, A1, A2 = forward(X, w1, w2, b1, b2)
    dw1, dw2, db1, db2 = backward(y, X, A2, A1, z2, z1, w2, w1)
    w1 = w1 - alpha * dw1
    w2 = w2 - alpha * dw2
    b1 = b1 - alpha * db1
    b2 = b2 - alpha * db2
    J = costfunction(A2, y)
    if (i % 100 == 0):
        print(i)
    plt.plot(i, J, 'ro')
plt.show()

使用梯度下降的方法來最小化損失函式，每次迭代後，描點損失函式J的值。

全部程式碼如下：

import numpy as np
import matplotlib.pyplot as plt

def sigmoid(z):
    return 1 / (1 + np.exp(-z))


def forward(X, w1, w2, b1, b2):
    z1 = np.dot(w1, X) + b1  # w1=h*n     X=n*m      z1=h*m
    A1 = sigmoid(z1)  # A1=h*m
    z2 = np.dot(w2, A1) + b2  # w2=1*h   z2=1*m
    A2 = sigmoid(z2)  # A2=1*m
    return z1, z2, A1, A2


def backward(y, X, A2, A1, z2, z1, w2, w1):
    n, m = np.shape(X)
    dz2 = A2 - y  # A2=1*m y=1*m
    dw2 = 1 / m * np.dot(dz2, A1.T)  # dz2=1*m A1.T=m*h dw2=1*h
    db2 = 1 / m * np.sum(dz2, axis=1, keepdims=True)
    dz1 = np.dot(w2.T, dz2) * A1 * (1 - A1)  # w2.T=h*1 dz2=1*m z1=h*m A1=h*m dz1=h*m
    dw1 = 1 / m * np.dot(dz1, X.T)  # z1=h*m X'=m*n dw1=h*n
    db1 = 1 / m * np.sum(dz1, axis=1, keepdims=True)
    return dw1, dw2, db1, db2


def costfunction(A2, y):
    m, n = np.shape(y)
    J = np.sum(y * np.log(A2) + (1 - y) * np.log(1 - A2)) / m
    # J = (np.dot(y, np.log(A2.T)) + np.dot((1 - y).T, np.log(1 - A2))) / m
    return -J


# Data = np.loadtxt("gua2.txt")
# X = Data[:, 0:-1]
# X = X.T
# y = Data[:, -1]
X=np.random.rand(100,200)
n, m = np.shape(X)
y=np.random.rand(1,m)
#y = y.reshape(1, m)

n_x = n  # size of the input layer
n_y = 1  # size of the output layer
n_h = 5  # size of the hidden layer
w1 = np.random.randn(n_h, n_x) * 0.01  # h*n
b1 = np.zeros((n_h, 1))  # h*1
w2 = np.random.randn(n_y, n_h) * 0.01  # 1*h
b2 = np.zeros((n_y, 1))
alpha = 0.1
number = 10000
for i in range(0, number):
    z1, z2, A1, A2 = forward(X, w1, w2, b1, b2)
    dw1, dw2, db1, db2 = backward(y, X, A2, A1, z2, z1, w2, w1)
    w1 = w1 - alpha * dw1
    w2 = w2 - alpha * dw2
    b1 = b1 - alpha * db1
    b2 = b2 - alpha * db2
    J = costfunction(A2, y)
    if (i % 100 == 0):
        print(i)
    plt.plot(i, J, 'ro')
plt.show()

執行後的實驗結果：

可以看到隨著迭代次數的增加，損失函式是逐漸減小的。

補充（稍加改進版）：

在原有的基礎上，加入一層隱藏層：

補充定義：

n_x=n
n_y=1
n_h1=5
n_h2=4
W1=np.random.rand(n_x,n_h1)*0.01
W2=np.random.rand(n_h1,n_h2)*0.01
W3=np.random.rand(n_h2,n_y)*0.01
b1=np.zeros((n_h1,1))
b2=np.zeros((n_h2,1))
b3=np.zeros((n_y,1))

將新的隱藏層的神經元個數定義n_h2=4

向前傳播：

# 向前傳遞
def forward(X, W1, W2, W3, b1, b2, b3):
    # 隱藏層1
    Z1 = np.dot(W1.T,X)+b1  # X=n*m ,W1.T=h1*n,b1=h1*1,Z1=h1*m
    A1 = sigmoid(Z1)  # A1=h1*m
    # 隱藏層2
    Z2 = np.dot(W2.T, A1) + b2  # W2.T=h2*h1,b2=h2*1,Z2=h2*m
    A2 = sigmoid(Z2)  # A2=h2*m
    # 輸出層
    Z3=np.dot(W3.T,A2)+b3  # W3.T=(h3=1)*h2,b3=(h3=1)*1,Z3=1*m
    A3=sigmoid(Z3)  # A3=1*m

    return Z1,Z2,Z3,A1,A2,A3

反向傳播：

# 反向傳播
def backward(Y,X,A3,A2,A1,Z3,Z2,Z1,W3,W2,W1):
    n,m = np.shape(X)
    dZ3 = A3-Y # dZ3=1*m
    dW3 = 1/m *np.dot(A2,dZ3.T) # dW3=h2*1
    db3 = 1/m *np.sum(dZ3,axis=1,keepdims=True) # db3=1*1

    dZ2 = np.dot(W3,dZ3)*A2*(1-A2) # dZ2=h2*m
    dW2 = 1/m*np.dot(A1,dZ2.T) #dw2=h1*h2
    db2 = 1/m*np.sum(dZ2,axis=1,keepdims=True) #db2=h2*1

    dZ1 = np.dot(W2, dZ2) * A1 * (1 - A1) # dZ1=h1*m
    dW1 = 1 / m * np.dot(X, dZ1.T)  # dW1=n*h
    db1 = 1 / m * np.sum(dZ1,axis=1,keepdims=True)  # db1=h*m

    return dZ3,dZ2,dZ1,dW3,dW2,dW1,db3,db2,db1

修改訓練程式碼：

for i in range(0,number):
    Z1,Z2,Z3,A1,A2,A3=forward(X,W1,W2,W3,b1,b2,b3)
    dZ3, dZ2, dZ1, dW3, dW2, dW1, db3, db2, db1=backward(Y,X,A3,A2,A1,Z3,Z2,Z1,W3,W2,W1)
    W1=W1-alpha*dW1
    W2=W2-alpha*dW2
    W3=W3-alpha*dW3
    b1=b1-alpha*db1
    b2=b2-alpha*db2
    b3=b3-alpha*db3
    J=costfunction(Y,A3)

可以說改動不是很大，如果需要更深層次的神經網路，按這個方法新增就可以了，當然，如果層次太多，程式碼還是顯得太過繁瑣。

修改後的全部程式碼如下：

import numpy as np
import matplotlib.pyplot as plt


# 啟用函式
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# 向前傳遞
def forward(X, W1, W2, W3, b1, b2, b3):
    # 隱藏層1
    Z1 = np.dot(W1.T,X)+b1  # X=n*m ,W1.T=h1*n,b1=h1*1,Z1=h1*m
    A1 = sigmoid(Z1)  # A1=h1*m
    # 隱藏層2
    Z2 = np.dot(W2.T, A1) + b2  # W2.T=h2*h1,b2=h2*1,Z2=h2*m
    A2 = sigmoid(Z2)  # A2=h2*m
    # 輸出層
    Z3=np.dot(W3.T,A2)+b3  # W3.T=(h3=1)*h2,b3=(h3=1)*1,Z3=1*m
    A3=sigmoid(Z3)  # A3=1*m

    return Z1,Z2,Z3,A1,A2,A3

# 反向傳播
def backward(Y,X,A3,A2,A1,Z3,Z2,Z1,W3,W2,W1):
    n,m = np.shape(X)
    dZ3 = A3-Y # dZ3=1*m
    dW3 = 1/m *np.dot(A2,dZ3.T) # dW3=h2*1
    db3 = 1/m *np.sum(dZ3,axis=1,keepdims=True) # db3=1*1

    dZ2 = np.dot(W3,dZ3)*A2*(1-A2) # dZ2=h2*m
    dW2 = 1/m*np.dot(A1,dZ2.T) #dw2=h1*h2
    db2 = 1/m*np.sum(dZ2,axis=1,keepdims=True) #db2=h2*1

    dZ1 = np.dot(W2, dZ2) * A1 * (1 - A1) # dZ1=h1*m
    dW1 = 1 / m * np.dot(X, dZ1.T)  # dW1=n*h
    db1 = 1 / m * np.sum(dZ1,axis=1,keepdims=True)  # db1=h*m

    return dZ3,dZ2,dZ1,dW3,dW2,dW1,db3,db2,db1

def costfunction(Y,A3):
    m, n = np.shape(Y)
    J=np.sum(Y*np.log(A3)+(1-Y)*np.log(1-A3))/m
    # J = (np.dot(y, np.log(A2.T)) + np.dot((1 - y).T, np.log(1 - A2))) / m
    return -J

# Data = np.loadtxt("gua2.txt")
# X = Data[:, 0:-1]
# X = X.T
# Y = Data[:, -1]
# Y=np.reshape(1,m)
X=np.random.rand(100,200)
n,m=np.shape(X)
Y=np.random.rand(1,m)
n_x=n
n_y=1
n_h1=5
n_h2=4
W1=np.random.rand(n_x,n_h1)*0.01
W2=np.random.rand(n_h1,n_h2)*0.01
W3=np.random.rand(n_h2,n_y)*0.01
b1=np.zeros((n_h1,1))
b2=np.zeros((n_h2,1))
b3=np.zeros((n_y,1))
alpha=0.1
number=10000
for i in range(0,number):
    Z1,Z2,Z3,A1,A2,A3=forward(X,W1,W2,W3,b1,b2,b3)
    dZ3, dZ2, dZ1, dW3, dW2, dW1, db3, db2, db1=backward(Y,X,A3,A2,A1,Z3,Z2,Z1,W3,W2,W1)
    W1=W1-alpha*dW1
    W2=W2-alpha*dW2
    W3=W3-alpha*dW3
    b1=b1-alpha*db1
    b2=b2-alpha*db2
    b3=b3-alpha*db3
    J=costfunction(Y,A3)
    if (i%100==0):
        print(i)
    plt.plot(i,J,'ro')
plt.show()

執行結果：

可以看到這個損失函式的下降就比較快了，因為只是簡單的隨機資料，兩層的神經網路相對來說也比較“深”了。

深度學習一：搭建簡單的全連線神經網路

深度學習一：搭建簡單的全連線神經網路新手入門學習神經網路，嘗試搭建淺層的全連線神經網路，廢話不多說，上主題（文章左後會貼上全部程式碼）：實驗環境：Python3+Pycharm 一個神經網路分為輸入層、隱藏和輸出層，先實現一個單隱藏層的神經網路，輸入為隨機向量x，通過神經網路，擬合隨機

【機器學習】動手寫一個全連線神經網路（三）：分類

我們來用python寫一個沒有正則化的分類神經網路。傳統的分類方法有聚類，LR邏輯迴歸，傳統SVM，LSSVM等。其中LR和svm都是二分類器，可以將多個LR或者svm組合起來，做成多分類器。多分類神經網路使用softmax+cross entropy組

CS231n作業筆記2.1：兩層全連線神經網路的分層實現

CS231n簡介作業筆記 1. 神經網路的分層實現全連線前向傳播：out = x.reshape([x.shape[0],-1]).dot(w)+b 全連線後向傳播： x, w, b = cache dx, dw, db = No

簡單全連線神經網路--MNIST

使用全連線神經網路進行手寫數字識別，這個效果比CNN要差，僅做練習。 1、mnist_inference.py #coding:utf-8 import tensorflow as tf #定義神經網路結構相關的引數 INPURT_NODE = 78

深度學習二：使用TensorFlow搭建簡單的全連線神經網路

深度學習二：使用TensorFlow搭建簡單的全連線神經網路學習《TensorFlow實戰Google深度學習框架》一書在前一篇部落格中，學習了使用python搭建簡單的全連線神經網路深度學習一：搭建簡單的全連線神經網路這裡繼續學習使用TensorFlow來搭建全連線神經

《TensorFlow：實戰Google深度學習框架》——6.2 卷積神經網路簡介（卷積神經網路的基本網路結構及其與全連線神經網路的差異）

下圖為全連線神經網路與卷積神經網路的結構對比圖：由上圖來分析兩者的差異：全連線神經網路與卷積網路相同點 &nb

深度學習tensorflow實戰筆記（1）全連線神經網路（FCN）訓練自己的資料（從txt檔案中讀取）

寫在前面的話：離上一次寫部落格已經有些日子了，以前的工程都是在caffe平臺下做的，caffe平臺雖然挺好用的，但是caffe主要用於做CNN，對於其它的網路模型用起來不太方便，所以博主轉戰tensorflow，Google對待tensorflow就想當年對待An

深度學習2---任意結點數的三層全連線神經網路

上一篇文章：深度學習1—最簡單的全連線神經網路　　　我們完成了一個三層（輸入+隱含+輸出）且每層都具有兩個節點的全連線神經網路的原理分析和程式碼編寫。本篇文章將進一步探討如何把每層固定的兩個節點變成任意個節點，以方便我們下一篇文章用本篇文章完成的網路來訓練手寫

TF之DNN：TF利用簡單7個神經元的三層全連線神經網路實現降低損失到0.000以下(輸入、隱藏、輸出層分別為 2、3 、 2 個神經元)——Jason niu

# -*- coding: utf-8 -*- import tensorflow as tf import os import numpy as np #TF：TF實現簡單的三層全連線神經網路（輸入、隱藏、輸出層分別為 2、3 、 2 個神經元） #隱藏層和輸出層的啟用

後端之路一：搭建簡單伺服器（SpringBoot+Gradle實現通用Mapper）

注意：本文參考網上大神寫的一個Mybtais通用框架而實現的，框架地址：http://git.oschina.net/free/Mapper2/blob/master/wiki/mapper/4.Spring4.md 本文思路主要使用SpringBoot+Mybatis+G

深度學習一：深度前饋網路

# 簡述 - **深度前饋網路(deep feedforward network)**, 又叫**前饋神經網路(feedforward neural network)**和**多層感知機(multilayer perceptron, MLP)** . - 深度前饋網路之所以被稱為**網路**(networ

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

卷積神經網路 3 經典的模型經典的卷積神經網路模型是我們學習CNN的利器，不光是學習原理、架構、而且經典模型的超引數、引數，都是我們做遷移學習最好的源材料之一。 1. LeNet-5 [LeCun et al., 1998] 我們還是從CNN之父，LeCun大神在98年提出的模

《TensorFlow：實戰Google深度學習框架》——6.3 卷積神經網路常用結構

1、卷積層圖6-8顯示了卷積層神經網路結構中重要的部分：濾波器（filter）或者核心（kernel）。過濾器可以將當前層神經網路上的一個子節點矩陣轉化為下一層神經網路上的一個單位節點矩陣。單位節點矩陣指的是一個長和寬都為1，但深度不限的節點矩陣。在一個卷積層巾，過濾器

《TensorFlow：實戰Google深度學習框架》——6.3 卷積神經網路常用結構（池化層）

池化層在兩個卷積層之間，可以有效的縮小矩陣的尺寸（也可以減小矩陣深度，但實踐中一般不會這樣使用），co。池從而減少最後全連線層中的引數。池化層既可以加快計算速度也可以防止過度擬合問題的作用。池化層也是通過一個類似過濾器結構完成的，計算方式有兩種：最大池化層：採用最

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

　　上一篇部落格先搭建了基礎環境，並熟悉了基礎知識，本節基於此，再進行深一步的學習。　　接下來看看如何基於PyTorch深度學習框架用簡單快捷的方式搭建出複雜的神經網路模型，同時讓模型引數的優化方法趨於高效。如同使用PyTorch中的自動梯度方法一樣，在搭建複雜的神經網路模型的時候，我們也可以使用PyTor

Tensorflow實現簡單的全連線神經網路

#coding : utf8 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #讀資料集 ''' 1.資料讀取資料,劃分訓練集測試集labels,fea

《吳恩達深度學習工程師系列課程之——改善深層神經網路：超引數除錯、正則化以及優化》學習筆記

本課程分為三週內容：深度學習的使用層面優化演算法超引數除錯、Batch正則化和程式框架 WEEK1 深度學習的使用層面 1.建立神經網路時選擇：神經網路層數每層隱藏單元的個數學習率為多少各層採用的啟用函式為哪些 2

pytorch中全連線神經網路搭建兩種模式

pytorch搭建神經網路是很簡單明瞭的，這裡介紹兩種自己常用的搭建模式：import torch import torch.nn as nnfirst：class NN(nn.Module): def __init__(self): super(NN

基於Tensorflow的機器學習(5) -- 全連線神經網路

這篇部落格將實現的主要神經網路如下所示：以下是相關程式碼的實現步驟：簡單化的實現匯入必要內容 # Import MNIST data import tensorflow as tf from tensorflow.examples.tuto

全連線神經網路的簡單python實現

學習深度學習很長一段時間了，平時專案中也使用過caffe，tensorflow等深度學習框架，但一直沒有真正動手實現過。雖然平時專案不建議自己重複造輪子，但作為時下這麼火的深度學習，與它強大無比的功能相比，它的基本原理卻是這麼簡潔，優雅，實現起來也不算多麼複

深度學習一：搭建簡單的全連線神經網路

深度學習一：搭建簡單的全連線神經網路

相關推薦