TensorFlow神經網路：模組化的神經網路八股

阿新 • • 發佈：2018-11-14

1、前向傳播：

搭建從輸入到輸出的網路結構
forward.py:

# 定義前向傳播過程
def forward(x, regularizer):
	w = 
	b = 
	y = 
	return y

# 給w賦初值，並把w的正則化損失加到總損失中
def get_weight(shape, regularizer):
	w = tf.Variable()
	tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w))
	return w

def get_bias 
(shape)
	b = tf.Variable()
	return b

2、反向傳播

訓練網路，優化網路引數，提高模型準確性
backward.py：

# 定義反向傳播
def backward():
	# 對資料集x和標準答案y_佔位
	x = tf.placeholder()
	y_ = tf.placeholder(
		)
	# 利用forward模組復現前向傳播網路的結構，計算得到y
	y = forward.forward(x, REGULARIZER)

	# 定義輪數計數器
	global_step = tf.Variable(0, trainable = 
 False)

	# 定義損失函式
	loss = 

	'''
	# 均方誤差
	loss = tf.reduce_mean(tf.square(y - y_))
	# 交叉熵
	ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits = y, lables = tf.argmax(y_, 1))
	loss = tf.reduce_mean(ce)
	'''

	# 在訓練網路模型時
	# 常常將1正則化、2指數衰減學習率、3滑動平均這三個方法作為優化模型的方法
	
	'''
	# 使用正則化時的損失函式
	loss = loss(y, y_) + tf.add_n(tf.get_collection('losses'))

	# 使用指數衰減的學習率時，加上：
	learning_rate = tf.train.exponential_decay(
		LEARNING_RATE_BASE,
		global_step,
		資料集總樣本數/BATCH_SIZE,
		LEARNING_RATE_DECAY,
		staircase = True)
	''' 


	# 上面的損失函式和學習率選好之後，定義反向傳播過程使用梯度下降
	train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step = global_step)
	
	# 如果使用滑動平均時，加上：
	'''
	ema = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)
	ema_op = ema.apply(tf.trainable_variables())
	with tf.control_dependencies([train_step, ema_op]):
		train_op = tf.no_op(name = 'train')
	'''

	# 訓練過程
	with tf.Session() as sess:
		# 初始化所有引數
		init_op = tf.global_variables_initializer()
		sess.run(init_op)
		# 迴圈迭代
		for i in range(STEPS):
			# 每輪呼叫sess.run執行訓練過程train_step
			sess.run(train_step, feed_dict = {x: , y_: })
			# 每執行一定輪數，打印出當前的loss資訊
			if i %  輪數==0
			    print

3、判斷主檔案

# 判斷python執行檔案是否為主檔案，如果是，則執行
if __name__ == '__main__':
	backward()

4、例項模組化展示

加入指數衰減學習率–優化效率
加入正則化–提高泛化效能
模組化設計
① generateds.py

# modelNN_generateds.py
# 資料匯入模組，生成模擬資料集
# coding: utf-8

import numpy as np
import matplotlib.pyplot as plt
import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'  #hide warnings

seed = 2

def generateds():
	# 基於seed產生隨機數
	rdm = np.random.RandomState(seed)

	# 隨機數返回300行2列的矩陣，表示300組座標點，作為輸入資料集
	X = rdm.randn(300, 2)

	# 手工標註資料分類
	Y_ = [int(x0*x0 + x1*x1 < 2)for (x0, x1) in X]

	# Y_為1，標記紅色，否則藍色
	Y_c = [['red' if y else 'blue'] for y in Y_]

	# 對資料集和標籤進行reshape， X整理為n行2列，Y為n行1列，第一個元素-1表示n行
	X = np.vstack(X).reshape(-1, 2)
	Y_ = np.vstack(Y_).reshape(-1, 1) 

	return X, Y_, Y_c

	print("X:\n")
	print(X)
	print("Y_:\n")
	print(Y_)
	print("Y_c:\n")
	print(Y_c)

② forward.py

# modelNN_generateds.py
# 前向傳播模組
# 定義神經網路的輸入、引數和輸出，定義前向傳播過程
# coding: utf-8

import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'  #hide warnings

# 給w賦初值，並把w的正則化損失加到總損失中
def get_weight(shape, regularizer):
	w = tf.Variable(tf.random_normal(shape), dtype = tf.float32)
	tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w))
	return w

# 給b賦初值
def get_bias(shape):
	b = tf.Variable(tf.constant(0.01, shape = shape))
	return b

def forward(x, regularizer):
	w1 = get_weight([2, 11], regularizer)
	b1 = get_bias([11])
	y1 = tf.nn.relu(tf.matmul(x, w1) + b1)

	w2 = get_weight([11, 1], regularizer)
	b2 = get_bias([1])
	y = tf.matmul(y1, w2) + b2 #輸出層不通過啟用函式

	return y

③ backward.py

# modelNN_generateds.py
# 反向傳播模組
# 定義神經網路的反向傳播過程
# coding: utf-8

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import modelNN_generateds
import modelNN_forward
import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'  #hide warnings

# 定義超引數
STEPS = 40000 #訓練輪數
BATCH_SIZE = 30 
LEARNING_RATE_BASE = 0.001 #初始學習率
LEARNING_RATE_DECAY = 0.999 # 學習率衰減率
REGULARIZER = 0.01 # 正則化引數

def backward():
	# placeholder佔位
	x = tf.placeholder(tf.float32, shape = (None, 2))
	y_ = tf.placeholder(tf.float32, shape = (None, 1))

	# 生成資料集
	X, Y_, Y_c = modelNN_generateds.generateds()

	# 前向傳播推測輸出y
	y = modelNN_forward.forward(x, REGULARIZER)

	# 定義global_step
	global_step = tf.Variable(0, trainable = False)

	# 定義指數衰減學習率
	learning_rate = tf.train.exponential_decay(
		LEARNING_RATE_BASE,
		global_step, 
		300/BATCH_SIZE,
		LEARNING_RATE_DECAY,
		staircase = True)
	
	# 定義損失函式
	loss_mse = tf.reduce_mean(tf.square(y - y_))
	loss_total = loss_mse + tf.add_n(tf.get_collection('losses'))

	# 定義反向傳播方法：包含正則化
	train_step = tf.train.AdamOptimizer(learning_rate).minimize(loss_total)

	# 定義訓練過程
	with tf.Session() as sess:
		init_op = tf.global_variables_initializer()
		sess.run(init_op)
		for i in range(STEPS):
			start = (i * BATCH_SIZE) % 300
			end = start + BATCH_SIZE
			sess.run(train_step, feed_dict = {x: X[start:end], y_:Y_[start:end]})
			if i % 2000==0:
				loss_v = sess.run(loss_total, feed_dict = {x: X, y_: Y_})
				print("after %d steps, loss for total is %f" %(i, loss_v))
		
		xx, yy = np.mgrid[-3:3:.01, -3:3:.01]
		grid = np.c_[xx.ravel(), yy.ravel()]
		probs = sess.run(y, feed_dict = {x: grid})
		probs = probs.reshape(xx.shape)

	# 視覺化
	plt.scatter(X[:, 0], X[:, 1], c = np.squeeze(Y_c))
	# 給probs值為0.5的所有點(xx, yy)上色
	plt.contour(xx, yy, probs, levels = [.5])
	plt.show()

# 判斷python執行檔案是否為主檔案，如果是，則執行
if __name__ == '__main__':
	backward()

在這裡插入圖片描述

TensorFlow神經網路：模組化的神經網路八股

1、前向傳播：搭建從輸入到輸出的網路結構 forward.py: # 定義前向傳播過程 def forward(x, regularizer): w = b = y = return y # 給w賦初值，並把w的正則化損失加到總損失中 def g

Tensorflow－模組化神經網路

以模組化的方式來定義一個NN inference(): 定義前向傳播過程，即FP過程。因為tensorflow的NN構建可以理解為實際上前期工作都是在定義一張計算圖，只有到session處才是開始圖的運算。所以前向過程反映了整個NN的框架，包括多少層，有哪些層，各個層由哪些引數，使用什麼啟用

tensorflow學習筆記：卷積神經網路最終筆記

　　這已經是我的第四篇部落格學習卷積神經網路了。之前的文章分別是：　　1，Keras深度學習之卷積神經網路（CNN），這是開始學習Keras，瞭解到CNN，其實不懂的還是有點多，當然第一次筆記主要是給自己心中留下一個印象，知道什麼是卷積神經網路，當然主要是學習Keras，順便走一下CNN的過程。　　2，深

再說閃電網路：HTLC高效轉賬網路

閃電通道，它的實現機制其實有個名稱，叫RSMC（Recoverable Sequence Maturity Contract），中文名為“序列到期可撤銷合約”，很拗口吧！所以，我前面一直不敢把它擺出來嚇人。今天，就趁著介紹它兄弟的機會，讓哥倆的名字也露露面吧。它兄弟的名字叫HTLC（Hash

node學習四：模組化

模組化：是從程式碼邏輯的角度進行劃分的；方便程式碼分層開發，保證每個功能模組的職能單一；傳統非模組化開發有如下的缺點： 1、命名衝突 2、檔案依賴前端標準的模組化規範： 1、AMD - requirejs 2、CMD - seajs 伺服器端的模組化規範： 1、Co

JEP 200：模組化JDK

原文連結譯者：carvendy JEP 200:模組化JDK 作者 Mark Reinhold 建立 2014/07/22 14:08 更新 2017/03/08 13:58 型別特性狀態整合域 SE JSR 376 討論拼圖的開發在openjdk.java

Android 流量優化(一)：模組化流量統計

有個使用者說一夜間跑了幾百兆的移動流量，流量是哪裡產生的？是不是哪裡有程式碼缺陷？怎樣定位到問題？於是想著把流量劃分模組的統計下來，以便優化App的整體健康；如果僅統計應用總流量，類提供的介面就足以實現了；現在我們需要分析流量的成分，一直沒有發現比較好的方

JavaScript系列之四：模組化開發

模組化(切記：學習思想) 如果不用模組化編寫程式碼，那麼會具有以下問題：程式碼雜亂無章，沒有條理性，不便於維護，不便於複用很多程式碼重複、邏輯重複全域性變數汙染不方便保護私有資料(閉包) 模組化的基本實現：閉包的自呼叫函式 //

計算機網路：傳輸層和網路層

傳輸層介紹傳輸層是客戶程式和伺服器程式之間的聯絡人，是一個程序之間的連線。傳輸層服務首先了解一下傳輸層所提供的服務。程序到程序通訊 TCP/IP協議簇的5層模型：其中，網路層負責計算機層次的通訊（主機到主機通訊），網路層協議只把

計算機網路：傳輸層和網路層（3）

傳輸層介紹傳輸層是客戶程式和伺服器程式之間的聯絡人，是一個程序之間的連線。傳輸層服務首先了解一下傳輸層所提供的服務。程序到程序通訊 TCP/IP協議簇的5層模型：其中，網路層負責計算機層次的通訊（主機到主機通訊），網路層協議只把報文傳遞到目的

資源 | HiddenLayer：視覺化PyTorch、TensorFlow神經網路圖的輕量級工具！

本文介紹了一個面向 PyTorch 和 TensorFlow 神經網路計算圖和訓練度量（metric）的輕量級庫——HiddenLayer，它適用於快速實驗，且與 Jupyter Notebook 相容。 GitHub連結：https://github.com/

一圖抵千言：帶你瞭解最直觀的神經網路架構視覺化

一張好的圖抵得上一千個等式。神經網路是複雜、多維、非線性的陣列運算。如何在避免過於複雜或重複的情況下呈現深度學習模型架構的重要特徵呢？又該以何種方式清晰直觀、啟發性地呈現它們呢？（好看也是加分項！）無論研究還是教學專案對此都沒有固定標準。本文我們就來了解一下視覺化整個

改善深層神經網路：超引數除錯、正則化以及優化_課程筆記_第一、二、三週

所插入圖片仍然來源於吳恩達老師相關視訊課件。仍然記錄一下一些讓自己思考和關注的地方。第一週訓練集與正則化這周的主要內容為如何配置訓練集、驗證集和測試集；如何處理偏差與方差；降低方差的方法（增加資料量、正則化：L2、dropout等）；提升訓練速度的方法：歸一化訓練集；如何合理的初始化權

Tensorflow系列專題（四）：神經網路篇之前饋神經網路綜述

目錄：神經網路前言神經網路感知機模型多層神經網路啟用函式 Logistic函式 Tanh函式 ReLu函式損失函式和輸出單元損失函

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層 https://blog.csdn.net/yjl9122/article/details/70198357?utm_source=blogxgwz3 一、卷積層特徵提取輸入影象是32*32*3，3是它的深度（即R

tensorflow基本教程10：RNN迴圈神經網路對於手寫體識別預測

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #this is data mnist=input_data.read_data_sets("MNIST_data",one_

TensorSpace：一套用於構建神經網路3D視覺化應用的框架

作者 | syt123450、Chenhua Zhu、Yaoxing Liu （本文經原作者授權轉載）今天要為大家推薦一套超酷炫的，用於構建神經網路 3D 視覺化應用的框架——TensorSpace。有什麼用途？大家可以使用類 Keras

機器學習筆記（十五）：TensorFlow實戰七（經典卷積神經網路：VGG）

1 - 引言之前我們介紹了LeNet-5和AlexNet，在AlexNet發明之後，卷積神經網路的層數開始越來越複雜，VGG-16就是一個相對前面2個經典卷積神經網路模型層數明顯更多了。 VGGNet是牛津大學計算機視覺組（Visual Geometry Group）和Google

機器學習筆記（十四）：TensorFlow實戰六（經典卷積神經網路：AlexNet ）

1 - 引言 2012年，Imagenet比賽冠軍的model——Alexnet [2]（以第一作者alex命名）。這個網路算是一個具有突破性意義的模型首先它證明了CNN在複雜模型下的有效性，然後GPU實現使得訓練在可接受的時間範圍內得到結果，讓之後的網路模型構建變得更加複雜，並且通過

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

1 - 引言之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型，不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢？下圖展示了CNN的發展歷程。經過人們不斷的嘗試，誕生了許多有

TensorFlow神經網路：模組化的神經網路八股

相關推薦