1. 程式人生 > >【TensorFlow實戰】2.完整神經網路例子

【TensorFlow實戰】2.完整神經網路例子

# coding=utf-8
import tensorflow as tf

#NumPy是科學計算工具包,呼叫生成模擬資料集
from numpy.random import RandomState

#定義訓練資料batch的大小
batch_size = 8

#定義神經網路的引數
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

#在shape的一個維度上使用None可以方便使用不大的batch大小.在訓練時需要把資料
#分成比較小的batch,但是在測試時,可以一次性使用全部的資料,當資料集比較小時
#這樣比較方便測試,但是資料集較大時,將大量資料放入一個batch可能導致記憶體溢位。
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

#定義神經網路前向傳播過程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

#在上面的程式碼中,y_代表正確結果,y代表預測結果

#定義損失函式和反向傳播演算法
#定義算是函式來刻畫預測值與真實值之間的差距
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))

#定義學習率
learning_rate = 0.001
#定義反向傳播演算法來優化神經網路中的引數
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

#通過隨機數生成一個模擬資料集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
#定義規則來給出樣本的標籤。這裡所有x1+x2<1的樣本都被認為是正樣本(零件合格)
#其它為負樣本(零件不合格)
#這裡採用0和1的表示方法,0負樣本,1正樣本
Y = [[int(x1+x2 < 1)] for (x1, x2) in X] 

#建立一個會話來執行TensorFlow程式
with tf.Session() as sess:
	init_op = tf.initialize_all_variables()
	#初始化變數
	sess.run(init_op)
	print sess.run(w1)
	print sess.run(w2)

	#設定訓練輪數
	STEPS = 5000
	for i in range(STEPS):
		#每次選取batch_size個樣本進行訓練
		start = (i * batch_size) % dataset_size
		end = min(start+batch_size, dataset_size)
		
		#通過選取的樣本訓練神經網路並更新引數
		sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
		if i % 1000 == 0:
			#每隔一段時間計算在所有資料上的交叉熵並輸出
			total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
			print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy))

	print sess.run(w1)
	print sess.run(w2)

我在Ubuntu下面跑的,提示出現下面的錯誤

SyntaxError: Non-ASCII character '\xe6' in file 3.2.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
解決方法:在程式碼開頭加一段註釋
# coding=utf-8
訓練神經網路的過程:

1.定義神經網路的結構和前向傳播的輸出結果

2.定義損失函式以及選擇反向傳播優化的演算法

3.生成會話(tf.Session)並且在訓練資料上反覆執行反向傳播優化演算法