【TensorFlow實戰】2.完整神經網路例子
阿新 • • 發佈:2019-01-09
# coding=utf-8 import tensorflow as tf #NumPy是科學計算工具包,呼叫生成模擬資料集 from numpy.random import RandomState #定義訓練資料batch的大小 batch_size = 8 #定義神經網路的引數 w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1)) w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1)) #在shape的一個維度上使用None可以方便使用不大的batch大小.在訓練時需要把資料 #分成比較小的batch,但是在測試時,可以一次性使用全部的資料,當資料集比較小時 #這樣比較方便測試,但是資料集較大時,將大量資料放入一個batch可能導致記憶體溢位。 x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input') y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input') #定義神經網路前向傳播過程 a = tf.matmul(x, w1) y = tf.matmul(a, w2) #在上面的程式碼中,y_代表正確結果,y代表預測結果 #定義損失函式和反向傳播演算法 #定義算是函式來刻畫預測值與真實值之間的差距 cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))) #定義學習率 learning_rate = 0.001 #定義反向傳播演算法來優化神經網路中的引數 train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy) #通過隨機數生成一個模擬資料集 rdm = RandomState(1) dataset_size = 128 X = rdm.rand(dataset_size, 2) #定義規則來給出樣本的標籤。這裡所有x1+x2<1的樣本都被認為是正樣本(零件合格) #其它為負樣本(零件不合格) #這裡採用0和1的表示方法,0負樣本,1正樣本 Y = [[int(x1+x2 < 1)] for (x1, x2) in X] #建立一個會話來執行TensorFlow程式 with tf.Session() as sess: init_op = tf.initialize_all_variables() #初始化變數 sess.run(init_op) print sess.run(w1) print sess.run(w2) #設定訓練輪數 STEPS = 5000 for i in range(STEPS): #每次選取batch_size個樣本進行訓練 start = (i * batch_size) % dataset_size end = min(start+batch_size, dataset_size) #通過選取的樣本訓練神經網路並更新引數 sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]}) if i % 1000 == 0: #每隔一段時間計算在所有資料上的交叉熵並輸出 total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y}) print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy)) print sess.run(w1) print sess.run(w2)
我在Ubuntu下面跑的,提示出現下面的錯誤
SyntaxError: Non-ASCII character '\xe6' in file 3.2.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
解決方法:在程式碼開頭加一段註釋# coding=utf-8
訓練神經網路的過程:
1.定義神經網路的結構和前向傳播的輸出結果
2.定義損失函式以及選擇反向傳播優化的演算法
3.生成會話(tf.Session)並且在訓練資料上反覆執行反向傳播優化演算法