筆記:TensorFlow實現機器學習演算法的步驟
阿新 • • 發佈:2018-12-14
核心步驟:
(1)定義演算法公式,也就是神經網路前向執行時的計算;
(2)定義loss,選定optimizer,使用優化器優化loss;
(3)開啟迭代的資料訓練操作;
(4)計算準確率,做出評測。
【例】TensorFlow實現手寫數字識別
自己編寫的程式碼,親測可以執行(2018年10月10日,python3.6+tensorflow),其中寫了詳盡的註釋幫助理解。
網路上關於這個話題有很多博文了,但有些博文中程式碼可能跑不通,或也是參考《TensorFlow實戰》一書中的例項來的。
'''python3+tensorflow 用最淺的神經網路實現手寫數字的識別''' import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #匯入官方提供的資料 # number 1 to 10 data 如果沒有會去下載下來 mnist = input_data.read_data_sets('MNIST_data', one_hot=True) def add_layer(inputs, in_size, out_size, activation_function=None,): # add one more layer and return the output of this layer Weights = tf.Variable(tf.random_normal([in_size, out_size])) biases = tf.Variable(tf.zeros([1, out_size]) + 0.1,) Wx_plus_b = tf.matmul(inputs, Weights) + biases if activation_function is None: outputs = Wx_plus_b else: outputs = activation_function(Wx_plus_b,) return outputs def compute_accuracy(v_xs, v_ys): global prediction y_pre = sess.run(prediction, feed_dict={xs: v_xs}) correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1)) #tf.argmax是尋找一個tensor中最大值的序號 accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) #用tf.cast將之前correct_prediction的BOOL強轉為float32 再求平均 result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys}) return result # define placeholder for inputs to network xs = tf.placeholder(tf.float32, [None, 784]) # 規定每一個sample的特徵是28x28=784個變數,每個手寫字型sample行改寫成列 ys = tf.placeholder(tf.float32, [None, 10]) # add output layer 這是一個沒有隱含層的最淺的機器學習的神經網路 prediction = add_layer(xs, 784, 10, activation_function=tf.nn.softmax) #sofrmax常常用來用來做多分類。 # the error between prediction and real data # cross_entropy就是它的loss 和softmax搭配的一種loss計算方法 cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1])) train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) sess = tf.Session() # important step sess.run(tf.initialize_all_variables()) for i in range(1000): batch_xs, batch_ys = mnist.train.next_batch(100) #提取出一部分的資料集xs和ys #(分批次訓練降低計算量,減少耗時,也能避免陷入區域性最優 ) sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys}) if i % 50 == 0: print(compute_accuracy( mnist.test.images, mnist.test.labels))