用tensorflow實現一個卷積神經網路
阿新 • • 發佈:2018-11-21
學了一段深度學習,最近學了tensorflow,所以想自己去根據教程寫一個簡單的卷積神經網路。
CNN:卷積神經網路的實現
一個卷積神經網路的結構一般是由輸入-->卷積-->池化-->卷積-->池化-->............-->全連線-->全連線-->輸出,這樣的一層層構建起來的網路。本程式碼構建了一個含有兩個卷積層,兩個池化層和兩個全連線層的網路,在mnist手寫數字分類任務上精度達到0.99
神經網路上一層的輸出是下一層的輸入,所有資料的shape必須要匹配上,否則到到計算資料時會報錯。所有程式碼接受均在程式碼段註釋中。
環境:windows10, 64位作業系統, python3.5, tensorflow1.11版本
'''實現mnist手寫數字的分類''' import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_DATA',one_hot=True)#如果沒有mnist資料就進行下載;使用one_hot編碼 #定義權重初始化,偏置初始化 def weight_variable(shape): #生成正態分佈資料的一種形式。shape表示生成資料的維度,stddev為標準差 inital=tf.truncated_normal(shape,stddev=0.1) return tf.Variable(inital) def bias_variable(shape): inital = tf.constant(0.1,shape=shape) return tf.Variable(inital) #定義卷積操作 def conv2d(x,W): #strides[1,x_movement,y_movement,1],第一個和最後一個1是規定好的必須等於1 #strides=[1,1,1,1]中間兩個1表示卷積在x,y兩個方向的步長為1 #padding='SAME'表示輸出尺寸與輸入相同,有兩個可選的值,另一個是VAILD,根據卷積核的大小相應產生變化 return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME') #定義池化操作 def max_pool_2x2(x): #strides[1,x_movement,y_movement,1],第一個和最後一個1是規定好的必須等於1 #ksize意為kernel size表示卷積核尺寸大小,strides=[1,2,2,1],與上面卷積層相似,只不過步長為2 return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME') #用placeholder先把網路輸入資料先存起來 xs=tf.placeholder(tf.float32,[None,784]) #手寫數字識別的圖片尺寸為28*28=784 ys=tf.placeholder(tf.float32,[None,10]) #輸出的類別為10類 keep_prob=tf.placeholder(tf.float32) #keep_prob適合dropout聯合使用的,我發現將全文中的keep_prob去掉後,僅僅在下面的dropout處理的地方填上一個值,網路依然可以執行,結果還不錯。 x_image=tf.reshape(xs,[-1,28,28,1]) #將傳入的資訊換成圖片的資訊,傳入xs,將形狀變為28*28*1, -1為所有傳入的圖片 #print(x_image.shape)#你可以執行這步,檢視x_image的資料的shape ####conv1 layer構建第一層卷積層,後面緊跟一層池化操作 W_conv1=weight_variable([5,5,1,32]) #5,5為卷積核大小,1為輸入的深度,32為輸出深度 b_conv1=bias_variable([32]) h_conv1=tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1)#此步驟輸出的圖片大小為28*28*32 h_pool1=max_pool_2x2(h_conv1) #池化後輸出的大小為14*14*32 ####conv2 layer構建第二層卷積層,後面再跟一層池化操作 W_conv2=weight_variable([5,5,32,64]) #5,5為卷積核大小,32為輸入的深度,64為輸出深度 b_conv2=bias_variable([64]) h_conv2=tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)#此步驟輸出的圖片大小為14*14*64 h_pool2=max_pool_2x2(h_conv2) #池化後輸出的大小為7*7*64 ####func1 layer構建一層全連線層 W_fc1=weight_variable([7*7*64,1024]) b_fc1=bias_variable([1024]) #[n_samples,7,7,64]---->[n_samples,7*7*64]相當於把後面的三個維度,拍平成一個一維向量。 h_pool2_flat=tf.reshape(h_pool2,[-1,7*7*64]) #全連線層:用relu啟用函式,啟用後面的Wx+b h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1)+b_fc1) h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob) #即在這裡將keep_prob替換為0-1之間的數,網路一樣可以執行 ####func2 layer構建第二層全連線層 W_fc2=weight_variable([1024,10]) b_fc2=bias_variable([10]) prediction=tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2)+b_fc2) #使用了一個交叉熵損失函式 cross_entropy=tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction),reduction_indices=[1])) #訓練優化器選擇的自適應的優化器,學習率為0.0001, train_step=tf.train.AdamOptimizer(0.0001).minimize(cross_entropy) #定義計算精度的函式 def compute_accuracy(v_xs,v_ys): global prediction #keep_prob是每個元素被保留的概率,keep_prob:1就是所有元素全部保留 y_pre = sess.run(prediction,feed_dict={xs:v_xs,keep_prob:1}) #函式tf.equal(x,y,name=None)對比x與y矩陣/向量中相等的元素,相等的返回True,不相等返回False,返回的矩陣/向量的維度與x相同;tf.argmax()返回最大值對應的下標(1表示每一列中的,0表示每一行),在此就是說y的預測和真實標籤是否一致 correct_prediction = tf.equal(tf.argmax(y_pre,1),tf.argmax(v_ys,1)) #tf.cast()型別轉換函式,將correct_prediction轉換成float32型別,並對correct_prediction求平均值得到arruracy accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32)) result = sess.run(accuracy,feed_dict={xs:v_xs,ys:v_ys,keep_prob:1}) return result with tf.Session() as sess: #對所有定義變數進行初始化 sess.run(tf.initialize_all_variables()) #開始迭代訓練資料 for i in range(10000): #用兩個變數接受資料集的返回值,batch_xs接受圖片,batch_ys接收標籤,每次接受100個數據 batch_xs, batch_ys = mnist.train.next_batch(100) sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys,keep_prob:1}) #每50次列印一次精度 if i % 50 == 0: print(i,"accuracy:",compute_accuracy(mnist.test.images, mnist.test.labels))
可以看出在前500次迭代的時候,精度大幅度的提升,在10000次左右達到飽和。
下一篇想寫一個Alexnet網路。
參考tensorflow教學視訊:https://www.bilibili.com/video/av16001891/?p=28