1. 程式人生 > >用tensorflow實現一個卷積神經網路

用tensorflow實現一個卷積神經網路

學了一段深度學習,最近學了tensorflow,所以想自己去根據教程寫一個簡單的卷積神經網路。

CNN:卷積神經網路的實現

一個卷積神經網路的結構一般是由輸入-->卷積-->池化-->卷積-->池化-->............-->全連線-->全連線-->輸出,這樣的一層層構建起來的網路。本程式碼構建了一個含有兩個卷積層,兩個池化層和兩個全連線層的網路,在mnist手寫數字分類任務上精度達到0.99

神經網路上一層的輸出是下一層的輸入,所有資料的shape必須要匹配上,否則到到計算資料時會報錯。所有程式碼接受均在程式碼段註釋中。

環境:windows10,   64位作業系統,   python3.5,   tensorflow1.11版本

'''實現mnist手寫數字的分類'''
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist=input_data.read_data_sets('MNIST_DATA',one_hot=True)#如果沒有mnist資料就進行下載;使用one_hot編碼

#定義權重初始化,偏置初始化
def weight_variable(shape):
    #生成正態分佈資料的一種形式。shape表示生成資料的維度,stddev為標準差
    inital=tf.truncated_normal(shape,stddev=0.1)
    return tf.Variable(inital)

def bias_variable(shape):
    inital = tf.constant(0.1,shape=shape)
    return tf.Variable(inital)

#定義卷積操作
def conv2d(x,W):
    #strides[1,x_movement,y_movement,1],第一個和最後一個1是規定好的必須等於1
    #strides=[1,1,1,1]中間兩個1表示卷積在x,y兩個方向的步長為1
    #padding='SAME'表示輸出尺寸與輸入相同,有兩個可選的值,另一個是VAILD,根據卷積核的大小相應產生變化
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')

#定義池化操作
def max_pool_2x2(x):
    #strides[1,x_movement,y_movement,1],第一個和最後一個1是規定好的必須等於1
    #ksize意為kernel size表示卷積核尺寸大小,strides=[1,2,2,1],與上面卷積層相似,只不過步長為2
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

#用placeholder先把網路輸入資料先存起來
xs=tf.placeholder(tf.float32,[None,784])    #手寫數字識別的圖片尺寸為28*28=784
ys=tf.placeholder(tf.float32,[None,10])     #輸出的類別為10類
keep_prob=tf.placeholder(tf.float32)   #keep_prob適合dropout聯合使用的,我發現將全文中的keep_prob去掉後,僅僅在下面的dropout處理的地方填上一個值,網路依然可以執行,結果還不錯。


x_image=tf.reshape(xs,[-1,28,28,1]) #將傳入的資訊換成圖片的資訊,傳入xs,將形狀變為28*28*1, -1為所有傳入的圖片
#print(x_image.shape)#你可以執行這步,檢視x_image的資料的shape

####conv1 layer構建第一層卷積層,後面緊跟一層池化操作
W_conv1=weight_variable([5,5,1,32]) #5,5為卷積核大小,1為輸入的深度,32為輸出深度
b_conv1=bias_variable([32])
h_conv1=tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1)#此步驟輸出的圖片大小為28*28*32
h_pool1=max_pool_2x2(h_conv1)       #池化後輸出的大小為14*14*32

####conv2 layer構建第二層卷積層,後面再跟一層池化操作
W_conv2=weight_variable([5,5,32,64]) #5,5為卷積核大小,32為輸入的深度,64為輸出深度
b_conv2=bias_variable([64])
h_conv2=tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)#此步驟輸出的圖片大小為14*14*64
h_pool2=max_pool_2x2(h_conv2)       #池化後輸出的大小為7*7*64

####func1 layer構建一層全連線層
W_fc1=weight_variable([7*7*64,1024])
b_fc1=bias_variable([1024])
#[n_samples,7,7,64]---->[n_samples,7*7*64]相當於把後面的三個維度,拍平成一個一維向量。
h_pool2_flat=tf.reshape(h_pool2,[-1,7*7*64])
#全連線層:用relu啟用函式,啟用後面的Wx+b
h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)
h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob)  #即在這裡將keep_prob替換為0-1之間的數,網路一樣可以執行

####func2 layer構建第二層全連線層
W_fc2=weight_variable([1024,10])
b_fc2=bias_variable([10])
prediction=tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2)+b_fc2)

#使用了一個交叉熵損失函式
cross_entropy=tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction),reduction_indices=[1]))
#訓練優化器選擇的自適應的優化器,學習率為0.0001,
train_step=tf.train.AdamOptimizer(0.0001).minimize(cross_entropy)

#定義計算精度的函式
def compute_accuracy(v_xs,v_ys):
    global prediction
    #keep_prob是每個元素被保留的概率,keep_prob:1就是所有元素全部保留
    y_pre = sess.run(prediction,feed_dict={xs:v_xs,keep_prob:1})
    #函式tf.equal(x,y,name=None)對比x與y矩陣/向量中相等的元素,相等的返回True,不相等返回False,返回的矩陣/向量的維度與x相同;tf.argmax()返回最大值對應的下標(1表示每一列中的,0表示每一行),在此就是說y的預測和真實標籤是否一致
    correct_prediction = tf.equal(tf.argmax(y_pre,1),tf.argmax(v_ys,1))
    #tf.cast()型別轉換函式,將correct_prediction轉換成float32型別,並對correct_prediction求平均值得到arruracy
    accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
    result = sess.run(accuracy,feed_dict={xs:v_xs,ys:v_ys,keep_prob:1})
    return result

with tf.Session() as sess:
    #對所有定義變數進行初始化
    sess.run(tf.initialize_all_variables())
    #開始迭代訓練資料
    for i in range(10000):
        #用兩個變數接受資料集的返回值,batch_xs接受圖片,batch_ys接收標籤,每次接受100個數據
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys,keep_prob:1})
        #每50次列印一次精度
        if i % 50 == 0:
            print(i,"accuracy:",compute_accuracy(mnist.test.images, mnist.test.labels))

                            

可以看出在前500次迭代的時候,精度大幅度的提升,在10000次左右達到飽和。

下一篇想寫一個Alexnet網路。

參考tensorflow教學視訊:https://www.bilibili.com/video/av16001891/?p=28