python3下tensorflow練習（二）

阿新 • • 發佈：2019-01-13

MNIST手寫字識別

流程：
1、將要識別的圖片轉為灰度圖，並且轉化為784矩陣（單通道，每個畫素範圍0-255，0為黑色，255為白色，這一點與MNIST中的正好相反）
2、將28*28的矩陣轉換成1維矩陣[[784]]（也就是把第2,3,4,5....行矩陣紛紛接入到第一行的後面）
3、用一個1*10的向量代表標籤，也就是這個數字到底是幾，舉個例子e數字1對應的矩陣就是[0,1,0,0,0,0,0,0,0,0]
4、softmax迴歸預測圖片是哪個數字的概率

5、用交叉熵和梯度下降法訓練引數

注意：這裡我建立的是單層神經網路

（1）softmax啟用函式詳解：

softmax直白來說就是將原來輸出是3,1,-3通過softmax函式一作用，就對映成為(0,1)的值，而這些值的累和為1（滿足概率的性質），那麼我們就可以將它理解成概率，在最後選取輸出結點的時候，我們就可以選取概率最大（也就是值對應最大的）結點，作為我們的預測目標！

像這裡的MNIST要把它分成10類，就必須用softmax來進行分類了。
P(y=0)=p0,P(y=1)=p1,p(y=2)=p2......P(y=9)=p9.這些表示預測為數字i的概率，（跟上面標籤的格式正好對應起來了）,它們的和為1，即 ∑(pi)=1。

tensorflow實現了這個函式，我們直接呼叫這個softmax函式即可，原理圖：

（2）交叉熵刻畫了兩個概率分佈之間的距離，它是分類問題中使用比較廣的一種損失函式。給定兩個概率分佈p和q，通過q來表示p的交叉熵為：

在tensorflow中的函式表示：
cross_entropy = -tf.reduce_mean( y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
)
其中y_代表正確結果，y代表預測結果，tf.clip_by_value函式可以將一個張量中的數值限制在一個範圍之內，tf.log完成對張量中所有元素依次求對數
，* 實現兩個矩陣元素之間直接相乘（矩陣乘法需要使用tf.matmul函式來完成）。

注意：

交叉熵和最大似然估計的聯絡與區別

引用https://blog.csdn.net/diligent_321/article/details/53115369該文章的解釋

在利用深度學習模型解決有監督問題時，比如分類、迴歸、去噪等，我們一般的思路如下：

（1）最大似然誤差是從概率的角度，求解出能完美擬合訓練樣例的模型引數theta，使得概率p(y | x, theta)最大化；

（2）交叉熵損失函式，衡量的是兩個分佈p、q的相似性。在給定集合上兩個分佈p和q的cross entropy定義如下：

在機器學習應用中，p一般表示樣例的標籤的真實分佈，在分類問題中，交叉熵的本質就是似然函式的最大化

。證明如下：

記帶標籤的樣例為（x, y），其中x表示輸入特徵向量，y=[y1, y2, ..., yc]表示真實標籤的one-hot表示，y_=[y_1, y_2, ..., y_c]表示模型輸出的分佈，c表示樣例輸出的類別數，那麼，

（1）對於二分類問題，p(x)=[1， 0]，q(x)=[y_1， y_2]，y_1=p(y=1|x)表示模型輸出為真的概率，交叉熵H(p, q)=-（1*y_1+0*y_2）=-y_1，顯然此時交叉熵的最小化等價於似然函式的最大化；（2）對於多分類問題，假設p(x)=[0, 0, 0, ..., 1, 0, 0]，q(x)=[y_1, y_2, y_3, ..., y_k, y_(k+1), y_(k+2)]，即表示真實樣例標籤為第k類，y_k=p(y=k|x)表示模型輸出為第k類的概率，交叉熵H(p, q)=-( 0*y_1+0*y_2+0*y_3+...+1*y_k+0*y_(k+1)+0*y_(k+2) ) = -y_k，此時同上。

"""
author:jiancgehng
2018.05.04
"""
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import matplotlib.pyplot as plt#匯入plt繪圖模組

# number 1 to 10 data提前下下來了再“MNIST”資料夾下
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)#one_hot一種編碼格式0000000100（0-9數字）

建立網路層函式：

def add_layer(inputs, in_size, out_size, activation_function=None,):
    # #biases和Weights並不是純隨機數，一定的初始值跟有利於尋找到最優解
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1,)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b,)
    return outputs

建立評估模型準確率公式：

"""
    tf.argmax(y_pre,1)，tf.argmax(vector, 1)：返回的是vector中的最大值的索引號，如果vector是一個向量，那就返回一個值，
    如果是一個矩陣，那就返回一個向量，這個向量的每一個維度都是相對應矩陣行的最大值元素的索引號。
    [[100000000]]輸入，輸出最大數的索引0
    
    tf.equal(A, B)是對比這兩個矩陣或者向量的相等的元素，如果是相等的那就返回True，反正返回False，返回的值的矩陣維度和A是一樣的
    將實際值和預測值進行比較，返回Bool資料型別
    
     tf.cast(x, dtype, name=None) 
     將x的資料格式轉化成dtype.例如，原來x的資料格式是bool， 
     那麼將其轉化成float以後，就能夠將其轉化成0和1的序列。
"""
def compute_accuracy(v_xs, v_ys):
    global prediction#全域性變數
    y_pre = sess.run(prediction, feed_dict={xs: v_xs})#預測值
    correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1))#100個樣本，就是1*100的向量
    accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))#將上面的bool型別轉為float，求得矩陣中所有元素的平均值 如：98/100=.98
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys})#run()執行才能有結果
    return result

以palceholder傳入樣本X值：

"""
    define placeholder for inputs to network
    相當於一個容器，feed_dict()就是呼叫容器的方法
    placeholder一共兩個引數：1.資料型別，tf.float32或者“FLOAT32” 2.出入引數（矩陣）的形狀，第一維None:不限制樣本個數（X）,第二維：特徵個數
"""
xs = tf.placeholder(tf.float32, [None, 784]) # 28x28，輸入特徵784個
ys = tf.placeholder(tf.float32, [None, 10])#輸出10個數字

輸出預測值：

# add output layer單層神經網路
#數字1對應的矩陣就是[0,1,0,0,0,0,0,0,0,0]，輸出結果為10個矩陣
prediction = add_layer(xs, 784, 10,  activation_function=tf.nn.softmax)#錯誤：其實就是二分類問題，輸出的10個數{0,1}；多分類：tf.nn.softmax

計算損失值（準備反向傳播）：

"""
    the error between prediction and real data，損失值
    tf.reduce_mean(input_tensor, reduction_indices=None, keep_dims=False, name=None)
    計算一個張量的維數的平均值。如果還原指數沒有條目，則所有維度都被還原，一個帶有單個元素的張量被返回。
    input_tensor: 張量減少。應該有數字型別。
    reduction_indices: 尺寸減少。如果沒有（預設），則減少所有維度。
    keep_dims: 如果是真的，則保留長度為1的維度。
    name: 操作的名稱
    
    -tf.reduce_sum(ys * tf.log(prediction),reduction_indices=[1])
"""
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),
                                              reduction_indices=[1]))       # loss

選擇優化器（梯度下降）一次訓練：

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)#一次正向傳播+反向傳播，得到模型

開啟會話開始訓練：

sess = tf.Session()
# important step
sess.run(tf.initialize_all_variables())


#plot_images_labels_prediction(mnist.train.images,
#                              mnist.train.labels,prediction,0)
for i in range(1000):
    #讀取批次資料，為了更快的收斂
    #每次讀取1001項批次訓練資料，讀取的訓練資料存放在 batch_xs, batch_ys ，準備訓練使用
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys})#訓練模型
    if i % 50 == 0:
        print(compute_accuracy(
            mnist.test.images, mnist.test.labels))

訓練結果：

python3下tensorflow練習（二）

python3下tensorflow練習（二）

python3下tensorflow練習（一）

python3下tensorflow練習（五）之CNN下的MNIST識別

linux下安裝vsftp（二）

Shell練習（二）

Leetcode代碼練習（二）

vmware下安裝centos7（二）

git 在windows下的應用（二） - 遠程倉庫代碼管理

SQL作業：綜合練習（二）的返評

PL/SQL 上機練習（二）

ProtoBuf練習（二）

Python基礎練習（二）筆趣看《伏天氏》全文章節爬取

Java練習（二）

Redtiger SQL注入練習（二）

Python3從零學習（二）

某演算法的板子練習（二）

TensorFlow學習（二）：tf.random_normal() 和 tf.random_unform()

TensorFlow 實戰（二）—— tf train（優化演算法）

專案練習（二）—微博資料結構化

TensorFlow 學習（二）張量和基本運算

python3下tensorflow練習（二）

相關推薦