非常精簡的Mnist分類，基於tensorflow框架

阿新 • • 發佈：2018-11-12

一、介紹

基於tensorflow框架實現的Mnist資料分類。程式碼主要包括網路結構的搭建，訓練超引數的匯入和儲存，損失函式地繪製等。不足之處是在網路結尾沒用使用softmax函式，而直接使用了tanh輸出了分類結果。下面請看程式碼的詳細介紹

二、程式碼

匯入必要的包檔案，需要的包我直接通過pycharm匯入的，能匯入的原因是採用了anaconda3底下的python.exe，新建工程的時候，從外部匯入

# 需要使用到的包檔案
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets
import argparse
import os
# 加上這一句能夠使Plot繪製出來的圖更精美
sns.set_style("whitegrid")

訓練引數設定，詳細介紹請看程式碼註釋，主要採用了argparse，該模組的好處是直接可以在執行時修改引數，比如：python main.py --data_dir= "**"

parser = argparse.ArgumentParser(description="Network for image classification")                
parser.add_argument('--data_dir', default='tem/data', help='Directory for training data')   # Mnist資料集存放位置
parser.add_argument('--result_dir', default='tem/result')                                   # 訓練結果的存放
parser.add_argument('--model_dir', default='model/', help='the place of saving networks parameters')   #訓練引數的存放地址
parser.add_argument('--batch_size', default=32)
parser.add_argument('--print_loss', default=10) # 每隔10次迭代列印損失值
parser.add_argument('--plot_loss', default=100) # 每隔100次迭代繪製損失函式曲線
parser.add_argument('--learning_rate', default=0.001, type=float) # 學習率，不易設定過大
parser.add_argument('--n_iterations', default=10000, type=int) # 迭代次數
args = parser.parse_args() # 將--*的*傳遞給arg，呼叫時直接使用args.data_dir這樣的結構

網路結構搭建

w_init = tf.random_normal_initializer(stddev=0.01)   # 權重w初始化，標準差為0.01，平均值0
def network(x): # 啟用函式都為relu，除了輸出
    layers1 = tf.layers.conv2d(x, 32, 3, 1, padding='same', activation=tf.nn.relu, kernel_initializer=w_init)      # 32個卷積核，3x3卷積核大小，步長為1，padding為'same',即輸出大小為input/stride，向上取整
    layers2 = tf.layers.conv2d(layers1, 62, 3, 1, padding='same', activation=tf.nn.relu, kernel_initializer=w_init) 
    layers2_flatten = tf.contrib.layers.flatten(layers2)  # 將layers2的輸出"磨平"，降低相關維度，以供全連線層工作
    layers3 = tf.layers.dense(layers2_flatten, 200, activation=tf.nn.relu, kernel_initializer=w_init) # 200為全連線層單元個數，其它的痛卷積函式類似
    output = tf.layers.dense(layers3, 10, activation=tf.nn.tanh, kernel_initializer=w_init) # 使用tanh作為輸出，比sigmoid好，因為sigmoid是有0項，不利於網路訓練
    return output

訓練網路，詳細介紹看註釋

def training():
    input_x = tf.placeholder(tf.float32, [None, 28, 28, 1])  # 放置佔位矩陣
    label_y = tf.placeholder(tf.float32, [None, 10])
    output_y = network(input_x)                              # 前向傳播
    loss = tf.reduce_sum(tf.square(label_y-output_y))        # 計算同便籤損失
    optimizer = tf.train.AdamOptimizer(learning_rate=args.learning_rate).minimize(loss) # 使用Adam優化

    init_all_v = tf.global_variables_initializer()           # 張量初始化函式
    sess = tf.InteractiveSession()                           
    sess.run(init_all_v)                                     # 實行張量初始化
    saver = load_model(sess)                                 # 匯入之前訓練過的引數，如果沒有則打印出來
    mnist = read_data_sets(args.data_dir, one_hot=True)      # 往指定目錄讀取Mnist資料集
    print('start training')                                   
    plot_loss = []                                           # 損失值快取
    for i in range(args.n_iterations):                             
        batch_x, batch_y = mnist.train.next_batch(args.batch_size)      # 讀取Batch_size
        batch_x = batch_x.reshape([args.batch_size, 28, 28, 1])         # 維度匹配   
        y = np.zeros([args.batch_size, 10])                             # 下面的操作是因為我讀到的標籤是6,8,9直接對應的圖片的數字，所以將這些數字向量化，以便訓練
        for j in range(args.batch_size):
            k = batch_y[j].astype(np.int)
            y[j, k] = 1.
        batch_y = y
        d_loss, _ = sess.run([loss, optimizer], feed_dict={input_x:batch_x, label_y:batch_y})  # 執行
        plot_loss.append(d_loss)

        if i % args.print_loss == 0 and i > 0:
            print('Iteration is : %d, Loss is: %f' % (i, d_loss))   # 列印損失
        if i % args.plot_loss == 0 and i > 0:            # 繪圖
            plt.figure(figsize=(6*1.1618, 6))
            plt.plot(range(len(plot_loss)), plot_loss)
            plt.xlabel('iteration times')
            plt.ylabel('lost')
            plt.show()
        if i % 500 == 0 and i > 0:
            save_model(saver, sess, i)

模組的匯入與儲存

def save_model(saver, sess, step):   # 儲存模組
    saver.save(sess, os.path.join(args.model_dir, "classification"), global_step=step)
def load_model(sess):                # 匯入模組 
    saver = tf.train.Saver()
    checkpoint = tf.train.get_checkpoint_state(args.model_dir)
    if checkpoint and checkpoint.model_checkpoint_path:
        saver.restore(sess, checkpoint.model_checkpoint_path)
        print("Successfully loaded:", checkpoint.model_checkpoint_path)
    else:
        print("Could not find any old weights!")
    return saver

主函式

def main(_):
    training()
if __name__ == "__main__":
    tf.app.run()

從上往下黏貼就行，貼到IDE下就可以執行，還可以列印損失函式

鬼知道為什麼下降這麼快，，，

非常精簡的Mnist分類，基於tensorflow框架

一、介紹基於tensorflow框架實現的Mnist資料分類。程式碼主要包括網路結構的搭建，訓練超引數的匯入和儲存，損失函式地繪製等。不足之處是在網路結尾沒用使用softmax函式，而直接使用了tanh輸出了分類結果。下面請看程式碼的詳細介紹二、程式

大資料下基於Tensorflow框架的深度學習示例教程

近幾年，資訊時代的快速發展產生了海量資料，誕生了無數前沿的大資料技術與應用。在當今大資料時代的產業界，商業決策日益基於資料的分析作出。當資料膨脹到一定規模時，基於機器學習對海量複雜資料的分析更能產生較好的價值，而深度學習在大資料場景下更能揭示資料內部的邏輯關係。本文就以大資料作為場景，通過自底向上的

1.CNN圖片單標籤分類（基於TensorFlow實現基礎VGG16網路）

本文所使用的開源資料集（kaggle貓狗大戰）： www.kaggle.com/c/dogs-vs-c… 國內百度網盤下載地址： pan.baidu.com/s/12ab32UNY… 利用本文程式碼訓練並生成的模型（對應專案中的model資料夾）： pan.baidu.com/s/1tBkVQKoH

2.CNN圖片多標籤分類（基於TensorFlow實現驗證碼識別OCR）

上一篇實現了圖片CNN單標籤分類（貓狗圖片分類任務）地址：juejin.im/post/5c0739… 預告：下一篇用LSTM+CTC實現不定長文字的OCR，本質上是一種不固定標籤個數的多標籤分類問題本文所用到的10w驗證碼資料集百度網盤下載地址（也可使用下文程式碼自行生成）： pan.baidu

python進行文字分類，基於word2vec,sklearn-svm對微博垃圾評論分類

差不多一年前的第一個分類任務，記錄一下語料庫是關於微博的垃圾使用者評論，分為兩類，分別在normal,和spam資料夾下。裡面是很多個txt檔案，一個txt是一條使用者評論。一、進行分詞利用Jieba分詞和去除停用詞（這裡我用的是全模式分詞），每一篇文件為一行

php簡單圖片壓縮，基於laravel框架的原生處理

if($image->getClientMimeType() == "image/png"){//圖片格式$src = @imagecreatefrompng ($image->getRealPath()); //建立畫布，從快取檔案路徑載入圖片list($wi

python進行文字分類，基於word2vec,sklearn-svm對微博性別分類

第一個分類任務，記錄一下語料庫下載一、進行手工分類導師給的資料是兩個資料夾，一個包含了以使用者ID名為標題的一大堆txt（未分類），還有一個資料夾裡面是已經分類好的男女性別ID的集合txt。先要做的任務就是將未分類的txt分成兩類（根據給

基於opencv分類（基於TensorFlow 的訓練模型inception_v1）

#include<opencv2\opencv.hpp> #include <opencv2\dnn.hpp> using namespace std; using namespace cv; using namespace cv::dnn; stri

cnn、rnn實現中文文字分類（基於tensorflow）

tensorflow版本： In[33]: tf.__version__Out[33]:'1.2.1' 首先是資料獲取： curl -O "ht

谷歌開源基於TensorFlow的通用框架AdaNet，快速且易於使用

Ensemble learning結合不同機器學習模型預測，被廣泛用於神經網路以實現最先進的效能，得益於豐富的歷史和理論保證，成功的挑戰，如Netflix獎和各種Kaggle競賽。然而，由於訓練時間長，它們在實踐中使用不多，機器學習模型候選者選擇需要其自己的領域專業知識。但隨著計算能力和專用深

基於TensorFlow的K近鄰（KNN）分類器實現——以MNIST為例

KNN分類原理 TF的KNN程式碼 def load_mnist_data(filename,isbatch=0,train_nums=1000,test_nums=200): from tensorflow.examples.

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

企業級搜尋系統案例原始碼（已經非常精簡），根據現公司專案搭建，基於 elasticsearch + canal，可支援千萬量級以上實時搜尋。

一、準備工作： IDEA：略 JDK1.8: 略 mysql資料庫：略安裝完mysql資料庫後，把bin_log設定開啟，如果不確定是否已經開啟，可執行 show variables like ‘log_bin%’; 如果顯示如下，那說明

基於TensorFlow的最近鄰（NN）分類器——以MNIST識別為例

一、最近鄰分類理論二、TF在CPU上實現NN分類具體程式碼如下： import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data

程式碼，邏輯迴歸(logistic_regression)實現mnist分類（TensorFlow實現）

#logistic_regression by ffzhang import os os.environ['TF_CPP_MIN_LOG_LEVEL']='2' os.environ["CUDA_VISIBLE_DEVICES"]='2' import num

PHP.32-TP框架商城應用實例-後臺10-商品分類-需求分析、創建無限級商品分類，遞歸

創建 efault inno use creat -a his ati ida 商品管理需求分析 1、實現商品無限級分類管理【類似京東三級分類】 2、添加商品時要指定商品屬於一個主分類和多個擴展分類【擴展分類可以是其他主分類】 3、商品列表中可以根據分類搜索商品 a)　　搜

ThinkPHP框架，按分類，計算商品價格區間，來完成價格搜索

_id pricedata explode eid blog class light price think //取出分類下的篩選屬性 $cateId=I(‘get.cid‘); /********計算這個分類下商品的七個價格區間的範圍******/

Tensorflow框架初嘗試————搭建卷積神經網絡做MNIST問題

過擬合 dict cast 官方文檔 float hot blog next 神經網絡 Tensorflow是一個非常好用的deep learning框架學完了cs231n，大概就可以寫一個CNN做一下MNIST了 tensorflow具體原理可以參見它的官方文檔然後C

人工智能 tensorflow框架-->MNIST手寫字符數據集 06

推廣 x文件數據集 2.4 mage esx cnblogs -i 向量空間 1.下載MNIST數據集： 2.1數據集分成兩部分：60000行的訓練集 trainxxx （包含手寫數字的圖片imagexxx 和手寫數字對應的標簽labelxxx）

使用 Go 語言開發大型 MMORPG 遊戲服務器怎麽樣？（非常穩定、捕獲所有異常、非常適合從頭開始，但大公司已經有現成的C++框架、所以不會使用）

hive 有效筆記序列優勢 nal 授權登陸 RR 使用 Go 語言開發大型 MMORPG 遊戲服務器怎麽樣？和C Socket服務器比起來有什麽優劣？可行性怎麽樣？從2013年起,經朋友推薦開始用Golang編寫遊戲登陸服務器, 配合C++做第三方平臺

非常精簡的Mnist分類，基於tensorflow框架

一、介紹

二、程式碼

相關推薦