Tensorflow 如何避開全連線層

阿新 • • 發佈：2019-02-12

1、cnn+rnn

#!/usr/bin/python3
# -*- coding:utf-8 -*-
import tensorflow as tf
import numpy as np
# from tensorflow.contrib.layers.python.layers import batch_norm
from tensorflow.contrib import rnn
from tensorflow.examples.tutorials.mnist import input_data
# from tensorflow.python.framework import ops

# ops.reset_default_graph() 

"""
rnn+cnn
"""
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

# 定義一些引數
batch_size = 128
droup_out = 0.7
learn_rate = 0.001
num_steps = 100000
disp_step = 2000

n_input = 28
n_steps = 28
n_hidden = 128
n_classes = 10

with tf.Graph().as_default() as graph:
    # mnist影象大小是28x28 分成0~9 共10類
    x=tf.placeholder(tf.float32,[None 
,n_steps*n_input])
    y_=tf.placeholder(tf.float32,[None,n_classes])
    keep=tf.placeholder(tf.float32)

    x_img=tf.reshape(x,[-1,n_steps,n_input,1])

    w1=tf.Variable(tf.random_normal([3,3,1,16]))
    b1=tf.Variable(tf.random_normal([16]))

    x_img=tf.nn.conv2d(x_img,w1,[1,1,1,1],padding="SAME" 
)
    x_img=tf.nn.relu(tf.nn.bias_add(x_img,b1))
    x_img=tf.nn.max_pool(x_img,[1,2,2,1],[1,2,2,1],padding="SAME") #[n,14,14,16]

    x_img=tf.reshape(x_img,[-1,n_steps//2,14*16])

    x_img=tf.unstack(x_img,n_steps//2,1) # 按時間序列，即第二維將[N,n_steps, n_input] 拆分成 14[N,14*16]序列 ，資料型別 list

    lstm_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)

    # 加入多層rnn核
    lstm_cell = rnn.MultiRNNCell([lstm_cell] * 1, state_is_tuple=True)
    lstm_cell = rnn.MultiRNNCell([lstm_cell] * 1, state_is_tuple=True)
    lstm_cell = rnn.MultiRNNCell([lstm_cell] * 1, state_is_tuple=True)
    # Get lstm cell output
    outputs, states = rnn.static_rnn(lstm_cell, x_img, dtype=tf.float32)

    with tf.variable_scope('output') as scope:
        w=tf.get_variable('w',[n_hidden,n_classes],tf.float32,initializer=tf.random_uniform_initializer)*0.001
        b=tf.Variable(tf.random_normal([n_classes])+0.001)
    y=tf.nn.softmax(tf.matmul(outputs[-1], w) + b)


    loss=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_,logits=y))

    train_op=tf.train.AdamOptimizer(learn_rate).minimize(loss)

    correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
    # Calculate accuracy
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

sess=tf.InteractiveSession(graph=graph)

tf.global_variables_initializer().run()

for step in range(num_steps):
    batch_xs, batch_ys = mnist.train.next_batch(batch_size)
    train_op.run({x:batch_xs,y_:batch_ys,keep:droup_out})
    if step % disp_step==0:
        print("step",step,'acc',accuracy.eval({x:batch_xs,y_:batch_ys,keep:droup_out}),
              'loss',loss.eval({x:batch_xs,y_:batch_ys,keep:droup_out}))

# test acc
print('test acc',accuracy.eval({x:mnist.test.images,y_:mnist.test.labels,keep:1.}))

sess.close()

2、CNN（無全連線層）

#!/usr/bin/python3
# -*- coding:utf-8 -*-
import tensorflow as tf
import numpy as np
# from tensorflow.contrib.layers.python.layers import batch_norm
from tensorflow.contrib import rnn
from tensorflow.examples.tutorials.mnist import input_data
# from tensorflow.python.framework import ops

# ops.reset_default_graph()
"""
rnn+cnn
"""
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

# 定義一些引數
batch_size = 128
droup_out = 0.7
learn_rate = 0.001
num_steps = 100000
disp_step = 2000

img_size=28
n_classes = 10

with tf.Graph().as_default() as graph:
    # mnist影象大小是28x28 分成0~9 共10類
    x=tf.placeholder(tf.float32,[None,img_size*img_size])
    y_=tf.placeholder(tf.float32,[None,n_classes])
    keep=tf.placeholder(tf.float32)

    x_img=tf.reshape(x,[-1,img_size,img_size,1])

    w1=tf.Variable(tf.random_normal([3,3,1,16]))
    b1=tf.Variable(tf.random_normal([16]))
    conv1=tf.nn.conv2d(x_img,w1,[1,1,1,1],padding="SAME")
    conv1=tf.nn.relu(tf.nn.bias_add(conv1,b1))
    conv1=tf.nn.max_pool(conv1,[1,2,2,1],[1,2,2,1],padding="SAME") #[n,14,14,16]
    conv1=tf.nn.dropout(conv1,keep)

    w2 = tf.Variable(tf.random_normal([3, 3, 16, 32]))
    b2 = tf.Variable(tf.random_normal([32]))
    conv2 = tf.nn.conv2d(conv1, w2, [1, 1, 1, 1], padding="SAME")
    conv2 = tf.nn.relu(tf.nn.bias_add(conv2, b2))
    conv2 = tf.nn.max_pool(conv2, [1, 2, 2, 1], [1, 2, 2, 1], padding="SAME")  # [n,7,7,32]
    conv2 = tf.nn.dropout(conv2, keep)

    w3 = tf.Variable(tf.random_normal([3, 3, 32, 64]))
    b3 = tf.Variable(tf.random_normal([64]))
    conv3 = tf.nn.conv2d(conv2, w3, [1, 1, 1, 1], padding="SAME")
    conv3 = tf.nn.relu(tf.nn.bias_add(conv3, b3))
    conv3 = tf.nn.max_pool(conv3, [1, 2, 2, 1], [1, 2, 2, 1], padding="VALID")  # [n,3,3,64]
    conv3 = tf.nn.dropout(conv3, keep)

    w4 = tf.Variable(tf.random_normal([3, 3, 64, n_classes]))
    b4 = tf.Variable(tf.random_normal([n_classes]))
    conv4 = tf.nn.conv2d(conv3, w4, [1, 1, 1, 1], padding="SAME")
    conv4 = tf.nn.relu(tf.nn.bias_add(conv4, b4))
    conv4 = tf.nn.max_pool(conv4, [1, 2, 2, 1], [1, 2, 2, 1], padding="VALID")  # [n,1,1,10]

    y=tf.reshape(conv4,[-1,n_classes])


    loss=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_,logits=y))

    train_op=tf.train.AdamOptimizer(learn_rate).minimize(loss)

    correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
    # Calculate accuracy
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

sess=tf.InteractiveSession(graph=graph)

tf.global_variables_initializer().run()

for step in range(num_steps):
    batch_xs, batch_ys = mnist.train.next_batch(batch_size)
    train_op.run({x:batch_xs,y_:batch_ys,keep:droup_out})
    if step % disp_step==0:
        print("step",step,'acc',accuracy.eval({x:batch_xs,y_:batch_ys,keep:droup_out}),
              'loss',loss.eval({x:batch_xs,y_:batch_ys,keep:droup_out}))

# test acc
print('test acc',accuracy.eval({x:mnist.test.images,y_:mnist.test.labels,keep:1.}))

sess.close()

Tensorflow 如何避開全連線層

1、cnn+rnn #!/usr/bin/python3 # -*- coding:utf-8 -*- import tensorflow as tf import numpy as np # from tensorflow.contrib.laye

tensorflow 新增一個全連線層

對於一個全連線層，tensorflow都為我們封裝好了。使用：tf.layers.dense() 1 tf.layers.dense( 2 inputs, 3 units, 4 activation=None, 5 use_bias=True, 6

利用tensorflow實現神經網路卷積層、池化層、全連線層

第一步：匯入相應的庫import tensorflow as tf import numpy as np12第二步：準備資料（隨機生成一維資料）data_size=25 x_data=np.random.normal(size=data_size) x_input_1d=

Tensorflow--MNIST手寫資料集全連線層分類

手寫資料集分類一般都被用來當做tensorflow入門的教程。當然啦，神經網路一般分為全連線層（FC），卷積層（CNN）和序列模型（RNN），這裡先用全連線層做一個分類。我就把之前寫的程式碼貼上來吧。 # 用tensorflow 匯入資料 from tensorflow

ROIPooling的意義？全連線層輸入需要固定尺度？全連線層的實現？為什麼需要兩個全連線層？

ROIPooling的作用，就是resize到統一尺寸，這樣才能利用預訓練的全連線層引數，大多是7*7大小，這是因為全連結層需要固定的輸入尺寸.那麼為什麼需要固定尺寸呢？全連線層的計算其實相當於輸入的特徵圖資料矩陣和全連線層權值矩陣進行內積以vgg16,512*7*7

Caffe 全連線層

深度學習筆記（6）全連線層的實現：全連線層的每一個結點都與上一層的所有結點相連，用來把前邊提取到的特徵綜合起來。由於其全相連的特性，一般全連線層的引數也是最多的。全連線層的前向計算下圖中連線最密集的2個地方就是全連線層，這很明顯的可以看出全連線層的引數的確很多。在前向計算過程，也就是一個

為什麼目標檢測中要將全連線層轉化為卷積層？

參考文章： VGG網路中測試時為什麼全連結層改成卷積層為什麼使用卷積層替代CNN末尾的全連線層首先看一下卷積層的特點：區域性連線：提取資料區域性特徵，比如卷積核的感受野權值共享：一個卷積核只需提取一個特徵，降低了網路訓練的難度究竟使用卷積層代替全連線層會帶來什麼好處呢？

Global Average Pooling 對全連線層的可替代性

reference：https://blog.csdn.net/williamyi96/article/details/77530995 Golbal Average Pooling 第一次出現在論文Network in Network中，後來又很多工作延續使用了GAP

CNN卷積層到全連線層的輸入格式變換錯誤 tf.reshape()和slim.flatten()

TypeError: Failed to convert object of type < type ‘list’>to Tensor. Contents: [None, 9216]. Consider casting elements to a supported type.

為什麼要將全連線層轉化為卷積層

轉自：https://www.cnblogs.com/liuzhan709/p/9356960.html 理解為什麼要將全連線層轉化為卷積層 1.全連線層可以視作一種特殊的卷積考慮下面兩種情況：特徵圖和全連線層相連，AlexNet經過五次池化後得到7*7*512的特徵圖，下

[Object Detection]關於“在預訓練網路中增加捲積和全連線層可以改善效能”

Yolo論文裡提到"Ren et al. show that adding both convolutional and connected layers to pretrained networks can improve performance [28]." [28] S. Ren, K. He, R.

對CNN網路全連線層的一些理解

CNN網路的全連線層一般包含兩個部分：線性運算部分：完成線性變換的工作，將輸入經過線性變換轉換成輸出。非線性運算部分（以下簡稱非線性部分）：緊接著線性部分，完成非線性變換。線性運算部分的作用：線性部分從運算過程上看就是線性變換，對於一個輸入向量，線性部分的輸出向量是，線

【深度學習筆記】關於卷積層、池化層、全連線層簡單的比較

卷積層池化層全連線層功能提取特徵壓縮特徵圖，提取主要特徵將學到的“分散式特徵表示”對映到樣本標記空間操作可看這個的動態圖，可惜是二維的。對於三維資料比如RGB影象（3通道），卷積核的深度必須

keras呼叫自己訓練的模型，並去掉全連線層

其實很簡單 from keras.models import load_model base_model = load_model('model_resenet.h5')#載入指定的模型 print(base_model.summary())#輸出網路的結構圖

caffe學習筆記31-理解全連線層

理解全連線層：連線層實際就是卷積核大小為上層特徵大小的卷積運算，卷積後的結果為一個節點，就對應全連線層的一個點。（理解）假設最後一個卷積層的輸出為7×7×512，連線此卷積層的全連線層為1×1×4096。如果將這個全連線層轉化為卷積層：1.共有4096組濾波器2.每組濾

caffe詳解之全連線層

全連線層引數說明全連線層，輸出的是一個一維向量,引數跟卷積層一樣。一般將全連線置於卷積神經網路的後幾層。權重值的初始化採用xavier,偏置初始化為0.layer { name: "ip1" type: "InnerProduct" #全連線層 bottom: "poo

Keras —— 基於Vgg16模型（含全連線層）的圖片識別

一、載入並顯示圖片 img_path = 'elephant.jpg' img = image.load_img(img_path, target_size=(224, 224)) plt.ims

CNN中全連線層是什麼樣的？

名稱：全連線。意思就是輸出層的神經元和輸入層的每個神經元都連線。例子： AlexNet 網路中第一個全連線層是這樣的： layer { name: "fc6" type: "InnerProduct" bottom: "pool5" top:"fc6"

解釋一下全連線層&CNN中全連線層是什麼樣的

(名稱：全連線。意思就是輸出層的神經元和輸入層的每個神經元都連線)在卷積神經網路的最後，往往會出現一兩層全連線層，全連線一般會把卷積輸出的二維特徵圖轉化成一維的一個向量，這是怎麼來的呢？目的何在呢？舉個例子：最後的兩列小圓球就是兩個全連線層，在最後一層卷積結束後，進行了最後一

Keras —— 基於InceptionV3模型（不含全連線層）的遷移學習應用

一、ImageDataGenerator def image_preprocess(): # 　訓練集的圖片生成器，通過引數的設定進行資料擴增 train_datagen = ImageDataGenerator( prep

Tensorflow 如何避開全連線層

1、cnn+rnn

2、CNN（無全連線層）

相關推薦