淺談TF的共享變數

阿新 • • 發佈：2018-12-01

先說說為什麼需要共享變數。
我們在訓練模型的時候，需要一次次的輸入訓練資料，網路的權重和偏執在一次次的迭代過程中，不斷地修正自身的值，這個迭代過程，我們通常的程式設計思路是這麼做：
conver1_weight=tf.xxx(conver1_weight,…)
我們從兩個方面考慮這麼做的後果：
1，迭代過程被封裝在自己編寫的函式內部（考慮到模組化或者程式碼易讀性需要這麼做），那麼在函式內部的這個變數就是區域性變數，無法影響函式外部的conver1_weight的值，當然我們可以將conver1_weight設定為全域性變數。比如下面的例子：

import tensorflow as 
 tf
import numpy as np
global_var=tf.Variable(tf.constant(0.5))
def change_global_var():
    global global_var
    global_var=tf.add(global_var,0.4)
    return global_var
sess=tf.Session()
init=tf.global_variables_initializer()
sess.run(init)
print("global_var=",sess.run(global_var))
tmp=change_global_var( 
)
print("after add,global_var=",sess.run(global_var))

但是，這麼做會破會工程的封裝性，沒錯，就是這個cao蛋的理由，也是設計和使用共享變數的理由之一，雖然它看起來比什麼共享變數更簡單直觀易用。
這麼做的另一個缺點，和我們說的第二條缺點一樣。接著看：
2.神經網路很少是簡單的，主要是反映在節點的數量和訓練資料的量上。設想我們有一個3層，每層100個節點的網路，而且有10000條訓練資料。這樣的話，就有兩個100x100的方陣資料，每訓練一次，產生一個這樣的資料集（conver1_weight=tf.xxx(conver1_weight,…)會產生一個新的conver1_weight，name和原先的cover1_weight不一樣，大家可以編寫簡單程式碼測試），這時候產生的訓練變數有多少？1000x100x100，而且這還是隻有一個weight引數，加上bias呢？或者如果這是一個複雜的神經網路，有上億個神經元的時候呢？消耗的記憶體無疑是驚人的。怎麼處理這個問題呢？TF的設計者想出了共享變數這個點子，核心思想就是：如果根據name可知該變數存在，那麼使用該變數的值運算，不再建立新的tensor變數。
共享變數的宣告、建立和使用不復雜。下面說明：
第一次宣告共享變數，需要在tf.variable_scope中宣告，指明該共享變數的作用域，類似於其他語言的宣告一個靜態的類成員，該成員只能在類範圍內共享

[程式碼段1]
with tf.variable_scope("scope1"):
    get_var1=tf.get_variable("firstvar",[1],initializer=tf.constant_initializer(0.3))

如果程式的其他地方需要用到這個共享變數，那麼，也要宣告這段程式和變數屬於上面宣告的作用域scope1，並且宣告引數reuse=True，這時候，才可以用tf.get_variable()來取得該變數。格式如下：

[程式碼段2]
with tf.variable_scope("scope1",reuse=True):
    get_var3=tf.get_variable("firstvar",[1],initializer=tf.constant_initializer(0.5))

此時，在scope1中不能再用get_variable建立或取得[程式碼段1]沒有的額變數，否則會提示錯誤：Variable scope1/firstvar2 does not exist, or was not created with tf.get_variable(). Did you mean to set reuse=tf.AUTO_REUSE in VarScope?
get_variable會從系統維護的變數列表中查詢name為firstvar的變數，並用get_var3指向該變數，並不會建立新name的新變數（和程式碼1中不一樣，程式碼1中，如果沒有該name的變數，則建立一個）。
當然：resuse=tf.AUTO_REUSE更方便，可以實現第一次reuse=False，第二次自動為True。
完整的簡單演示程式碼如下：

import tensorflow as tf
with tf.variable_scope("scope1"):
    get_var1=tf.get_variable("firstvar",[1],initializer=tf.constant_initializer(0.3))
    print("get_var1:",get_var1.name)
with tf.variable_scope("scope2"):
    get_var2=tf.get_variable("firstvar",[1],initializer=tf.constant_initializer(0.4))
    print("get_var2:",get_var2.name)
with tf.variable_scope("scope1",reuse=True):
    get_var3=tf.get_variable("firstvar",[1],initializer=tf.constant_initializer(0.5))
    print("get_var3:",get_var3.name)    
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print("get_var1=",get_var1.eval())
    print("get_var2=",get_var2.eval())
    print("get_var3=",get_var3.eval())

點選這裡執行

淺談TF的共享變數

先說說為什麼需要共享變數。我們在訓練模型的時候，需要一次次的輸入訓練資料，網路的權重和偏執在一次次的迭代過程中，不斷地修正自身的值，這個迭代過程，我們通常的程式設計思路是這麼做： conver1_weight=tf.xxx(conver1_weight,…) 我們從兩個方面考慮這麼做的後果

淺談class私有變數

class的前世今生在 es6 之前，雖然 JS 和 Java 同樣都是 OOP （面向物件）語言，但是在 JS 中，只有物件而沒有類的概念。在 JS 中，生成例項物件的傳統方法是通過建構函式，如下所示： function A (x) { this.x = x } // 在原型鏈上掛載原型

Bugku-變數1之淺談超全域性變數 $GLOBALS

Bugku 變數一連結：http://120.24.86.145:8004/index1.php 程式碼審計代表關閉報錯提示包含檔案 flag1.php 對檔案進行語法高亮顯示條件判斷 get方法

淺談文檔協作在工程設計中的應用——共享excel計算書

文檔協作 engineercms 計算書 web開發我們設計過程中大量采用excel計算書，因為很多經典的計算都可以用excel解決，最最基本的就是工程量計算啦。稍微復雜的比如鋼管計算，埋地鋼管結構計算，頂管計算，水力學計算，波浪爬高計算，堤防高程計算，擋土墻穩定計算，溢洪道計算，水閘消能計

淺談變數交換

如何交換兩個整型變數的內容呢？我給出三種方法與大家分享。方法一：三變數法 #define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> #include<windows.h> int main() { i

淺談js變數宣告

----淺談js變數宣告或者確切地說應該是變數宣告以及與之相關的一些東西。這裡只談四種宣告方式（var,function,let,const），其它的宣告方式以後有接觸再更新。 ‘var’ VS ‘let’ var貌似是最常用的，在ES6還沒出來的時候只能用v

淺談Flask 中的執行緒區域性變數 request 原理

在多執行緒伺服器中客戶端每建立一個連結，伺服器就建立一個執行緒，每個執行緒中就會有一個request來表示客戶端的連結請求資訊。不同的使用者訪問flask伺服器.都有自己的request. 使用者A------------執行緒A-------------> request

淺談Spring依賴注入靜態成員變數

Spring的依賴注入是基於bean物件注入屬性;如果在一個類中定義了一個static修飾的成員變數,那麼這個變數就是屬於類的,無法完成依賴注入 eg: 假設在xml配置檔案已經配置了SolrTemplate物件 @Autowired private stat

淺談final修飾的變數

一直大概的知道final關鍵字的作用，但是自己實際工作中卻很少用，除非在宣告一些常量值的時候，今天忽然自己在專案中用一個map進行儲存一些值。一開始我只是用private修飾的，心裡想的是如果final修飾的話，應該不能修改了。畢竟被final修飾的變數不可變。今天回家後，做了下面的嘗試，徹底暴露出自己基礎

淺談變數型別之外的變數命名

在程式設計實踐中定義變數時，我們所能控制的無非兩點：變數型別與變數名。某種程度上，這兩者分別考驗的其實是開發者的數學水平與語文水平。在今天，即便已經有了非常高大上的型別系統，「名不副實」的變數名仍然經常能對開發者造成困擾。那麼，我們有什麼理論能用來指導變數命名呢？在電腦科學的萌芽時代，變數名和變數型別之間

【轉載】淺談JavaScript，let和var定義變數的區別

瞭解JS與ES5與ES6區別 JS語言 JavaScript一種動態型別、弱型別、基於原型的客戶端指令碼語言，用來給HTML網頁增加動態功能。動態：在執行時確定資料型別。變數使用之前不需要型別宣告，通常變數的型別是被賦值的那個值的型別。弱類：計算時可以不同型別之間對使用者透明地

淺談作用域、變數提升、閉包與遞迴

前提： 1.函式想要執行，就必須知道自身變數以及自身變數所在作用域中的位置。 2.函式的執行取決於函式定義時所在的作用域，不取決於呼叫時的作用域。 3.函式在作用域鏈中的變數訪問遵循向上查詢。（一）所謂作用域：變數的作用範圍。 1.在全域性宣告的變數具有全域性作用域。

淺談前後端分離中的跨資源共享（CORS）

簡介當下無論大廠小廠的前後端開發模式都是前後端分離。以前遇到通過jsonp解決跨域的方式也漸漸的淡出的工程中（不瞭解jsonp的可以看JSONP跨域請求+簡答實現百度搜索）。當前端請求一個介面的時候就會引起跨域，但是當下的前端構建工具都有相應的解決方案，比如webpack中web-dev-server這個

淺談ArcGIS移動開發中的基本變數（1）：MapView、Map、Layers、GraphicsOverlay

一、MapView 二、Map Map，程式設計中即ArcGISMap，可譯為地圖物件，主要用來承載地圖資料，ArcGISMap包含製圖資料圖層以及其它能夠定義地圖資訊的資料(例如basemaps底圖、popups彈出視窗、renderer渲染

淺談linux中shell變數$#,[email protected],$0,$1,$2,$?的含義解釋

淺談linux中shell變數$#,[email protected],$0,$1,$2,$?的含義解釋下面小編就為大家帶來一篇淺談linux中shell變數$#,[email protected],$0,$1,$2的含義解釋。小編覺得挺不錯的，現在就分享給大家，

淺談TF的共享變數

淺談TF的共享變數

淺談class私有變數

Bugku-變數1之淺談超全域性變數 $GLOBALS

淺談文檔協作在工程設計中的應用——共享excel計算書

淺談變數交換

淺談js變數宣告

淺談Flask 中的執行緒區域性變數 request 原理

淺談Spring依賴注入靜態成員變數

淺談final修飾的變數

淺談變數型別之外的變數命名

【轉載】淺談JavaScript，let和var定義變數的區別

淺談作用域、變數提升、閉包與遞迴

淺談前後端分離中的跨資源共享（CORS）

淺談ArcGIS移動開發中的基本變數（1）：MapView、Map、Layers、GraphicsOverlay

淺談linux中shell變數$#,[email protected],$0,$1,$2,$?的含義解釋

Java 常量與變數淺談

淺談JavaScript中3種變數定義方式

淺談C中靜態變數與全域性變數初始化時間

淺談cursor_sharing取值對SQL共享的影響（下）

淺談批處理for命令中的變數擴充套件

淺談TF的共享變數

相關推薦

淺談linux中shell變數$#,[email protected],$0,$1,$2,$?的含義解釋