tf 重要用法及概念

阿新 • • 發佈：2018-11-13

tf模型procedure

選擇graph（非必須）

>>> graph = tf.Graph()
>>> with graph.as_default():

構建graph：batch/label, tf.placeholder()
構建graph：NN structures，weight/bias/logits/activations
構建graph：loss function
構建graph：optimizer
構建graph：變數初始化，通常tf.global_variables_initializer()

session初始化，常用with語句
run變數，sess.run(init)或init.run()
batch generating，用loop
sess.run(loss&optimizer)，需要feed_dict喂入9中資料
assessment，關鍵指標eval()和展示

tf.gfile.GFile()

類似於普通python之open()的命令，將返回一個檔案操作控制代碼。

def read_words(filename):
    with tf.gfile.GFile(filename, 'r') as f:
        return 
 f.read().replace('\n', '<eos>').split()

tf.convert_to_tensor(data)

將給定的list或array轉換為tf的tensor物件。

>>> data = tf.convert_to_tensor([1,2,3])
<tf.Tensor 'Const:0' shape=(3,) dtype=int32>

tf.size(data)

返回data中全部元素的數量的tensor，注意返回的數量是全部元素，而不是len(data)

>>> tf.size( 
tf.convert_to_tensor([[1,2,3],[2,3,4]]))
<tf.Tensor 'Size_4:0' shape=() dtype=int32>
>>> sess=tf.Session()
>>> sess.run(tf.size(tf.convert_to_tensor([[1,2,3],[2,3,4]])))
6

tf.reshape(data, shape)

tf下面類似於np.reshape的函式，推斷維度時用-1

>>> sess=tf.Session()
>>> sess.run(tf.reshape([1,2,3,4],[-1,2]))
array([[1, 2],
       [3, 4]])

tf.one_hot(indices, length)

根據indices生成one_hot形式的tensor，length為每個one-hot vector的長度，即最後一個axis的長度

>>> sess=tf.Session()
>>> a=tf.one_hot([1,2,4],5)
>>> sess.run(a)
array([[0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 1.]], dtype=float32)
>>> b=tf.one_hot([[1,2,5],[3,4,6]],7)
>>> sess.run(b)
array([[[0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0.]],
       [[0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1.]]], dtype=float32)

tf.placeholder(dtype,shape)

類似於不需要進行初始化的tf變數，因為有的時候我們在宣告變數的時候無法明確其初始值。其也稱為佔位符。我們只需要明確其型別和形狀即可。形狀表示中可用None進行推斷，推斷時需要注意非None維度的匹配，否則會報錯，None推斷通常是對應於訓練batch中的batch長度。由於佔位符沒有初始值，因此在run的時候，我們需要給其“喂值”，即使用feed_dict.

>>> b = tf.placeholder(tf.float32, [None, 1])
>>> a = np.random.randint(0,5,(6,1))
>>> a
array([[1],
       [2],
       [3],
       [4],
       [3],
       [0]])
>>> sess = tf.Session()
>>> sess.run(b, feed_dict={b: a})
array([[1.],
       [2.],
       [3.],
       [4.],
       [3.],
       [0.]], dtype=float32)

tf.constant(value,dtype,shape)

生成一個給定值的張量常量。

>>> tf.constant([[1, 2, 3], [4, 5, 6]],tf.int32,[2,3])
<tf.Tensor 'Const:0' shape=(2, 3) dtype=int32>
>>> c=tf.constant([[1, 2, 3], [4, 5, 6]],tf.int32,[2,3])
>>> tf.Session().run(c)
array([[1, 2, 3],
       [4, 5, 6]])

tf.Variable(value,name=None)

tf張量變數，注意由於需要明確初始化數值，因此不需要設定形狀引數，名字可有可無。

>>> a
array([0, 0, 4, 1, 4, 1])
>>> tf.Variable(a)
<tf.Variable 'Variable:0' shape=(6,) dtype=int32_ref>

tf math operations

>>> d = tf.add(b, c, name='d')
>>> a = tf.multiply(d, e, name='a')
>>> c = tf.log(5.0)

tf.reduce_mean(data,axis=0)

等同於np.mean，即tf的求均值函式。這裡的reduce源於functional programming概念中的reduce paradigm，可忽略。

tf.reduce_sum(data,axis=0)

等同於np.sum，即tf的求和函式。這裡的reduce源於functional programming概念中的reduce paradigm，可忽略。

tf.global_variables_initializer()

初始化全部模型引數

>>> init_op = tf.global_variables_initializer()
>>> sess = tf.Session()
>>> sess.run(init_op)

也可以寫為init_op.run()

tf.Session().run(list,feed_dict)

tf張量和模型必須要在Session中run後才會真的進行計算和生成值，因此素有tf深度學習模型中必須有Session()和run()步驟。
tf的session在run的過程中，我們不需要去明確的run每一個操作，因為tf會根據圖的結構自己尋找每步操所所依賴的前提變數或操作，然後自動run這些前提變數或操作。注意，如存在佔位符變數，我們需要在run時喂入資料。

>>> sess = tf.Session()
>>> out = sess.run(a, feed_dict={b: np.arange(0, 10)[:, np.newaxis]})

另外，run將計算list中的全部目標值，返回相應數量的計算結果。

a, c = sess.run([optimiser, cross_entropy], 
                         feed_dict={x: batch_x, y: batch_y})

tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32)

取正態分佈數值

>>> a = tf.random_normal([2,3])
>>> sess = tf.Session()
>>> sess.run(a)
array([[-0.25265786, -1.6633197 ,  0.71720666],
       [-0.12861042,  0.9900551 , -0.04970803]], dtype=float32)

tf.nn.relu(value)

rectified linear unit activation function，將大於0的數保持不變，小於0的數置為0

>>> sess = tf.Session()
>>> sess.run(tf.nn.relu([-5,1,3]))
array([0, 1, 3])

tf.nn.softmax(logits)

對logits內全部要素進行exp函式加權，注意logits必須為float，可以將其理解為每層layer的net input，即輸入與權重相乘並加如bias後的值。

>>> import numpy as np
>>> aa = tf.nn.softmax([1.0,2.0,3.0])
>>> sess = tf.Session()
>>> sess.run(aa)
array([0.09003057, 0.24472848, 0.66524094], dtype=float32)
>>> a1,a2,a3 = np.exp(1),np.exp(2),np.exp(3)
>>> a4 = a1+a2+a3
>>> a1/a4
0.09003057317038046
>>> a2/a4
0.24472847105479767
>>> a3/a4
0.6652409557748219

tf.clip_by_value(data,min,max)

把data中的每一個元素的值都壓縮在min和max之間。小於min的讓它等於min，大於max的元素的值等於max

>>> sess=tf.Session()
>>> sess.run(tf.clip_by_value([1,3,5,7,9],3,7))
array([3, 3, 5, 7, 7])

tf.nn.softmax_cross_entropy_with_logits(labels,logits)

softmax在深度學習分類問題中通常作為輸出層的activation function，以此將輸出層的net input，即logits轉換為概率輸出。tf的softmax_cross_entropy函式的功能就是在輸出層整合softmax啟用函式以及cross_entropy熵或純度評估函式，從而直接輸出層的logits進行準確度評估。基本的思路就是先對logits進行softmax處理，從而生成各分類的概率評估：
$S_j=\cfrac{e^{a_j}}{\sum_{k=1} ^T e^{a_k}}$
而後根據各分類的概率評估以及各分類的實際值，進行cross entropy計算：
$L=-\sum\limits^{T}_{j=1} y_j \cdot ln(s_j)$
程式碼如下：

>>> labels = [1.0,1.0,0,0]
>>> logits = [1.0,2.0,5.0,3.0]
>>> sess = tf.Session()
>>> sess.run(tf.nn.softmax_cross_entropy_with_logits(labels=labels,logits=logits))
7.370365
>>> softmax_list=[np.exp(logits[i]) for i in range(len(logits))]
>>> softmax_list
[2.718281828459045, 7.38905609893065, 148.4131591025766, 20.085536923187668]
>>> softmax_sum=sum(softmax_list)
>>> softmax_sum
178.60603395315397
>>> softmax=[i/softmax_sum for i in softmax_list]
>>> softmax
[0.015219428864155927, 0.04137069692096015, 0.8309526605439513, 0.11245721367093255]
>>> cross_entropy_list=[-labels[i]*np.log(softmax[i]) for i in range(len(logits))]
>>> sum(cross_entropy_list)
7.370364905207625

可見我們逐項利用logtis計算softmax，而後在用此softmax與真實labels進行cross entropy計算後的得到的值是與直接使用tf中的softmax_cross_entropy_with_logits函式計算出來的值是完全一致的。

tf.train.GradientDescentOptimizer(learning_rate)

gradient descent最優化問題，需輸入learning rate。
.minimize(loss) 根據optimizer物件最小化loss值。

>>> optimiser = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimize(cross_entropy)

tf.argmax(data,axis=0)

返回data中的最大值的索引號，如果是向量，那就返回一個值，如果是矩陣，那就返回一個向量，這個向量的每一個維度都是相對應矩陣行的最大值元素的索引號。axis為取值維度引數。

>>> A = [[1,3,4,5,6]]
>>> B = [[1,3,4], [2,4,1]]
>>> sess.run(tf.argmax(A,0))
array([0, 0, 0, 0, 0], dtype=int64)
&

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    tf 重要用法及概念
       
  
  
 tf模型procedure 
  
  選擇graph（非必須） 
  
 >>> graph = tf.Graph()
>>> with graph.as_default():
 
  
  構建graph：batch/label, tf.placeho 

  
 

    

    
    python 重要用法及概念
       
  
  
 
 
  文章目錄
  
   
    sorted(iterables, key=lambda, reverse=False)
    zip(a, b, ...)
    作用域
    閉包(closure或lexical closure)
    抽象類
   
  
 
  
  

  
 

    

    
    tf.tile()用法及例項
       
 
 tf.tile(  
    input,     #輸入  
    multiples,  #某一維度上覆制的次數  
    name=None  
) 
 例項 
 import tensorflow as tf
a = tf.tile([1,2,3],[2])
b = tf.tile([[ 

  
 

    

    
    tf.reduce_prod用法及tf.placehoder用法
      
                '''
tf.reduce_prod(
    input_tensor,
    axis=None,
    keepdims=None,
    name=None,
    reduction_indices=None,
    keep_dims=None
)

此 

  
 

    

    
    面向對象的一些重要的基本概念
      計算機   簡單   int   overload   其他   style   可擴展   mic   自動   隨著編程經驗的不斷積累，我對編程的理解也在不斷的更新變化，剛開始接觸到的C語言，感覺比較簡單，而且非常有感覺，很有意思，後來是數據結構，然後在學習數據結構的時候了解到編程都有一種非常神秘的算法存 

  
 

    

    
    Linux中yum和apt-get用法及區別
      記錄   auto   yum安裝軟件   mirror   內核   epo   綁定   提示   們的   Linux中yum和apt-get用法及區別
 
一般來說著名的linux系統基本上分兩大類：
 
1.RedHat系列：Redhat、Centos、Fedora等
 
2.Debian系列：De 

  
 

    

    
    iptables 用法及常用模塊總結
      iptables   範圍   著圖   針對   規則   用法   是否   傳輸數據   net   
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
iptables傳輸數據包的過程：
　　1. 當一個數據包進入網卡時，它首先進入PREROUTING鏈，內核根據數據包目的IP判斷是否需 

  
 

    

    
    【轉】event.keyCode用法及列表
      strong   page   ets   cells   不支持   和數   jump   fire   靜音   event.keyCode用法及列表
 


HTML
用戶名：<input type="text" id="UserAccount" onKeyPress="JumpByEnter( 

  
 

    

    
    【Java學習筆記之二十二】解析接口在Java繼承中的用法及實例分析
      ani   復制代碼   ads   compute   現在   target   body   常量   實現接口   一、定義
Java接口（Interface），是一系列方法的聲明，是一些方法特征的集合，一個接口只有方法的特征沒有方法的實現，因此這些方法可以在不同的地方被不同的類實現，而這些實現可以具 

  
 

    

    
    Git(1)：思想及概念
      .com   永久   導致   回來   運算   image   提交   簡單的   設計   Git與其他版本控制軟件的差異及思想
直接記錄快照，而非差異比較
    Git不保存這些前後變化的差異數據。實際上，Git 更像是把變化的文件作快照後，記錄在一個微型的文件系統中。每次提交更新時，它會縱覽一 

  
 

    

    
    軟件系統最重要的一點 - 概念完整性
      理由   良好的   領域   object   .html   解決   軟件開發   修改   都是   《人月神話》中Brooks一直非常強調“概念完整性”對於系統的重要性。十年前看這本書的時候總是覺得不懂，是一種說不清，朦朦朧朧的感覺。
 
【轉載自http://blog.sina.com.cn/s/ 

  
 

    

    
    hash在URL上的用法及作用
      指導   使用方法   發生   show   event   字符串   重載   完全   整理   
閱讀目錄

1. #
2. ？
3. &


回到頂部
1. #
    10年9月，twitter改版。一個顯著變化，就是URL加入了"#!"符號。比如，改版前的用戶主頁網 

  
 

    

    
    安裝軟件包的三種方法、rpm包介紹及工具用法、yum用法及搭建本地倉庫
      安裝軟件包的三種方法、rpm包介紹及工具用法、yum用法及搭建本地倉庫一、安裝軟件包的三種方法rpm工具rpm(Redhat Package Manager)RPM軟件包管理器，是以一種數據庫記錄的方式來將我們所需要的套件安裝到Linux主機的一套管理程序。rpm包是預先在Linux機器上編譯好並打包好的文件 

  
 

    

    
    (轉)輕松掌握shell編程中數組的常見用法及示例
      分享   shell編程   內容   就是   linu   迷糊   常見   /etc/   med   緣起：在老男孩進行linux培訓shell編程教學中，發現不少水平不錯的網友及同學對數組仍然很迷糊，下面就給大家分享下數組的用法小例子，希望能給大家一點幫助。其實SHELL的數組很簡單，好用。我們學 

  
 

    

    
    WordPress分類列表函數:wp_list_categories用法及參數詳解舉例
      array   play   ide   rgs   arc   err   無序   null   列表函數   http://www.511yj.com/wordpress-wp-categories.html
 
註意：
1、 wp_list_categories() 和 list_cats() 以及  

  
 

    

    
    Python中，While循環語句的用法及註意事項
      pen   bubuko   縮進   .com   對比   出錯   lag   spl   處的   今天跟著老師學習了While語句的用法，聽老師講的時候是聽明白了，感覺好簡單，但是自己做一遍的時候出了好多處的錯誤。我犯的錯誤都是新手常犯的，因此我覺得有必要把這次記錄下來，提醒自己也提醒跟我一樣的小白 

  
 

    

    
    DOM用法及應用
      html   html中   文本節點   樣式   before   get   nod   node   沒有   DOM介紹：文檔對象模型
為了方便javascript語言通過dom操作html比較方便；
HTML中節點分類：
1.文檔節點(document)
2.元素節點
3.文本節點
4.屬性節點
 

  
 

    

    
    grep和egrep的用法及解釋說明
      init   新建   -i   網卡   前三   打印   內容   alt   一道   grep是一種強大的搜索工具，它能夠用正則表達式搜索文本，並把匹配的行打印出來。-a 表示不要忽視二進制數據。-A顯示列數，出了顯示符合樣本的那一行之外，並顯示該行之後的內容。-b 在顯示符合樣本的那一行之外，並顯 

  
 

    

    
    Union用法及說明：
      clas   target   tex   www   pst   說明   href   union all   默認   Union是用戶合並多個select結果集的操作符，需要註意的是：select語句需要有相同的列數，類似的數據類型，且列的順序相同，另外，UNION 結果集中的列名總是等於 UNION 

  
 

    

    
    sed詳解---用法及解釋
      nts   parameter   同一行   開頭   types   consul   win   命令   one   1.sed -n ‘2‘p filename 打印文件的第二行。 2.sed -n ‘1,3‘p filename 打印文件的1到3行
3. sed -n ‘/Neave/‘p fil