跑深度學習網路時碰到的一些問題記錄

阿新 • • 發佈：2018-12-22

分兩部分記錄：

一.日誌資訊

二.程式語言

#############################################################################

一.日誌資訊

在TRAIN_DIR路徑下會產生四種檔案：

1.checkpoint:文字檔案，包含所有model.ckpt-xxxx,相當於是不同時間節點生成的所有ckpt檔案的一個索引。

2.model.ckpt-2124.data-000000-of-000001:模型檔案，儲存模型的權重

3.model.ckpt-2124.meta: 圖檔案，儲存模型的網路圖

4.model.ckpt-2124.index: 這個不清楚

5.graph.pbtxt: 用protobuf格式儲存的模型的圖

Tensorflow使用五個不同級別的日誌訊息。按照上升的順序，它們是DEBUG,INFO,WARN,ERROR和FATAL。當在任何這些級別配置日誌記錄時，Tensorflow將輸出與該級別相對應的所有日誌訊息以及所有級別的嚴格級別。例如，如果設定了ERROR的日誌記錄級別，則會收到包含ERROR和FATAL訊息的日誌輸出，如果設定了一個DEBUG級別，則會從所有五個級別獲取日誌訊息。

預設情況下，Tensorflow在WARN的日誌記錄級別進行配置，但是在跟蹤模型訓練時，需要將級別調整為INFO，tf.logging.set_verbosity(tf.logging.INFO)

二.程式語言

1.join 和 os.path.join函式

join：用於合併字串陣列

os.path.join:用於合併多個路徑

import os
dataset_dir = '.'
file_pattern = 'fgvc_%s.tfrecord'
split_name = 'train'
a = os.path.join(dataset_dir, file_pattern % (split_name))
print a   #./fgvc_train.tfrecord

2.tf.expand_dims 和 tf.squeeze

tf.expand_dims：用於增加維度(

點選開啟連結)

import tensorflow as tf
a = tf.constant([[1,2,3],[4,5,6]])
with tf.Session() as sess:
    print sess.run(a)
    '''
    [[1 2 3]
     [4 5 6]]
     '''
    print tf.shape(a)
    '''
    Tensor("Shape_5:0", shape=(2,), dtype=int32)
    '''
    a_1 = tf.expand_dims(a,0)
    print sess.run(a_1)
    '''
    [[[1 2 3]
      [4 5 6]]]
    '''
    print tf.shape(a_1)
    '''
    Tensor("Shape_6:0", shape=(3,), dtype=int32)
    '''
    a_2 = tf.expand_dims(a,-1)
    print sess.run(a_2)
    '''
    [[[1]
      [2]
      [3]]

     [[4]
      [5]
      [6]]]
    '''
    print tf.shape(a_2)
    '''
    Tensor("Shape_7:0", shape=(3,), dtype=int32)
    '''
    a_3 = tf.expand_dims(a,1)
    print sess.run(a_3)
    '''
    [[[1 2 3]]

     [[4 5 6]]]
     '''
    print tf.shape(a_3)
    '''
    Tensor("Shape_8:0", shape=(3,), dtype=int32)
    '''

tf.squeeze:減少多餘的維度

import tensorflow as tf
a = tf.constant([[1]])
b = tf.constant([[[1,2],[3,4]]])
with tf.Session() as sess:
    print sess.run(a) #[[1]]
    print sess.run(tf.squeeze(a)) # 1
    print sess.run(b) 
    '''
    [[[1 2]
      [3 4]]]
      '''
    print sess.run(tf.squeeze(b))
    '''
    [[1 2]
     [3 4]]
    '''

3.tf.cast 函式

用法：tf. cast(x, dtype, name=None)

作用：將x的資料格式轉化成dtype.

import tensorflow as tf
a = tf.constant([[1.2]])
b = tf.constant([[[1,2],[3,4]]])
with tf.Session() as sess:
    print sess.run(a) #[[1.2]]
    print sess.run(tf.cast(a, tf.int32))# [[1]]

dtype類別有：tf.bool, tf.int32, tf.int64, tf.float32, tf.float64等

4.將Tensor張量轉化為numpy陣列

注：tensorflow裡面不能將張量轉化成矩陣後用numpy計算，因為numpy裡不能實現梯度反傳。

5.不能用for迴圈遍歷圖片的所有畫素點，這樣會導致op節點爆炸。

6.如果採用tf.initialize_all_variables().run()，所有權重都將初始化，如果只訓練某一層權重則不應用這句命令。

7.tf查詢元素相關程式點選開啟連結

8.tf.matmul與tf.multiply

tf.matmul：矩陣乘法

tf.multiply：element-wise。對應元素相稱，如兩個矩陣的第一行第一列相乘。

9.tf.shape(a) 和a.get_shape()

10.tf.argmax 返回最大值的下標

tf.argmax( ,axis = 0) 縱向比較

tf.argmax( , axis = 1) 橫向比較

11.

跑深度學習網路時碰到的一些問題記錄

分兩部分記錄：一.日誌資訊二.程式語言#############################################################################一.日誌資訊在TRAIN_DIR路徑下會產生四種檔案： 1.c

學習C++時的一些小知識點

標識程序 c程序 num 定義來講是否一個別名（轉載https://www.cnblogs.com/qyaizs/articles/2039101.html） struct和typedef struct 分三塊來講述：　　1 首先：//註意在C和C++裏不同　　

python核心編程學習過程中的一些記錄

ges 學習核心編程一些記錄 Python標準庫 NPU 保持 whereis .py 1P18.python標準庫位置（一般是string.py所在的位置，也可以whereis python找找）C:\Python27\Lib/usr/lib64/python2.6

利用Google免費GPU跑深度學習模型

還在為電腦沒有很好的GPU而煩惱麼，這個教程教你隨時利用Colab中的Tesla K80顯示卡跑深度學習模型先從價格上感受下Tesla K80 首先想體驗Colab，必須先學會科學上網，可以利用VPS買國外結點的伺服器，利用Shadowsockes搭梯子，具體教程可以參考其他博主，在此不做贅述。

Caffe訓練深度學習網路的暫停與繼續

Caffe訓練深度學習網路的暫停與繼續博主在訓練Caffe模型的過程中，遇到了如何暫停訓練並斷點繼續訓練的問題。在此記錄下有關這個問題的幾種解決方案。更新於2018.10.27。方法1：臨時暫停這種方法是用於臨時暫停Caffe訓練，暫停後可以以完全相同的配置從斷點處繼續

學習block時的一些筆記

1.完整寫法 void(^ blockName)(arg)=void^(arg){}; 2.block 可以使用擷取到的自動變數，但是不允許修改重新賦值。例: int m=3; char* str1="str1"; &nbs

自動學習多工深度學習網路

個人分類：行人屬性多工深度學習網路，一般是先設計網路有一些共享層，然後有多個分支學習不同的任務。論文從一個較瘦的網路開始，逐漸加粗。任務間進行選擇性共享，挖掘那些任務之間更相關。thin網路使用SOMP初始化。 task-specific子網路或分支：淺層特徵共享，深層特徵tas

清理桌面，發現學習java時的一些筆記

今天整理下桌面，將很多不需要的檔案及資料夾丟盡垃圾桶並清理一下。發現了不知道什麼時候看視訊或者整理筆記的時候留下的幾張關於java語言理解的圖。貼一下。現在與當時的區別就是，當時

深度學習網路篇——ZFNet（Part3 ZFNet的實驗環節）

上篇ZFNet的文章中我們簡單的分享了一下ZFNet的網路結構和訓練細節，這篇文章將分享ZFNet論文上的實驗環節。ZFNet做了很多巧妙的實驗，從這邊文章中也可以看到未來深度網路發展方向的蛛絲馬跡。一、Experiments實驗 1.ImageNet 2012 該資料集由1.3M

深度學習網路篇——ZFNet（Part2 ZFNet的訓練細節）

上篇文章中我們介紹了ZFNet的發展歷程和一些演算法小心機，在這篇文章中我們將分享一下ZFNet的訓練細節！Come on！！！Baby！！！一、ZFNet訓練細節【AlexNet和ZFNet的區別】 1.AlexNet中使用2個GPU運的稀疏連線；在ZFNet中被單GPU密集連

深度學習網路篇——ZFNet（Part1 從AlexNet到ZFNet）

一、上回說到的 AlexNet 請各位看官們參見部落格之前的文章：深度學習網路篇——AlexNet https://blog.csdn.net/weixin_43624538/article/details/83988998 1）AlexNet效能舉世矚目 top-1和top-5

深度學習網路篇——AlexNet

作為一個機器學習剛入門的小學生，今天和大家分享的是一篇比較經典的論文《ImageNet Classification with Deep Convolutional Neural Networks》。只是我們在學習後的知識分享和總結，有不周到的地方還請各位大大們指正。簡要概括 Al

深度學習網路壓縮簡單介紹

我課題組做基於深度學習的影象處理主要分兩條線：基於深度學習的目標檢測網路壓縮我的方向是網路壓縮，為了以後方便展開，下邊先簡要介紹幾種網路壓縮的方式，： 1 網路修剪網路修剪,採用當網路權重非常小的時候(小於某個設定的閾值),把它置0,就像二值網路一般；然後遮蔽被設定為0的權重更新，繼

關於機器學習、深度學習基礎概念的一些理解

首先，根據問題的背景，需要選擇合適的機器學習或深度學習演算法去求解，也就是說需要訓練出一個模型來，這個模型的實際訓練過程是：當確定了機器學習模型後，需要在訓練集上進行訓練確定其中的權重和偏差引數（使用梯度下降演算法最小化損失函式），使用訓練資料集來訓練模型的過程稱作為模型擬合，確定的是引

《深度學習網路訓練--第一講》資料採集與資料預處理

經過專案的實踐，我感受到要想訓練出一個性能優良的模型網路，資料採集與預處理是多麼的艱難與重要。資料的採集資料的採集是一個費時費力的過程。對於人臉資料來說，針對產品的應用場景，需要採集不同環境變數的人臉影象。對於我的經驗來說，公司想要做一個人臉識別的A

基於CNN的常見深度學習網路總結歸納

本文主要是對前一段時間的深度學習進行歸納總結，其中有參考幾位主要博主的理解，也有自己對大神論文的一些翻譯及看法，如有問題，歡迎大家指正；深度學習深度學習主要是對人工神經網路的延伸，它的目的主要是模擬人腦的機制來解釋影象，深度學習通過組織底

深度學習網路模型視覺化

在學習Resnet50的時候官網上給出了網路的整個模型圖 http://ethereon.github.io/netscope/#/gist/db945b393d40bfa26006 ，但是學RFCN的時候就不知道哪裡能找到，看到同事給的文件裡面有部分圖，諮詢後，同事給了我幾個prototx

深度學習網路訓練不收斂問題

不收斂描述及可能原因分析不收斂情景1 描述從訓練開始就一直震盪或者發散可能原因圖片質量極差，人眼幾乎無法識別其中想要識別的特徵，對於網路來說相當於輸入的一直都是噪音資料，比如通過resize的時候，圖片的長寬比改變特別大，使圖片喪失對應特

構建深度學習網路的實用技巧

作者| Matt H/Daniel R 譯者| 婉清編輯| Jane 出品| AI 科技大本營【導讀】在經歷成千上萬個小時機器學習訓練時間後，計算機並不是唯一學到很多東西的角色，作為開發者和訓練者的我們也犯了很多錯誤，修復了許多錯誤，從而積累了很多經驗。在

用nvidia-docker跑深度學習模型.md

用nvidia-docker跑深度學習模型 ##背景最近實驗室要參加一個目標檢測的比賽，這段時間一直在跑ssd模型，最開始根據作者給的文件成功編譯後，可以在VOC資料集上進行訓練。由於要用比賽官方的資料集，因此做了幾天的資料集，然後拿自己的資料集訓練的時候，

跑深度學習網路時碰到的一些問題記錄

相關推薦