Tensorflow訓練模型越來越慢的2種解決方案

阿新 • • 發佈：2020-02-07

1 解決方案

【方案一】

載入模型結構放在全域性，即tensorflow會話外層。

'''載入模型結構:最關鍵的一步'''
saver = tf.train.Saver()
'''建立會話'''
with tf.Session() as sess:
 for i in range(STEPS):
 '''開始訓練'''
 _,loss_1,acc,summary = sess.run([train_op_1,train_loss,train_acc,summary_op],feed_dict=feed_dict)
 '''儲存模型'''
 saver.save(sess,save_path="./model/path",i)

【方案二】

在方案一的基礎上，將模型結構放在圖會話的外部。

'''預測值'''
train_logits= network_model.inference(inputs,keep_prob)
'''損失值'''
train_loss = network_model.losses(train_logits)
'''優化'''
train_op = network_model.train(train_loss,learning_rate)
'''準確率'''
train_acc = network_model.evaluation(train_logits,labels)
'''模型輸入'''
feed_dict = {inputs: x_batch,labels: y_batch,keep_prob: 0.5}
'''載入模型結構'''
saver = tf.train.Saver()
'''建立會話'''
with tf.Session() as sess:
 for i in range(STEPS):
 '''開始訓練'''
 _,i)

2 時間測試

通過不同方法測試訓練程式，得到不同的訓練時間，每執行一次訓練都重新載入圖結構，會使每一步的訓練時間逐次增加，如果訓練步數越大，後面訓練速度越來越慢，最終可導致圖爆炸，而終止訓練。

【時間累加】

2019-05-15 10:55:29.009205: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
step: 0,time cost: 1.8800880908966064
step: 1,time cost: 1.592250108718872
step: 2,time cost: 1.553826093673706
step: 3,time cost: 1.5687050819396973
step: 4,time cost: 1.5777575969696045
step: 5,time cost: 1.5908267498016357
step: 6,time cost: 1.5989274978637695
step: 7,time cost: 1.6078357696533203
step: 8,time cost: 1.6087186336517334
step: 9,time cost: 1.6123006343841553
step: 10,time cost: 1.6320762634277344
step: 11,time cost: 1.6317598819732666
step: 12,time cost: 1.6570467948913574
step: 13,time cost: 1.6584930419921875
step: 14,time cost: 1.6765813827514648
step: 15,time cost: 1.6751370429992676
step: 16,time cost: 1.7304580211639404
step: 17,time cost: 1.7583982944488525

【時間均衡】

2019-05-15 13:03:49.394354: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:1 with 7048 MB memory) -> physical GPU (device: 1,name: Tesla P4,pci bus id: 0000:00:0d.0,compute capability: 6.1)
step: 0,time cost: 1.9781079292297363
loss1:6.78,loss2:5.47,loss3:5.27,loss4:7.31,loss5:5.44,loss6:6.87,loss7: 6.84
Total loss: 43.98,accuracy: 0.04,steps: 0,time cost: 1.9781079292297363
step: 1,time cost: 0.09688425064086914
step: 2,time cost: 0.09693264961242676
step: 3,time cost: 0.09671926498413086
step: 4,time cost: 0.09688210487365723
step: 5,time cost: 0.09646058082580566
step: 6,time cost: 0.09669041633605957
step: 7,time cost: 0.09666872024536133
step: 8,time cost: 0.09651994705200195
step: 9,time cost: 0.09705543518066406
step: 10,time cost: 0.09690332412719727

3 原因分析

(1) Tensorflow使用圖結構構建系統，圖結構中有節點(node)和邊(operation)，每次進行計算時會向圖中新增邊和節點進行計算或者讀取已存在的圖結構；

(2) 使用圖結構也是一把雙刃之劍，可以加快計算和提高設計效率，但是，程式設計不合理會導向負面，使訓練越來約慢；

(3) 訓練越來越慢是因為執行一次sess.run，向圖中新增一次節點或者重新載入一次圖結構，導致圖中節點和邊越來越多，計算引數也成倍增長；

(4) tf.train.Saver()就是載入圖結構的類，因此設計訓練程式時，若每執行一次跟新就使用該類載入圖結構，自然會增加引數數量，必然導致訓練變慢；

(5) 因此，將載入圖結構的類放在全域性，即只載入一次圖結構，其他時間只訓練圖結構中的引數，可保持原有的訓練速度；

4 總結

(1) 設計訓練網路，只載入一次圖結構即可；

(2) tf.train.Saver()就是載入圖結構的類，將該類的例項化放在全域性，即會話外部，解決訓練越來越慢。

以上這篇Tensorflow訓練模型越來越慢的2種解決方案就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Tensorflow訓練模型越來越慢的2種解決方案

1 解決方案【方案一】載入模型結構放在全域性，即tensorflow會話外層。 \'\'\'載入模型結構:最關鍵的一步\'\'\'

net start/stop mysql 發生系統錯誤5 拒絕訪問的2種解決方案

當我們啟動伺服器時，在cmd埠輸出net stop/start mysql（關閉和啟動）時顯示如下錯誤：解決方法有2種。

win10開啟網頁圖片載入很慢怎麼回事？win10開啟網頁載入不出來2種解決方法

操作win10系統經常需要開啟網頁查詢資料，有時候開啟網頁圖片總是載入很慢或者直接載入不出來，最後顯示一個×的標誌，這是什麼情況?可能是網速過低，或者設定裡面開啟了省流量模式，需要修復此問題也比較簡單，有相

pytorch模型儲存的2種實現方法

1、儲存整個網路結構資訊和模型引數資訊： torch.save(model_object,\'./model.pth\') 直接載入即可使用：

PyCharm無法識別PyQt5的2種解決方法，ModuleNotFoundError: No module named 'pyqt5'

PyCharm不識別PyQt5的問題如圖所示，引用PyQt5的時候顯示錯誤“ModuleNotFoundError: No module named \'pyqt5\'”

使用TensorFlow訓練模型

框架準備：　　1. 下載TensorFlow框架程式碼，以ssd-TensorFlow為例　　　　https://github.com/balancap/SSD-Tensorflow

微服務分散式事務4種解決方案實戰

案列原始碼地址 github.com/qinxuewu/bo… 分散式事務分散式事務是指事務的參與者，支援事務的伺服器，資源伺服器分別位於分散式系統的不同節點之上，通常一個分散式事物中會涉及到對多個資料來源或業務系統的操

redis的2種持久化方案深入講解

前言 Redis是一種高階key-value資料庫。它跟memcached類似，不過資料可以持久化，而且支援的資料型別很豐富。有字串，連結串列，集合和有序集合。支援在伺服器端計算集合的並，交和補集(difference)等，還支援多種

Mysql忘記密碼的幾種解決方案

解決辦法1 解除安裝完全，刪除所有資料,先關閉跟MySql所有有關的程序,進入命令列(cmd)中輸入taskkill /f /im mysqld-nt.exe

詳解MySQL雙活同步複製四種解決方案

對於資料實時同步，其核心是需要基於日誌來實現，是可以實現準實時的資料同步，基於日誌實現不會要求資料庫本身在設計和實現中帶來任何額外的約束。

在微信小程式中渲染HTML內容3種解決方案及分析與問題解決

大部分Web應用的富文字內容都是以HTML字串的形式儲存的，通過HTML文件去展示HTML內容自然沒有問題。但是，在微信小程式（下文簡稱為「小程式」）中，應當如何渲染這部分內容呢？

tensorflow-gpu安裝的常見問題及解決方案

裝tensorflow-gpu的時候經常遇到問題，自己裝過幾次，經常遇到相同或者類似的問題，所以打算記錄一下，也希望對其他人有所幫助

python 對任意資料和曲線進行擬合併求出函式表示式的三種解決方案

第一種是進行多項式擬合，數學上可以證明，任意函式都可以表示為多項式形式。具體示例如下。

Django CSRF認證的幾種解決方案

什麼是CSRF 瀏覽器在傳送請求的時候，會自動帶上當前域名對應的cookie內容，傳送給服務端，不管這個請求是來源A網站還是其它網站，只要請求的是A網站的連結，就會帶上A網站的cookie。瀏覽器的同源策略並不能阻止CSRF

Python在終端通過pip安裝好包以後在Pycharm中依然無法使用的問題(三種解決方案)

在終端通過pip裝好包以後，在pycharm中匯入包時，依然會報錯。新手不知道具體原因是什麼，我把我的解決過程發出來，主要原因就是pip把包安裝到了“直譯器1”，但我們專案使用的是“直譯器2”。我們新手怕字多，所以後

Python selenium頁面載入慢超時的解決方案

開發環境： win10-64 python2.7.16 chrome77 from selenium import webdriver driver = webdriver.Chrome(executable_path=\'chromedriver.exe\')

Android錄屏的三種解決方案

本文總結三種用於安卓錄屏的解決方案： adb shell命令screenrecord MediaRecorder， MediaProjection

Springboot跨域問題三種解決方案

使用vue+axios+spring boot前後端分離專案時會出現跨域問題解決方式: 一: 全域性配置

Spring aop失效的幾種解決方案

先看下這個問題的背景：假設有一個spring應用，開發人員希望自定義一個註解@Log，可以加到指定的方法上，實現自動記錄日誌(入參、出參、響應耗時這些)

c#.net中實現檔案上傳下載的三種解決方案(推薦)

以ASP.NET Core WebAPI作後端API，用Vue構建前端頁面，用Axios從前端訪問後端API,包括檔案的上傳和下載。

Tensorflow訓練模型越來越慢的2種解決方案

相關推薦