解決重複執行Tensorflow程式GPU記憶體佔用的小白方法

阿新 • • 發佈：2020-08-01

作為一個剛入門CV的新手，最近在執行一個生成人臉影象的程式時遇到了問題，程式是可以執行的，但是執行兩次後就會出錯，具體如下：

ResourceExhaustedError: 2 root error(s) found.
  (0) Resource exhausted: OOM when allocating tensor with shape[1,3,3,512,512] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
     [[{{node G_synthesis_5/_Run/G_synthesis/64x64/Conv0_up/Square}}]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions  
for current allocation info.

     [[G_synthesis_5/_Run/saturate_cast/_4577]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.

  (1) Resource exhausted: OOM when allocating tensor with shape[1,3,3,512,512] and 
 type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
     [[{{node G_synthesis_5/_Run/G_synthesis/64x64/Conv0_up/Square}}]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.

0 successful operations.
0 derived errors ignored.

先介紹下我的執行環境：

Win 10
Spyder
Tensorflow-GPU == 1.14.0

查到的原因是GPU視訊記憶體不夠了。

第一次執行，專用GPU記憶體：0 ===> 1.2，第二次執行：1.2 ===> 1.6，第三次就沒有辦法運行了，由於自己的電腦是渣渣顯示卡，視訊記憶體太小，而我的程式是需要不斷改變引數重複執行的，但網上查了一遍說視訊記憶體是不會執行一次就釋放資源的，所以我不得不每執行兩次就重啟Spyder這樣來釋放視訊記憶體。也嘗試過執行一次後就殺掉顯示卡中的這個程式，但結果是直接導致Spyder核心連線中斷，結果還是重啟。

最後，靈機一動，直接在控制檯重啟核心就可以釋放掉程式以及所佔視訊記憶體資源，這樣就不用重啟麻煩了。

如果是一段連續程式視訊記憶體不夠，那就要麼換大一點視訊記憶體的顯示卡，或者設定每次佔用GPU資源的值了。這個可以看看其他博主的部落格。

方法不高階，但挺實用，如果有更好的方法，歡迎留言評論。

解決重複執行Tensorflow程式GPU記憶體佔用的小白方法

解決重複執行Tensorflow程式GPU記憶體佔用的小白方法

解決cmd執行java程式“找不到檔案”提示的方案

一個神奇的bug：OOM？優雅終止執行緒？系統記憶體佔用較高？

Java記憶體佔用排查的方法

sql查出重複資料，刪除重複資料只留一條（小白專用）

17年資深程式設計師寫給小白的Python學習防坑祕籍

執行tensorflow python程式,限制對GPU和CPU的佔用操作

解決TensorFlow程式無限制佔用GPU的方法

深度學習訓練已經停止(強行中斷)了，可GPU記憶體還在佔用著，如何解決？

Redis過期--淘汰機制的解析和記憶體佔用過高的解決方案

解決tensorflow訓練時記憶體持續增加並佔滿的問題

基於tensorflow指定GPU執行及GPU資源分配的幾種方式小結

Keras - GPU ID 和視訊記憶體佔用設定步驟

如何解決win10 1909開機記憶體佔用高的問題

win10開機記憶體佔用50怎麼辦_win10一開機記憶體就佔用過高的解決方法

淺談多卡伺服器下隱藏部分 GPU 和 TensorFlow 的視訊記憶體使用設定

解決執行django程式出錯問題 'str'object has no attribute'_meta'

分散式定時任務重複執行解決方案--redis篇

“javac不是內部或外部命令，也不是可執行的程式“解決方法（WIN10）

win10開機記憶體佔用60%怎麼解決

解決重複執行Tensorflow程式GPU記憶體佔用的小白方法

相關推薦