PyTorch的可重複性問題（如何使實驗結果可復現）

阿新 • • 發佈：2019-02-13

由於在模型訓練的過程中存在大量的隨機操作，使得對於同一份程式碼，重複執行後得到的結果不一致。因此，為了得到可重複的實驗結果，我們需要對隨機數生成器設定一個固定的種子。

許多部落格都有介紹如何解決這個問題，但是很多都不夠全面，往往不能保證結果精確一致。我經過許多調研和實驗，總結了以下方法，記錄下來。

全部設定可以分為三部分：

1. CUDNN

cudnn中對卷積操作進行了優化，犧牲了精度來換取計算效率。如果需要保證可重複性，可以使用如下設定:

from torch.backends import cudnn
cudnn.benchmark = False            # if benchmark=True, deterministic will be False
cudnn.deterministic = True

不過實際上這個設定對精度影響不大，僅僅是小數點後幾位的差別。所以如果不是對精度要求極高，其實不太建議修改，因為會使計算效率降低。

2. Pytorch

torch.manual_seed(seed)            # 為CPU設定隨機種子
torch.cuda.manual_seed(seed)       # 為當前GPU設定隨機種子
torch.cuda.manual_seed_all(seed)   # 為所有GPU設定隨機種子

3. Python & Numpy

如果讀取資料的過程採用了隨機預處理(如RandomCrop、RandomHorizontalFlip等)，那麼對python、numpy的隨機數生成器也需要設定種子。

import random
import numpy as np
random.seed(seed)
np.random.seed(seed)

最後，關於dataloader：

注意，如果dataloader採用了多執行緒(num_workers > 1), 那麼由於讀取資料的順序不同，最終執行結果也會有差異。也就是說，改變num_workers引數，也會對實驗結果產生影響。目前暫時沒有發現解決這個問題的方法，但是隻要固定num_workers數目（執行緒數）不變，基本上也能夠重複實驗結果。

對於不同執行緒的隨機數種子設定，主要通過DataLoader的worker_init_fn引數來實現。預設情況下使用執行緒ID作為隨機數種子。如果需要自己設定，可以參考以下程式碼：

GLOBAL_SEED = 1

def set_seed(seed):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)

GLOBAL_WORKER_ID = None
def worker_init_fn(worker_id):
    global GLOBAL_WORKER_ID
    GLOBAL_WORKER_ID = worker_id
    set_seed(GLOBAL_SEED + worker_id)

dataloader = DataLoader(dataset, batch_size=16, shuffle=True, num_workers=2, worker_init_fn=worker_init_fn)

PyTorch的可重複性問題（如何使實驗結果可復現）

由於在模型訓練的過程中存在大量的隨機操作，使得對於同一份程式碼，重複執行後得到的結果不一致。因此，為了得到可重複的實驗結果，我們需要對隨機數生成器設定一個固定的種子。許多部落格都有介紹如何解決這個問題，但是很多都不夠全面，往往不能保證結果精確一致。我經過許多調研和實驗，總

JavaFx表格檢視TableView設定單元格可編輯（只需兩步實現）

只需兩步： 1. tableView.setEditable(true);//表格設定為可編輯 2. colUrl.setCellFactory(TextFieldTableCell.for

Ruby 開發環境安裝linux、mac，遇到的錯誤總結（使後人避免入坑）

一、linux安裝ruby時遇到的錯誤首先講一下為什麼不寫Windows的，個人建議，最好不要用Windows環境，問題很多，需要安裝的東西更多，而且未知的錯誤多，網上不一定查的到，我也安裝過Windows的，也成功過，但是，有時執行會報錯，後來放棄了，安了個Linux的，再後來用了mac系統，

Navicat 的檔案匯入匯出（包含查詢結果的匯出）

一、資料的匯入 1、在navicat中先新建一個數據表hrms_org 2、現從外部匯入相應的資料，先選中表，點選“匯入”。 3、選擇要匯入的檔案格式，此處以csv格式為例。 4、選擇要匯入檔案的路徑。 5、點選“下一步”。 6、確認源表與目

利用caffe日誌進行測試精度訓練損失等的畫圖（caffe訓練結果視覺化）

本文主要介紹，將caffe訓練得到的accracy,loss進行影象化。對於一般caffe訓練結果的視覺化： 1.在訓練時，需要將訓練的結果儲存日誌。 train.sh： #!/usr/bin/env sh TOOLS=/home/zhuangni/code/Mu

吳恩達實驗（神經網絡和深度學習）第一課第三周，代碼和數據集，親測可運行

HR tps size nac www cond -c 自己 c-c 代碼和數據集已上傳到文件中應該可以直接下載吧（第一次上傳文件，感覺是），解壓後把文件夾拷貝到jupyter工作空間即可註：我對下載的代碼的格式稍作了修改，原來定義函數與調用函數在兩個單元格裏，我直

如何使QT的Release模式可除錯（Windows）

如何使QT的Release模式可除錯（Windows）如需轉載請標明出處：http://blog.csdn.net/itas109 QQ技術交流群：129518033 目錄文章目錄如何使QT的Release模式可除錯（Windows

莫煩大大TensorFlow筆記（6）----結果可視化

tput optimize 第一次 mage orf .sh class sum nbsp #import os #os.environ[‘TF_CPP_MIN_LOG_LEVEL‘] = ‘2‘ import tensorflow as tf import nu

#如何使釋出在IIS上的程式在同一區域網內均可訪問（win10系統）

如何使釋出在IIS上的程式在同一區域網內均可訪問（win10系統） ###1. 開啟控制面板中的Windows Defender防火牆，點選左側的高階設定，點選左側入站規則 ###2.點選右側新建規則，

使根視窗可伸縮（tkinter，Python3.x）

使根視窗可伸縮讓使用者可以放大縮小整個應用視窗，並將多餘的空間分配給內部的外掛。這需要一些操作。為了讓應用的外掛可伸縮，需要用到行列尺寸管理的技術，詳細參見設定行，列尺寸。對於最小的應用中的應用，它只包含了一個 Quit 外掛，如果執行這個

用R語言（rvest包）爬取獵聘網招聘資訊（保證可重複性）

前言最近一直在思考動手做自己的第一個R語言資料分析專案，在R語言中文社群公眾號上看了許多爬取招聘網站的案例後，發現做招聘資訊分析是個不錯的選擇： 1. 整合並分析招聘資訊可以深入瞭解各個崗位的整體收入情況、學歷要求、經驗要求等，相信這是許多人都感興趣的； 2. 招聘網站的

Docker可視化界面（Consul+Shipyard+Swarm+Service Discover）部署記錄

agen net 映射 control pro doc labs 容器默認賬戶前面一篇說到了Docker管理工具-Swarm部署記錄，基於這個環境，下面記錄下Docker可視化界面部署過程： 1）下載相關驚喜 manager-node節點（182.48.115.

jmeter 計數器（可自動生成新數字、註冊專用）

技術分享查看 png 結果 .cn image src 專用設置 1、打開jmeter，創建好線程組後，添加計數器 2、設置計數器 3、添加HTTP請求，驗證所設置的計數器 4、填寫對應參數 5、添加查看結果樹，查看結果

在思科模擬器中搭建拓撲使PC機可以遠程連接交換機

ext 完成 mark com quest 路由圖片 pin 5.0 實驗條件如圖：實驗步驟：1.給PC機配IP為“10.0.0.1”子網掩碼為“255.0.0.0”網關為“10.0.0.254”如圖： 2.給switch0配置管理IP為10.0.0.2，配置遠程密碼為“

css計數器及鼠標經過從中間擴散一個矩形（正方形長方形均可）

aaa ack before har :after div near one css <!DOCTYPE html> <html> <head> <title>css計數器--兼容IE8</title>

精心收集的 48 個 JavaScript 代碼片段，僅需 30 秒就可理解!（轉載）

mat fine 添加 pre case nag map tolower != Anagrams of string（帶有重復項）使用遞歸。對於給定字符串中的每個字母，為字母創建字謎。使用map（）將字母與每部分字謎組合，然後使用reduce（）將所有字謎組合到一個數組中

KindEditor 一款好用的HTML可視化編輯器（富文本編輯器）

好用 shu spl 相對 relative -a sda per 我想　　KindEditor使用JavaScript編寫，可以無縫的於Java、.NET、PHP、ASP等程序接合。 KindEditor非常適合在CMS、商城、論壇、博客、Wiki、電子郵件等互聯網應用

邏輯回歸--數據獨熱編碼＋數據結果可視化

ati values group 歸一化 fix sco value space AD #-*- coding: utf-8 -*- ‘‘‘ 在數據處理和特征工程中，經常會遇到類型數據，如性別分為[男，女]（暫不考慮其他。。。。），手機運營商分為[移動，聯通，電信]等，我

使數據可供ArcGIS Server訪問

使用 zh-cn 網絡 linu pub 管理系情況 local 網絡流量內容來自ESRI官方文檔（點擊訪問），簡單總結如下: 1 ArcGIS Server用於發布服務的數據必須存儲在服務器可以訪問的位置； 2 這樣的位置有三種類型：本地路徑：將數據本地存儲在每臺

尋找一個數組中未出現的最小正整數（數組元素可重復）

個數 pre doesn inf tput swe return 分享圖片針對題目描述 Description Given nn non-negative integers, please find the least non-negative integer that

PyTorch的可重複性問題 （如何使實驗結果可復現）

1. CUDNN

2. Pytorch

3. Python & Numpy

相關推薦

PyTorch的可重複性問題（如何使實驗結果可復現）