[Pytorch]Pytorch 儲存模型與載入模型(轉)

阿新 • • 發佈：2018-12-05

轉自：知乎

儲存模型與載入模型
凍結一部分引數，訓練另一部分引數
採用不同的學習率進行訓練

1.儲存模型與載入

簡單的儲存與載入方法：

# 儲存整個網路

torch.save(net, PATH)

# 儲存網路中的引數, 速度快，佔空間少

torch.save(net.state_dict(),PATH)

#--------------------------------------------------

#針對上面一般的儲存方法，載入的方法分別是：

model_dict=torch.load(PATH)

model_dict=model.load_state_dict 
(torch.load(PATH))

然而，在實驗中往往需要儲存更多的資訊，比如優化器的引數，那麼可以採取下面的方法儲存：

torch.save({'epoch': epochID + 1, 'state_dict': model.state_dict(), 'best_loss': lossMIN,

'optimizer': optimizer.state_dict(),'alpha': loss.alpha, 'gamma': loss.gamma},

checkpoint_path + '/m-' + launchTimestamp + '-' + str("%.4f" % lossMIN) + '.pth.tar')

以上包含的資訊有，epochID, state_dict, min loss, optimizer, 自定義損失函式的兩個引數；格式以字典的格式儲存。

載入的方式：

def load_checkpoint(model, checkpoint_PATH, optimizer):

if checkpoint != None:

model_CKPT = torch.load(checkpoint_PATH)

model.load_state_dict(model_CKPT['state_dict'])

print('loading checkpoint!')

optimizer.load_state_dict(model_CKPT['optimizer'])

return model, optimizer

其他的引數可以通過以字典的方式獲得

但是，但是，我們可能修改了一部分網路，比如加了一些，刪除一些，等等，那麼需要過濾這些引數，載入方式：

def load_checkpoint(model, checkpoint, optimizer, loadOptimizer):

if checkpoint != 'No':

print("loading checkpoint...")

model_dict = model.state_dict()

modelCheckpoint = torch.load(checkpoint)

pretrained_dict = modelCheckpoint['state_dict']

# 過濾操作

new_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict.keys()}

model_dict.update(new_dict)

# 打印出來，更新了多少的引數

print('Total : {}, update: {}'.format(len(pretrained_dict), len(new_dict)))

model.load_state_dict(model_dict)

print("loaded finished!")

# 如果不需要更新優化器那麼設定為false

if loadOptimizer == True:

optimizer.load_state_dict(modelCheckpoint['optimizer'])

print('loaded! optimizer')

else:

print('not loaded optimizer')

else:

print('No checkpoint is included')

return model, optimizer

2.凍結部分引數，訓練另一部分引數

1）新增下面一句話到模型中

for p in self.parameters():

p.requires_grad = False

比如載入了resnet預訓練模型之後，在resenet的基礎上連線了新的模快，resenet模組那部分可以先暫時凍結不更新，只更新其他部分的引數，那麼可以在下面加入上面那句話

class RESNET_MF(nn.Module):

def init(self, model, pretrained):

super(RESNET_MF, self).__init__()

self.resnet = model(pretrained)

for p in self.parameters():

p.requires_grad = False

self.f = SpectralNorm(nn.Conv2d(2048, 512, 1))

self.g = SpectralNorm(nn.Conv2d(2048, 512, 1))

self.h = SpectralNorm(nn.Conv2d(2048, 2048, 1))

...

同時在優化器中新增：filter(lambda p: p.requires_grad, model.parameters())

optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.001, betas=(0.9, 0.999),

eps=1e-08, weight_decay=1e-5)

2) 引數儲存在有序的字典中，那麼可以通過查詢引數的名字對應的id值，進行凍結

查詢的程式碼：

 model_dict = torch.load('net.pth.tar').state_dict()

dict_name = list(model_dict)

for i, p in enumerate(dict_name):

print(i, p)

儲存一下這個檔案，可以看到大致是這個樣子的：

0 gamma

1 resnet.conv1.weight

2 resnet.bn1.weight

3 resnet.bn1.bias

4 resnet.bn1.running_mean

5 resnet.bn1.running_var

6 resnet.layer1.0.conv1.weight

7 resnet.layer1.0.bn1.weight

8 resnet.layer1.0.bn1.bias

9 resnet.layer1.0.bn1.running_mean

....

同樣在模型中新增這樣的程式碼：

for i,p in enumerate(net.parameters()):

if i < 165:

p.requires_grad = False

在優化器中新增上面的那句話可以實現引數的遮蔽

[Pytorch]Pytorch 儲存模型與載入模型(轉)

轉自：知乎目錄：儲存模型與載入模型凍結一部分引數，訓練另一部分引數採用不同的學習率進行訓練 1.儲存模型與載入簡單的儲存與載入方法： # 儲存整個網路 torch.save(net, PATH) # 儲存網路中的引數, 速度快，佔空間少 torch.save(n

Keras儲存與載入模型（JSON+HDF5）

在Keras中，有時候需要對模型進行序列化與反序列化。進行模型序列化時，會將模型結果與模型權重儲存在不同的檔案中，模型權重通常儲存在HDF5檔案中，模型的結構可以儲存在JSON或者YAML檔案中。後二者方法大同小異，這裡以JSON為例說明一下Keras模型的儲存與載入。 from sklearn

Tensorflow訓練卷積神經網路並儲存模型，載入模型並匯入手寫圖片測試

剛學習tensorflow,折騰了這幾天，之前一直按照書上的教程訓練網路，看那些沒玩沒了的不斷接近於1的準確率，甚是無聊，我一直想將辛辛苦苦訓練出來的網路，那些識別率看上去很高的網路，是否能真正用來識別外面匯入的圖片呢，而不僅僅是那些訓練集或者測試集的圖片。

keras 儲存模型和載入模型

import numpy as np np.random.seed(1337) # for reproducibility from keras.models import Sequential from keras.layers import Dense from k

tensorflow儲存模型、載入模型和提取模型引數和特徵圖

1.tf.train.latest_checkpoint('./model_data/')這一句最終返回的是一個字串，比如'./model_data/model-99991'這個方法本身還會做相應的檢查，比如checkpoint中最新的模型model_checkpoint_p

tensorflow中儲存模型、載入模型做預測（不需要再定義網路結構）

下面用一個線下回歸模型來記載儲存模型、載入模型做預測參考文章: 訓練一個線下回歸模型並儲存看程式碼： import tensorflow as tfimport numpy as

keras儲存模型和載入模型

1、儲存模型和載入模型的方法用實驗室的伺服器跑神經網路的時候伺服器老是斷開連線，這對我的訓練和測試來時是一件比較崩潰的事，因為這意味著我要重新訓練一次，要浪費又一次的時間，所以我在網上百度了儲存模型和載入模型的辦法，大部分的方法如下：儲存模型 model.s

RUP模型與XP模型

心得體會將在對象制作 splay 部署思想初始化進行　　上一篇文章中大致介紹了軟件開發過程模型和一些傳統的過程模型，接下來分享一下學習新型軟件開發過程模型RUP的心得體會。 RUP模型　　RUP（Rational Unified Process)，統一軟件開

PowerDesigner概念模型與物理模型相互轉換及導出數據字典

microsoft 字典 ros 去掉相互轉換右擊 soft designer design 最近公司項目竣工，驗收完成後，把整體平臺的所有文檔都寫清楚，找包發給甲方，由於本人是維護數據庫工作，依上面要求，必須編寫《數據庫設計說明書》裏面格式包含三個部分：概念模型

MVC模型與MTV模型

png 如何 emp 請求 pytho 後端 com 不同界面 MVC模型： MVC（Model View Controller 模型-視圖-控制器）是一種Web架構的模式，它把業務邏輯、模型數據、用戶界面分離開來，讓開發者將數據與表現解耦，前端工程師可以只改頁面效果部分

CAP理論下對比ACID模型與BASE模型

關系實現數據庫需要 ava base 庫存 sof 一個 CAP介紹 Consistency(一致性), 數據一致更新，所有數據變動都是同步的。比如網購，庫存減少的同時資金增多。Availability(可用性), 好的響應性能。比如支付操作10ms內響應用戶。Par

網絡基礎之osi模型與TCP模型

接口上層 system sum 選擇 prior 處理報文 pro ISO/OSI(pen System Internetwork) 根據網絡功能劃分層次：物理層：

斯坦福大學-自然語言處理入門筆記第十一課最大熵模型與判別模型（2）

一、最大熵模型 1、模型介紹基本思想：我們希望資料是均勻分佈的，除非我們有其他的限制條件讓給我們相信資料不是均勻分佈的。均勻分佈代表高熵（high entropy）。所以，最大熵模型的基本思想就是我們要找的分佈是滿足我們限制條件下，同時熵最高的分佈。熵：表示分佈的不

斯坦福大學-自然語言處理入門筆記第八課最大熵模型與判別模型

一、生成模型與判別模型 1、引言到目前為止，我們使用的是生成模型（generative model)，但是在實際使用中我們也在大量使用判別模型（discriminative model)，主要是因為它有如下的優點：準確性很高更容易包含很多和

ML13生成模型與判別模型

轉載自GitHub：http://t.cn/E76fhB6 生成模型與判別模型監督學習的任務是學習一個模型，對給定的輸入預測相應的輸出這個模型的一般形式為一個決策函式或一個條件概率分佈（後驗概率）：

理解生成模型與判別模型

導言我們都知道，對於有監督的機器學習中的分類問題，求解問題的演算法可以分為生成模型與判別模型兩種型別。但是，究竟什麼是生成模型，什麼是判別模型？不少書籍和技術文章對這對概念的解釋是含糊的。在今天這篇文章中，我們將準確、清晰的解釋這一組概念。第一種定義對於判別模型和生成模型有兩種定義

星型模型與雪花模型

星型模型和雪花模型在多維分析的商業智慧解決方案中，根據事實表和維度表的關係，又可將常見的模型分為星型模型和雪花型模型。在設計邏輯型資料的模型的時候，就應考慮資料是按照星型模型還是雪花型模型進行組織。星型模型當所有維表都直接連線到“ 事實表”上時，整個圖解就像星星一樣，

CUDA平行計算 | 執行緒模型與記憶體模型

文章目錄前言 CUDA執行緒模型（如何組織執行緒） CUDA記憶體模型（瞭解不同記憶體優缺點，合理使用）前言 CUDA（Compute Unified Device Architecture

機器學習_生成式模型與判別式模型

從概率分佈的角度看待模型。給個例子感覺一下: 如果我想知道一個人A說的是哪個國家的語言，我應該怎麼辦呢? 生成式模型我把每個國家的語言都學一遍，這樣我就能很容易知道A說的是哪國語言，並且C、D說的是哪國的我也可以知道，進一步我還能自己講不同國家語言。

LVS下的NAT模型與DR模型實戰

LVS是工作在四層的高效能負載均衡伺服器，由於工作在TCP/IP層並不涉及到使用者態，擺脫了套接字65535數量的限制，所以效能十分強悍，當然優秀的背後少不了我們國人章文嵩的付出，感謝開源如此優秀的作品。 LVS 是工作在核心netfilter的INPUT鏈路上的一組ipvs框架，他的使用有點類似於配置ne

[Pytorch]Pytorch 儲存模型與載入模型(轉)

1.儲存模型與載入

2.凍結部分引數，訓練另一部分引數

相關推薦