從頭學pytorch(十二):模型儲存和載入

阿新 • • 發佈：2020-01-03

模型讀取和儲存

總結下來,就是幾個函式

torch.load()/torch.save()

通過python的pickle完成序列化與反序列化.完成記憶體<-->磁碟轉換.

Module.state_dict()/Module.load_state_dict()

state_dict()獲取模型引數.load_state_dict()載入模型引數

讀寫Tensor

我們可以直接使用save函式和load函式分別儲存和讀取Tensor。save使用Python的pickle實用程式將物件進行序列化，然後將序列化的物件儲存到disk，使用save可以儲存各種物件,包括模型、張量和字典等。而laod

使用pickle unpickle工具將pickle的物件檔案反序列化為記憶體。
下面的例子建立了Tensor變數x，並將其存在檔名同為x.pt的檔案裡。

import torch
from torch import nn

x = torch.ones(3)
torch.save(x, 'x.pt')

然後我們將資料從儲存的檔案讀回記憶體。

x2 = torch.load('x.pt')
x2

輸出：

tensor([1., 1., 1.])

我們還可以儲存一個Tensor列表並讀回記憶體。

y = torch.zeros(4)
torch.save([x, y], 'xy.pt')
xy_list = torch.load('xy.pt')
xy_list

輸出：

[tensor([1., 1., 1.]), tensor([0., 0., 0., 0.])]

儲存並讀取一個從字串對映到Tensor的字典。

torch.save({'x': x, 'y': y}, 'xy_dict.pt')
xy = torch.load('xy_dict.pt')
xy

輸出：

{'x': tensor([1., 1., 1.]), 'y': tensor([0., 0., 0., 0.])}

state_dict

在PyTorch中，Module的可學習引數(即權重和偏差)，模組模型包含在引數中(通過model.parameters()

訪問)。state_dict是一個從引數名稱隱射到引數Tesnor的字典物件。

class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.hidden = nn.Linear(3, 2)
        self.act = nn.ReLU()
        self.output = nn.Linear(2, 1)

    def forward(self, x):
        a = self.act(self.hidden(x))
        return self.output(a)

net = MLP()
net.state_dict()

輸出：

OrderedDict([('hidden.weight', tensor([[ 0.2448,  0.1856, -0.5678],
                      [ 0.2030, -0.2073, -0.0104]])),
             ('hidden.bias', tensor([-0.3117, -0.4232])),
             ('output.weight', tensor([[-0.4556,  0.4084]])),
             ('output.bias', tensor([-0.3573]))])

注意，只有具有可學習引數的層(卷積層、線性層等)才有state_dict中的條目優化器(optim)也有一個state_dict，其中包含關於優化器狀態以及所使用的超引數的資訊。

optimizer = torch.optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
optimizer.state_dict()

輸出：

{'state': {}, 'param_groups': [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'params': [139952370292992, 139952370293784, 139952370294144, 139952370293496]}]}

儲存和載入模型

PyTorch中儲存和載入訓練模型有兩種常見的方法:

僅儲存和載入模型引數(state_dict)
儲存和載入整個模型

儲存和載入`state_dict`(推薦方式)

儲存：

torch.save(model.state_dict(), PATH) # 推薦的檔案字尾名是pt或pth

載入：

model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))

儲存和載入整個模型

儲存：

torch.save(model, PATH)

載入：

model = torch.load(PATH)

我們採用推薦的方法一來實驗一下:

X = torch.randn(2, 3)
Y = net(X)

PATH = "./net.pt"
torch.save(net.state_dict(), PATH)

net2 = MLP()
net2.load_state_dict(torch.load(PATH))
Y2 = net2(X)
Y2 == Y

輸出：

tensor([[1],
        [1]], dtype=torch.uint8)

因為這net和net2都有同樣的模型引數，那麼對同一個輸入X的計算結果將會是一樣的。上面的輸出也驗證了這一點。

此外，還有一些其他使用場景，例如GPU與CPU之間的模型儲存與讀取、使用多塊GPU的模型的儲存等等，使用的時候可以參考官方文件

從頭學pytorch(十二):模型儲存和載入

模型讀取和儲存總結下來,就是幾個函式 torch.load()/torch.save() 通過python的pickle完成序列化與反序列化.完成記憶體<-->磁碟轉換. Module.state_dict()/Module.load_state_dict() state_dict()獲

機器學習實踐（十六）—sklearn之模型儲存和載入

一、sklearn - 模型的儲存和載入 - API from sklearn.externals import joblib 儲存 joblib.dump(rf, ‘test.pkl’) 載入 estimator

從頭學pytorch(十四):lenet

卷積神經網路在之前的文章裡,對28 X 28的影象,我們是通過把它展開為長度為784的一維向量,然後送進全連線層,訓練出一個分類模型.這樣做主要有兩個問題影象在同一列鄰近的畫素在這個向量中可能相距較遠。它們構成的模式可能難以被模型識別。對於大尺寸的輸入影象，使用全連線層容易造成模型過大。假設輸入是高和

從頭學pytorch(十五):AlexNet

AlexNet AlexNet是2012年提出的一個模型,並且贏得了ImageNet影象識別挑戰賽的冠軍.首次證明了由計算機自動學習到的特徵可以超越手工設計的特徵,對計算機視覺的研究有著極其重要的意義. AlexNet的設計思路和LeNet是非常類似的.不同點主要有以下幾點: 啟用函式由sigmoid改為R

從頭學pytorch(十六):VGG NET

VGG AlexNet在Lenet的基礎上增加了幾個卷積層,改變了卷積核大小,每一層輸出通道數目等,並且取得了很好的效果.但是並沒有提出一個簡單有效的思路. VGG做到了這一點,提出了可以通過重複使⽤簡單的基礎塊來構建深度學習模型的思路. 論文地址:https://arxiv.org/abs/1409.155

從頭學pytorch(十七):網路中的網路NIN

網路中的網路NIN 之前介紹的LeNet,AlexNet,VGG設計思路上的共同之處,是加寬(增加捲積層的輸出的channel數量)和加深(增加捲積層的數量),再接全連線層做分類.　　 NIN提出了一個不同的思路,串聯多個由卷積層和'全連線層'(1x1卷積)構成的小網路來構建一個深層網路. 論文地址:http

從頭學pytorch(十八):GoogLeNet

GoogLeNet GoogLeNet和vgg分別是2014的ImageNet挑戰賽的冠亞軍.GoogLeNet則做了更加大膽的網路結構嘗試，雖然深度只有22層，但大小卻比AlexNet和VGG小很多，GoogleNet引數為500萬個，AlexNet引數個數是GoogleNet的12倍，VGGNet引數又是

從頭學pytorch(十九):批量歸一化batch normalization

批量歸一化論文地址:https://arxiv.org/abs/1502.03167 批量歸一化基本上是現在模型的標配了. 說實在的,到今天我也沒搞明白batch normalize能夠使得模型訓練更穩定的底層原因,要徹底搞清楚,涉及到很多凸優化的理論,需要非常紮實的數學基礎才行. 目前為止,我理解的批量歸

tensorflow-模型儲存和載入（一）

模型儲存和載入（一）TensorFlow的模型格式有很多種，針對不同場景可以使用不同的格式。格式簡介Checkpoint用於儲存模型的權重，主要用於模型訓練過程中引數的備份和模型訓練熱啟動。GraphD

從頭學pytorch(二十):殘差網路resnet

殘差網路ResNet resnet是何凱明大神在2015年提出的.並且獲得了當年的ImageNet比賽的冠軍. 殘差網路具有里程碑的意義,為以後的網路設計提出了一個新的思路. googlenet的思路是加寬每一個layer,resnet的思路是加深layer. 論文地址:https://arxiv.org/a

從頭學pytorch(二十一):全連線網路dense net

DenseNet 論文傳送門,這篇論文是CVPR 2017的最佳論文. resnet一文裡說了,resnet是具有里程碑意義的.densenet就是受resnet的啟發提出的模型. resnet中是把不同層的feature map相應元素的值直接相加.而densenet是將channel維上的feature

Pytorch 儲存和載入模型 part2

搭建網路： torch.manual_seed(1) # reproducible # 假資料 x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1) y = x.p

pytorch 模型的儲存和載入

本文轉至：https://byjiang.com/2017/06/05/How_To_Save_And_Restore_Model/ 在模型完成訓練後，我們需要將訓練好的模型儲存為一個檔案供測試使用，或者因為一些原因我們需要繼續之前的狀態訓練之前儲存的模型，那麼如何在PyTorch中儲存和恢復模型

基於pytorch的儲存和載入模型引數

當我們花費大量的精力訓練完網路，下次預測資料時不想再（有時也不必再）訓練一次時，這時候torch.save(),torch.load()就要登場了。儲存和載入模型引數有兩種方式：方式一： torch.save(net.state_dict(),path): 功能

pytorch筆記02)模型的儲存和載入

儲存和載入整個模型 torch.save(model_object, 'model.pkl') model = torch.load('model.pkl') 僅儲存和載入模型引數(推薦使用,需要提前手動構建模型) torch.save(model_object.state_

PyTorch(七)——模型的訓練和測試、儲存和載入

PyTorch的學習和使用（七）模型的訓練和測試在訓練模型時會在前面加上： model.train() 在測試模型時在前面使用： model.eval() 同時發現，如果不寫這兩個程式也可以執行，這是因為這兩個方法是針對在網路訓練和測試時採用不同方式的

pytorch學習筆記（五）：儲存和載入模型

# 儲存和載入整個模型 torch.save(model_object, 'model.pkl') model = torch.load('model.pkl') # 僅儲存和載入模型引數(推薦使

pytorch模型的訓練、儲存和載入

PyTorch的學習和使用（七）模型的訓練和測試在訓練模型時會在前面加上： model.train()1 在測試模型時在前面使用： model.eval()1 同時發現，如果不寫這兩個程式也可以執行，這是因為這兩個方法是針對在網路訓練和測試

從頭學pytorch(九):模型構造

模型構造 nn.Module nn.Module是pytorch中提供的一個類,是所有神經網路模組的基類.我們自定義的模組要繼承這個基類. import torch from torch import nn class MLP(nn.Module): # 宣告帶有模型引數的層，這裡聲明瞭兩個全連線層

【小白學PyTorch】6 模型的構建訪問遍歷儲存（附程式碼）

文章轉載自微信公眾號：機器學習煉丹術。歡迎大家關注，這是我的學習分享公眾號，100+原創乾貨。文章目錄： [TOC] 本文是對一些函式的學習。函式主要包括下面四個方便： - 模型構建的函式：```add_module```,```add_module```,```add_module``` - 訪問子

從頭學pytorch(十二):模型儲存和載入

模型讀取和儲存

讀寫Tensor

state_dict

儲存和載入模型

儲存和載入state_dict(推薦方式)

儲存和載入整個模型

相關推薦

儲存和載入`state_dict`(推薦方式)