PyTorch學習：載入模型和引數

阿新 • • 發佈：2019-01-09

pytorch的模型和引數是分開的，可以分別儲存或載入模型和引數。

pytorch有兩種模型儲存方式：

一、儲存整個神經網路的的結構資訊和模型引數資訊，save的物件是網路net

二、只儲存神經網路的訓練模型引數，save的物件是net.state_dict()

對應兩種儲存模型的方式，pytorch也有兩種載入模型的方式。對應第一種儲存方式，載入模型時通過torch.load('.pth')直接初始化新的神經網路物件；對應第二種儲存方式，需要首先匯入對應的網路，再通過net.load_state_dict(torch.load('.pth'))完成模型引數的載入。

在網路比較大的時候，第一種方法會花費較多的時間。

1. 直接載入模型和引數

載入別人訓練好的模型：

# 儲存和載入整個模型
torch.save(model_object, 'resnet.pth')
model = torch.load('resnet.pth')

2. 分別載入網路的結構和引數

# 將my_resnet模型儲存為my_resnet.pth
torch.save(my_resnet.state_dict(), "my_resnet.pth")
# 載入resnet，模型存放在my_resnet.pth
my_resnet.load_state_dict(torch.load("my_resnet.pth"))

其中my_resnet是my_resnet.pth對應的網路結構。

3. pytorch預訓練模型

1）載入預訓練模型和引數

resnet18 = models.resnet18(pretrained=True)

這裡是直接呼叫pytorch中的常用模型

# PyTorch中的torchvision裡有很多常用的模型，可以直接呼叫：
import torchvision.models as models

resnet101 = models.resnet18()
alexnet = models.alexnet()
squeezenet = models.squeezenet1_0()
densenet = models.densenet_161()

2）只加載模型，不載入預訓練引數

# 匯入模型結構
resnet18 = models.resnet18(pretrained=False)
# 載入預先下載好的預訓練引數到resnet18
resnet18.load_state_dict(torch.load('resnet18-5c106cde.pth'))

3）載入部分預訓練模型

resnet152 = models.resnet152(pretrained=True)
pretrained_dict = resnet152.state_dict()
"""載入torchvision中的預訓練模型和引數後通過state_dict()方法提取引數
   也可以直接從官方model_zoo下載：
   pretrained_dict = model_zoo.load_url(model_urls['resnet152'])"""
model_dict = model.state_dict()
# 將pretrained_dict裡不屬於model_dict的鍵剔除掉
pretrained_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict}
# 更新現有的model_dict
model_dict.update(pretrained_dict)
# 載入我們真正需要的state_dict
model.load_state_dict(model_dict)

參考資料：

PyTorch學習：載入模型和引數

pytorch的模型和引數是分開的，可以分別儲存或載入模型和引數。 pytorch有兩種模型儲存方式：一、儲存整個神經網路的的結構資訊和模型引數資訊，save的物件是網路net 二、只儲存神經網路的訓練模型引數，save的物件是net.state_dict() 對應

PyTorch學習：動態圖和靜態圖

動態圖和靜態圖目前神經網路框架分為靜態圖框架和動態圖框架，PyTorch 和 TensorFlow、Caffe 等框架最大的區別就是他們擁有不同的計算圖表現形式。 TensorFlow 使用靜態圖，這意味著我們先定義計算圖，然後不斷使用它，而在 PyTorch 中，每次都

監督學習：生成模型和判別模型

生成模型與判別模型一直在看論文的過程中遇到這個問題，折騰了不少時間，然後是下面的一點理解，不知道正確否。若有錯誤，還望各位前輩不吝指正，以免小弟一錯再錯。在此謝過。一、決策函式Y=f(X)或者條件概率分佈P(Y|X) 監督學習的任務就是從

機器學習：生成模型和判別模型

經典提問：Navie Bayes和Logistic迴歸區別是什麼？ Navie Bayes是生成式模型，Logistic迴歸是判別式模型，二者的區別就是生成式模型與判別式模型的區別。首先，Navie Bayes通過已知樣本求得先驗概率P(Y), 及條件概率P(X|Y),

PyTorch學習筆記(3)—CPU和GPU上載入模型

前言有一些現實的問題是這樣的：當我們在GPU叢集或者伺服器上訓練模型的時候，有時候需要將模型取回，在本地測試一下。這個時候就需要PyTorch將模型轉換為cpu的版本，因為PyTorch針對不同的系統和cuda有不同的版本。因此無法直接將GPU訓練出的

機器學習：sklearn模型指標和特徵貢獻度檢視

模型訓練完成後，即使模型評估很好，各項指標都很到位，業務人員肯定也是心裡沒底的，哪怕有模型公式，他們也看不懂啊。咋整，當然是先把模型的重要評估指標列印給他們看，再把特徵貢獻度從大到小，畫成圖給他們看啦。今天就通過sklearn實現模型評估指標和特徵貢獻度的圖形檢視。本文的資料集採用泰坦尼克號倖

PyTorch學習：引數初始化

Sequential 模型的引數初始化 import numpy as np import torch from torch import nn # 定義一個 Sequential 模型 net1 = nn.Sequential( nn.Linear(2, 4),

pytorch學習：構建網路模型的幾種方法

利用pytorch來構建網路模型有很多種方法，以下簡單列出其中的四種。假設構建一個網路模型如下：卷積層--》Relu層--》池化層--》全連線層--》Relu層--》全連線層首先匯入幾種方法用到的包： import torch import torch.nn.functional as F

keras、pytorch模型和引數的儲存

這篇博文主要簡單介紹深度學習框架keras和pytorch的模型儲存方法和模型引數儲存方法。 keras： import keras form keras.models import load_model,Sequential,Model,Input f

Keras如何儲存和載入訓練好的模型和引數

1，儲存模型： my_model = create_model_function( ...... ) my_model.compile( ...... ) my_model.fit( ...... ) model_name . save( filepath, ove

Keras 多GPU下模型和引數儲存Modelcheckpoint callback報錯問題以及在單GPU/CPU下載入

儲存多GPU下無法直接儲存多GPU模型結構和引數，而應該使用template model進行儲存 keras文件：To save the multi-gpu model, use .save(fname) or .save_weights(fna

tensorflow儲存模型、載入模型和提取模型引數和特徵圖

1.tf.train.latest_checkpoint('./model_data/')這一句最終返回的是一個字串，比如'./model_data/model-99991'這個方法本身還會做相應的檢查，比如checkpoint中最新的模型model_checkpoint_p

flask學習筆記（四）：渲染模板和引數

1、渲染模板需要先匯入render_templatem模組，然後先在檔案所在目錄建立一資料夾，命名為templates，然後在資料夾中新建一個html網頁檔案。（渲染時框架會自動尋找網頁檔案，不必新增"templates"這個路徑，這是由flask框架決定的） &l

機器學習：交叉驗證和模型選擇與Python程式碼實現

前言：本篇博文主要介紹交叉驗證（cross validation）和模型選擇，首先介紹相關的基礎概念和原理，然後通過Python程式碼實現交叉驗證和模型評估以及選擇。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記。 1.分類器的評價評價分類

javascript學習：閉包和prototype原型使用基礎

c# 作用 cnblogs public return rem 聲明 pre 都是閉包 function Person(name) { this.Username = name; var Userage = 18;

C++PrimerPlus學習之記憶體模型和名稱空間

標頭檔案如果檔名包含在尖括號中，則C++編譯器將在儲存標準標頭檔案的主機系統的檔案系統的中查詢。如果檔名包含在雙引號中，則編譯器將在當前目錄下查詢。使用條件編譯防止多次包含標頭檔案 #ifndef XXX_H_ #define XXX_H_ ... #en

【5】caffe的python介面學習：訓練模型（training)

如果不進行視覺化，只想得到一個最終的訓練model, 那麼程式碼非常簡單，如下 : import caffe caffe.set_device(0) caffe.set_mode_gpu() solver = caffe.SGDSolver('/home/yeler082/data/solver

SpringBoot學習：讀取yml和properties檔案的內容

轉：https://www.cnblogs.com/tongxuping/p/7207814.html 一、在SpringBoot實現屬性注入：　　1）、新增pom依賴jar包； 1

pytorch筆記：03)softmax和log_softmax，以及CrossEntropyLoss

softmax在神經網路裡面比較常見，簡而言之，就是多分類的概率輸出 sotfmax(xi)=exp(xi)∑jexp(xj) s o t

pytorch筆記：06)requires_grad和volatile

requires_grad Variable變數的requires_grad的屬性預設為False,若一個節點requires_grad被設定為True，那麼所有依賴它的節點的requires_grad都為True。 x=Variable(torch.ones(1)) w=Vari

PyTorch學習：載入模型和引數

pytorch有兩種模型儲存方式：

1. 直接載入模型和引數

2. 分別載入網路的結構和引數

3. pytorch預訓練模型

相關推薦