pytorch筆記（二）——模型的儲存與載入

阿新 • • 發佈：2021-01-08

技術標籤：pytorch

1.儲存和載入模型

# 模型儲存
model = ModelClass(*args, **kwargs)
torch.save(model, 'model.ckpt')

# 模型載入
model = torch.load(PATH)

儲存整個網路的的結構資訊和模型引數資訊，save的物件是網路net。載入時無需再定義網路。

2.儲存和載入模型引數

# 模型引數儲存
model = ModelClass(*args, **kwargs)
torch.save(model.state_dict(), 'params.ckpt')

# 模型引數載入
model = 
 ModelClass(*args, **kwargs)
model.load_state_dict(torch.load('params.ckpt'))

只儲存神經網路的訓練模型引數，save的物件是net.state_dict()。載入模型引數前需要自己定義網路，並且其中的引數名稱與結構要與儲存的模型中的一致。

使用該方式常見問題：
1.模型引數引數名稱不一致
在這裡插入圖片描述
在上圖中儲存的模型引數比現在的模型多了flat_w這一部分，如果直接載入儲存的模型引數就會報下面的錯誤。

RuntimeError: Error(s) in loading state_dict for CNNMnist: 

 Unexpected key(s) in state_dict: "flat_w".

解決辦法：
建立一個新的字典物件OrderedDict()，將需要的引數賦值到新建的字典物件中，然後載入新建的字典物件

print("現在的模型引數名稱")
model = CNNMnist(args=args).to(args.device)
for (k, v) in model.state_dict().items():
    print(k)

print("儲存的模型引數名稱")
params = torch.load("./model/model0.ckpt" 
)
for (k, v) in params.items():
    print(k)
new_state_dict = OrderedDict()
for i, (k, v) in enumerate(params.items()):
    if i != 0:
        name = k
        new_state_dict[name] = v
model.load_state_dict(new_state_dict)

2.儲存引數和載入引數的torch版本不同
如果儲存模型時，torch的版本為1.6，而載入引數時的torch版本小於。那麼載入引數是會出現以下錯誤

raise RuntimeError("{} is a zip archive (did you mean to use torch.jit.load()?)".format(f.name))

這是因為在torch1.6版本中torch.save儲存的引數是zip格式的，所以載入時出現錯誤。
解決辦法：
1.在torch1.6使用torch.save儲存引數是加上_use_new_zipfile_serialization=False這個引數，即

torch.save(model.state_dict(), 'params.ckpt'， _use_new_zipfile_serialization=False)

2.將載入引數時的torch版本升到1.6

pytorch筆記（二）——模型的儲存與載入

技術標籤：pytorch 1.儲存和載入模型 # 模型儲存 model = ModelClass(*args, **kwargs) torch.save(model, \'model.ckpt\')

Pytorch學習筆記16----CNN或LSTM模型儲存與載入

1.三個核心函式介紹一系列關於 PyTorch 模型儲存與載入的應用場景，主要包括三個核心函式：

PyTorch學習筆記（二）——torch.nn解析

PyTorch提供了方便漂亮的類和模組，來幫助我們建立和訓練神經網路，例如 torch.nn, torch.optim 等。為了更好地理解這些模組的功能和原理，我們在手動搭建的神經網路上，逐步新增這些模組，以顯示每部分模組的

分散式技術原理筆記（二）分散式資源管理與負載排程

第一章集中式體系結構集中式結構就是，由一臺或多臺伺服器組成中央伺服器，系統內的所有資料都儲存在中央伺服器中，系統內所有的業務也均先由中央伺服器處理。多個節點伺服器與中央伺服器連線，並將自己的資訊彙報

von Mises Distribution (馮·米賽斯分佈)的隨機模擬與引數估計的筆記（二）

von Mises Distribution (馮·米賽斯分佈)的隨機模擬與引數估計的筆記（二） 1.引數估計運算元分析

《Redis設計與實現》讀書筆記（二） ——Redis中的字典（Hash）

《Redis設計與實現》讀書筆記（二） ——Redis中的字典（Hash）（原創內容，轉載請註明來源，謝謝）

資料倉庫學習筆記（二）

這一系列主要是美團18年一年的大資料相關的文章分享，倒序。從中可以看到美團的實時資料系統架構從Storm到Flink的轉變和選擇。

伯陽的網路筆記（二）：HTTP基礎

因為疫情期間在外當志願者，晚上回家無聊翻翻網路知識，權當記錄了。初始動筆：2019-02-03

SchemaViolationException-JanusGraph問題筆記（二）

場景 Gremlin命令列載入Graph of the Gods(官網入門Demo) GraphOfTheGodsFactory.load(graph) 問題 E04: 載入示例圖時報錯SchemaViolationException

Spring Cloud入門筆記（二）Hystrix服務容錯

1.Hystrix基本概念 Hystrix is a latency and fault tolerance library designed to isolate points of access to remote systems,services and 3rd party libraries,stop cascading failure and enable resilienc