pytorch-模型儲存和載入

阿新 • • 發佈：2021-06-23

pytorch-模型儲存和載入

pytorch-模型儲存和載入

載入模型引數和選擇是由儲存的模型資料結構決定，故先要確定儲存模型模型的方法和資料結構

儲存模型

# 模型權重引數
model.state_dict()
'''首先說一下 model.state_dict()
pytorch 中的 model.state_dict 是一個簡單的python的字典物件,將每一層與它的對應引數建立對映關係.(如model的每一層的weights及偏置等等)
只有那些引數可以訓練的layer才會被儲存到模型的state_dict中,如卷積層,線性層等

state_dict是在定義了model或optimizer之後pytorch自動生成的
'''
# model.state_dict() 其實返回的是一個OrderDict，儲存了網路結構的名字和對應的引數


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.linear1 = nn.Linear(1, 2)
        self.linear2 = nn.Linear(2, 1)

    def forward(self, x):
        x = self.linear1(x)
        x = self.linear2(x)

        return x


mode = Net()
print(mode.state_dict())
"""
OrderedDict([('linear1.weight', tensor([[ 0.8108],[-0.7968]])), ('linear1.bias', tensor([ 0.2680, -0.4772])), ('linear2.weight', tensor([[-0.7066, -0.3334]])), ('linear2.bias', tensor([0.4819]))])

"""

print(mode.state_dict().keys())
"""
odict_keys(['linear1.weight', 'linear1.bias', 'linear2.weight', 'linear2.bias'])
"""

for param_tensor in model.state_dict():
    #列印 key value字典
    print(param_tensor,'\t',model.state_dict()[param_tensor].size())
    
"""
linear1.weight 	 torch.Size([2, 1])
linear1.bias 	 torch.Size([2])
linear2.weight 	 torch.Size([1, 2])
linear2.bias 	 torch.Size([1])
"""

# 儲存模型

torch.save(obj, f, pickle_module,pickle_protocol )
"""輸入引數
obj	   			可以是單個值也可以字典、物件
f 	   			要儲存引數的檔案路徑
pickle_module
pickle_protocol
"""

# 1、自定義儲存-工程實踐中常常使用---推薦
state = {'model':     model.state_dict(), 
         'optimizer': optimizer.state_dict(), 
         'epoch':     epoch   }
torch.save(model_object, './model.pt')  

# 2、僅僅是儲存模型權重引數
torch.save(model.state_dict(), PATH)

# 3、直接儲存整個模型和模型結構
torch.save(Net,PATH)

載入模型

引數的儲存

torch.save(model_object.state_dict(), 'params.pth') 

# 模型的載入有模型儲存的資料結構決定
ckpt = torch.load(f, map_location=None)
"""輸入引數
f					file模型檔案
map_location		torch.device, 動態地進行記憶體重對映，從不同的裝置上讀取檔案
pickle_module 		用於unpickling元資料和物件的模組
pickle_load_args 	傳遞給pickle_module.load()

註釋: 如果多塊顯示卡，map_location={'cuda:0':"cuda:1"},指定在2號顯示卡,不使用1號顯示卡
返回引數 字典d
由載入檔案定義
預設情況，dict_keys(['epoch', 'state_dict', 'optimizer', 'best_pred'])
"""

# 1、針對第一種儲存模型的載入方式
# 載入模型
model=Net()										
# 載入模型引數
model_CKPT = torch.load(checkpoint_PATH) 
# 引數各個屬性f
model.load_state_dict(model_CKPT['model'])  
optimizer.load_state_dict(model_CKPT['optimizer'])

# 2、針對第二種儲存模型的載入方式
model=Net()									# 例項化網路
model_CKPT = torch.load(checkpoint_PATH)    # 載入模型引數
model.load_state_dict(model_CKPT)  

# 針對第三種儲存整個模型的載入方式
model = torch.load(mode_PATH)

部分權重的載入

# 關鍵自定義函式

def intersect_dicts(da, db, exclude=()):
    """輸入引數
    da (state_dict)			 載入權重的 state_dict 
    db (state_dict) 	 	 載入模型的 state_dict
    exclude (list)           不想要的權重 keys()
    
    返回引數
    載入的部分權重 (state_dict)
    """	
    '''
    print("exclude",exclude)
    for k, v in da.items():
        for x in exclude:
            if x in k:
                print('@ ',x ,k)
            if v.shape != db[k].shape:
                print('# ', x, k)
	'''
    
    return {k: v for k, v in da.items() if k in db and not any(x in k for x in exclude) and v.shape == db[k].shape}

案例

# 載入模型
model = Net()

# 載入權重
ckpt=torch.load(weights, map_location=device)
state_dict=ckpt.state_dict()
# state_dict 是一個字典 

# state_dict.keys()
# odict_keys(['0.model.0.conv.conv.weight', '0.model.0.conv.conv.bias', '0.model.1.conv.weight', .....])

# 權重取捨處理
state_dict=intersect_dicts(state_dict, model.state_dict(), exclude=exclude)

# 模型載入權重
model.load_state_dict(state_dict, strict=False)

# 最後可以輸出載入了多少個
print('Transferred %g/%g items from %s' % (len(state_dict), len(model.state_dict()), weights))
# output >>> Transferred 498/506 items from yolov5m.pt

pytorch-模型儲存和載入

pytorch-模型儲存和載入目錄pytorch-模型儲存和載入儲存模型載入模型部分權重的載入案例

PyTorch 介紹 | 儲存和載入模型

本節我們將會看到如何儲存模型狀態、載入和執行模型預測 import torch import torchvision.models as models

在pytorch中儲存和載入神經網路

1. VGG簡介 VGG的名字源自於論文作者實驗室的名字Visual Geometry Group 。VGG提出了可以通過重複使用簡單的基礎塊來構建深度模型的思路。1

TensorFlow模型儲存和載入方法彙總

技術標籤：tensorflow 目錄一、TensorFlow常規模型載入方法儲存模型載入模型1.不載入圖結構，只加載引數 2.載入圖結構和引數 3.簡化版本二、TensorFlow二進位制模型載入方法三、二進位制模型製作四、從圖上讀取

線性迴歸10-模型儲存和載入

1 sklearn模型的儲存和載入API from sklearn.externals import joblib 儲存：joblib.dump(estimator, \'test.pkl\')

pytorch儲存和載入模型的兩種方式

技術標籤：python """ pytorch的模型儲存和載入的兩種方式：方式1：只儲存和恢復模型中的引數，使用這種方法，我們需要自己匯入模型的結構資訊

在Keras中實現儲存和載入權重及模型結構

1. 儲存和載入模型結構（1）儲存為JSON字串 json_string = model.to_json() （2）從JSON字串重構模型

keras訓練淺層卷積網路並儲存和載入模型例項

這裡我們使用keras定義簡單的神經網路全連線層訓練MNIST資料集和cifar10資料集：

Pytorch學習筆記16----CNN或LSTM模型儲存與載入

1.三個核心函式介紹一系列關於 PyTorch 模型儲存與載入的應用場景，主要包括三個核心函式：

全面解析Pytorch框架下模型儲存，載入以及凍結

最近在做試驗中遇到了一些深度網路模型載入以及儲存的問題，因此整理了一份比較全面的在 PyTorch 框架下有關模型的問題。首先咱們先定義一個網路來進行後續的分析：

tensorflow模型儲存、載入之變數重新命名例項

話不多說，幹就完了。變數重新命名的用處？簡單定義：簡單來說就是將模型A中的引數parameter_A賦給模型B中的parameter_B

pytorch模型儲存的2種實現方法

1、儲存整個網路結構資訊和模型引數資訊： torch.save(model_object,\'./model.pth\') 直接載入即可使用：

Pytorch模型儲存機制

在訓練中，模型儲存至關重要，pytorch中主要有以下兩種儲存機制：

[NumPy]檔案的儲存和載入

import numpy as np 二進位制檔案 save()、savez()和load()函式以 numpy 專用的二進位制型別（npy、npz）儲存和讀取資料，這三個函式會自動處理ndim、dtype、shape等資訊，使用它們讀寫陣列非常方便，但是save()輸出

dgl資料集的儲存和載入使用

技術標籤：dgl DGL建議使用者實現儲存和載入資料的函式，將處理後的資料快取在本地磁碟中。這樣在多數情況下可以幫使用者節省大量的資料處理時間。DGL提供了4個函式讓任務變得簡單。

7. pytorch 現有網路模型的使用與修改和模型的儲存與載入

PyTorch是一個開源的Python機器學習庫，基於Torch，用於自然語言處理等應用程式。他提供了大量的模型供我們所使用，如下圖所示：

【小白學PyTorch】19 TF2模型的儲存與載入

【新聞】：機器學習煉丹術的粉絲的人工智慧交流群已經建立，目前有目標檢測、醫學影象、時間序列等多個目標為技術學習的分群和水群嘮嗑的總群，歡迎大家加煉丹兄為好友，加入煉丹協會。微信：cyx645016617.

pytorch筆記（二）——模型的儲存與載入

技術標籤：pytorch 1.儲存和載入模型 # 模型儲存 model = ModelClass(*args, **kwargs) torch.save(model, \'model.ckpt\')

Pytorch之儲存讀取模型例項

pytorch儲存資料 pytorch儲存資料的格式為.t7檔案或者.pth檔案，t7檔案是沿用torch7中讀取模型權重的方式。而pth檔案是python中儲存檔案的常用格式。而在keras中則是使用.h5檔案。

tensorflow2.0儲存和恢復模型3種方法

方法1：只儲存模型的權重和偏置這種方法不會儲存整個網路的結構，只是儲存模型的權重和偏置，所以在後期恢復模型之前，必須手動建立和之前模型一模一樣的模型，以保證權重和偏置的維度和儲存之前的相同。

pytorch-模型儲存和載入

pytorch-模型儲存和載入

儲存模型

載入模型

部分權重的載入

案例

相關推薦