PyTorch學習:載入模型和引數
阿新 • • 發佈:2019-01-09
pytorch的模型和引數是分開的,可以分別儲存或載入模型和引數。
pytorch有兩種模型儲存方式:
一、儲存整個神經網路的的結構資訊和模型引數資訊,save的物件是網路net
二、只儲存神經網路的訓練模型引數,save的物件是net.state_dict()
對應兩種儲存模型的方式,pytorch也有兩種載入模型的方式。對應第一種儲存方式,載入模型時通過torch.load('.pth')直接初始化新的神經網路物件;對應第二種儲存方式,需要首先匯入對應的網路,再通過net.load_state_dict(torch.load('.pth'))完成模型引數的載入。
在網路比較大的時候,第一種方法會花費較多的時間。
1. 直接載入模型和引數
載入別人訓練好的模型:
# 儲存和載入整個模型
torch.save(model_object, 'resnet.pth')
model = torch.load('resnet.pth')
2. 分別載入網路的結構和引數
# 將my_resnet模型儲存為my_resnet.pth
torch.save(my_resnet.state_dict(), "my_resnet.pth")
# 載入resnet,模型存放在my_resnet.pth
my_resnet.load_state_dict(torch.load("my_resnet.pth"))
其中my_resnet是my_resnet.pth對應的網路結構。
3. pytorch預訓練模型
1)載入預訓練模型和引數
resnet18 = models.resnet18(pretrained=True)
這裡是直接呼叫pytorch中的常用模型
# PyTorch中的torchvision裡有很多常用的模型,可以直接呼叫: import torchvision.models as models resnet101 = models.resnet18() alexnet = models.alexnet() squeezenet = models.squeezenet1_0() densenet = models.densenet_161()
2)只加載模型,不載入預訓練引數
# 匯入模型結構
resnet18 = models.resnet18(pretrained=False)
# 載入預先下載好的預訓練引數到resnet18
resnet18.load_state_dict(torch.load('resnet18-5c106cde.pth'))
3)載入部分預訓練模型
resnet152 = models.resnet152(pretrained=True)
pretrained_dict = resnet152.state_dict()
"""載入torchvision中的預訓練模型和引數後通過state_dict()方法提取引數
也可以直接從官方model_zoo下載:
pretrained_dict = model_zoo.load_url(model_urls['resnet152'])"""
model_dict = model.state_dict()
# 將pretrained_dict裡不屬於model_dict的鍵剔除掉
pretrained_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict}
# 更新現有的model_dict
model_dict.update(pretrained_dict)
# 載入我們真正需要的state_dict
model.load_state_dict(model_dict)
參考資料: