pytorch 預訓練模型修改

阿新 • • 發佈：2018-11-13


# coding=UTF-8
import torchvision.models as models
import torch
import torch.nn as nn
import math
import torch.utils.model_zoo as model_zoo
 
class CNN(nn.Module):
 
    def __init__(self, block, layers, num_classes=9):
        self.inplanes = 64
        super(ResNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3,
                               bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        self.layer1 = self._make_layer(block, 64, layers[0])
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2)
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2)
        self.layer4 = self._make_layer(block, 512, layers[3], stride=2)
        self.avgpool = nn.AvgPool2d(7, stride=1)
        #新增一個反捲積層
        self.convtranspose1 = nn.ConvTranspose2d(2048, 2048, kernel_size=3, stride=1, padding=1, output_padding=0, groups=1, bias=False, dilation=1)
        #新增一個最大池化層
        self.maxpool2 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)
        #去掉原來的fc層，新增一個fclass層
        self.fclass = nn.Linear(2048, num_classes)
 
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()
 
    def _make_layer(self, block, planes, blocks, stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes * block.expansion:
            downsample = nn.Sequential(
                nn.Conv2d(self.inplanes, planes * block.expansion,
                          kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(planes * block.expansion),
            )
 
        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample))
        self.inplanes = planes * block.expansion
        for i in range(1, blocks):
            layers.append(block(self.inplanes, planes))
 
        return nn.Sequential(*layers)
 
    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)
 
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
 
        x = self.avgpool(x)
        #新加層的forward
        x = x.view(x.size(0), -1)
        x = self.convtranspose1(x)
        x = self.maxpool2(x)
        x = x.view(x.size(0), -1)
        x = self.fclass(x)
 
        return x
 
#載入model
resnet50 = models.resnet50(pretrained=True)
cnn = CNN(Bottleneck, [3, 4, 6, 3])
#讀取引數
pretrained_dict = resnet50.state_dict()
model_dict = cnn.state_dict()
# 將pretrained_dict裡不屬於model_dict的鍵剔除掉
pretrained_dict =  {k: v for k, v in pretrained_dict.items() if k in model_dict}
# 更新現有的model_dict
model_dict.update(pretrained_dict)
# 載入我們真正需要的state_dict
cnn.load_state_dict(model_dict)
# print(resnet50)
print(cnn)
--------------------- 
作者：whut_ldz 
來源：CSDN 
原文：https://blog.csdn.net/whut_ldz/article/details/78845947 
版權宣告：本文為博主原創文章，轉載請附上博文連結！

pytorch 預訓練模型修改

# coding=UTF-8 import torchvision.models as models import torch import torch.nn as nn import math import torch.utils.model_zoo as model_zoo class C

Pytorch使用預訓練模型加速訓練的技巧

當屬於預訓練模型屬於下面的情況的時候，可以採用這個加速的技巧：固定前部分的層，只改變網路後面層的引數。比如，使用vgg16的預訓練模型，固定特徵提取層，改變後面的全連線層。要注意的是，如果固定的是特徵提取層+一個全連線層，也可以使用這個技巧，只要固定的是前一部分。

pytorch 如何載入部分預訓練模型

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

pytorch 更改預訓練模型網路結構

一個繼承nn.module的model它包含一個叫做children()的函式，這個函式可以用來提取出model每一層的網路結構，在此基礎上進行修改即可，修改方法如下(去除後兩層)： resnet_layer = nn.Sequential(*list(model.children())[:-2])

PyTorch—torchvision.models匯入預訓練模型與殘差網路講解

文章目錄 torchvision.models 1. 模組呼叫 2. 原始碼解析 3. ResNet類 4. Bottlenect類 5. BasicB

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率載入預訓練模型並finetune 修改loss函式兩個網路做ensemble，進行網路訓練，調節learning rate 載入預訓練模型並fi

pytorch學習筆記之載入預訓練模型

原文：https://blog.csdn.net/weixin_41278720/article/details/80759933 pytorch自發布以來，由於其便捷性，贏得了越來越多人的喜愛。 Pytorch有很多方便易用的包，今天要談的是torchvision包，

PyTorch學習系列(十五)——如何載入預訓練模型？

PyTorch提供的預訓練模型 PyTorch定義了幾個常用模型，並且提供了預訓練版本： AlexNet: AlexNet variant from the “One weird trick” paper. VGG: VGG-11, VGG-13, VGG

Pytorch載入部分預訓練模型的引數

前言自從從深度學習框架caffe轉到Pytorch之後，感覺Pytorch的優點妙不可言，各種設計簡潔，方便研究網路結構修改，容易上手，比TensorFlow的臃腫好多了。對於深度學習的初學者，Pytorch值得推薦。今天主要主要談談Pytorch是如何載入預訓練模型的引數以

Pytorch 快速入門（七）載入預訓練模型初始化網路引數

在預訓練網路的基礎上，修改部分層得到自己的網路，通常我們需要解決的問題包括： 1. 從預訓練的模型載入引數 2. 對新網路兩部分設定不同的學習率，主要訓練自己新增的層 PyTorch提供的預訓練模型PyTorch定義了幾個常用模型，並且提供了預訓練版本：AlexNet: Al

韓國小哥哥用Pytorch實現谷歌最強NLP預訓練模型BERT | 程式碼

乾明編譯整理自 GitHub 量子位報道 | 公眾號 QbitAI新鮮程式碼，還熱乎著呢。前

小白程式設計用Pytorch匯入預訓練模型&&設定不同學習速率

前兩天正好在做這個部分，參考了很多網友的做法，也去pytorch論壇查了一下，現在總結如下。建議還是自己單步除錯一下看看每個引數裡面的值是什麼樣的比較好。1.匯入預訓練的模型，預訓練模型是現有模型的一個或者幾個部分假設我有一個網路包含 pretrained和classify兩

基於densenet新增預訓練模型的pytorch訓練模型

本程式碼針對基於densenet 的 pytorch新增預訓練模型的的一個分類方法，由官方教程為基礎做的更改。本實驗主要目的是以Imagenet或其他大資料集已經訓練好的權重檔案，初始化到我們要用到的訓練網路中。本演算法基於jupyter noetbook 下載an

用pytorch搭建AlexNet（微調預訓練模型及手動搭建）

本文介紹瞭如何在pytorch下搭建AlexNet，使用了兩種方法，一種是直接載入預訓練模型，並根據自己的需要微調（將最後一層全連線層輸出由1000改為10），另一種是手動搭建。構建模型類的時候需要繼承自torch.nn.Module類，要自己重寫__\_\_

PyTorch-網路的建立，預訓練模型的載入

本文是PyTorch使用過程中的的一些總結，有以下內容：構建網路模型的方法網路層的遍歷各層引數的遍歷模型的儲存與載入從預訓練模型為網路引數賦值主要涉及到以下函式的使用 add_module,ModulesList,Sequential 模型建立 modules(),named_modules

【小白學PyTorch】5 torchvision預訓練模型與資料集全覽

文章來自：微信公眾號【機器學習煉丹術】。一個ai專業研究生的個人學習分享公眾號文章目錄： [TOC] # torchvision >官網上的介紹（FQ）：The torchvision package consists of popular datasets, model architecture

keras調用預訓練模型分類

dict 拓展 span 類別就是 num pan 維度上下在網上看到一篇博客，地址https://www.pyimagesearch.com/2017/03/20/imagenet-vggnet-resnet-inception-xception-keras/，是關

keras中使用預訓練模型進行圖片分類

shape puts output 代碼 ESS str closed weight list keras中含有多個網絡的預訓練模型，可以很方便的拿來進行使用。安裝及使用主要參考官方教程：https://keras.io/zh/applications/ https:

tensorflow利用預訓練模型進行目標檢測（一）：預訓練模型的使用

err sync numpy sna sta porting trac git int32 一、運行樣例官網鏈接：https://github.com/tensorflow/models/blob/master/research/object_detection/obje

谷歌官宣：全面超越人類的最強NLP預訓練模型BERT開源了！

來源 | Google Research GitHub 編譯 | 無明、Natalie 編輯 | Natalie AI 前線導讀：近日，谷歌 AI 的一篇 NLP 論文引起了社群極大的關注與討論，被認為是 NLP 領域的極大突破。谷歌大腦研究科學家 Thang Luong Twitter 表示，這項

pytorch 預訓練模型修改

相關推薦