【pytorch】模型的搭建儲存載入

阿新 • • 發佈：2019-01-11

使用pytorch進行網路模型的搭建、儲存與載入，是非常快速、方便的。

搭建ConvNet

所有的網路都要繼承torch.nn.Module，然後在建構函式中使用torch.nn中的提供的介面定義layer的屬性，最後，在forward函式中將各個layer連線起來。

下面，以LeNet為例：

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1   = nn.Linear(16*5*5, 120)
        self.fc2   = nn.Linear(120, 84)
        self.fc3   = nn.Linear(84, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(x.size(0), -1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        out = self.fc3(x)
        return out

這樣一來，我們就搭建好了網路模型，是不是很簡潔明瞭呢？此外，還可以使用torch.nn.Sequential，更方便進行模組化的定義，如下：

class LeNetSeq(nn.Module):
    def __init__(self):
        super(LeNetSeq, self).__init__()
        self.conv = nn.Sequential(
            nn.Conv2d(3, 6, 5),
            nn.ReLU(),
            nn.MaxPool2d(2),
            nn.Conv2d(6, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(2),
        )

        self.fc = nn.Sequential(
            nn.Linear(16*5*5, 120),
            nn.ReLU(),
            nn.Linear(120, 84),
            nn.ReLU(),
            nn.Linear(84, 10)
        )
        
    def forward(self, x):
        x = self.conv(x)
        x = out.view(x.size(0), -1)
        out = self.fc(x)
        return out

Module有很多屬性，可以檢視權重、引數等等；如下：

net = lenet.LeNet()
print(net)

for param in net.parameters():
     print(type(param.data), param.size())
     print(list(param.data)) 

print(net.state_dict().keys())
#引數的keys

for key in net.state_dict():#模型引數
    print key, 'corresponds to', list(net.state_dict()[key])

那麼，如何進行引數初始化呢？使用 torch.nn.init ，如下：

def initNetParams(net):
    '''Init net parameters.'''
    for m in net.modules():
        if isinstance(m, nn.Conv2d):
            init.xavier_uniform(m.weight)
            if m.bias:
                init.constant(m.bias, 0)
        elif isinstance(m, nn.BatchNorm2d):
            init.constant(m.weight, 1)
            init.constant(m.bias, 0)
        elif isinstance(m, nn.Linear):
            init.normal(m.weight, std=1e-3)
            if m.bias:
                init.constant(m.bias, 0)

initNetParams(net)

儲存ConvNet

使用torch.save()對網路結構和模型引數的儲存，有兩種儲存方式：

儲存整個神經網路的的結構資訊和模型引數資訊，save的物件是網路net；
儲存神經網路的訓練模型引數，save的物件是net.state_dict()。

torch.save(net1, 'net.pkl')  # 儲存整個神經網路的結構和模型引數    
torch.save(net1.state_dict(), 'net_params.pkl') # 只儲存神經網路的模型引數

載入ConvNet

對應上面兩種儲存方式，過載方式也有兩種。

對應第一種完整網路結構資訊，過載的時候通過torch.load(‘.pth’)直接初始化新的神經網路物件即可。
對應第二種只儲存模型引數資訊，需要首先匯入對應的網路，通過net.load_state_dict(torch.load('.pth'))完成模型引數的過載。

在網路比較大的時候，第一種方法會花費較多的時間，所佔的儲存空間也比較大。

# 儲存和載入整個模型  
torch.save(model_object, 'model.pth')  
model = torch.load('model.pth')  

# 僅儲存和載入模型引數  
torch.save(model_object.state_dict(), 'params.pth')  
model_object.load_state_dict(torch.load('params.pth'))

【pytorch】模型的搭建儲存載入

使用pytorch進行網路模型的搭建、儲存與載入，是非常快速、方便的。搭建ConvNet 所有的網路都要繼承torch.nn.Module，然後在建構函式中使用torch.nn中的提供的介面定義layer的屬性，最後，在forward函式中將各個layer連線起來。下面

【pytorch】載入模型出現的bug

在模型訓練完後再進行測試載入模型後出現bug，顯示如下錯誤據瞭解是由於pytorch版本導致的錯誤，可能與自己訓練階段保持的模型方式有關，訓練階段儲存方式如下：解決方案如下：方法一： generator.load_state_dict({k.replac

【three.js : 3D】【loader】THREE.js中載入不同格式的模型及動畫(fbx、json和obj)

轉載：THREE.js中載入不同格式的模型及動畫(fbx、json和obj) 注：本文章內容基於 Three.js 88dev 實現作為剛接觸three.js的小萌新，勵志將自己開荒歷程記錄下來，希望對後來人有所幫助。網上有很多demo，文件卻不多。每次都是，照搬別人的

【tensorflow】模型儲存和恢復

tensorflow中，模型的儲存和恢復使用tf.train.Saver類，模型儲存使用該類的 save 方法。模型恢復使用restore 方法。模型儲存模型儲存使用tf.train.Saver.save()方法。以saver.save(se

深度學習【3】keras：儲存keras學習好的深度神經網路模型引數為二進位制和txt檔案

http://blog.csdn.net/linmingan/article/details/50906141 由於工程需要，儲存為hdf5的keras權值在c/c++中的讀取比較不方便。因此將keras中的權值剝離出來，並儲存為二進位制檔案或者txt檔案。在進行程式碼的編

【小白學PyTorch】1 搭建一個超簡單的網路

文章目錄： [TOC] ## 1 任務首先說下我們要搭建的網路要完成的學習任務：讓我們的神經網路學會邏輯異或運算，異或運算也就是俗稱的“相同取0，不同取1” 。再把我們的需求說的簡單一點，也就是我們需要搭建這樣一個神經網路，讓我們在輸入（1,1）時輸出0，輸入（1,0）時輸出1（相同取0，不同取1），

【disconf】環境搭建【linux】

linux 文件建表 sco 兩個會有能夠 nginx日誌 copy 1.搭建disconf需要安裝的配置。安裝Linux：CentOS7 安裝Zookeeper：zookeeper-3.4.6 安裝Redis：redis-3.0.0

【SVN】Centos7搭建svn服務

ise password ins 阿裏進行整理 body authz 修改權限一、背景自己平時有記筆記的習慣，回到宿舍筆記就同步不了。打算入手下很火的筆記軟件，用著覺得不順手，目錄一多查找不方便，沒有英文首字母定位快，想想決定用svn同步，整理出來分享給大家。二、

【svn】Centos搭建svn服務器環境

writing wan you all lin read 版本庫 cnblogs body 1.需求描述在Centos系統中搭建svn服務器環境2.搭建過程2.1 yum安裝svn [root@localhost /]# yum install svn

【PyTorch】TypeError: argument 0 is not a Variable

TypeError: argument 0 is not a Variable 問題定位： Variables and tensors：需要將輸入資料轉換為 Variable 型別。解決方案：升級 PyTorch 版本：In the current pyto

【jvm】jvm的類載入機制

前言:提到jvm的類載入機制,就不得不說我當年的沙雕經歷了,當年不明白為啥面試官都喜歡問jvm的類載入機制,當時心想學這東西有啥用,它怎麼載入關我啥事呀,能寫程式碼不就好了嗎?但無奈應試教育教會了我,雖然不知道為啥要學,但人家要考,你就得學,然後學唄,學完算是知道它是怎麼載入類的了,但依舊沒能深刻理

【原創】叢集搭建報“Error unable to connect to nodes ['
【ACM】紙牌搭建

【題目】現有N張撲克牌，最多可以搭建幾層【題目分析】找到通項公式 f[ i ]=f[ i-1 ]+3*i-1。先打出表，再二分搜尋。不斷縮小範圍。 #include <iostream> #include <cstdio> #include &

【pytorch】模型的搭建儲存載入

搭建ConvNet

儲存ConvNet

載入ConvNet

【pytorch】模型的搭建儲存載入

【pytorch】載入模型出現的bug

【three.js : 3D】【loader】THREE.js中載入不同格式的模型及動畫(fbx、json和obj)

【tensorflow】模型儲存和恢復

深度學習【3】keras：儲存keras學習好的深度神經網路模型引數為二進位制和txt檔案

【小白學PyTorch】1 搭建一個超簡單的網路

【disconf】環境搭建【linux】

【SVN】Centos7搭建svn服務

【svn】Centos搭建svn服務器環境

【PyTorch】TypeError: argument 0 is not a Variable

【jvm】jvm的類載入機制

【ACM】紙牌搭建

【Maven】---Linux搭建Nexus3.X私服

Mac下python+selenium【1】環境搭建

【Linux】環境搭建基礎

【Python】[05]持久儲存

基於MNIST的GANs實現【Pytorch】

【ffmpeg】ffserver搭建流媒體服務

Learning-MySQL【2】：MySQL儲存引擎及資料庫的操作管理

【pytorch】模型的搭建儲存載入

搭建ConvNet

儲存ConvNet

載入ConvNet

相關推薦