pytorch定義自己的新層（非官方example）

阿新 • • 發佈：2018-12-23

一、解析層的結構

首先我們通過分析官方的原始碼瞭解一下什麼是層，它包含哪些結構，成員是啥等。

class Linear(nn.Module):
    def __init__(self, input_features, output_features, bias=True):
        super(Linear, self).__init__()
        self.input_features = input_features
        self.output_features = output_features
        self.weight = nn.Parameter(torch.Tensor(output_features, input_features))
        if bias:
            self.bias = nn.Parameter(torch.Tensor(output_features))
        else:
            self.register_parameter('bias', None)
        self.weight.data.uniform_(-0.1, 0.1)
        if bias is not None:
            self.bias.data.uniform_(-0.1, 0.1)
    def forward(self, input):
        return LinearFunction.apply(input, self.weight, self.bias)

上面的原始碼是官方的線性層實現方式。

引數含義：

input_features是輸入向量長度，output_features是輸出向量的長度
input呼叫該類時的輸入

Linear層包含兩個內部引數，也就是我們說的層的權重，weight和bias。兩個函式建構函式__init__和前向傳播函式forward。

我們可以得到以下結論：

pytorch的層繼承自nn.module類
層至少包含兩個函式成員__init__和前向傳播函式forward（如果自定義的操作不可導，還需要實現反向傳播的backward）
如果該層含有權重，那麼權重必須是nn.Parameter型別，關於Tensor和Variable（0.3版本之前）與Parameter的區別請參看之前

部落格。簡單說就是Parameter預設需要求導，其他兩個型別則不會。
可能的話，為自己定義的新層提供預設的引數初始化，以防使用過程中忘記初始化操作。

二、示例

下面我們實現一個簡單的層，輸入[x,y],輸出為z，實現z=a*x+b*y的功能，並通過網路自動學習到引數a，b。

首先分析一下我們所要實現的功能z=a*x+b*y，其中有兩個要學習的引數，a和b。假設輸入為一個1*2向量，為了利用pytorch的乘法，我們將a，b合起來定義為[1,2]的向量，型別為Parmeter（所有代權重層中引數的型別）。為了更普適性完成 $z=\sum w _{i}*x _{i}$ 的任務，我們將引數的形狀設為在定義時指定。

層的定義

##################################################################
####in_features->該層的形狀，e.g 引數為a，b，則(1,2);為a,b,c，則(1,3)
####reset_parameters()權重預設初始化函式
####forward自己定義的操作
####input->呼叫該層時的輸入  shape->[n,1,2]
#################################################################


class weight_pool(nn.Module):
    def __init__(self, in_features):            
        super(weight_pool, self).__init__()
        self.in_features = in_features
        self.weight = nn.Parameter(torch.Tensor(self.in_features))
        self.reset_parameters()

    def reset_parameters(self):
        stdv = 1. / math.sqrt(self.weight.size(0))
        self.weight.data.uniform_(-stdv, stdv)
        
    def forward(self, input):
        x = input * self.weight
        x = x.sum(dim=1,keepdim=True)
        return x

此時就完成了我們定義的新層。下面通過幾組測試來檢驗我們的新層是否具有學習功能。

1.task1 學習z = x + y

由於需要學習的引數只有兩個，理論上只需要兩組資料就能完成學習。但是為了更普適，我們輸入了五組訓練資料

x,y = [1.0,2.0], [1.0,3.0], [2.0,3.0], [3.0,4.0], [9.0,10.0]
z = [3.0], [4.0], [5.0], [7.0], [19.0]

損失函式用MSELoss，學習率0.01，SGD方法，迭代10個epoch。

網路定義如下：

class MyNet(nn.Module):

    def __init__(self):
        super(MyNet, self).__init__()
        self.wpool = weight_pool((1,2))
    def forward(self, x):
        x = self.wpool(x)
        return x

下面展示前10個epoch的loss曲線圖，可以看到2個epoch時網路已經接近收斂。此時學習到的引數為1.0324和0.9731，非常接近我們最理想的引數1和1。

為了測試網路的極限效能，我們直接迭代1000個epoch，可以看到此時學習到的引數就是最理想的引數1和1.

task2 學習z = x + 3*y

同樣損失函式用MSELoss，學習率0.01，SGD方法，迭代10個epoch

此時由於目標函式較複雜，10個epoch之後，得到結果僅為1.7896和2.3437，與我們的理想結果1和3相差較遠。

同樣的，我們將迭代次數增加到1000個epoch，可以看到學習到的結果為1.0077和2.9936，與目標結果1和3基本一致。

總結：

通過上面的例子我們可以證明我們自己寫的層具有和pytorch原有的層一樣，具有學習能力，可以完成我們的目標。最後再總結一下新實現層的要點：

繼承nn.module類
層的權重型別為Parameter
至少實現兩個函式__init__和forward
自定義操作如不可導，需要實現backward函式。

完整的工程可在此下載。

pytorch定義自己的新層（非官方example）

一、解析層的結構首先我們通過分析官方的原始碼瞭解一下什麼是層，它包含哪些結構，成員是啥等。 class Linear(nn.Module): def __init__(self, input_features, output_features, bias=True):

新版caffe新增自己的層（目前只學會新增，我想要新增的loss還沒能實現），cu檔案用於cuda加速的程式碼新版caffe新增自己的層（目前只學會新增，我想要新增的loss還沒能實現）

原新版caffe新增自己的層（目前只學會新增，我想要新增的loss還沒能實現） 2016年10月05日 16:23:25 scarlette唐閱讀數：1

【程式設計初學者】建立自己的開源專案5-在主分支上建立新分支（myeclipse+git）

上一篇：第四章寫的非常淺顯，文章針對小白，高手可以繞道前面我們詳細講解了如何建立遠端程式碼倉庫，建立原生代碼倉庫，以及如何將兩者關聯，相互進行程式碼的提交與下載。前面的做完之後，我們已經在遠端程式碼倉庫中，建立了一個我們自己的開源專案了，公開之後，誰都可以搜尋到你

JAVA 8 新特性（值得學習）

java 8 新特性JAVA 8 已經出現好長時間了，大的互聯網公司很多都已經使用了，甚至很多知名互聯網公司踩過很多坑，也有一些大牛分享出了他們的實戰經驗。去很多知名的互聯網公司經常會被面試官問，你了解java 8嗎？你知道它的一些新特性嗎？好像似乎成了一面面試官必問的一道題目。這篇博文，只是簡答的介紹了一下

jdk8新特性（文章推薦）

method targe href article int 比較 face lam border jdk9都已經出來了，雖然很多項目都已經使用jdk8，但是很少會用到jdk8中的新特性。本人經常用的到也就是使用Stream,Lambda，但也僅僅是使用，基本不知道什麽Fun

[計算機網絡基礎]數據鏈路層（第一部分）

一段 unit spa art 余數 tro span 需要 max 一：數據鏈路層的組幀：組幀：網絡層的IP數據報向下傳送至數據鏈路層，成為數據鏈路層的數據單元，給數據單元加上首部和尾部，就組成數據鏈路層的一個幀。如圖所示：其中規定數據鏈路層幀的數據單元所能

SpringMVC（十二）自定義異常處理器 HandlerExceptionResolver（接口）

pin org ota admin pack property framework ase exception 自定義異常處理器和系統異常處理器的提升版可以實現相同的功能，但是使用的方法不同，自定義異常處理器可以不用在配置文件中配置name多東西，只需要一個異常處理器就可以

使用ViewDragHelper打造屬於自己的DragLayout（抽屜開關）

true header 限制 open() flat 重寫 support 重要 red 使用ViewDragHelper打造屬於自己的DragLayout（抽屜開關

應用層（http協議） http與https區別

在協議分層的TCP/IP（或四層）通訊協議採用了5層的層級結構，5層分別包括：應用層、傳輸層、網路層、資料鏈路層、物理層。5層一些簡單功能和著名協議可參考這篇部落格：https://blog.csdn.net/sophia__yu/article/details/82717115 一.應用層

git 一個分支程式碼提交到遠端倉新分支（新建分支）

背景：從branchA分支拉了一份程式碼，做了一些修改，但是不想提交到branchA分支，想新建一個分支branchB儲存程式碼。操作方法：新增本地需要提交程式碼 git add . 1 提交原生代碼 git commit -m "add my code to new branchB" 1

坦克大戰第一節——畫出自己的坦克（新手篇）

剛剛開始學習Java，對Java不是很熟悉，但是自己的興趣挺喜歡Java。現在自己在自學Java做一個小遊戲，坦克大戰。自己現在完成了畫出自己的坦克和坦克的移動方向。希望各位大神指導一下我這個剛

讀書筆記 ---- 《計算機網路—謝希仁第7版》---- 第4章網路層（上篇）

上一篇：資料鏈路層：https://blog.csdn.net/pcwl1206/article/details/83863677 下一篇：網路層下篇：https://blog.csdn.net/pcwl1206/article/details/84098381 本章節目錄： 4.1&n

基於Pytorch實現網路視覺化（CS231n assignment3）

這篇部落格主要是對CS231n assignment3中的網路視覺化部分進行整理。我使用的是Pytorch框架完成的整個練習，但是和Tensorflow框架相比只是實現有些不一樣而已，數學原理還是一致的。 &nbs

Unity 2018.2 新功能（XR相關）

概述 Unity 2018版本週期將圍繞Scriptable Render Pipeline (SRP)、Shader Graph、C# Job System、Entity Component System、Burst Compiler等核心功能展開，2018.2即在此基礎上新增新的功

Odoo 自定義Widgets 基礎教程（章節1）

大家好，此次，我們主要講解 Odoo 中的Widgets。網上、論壇裡很多提及Widget的文章，但很少說Odoo自定義Widget 是如何實現的，這一直是大家所苦惱的地方。本章，將對Odoo中的Widget 進行基礎講解。首先， Widget【掛件】產生的目的，是為了方便後端開發人員在不熟悉Ja

Linux：驅動之字元設備註冊新介面（未完）

驅動之字元設備註冊新介面目前尚不是最終版本，還望有心人自己學習的時候，把自己整合的知識點相關的答案也好問題也好，或者實踐過程中的一些操作截圖，再或者其他的一些想要分享材料發給筆者郵箱：[email protected]，我們一起完善這篇部落格！筆者寫這篇部

如何建立一個自己的外掛（自動輸入）

要實現模擬的手寫輸入，文字一個一個出現在介面上： 1.jq程式碼 <!doctype html> <html lang="en"> <head> <meta charset="UTF-8"> <title>自動填寫文

自定義輪播圖（banner圖）

public class MyBannerActivity extends AppCompatActivity { private String[] picUrl = { "https://img.huxiucdn.com/article/c

BP神經網路反向傳播演算法一步一步例項推導（Backpropagation Example）

1. loss 函式的優化籠統來講：設計loss函式是為了衡量網路輸出值和理想值之間的差距，儘管網路的直接輸出並不顯式的包含權重因子，但是輸出是同權重因子直接相關的，因此仍然可以將loss函式視作在權重因子空間中的一個函式。可以將loss 記為E(w)，這裡為

自定義View繪製流程（面試專用）

（自己整理的比較亂，但這麼說沒問題的！）自定義view是幹嘛的呢？當我們不滿足於Android提供的原生控制元件和佈局時，就應該考慮到自定義view。自定義View分為兩大塊。自定義控制元件和自定義容器自定義View必須重寫兩個構造方法第一個

pytorch定義自己的新層（非官方example）

一、解析層的結構

二、示例

1.task1 學習z = x + y

task2 學習z = x + 3*y

總結：

相關推薦