pytorch中Linear類中weight的形狀問題原始碼探討

阿新 • • 發佈：2018-11-01

import torch
from torch import nn

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)

print(output.size())
print(m.weight.shape)

來看一下輸出：
out:

torch.Size([128, 30])
torch.Size([30, 20])

發現weight的形狀是[30,20]而非[20, 30]？

所以具體看一下原始碼的實現方式：

Linear類的原始碼網址：https://pytorch.org/docs/stable/_modules/torch/nn/modules/linear.html
functional模組的原始碼網址：
https://pytorch.org/docs/stable/_modules/torch/nn/functional.html

在Linear類中的__init__函式中，weight形狀為[out_features, in_features]
在forward函式中呼叫F.linear函式，實現單層線性神經網路層的計算
在F.linear函式中，使用的是weight.t()，也就是將weight轉置，再傳入matmul計算。

通過以上三步，pytorch就完成weight形狀的維護。簡單的說就是，在定義時使用的是[out_features, in_features]，而在單層線性神經網路計算時使用的是weight的轉置矩陣。

pytorch中Linear類中weight的形狀問題原始碼探討

import torch from torch import nn m = nn.Linear(20, 30) input = torch.randn(128, 20) output = m(input) print(output.size()) print(m.weight.sha

java反射中method類中的invoke方法作用

argument 方法 names 反射 java invoke 作用 odex table 　首先Method類代表一個方法，所以invoke（調用）就是調用Method類代表的方法。它可以讓你實現動態調用，例如你可以動態的傳人參數。下面是一個簡單的例子。 1 2

5.struts2中Action類中獲取ServletAPI的三種方式

靜態方法 ttr intercept println action 需求對象實例 ext.get ctype **Servlet的API的訪問（開發中偶爾會使用到）** 1.在Action類中也可以獲取到Servlet一些常用的API，有如下三種方式獲取 *

c++中string類中的函數

str const 沒有 HR 匹配 OS 指針第一個 size_t C/C++ string庫（string.h）提供了幾個字符串查找函數，如下： memchr 在指定內存裏定位給定字符 strchr 在指定字符串裏定位給定字符 strcspn 返回在字符串str1裏找

java中Arrays類中，binarySearch()方法的返回值問題

.cn pac rom 第一個 mage sea div arch x11 最近在復習Java知識，發現果然不經常使用忘得非常快。。。看到binarySearch()方法的使用時，發現書上有點錯誤，於是就自己上機實驗了一下，最後總結一下該方法的返回值。總結：bina

java中同一個類中元素的相互關係

java中同一個類中元素的相互關係 1.同一類中方法和變數的呼叫關係 1.1.在同一個類中只能由方法來呼叫變數，不能用變數來呼叫方法。 1.2.在構造方法中呼叫變數。 &nbs

Java中String類中常見方法以及類與類之間的轉換

String類中的方法描述 public String() 空引數構造方法 public String(byte[] bytes) 把位元組陣列轉換成字串物件 public String(byte[] bytes,int index,int length) 把位元組陣

西遊之路——python全棧——Django中模型類中Meta元物件瞭解

目錄 Django中模型類中Meta元物件瞭解 1.使用python manage.py shell 進入編輯命令列模式，可以直接進入專案（為我們配置好了環境） 2.對於元類資料的獲取，需要使用_meta獲取 3.幾個重要屬性

SLAM中“camera類中座標轉換"方法解讀

/* p_p : position_pexil ; p_c：position_camera ; p_w : position_world ; T_c_w : 歐式矩陣(包含R,t資訊) from camera to world cpp功能：實現關於pexil,camera,worl

Java中增強類中的方法的三種方式

增強Java中類的方法的方式增強Java類中的方式有三種分別是類的繼承、裝飾者模式、動態代理模式 · 繼承方式【最簡單，但是不是所有的都可以用繼承（需要知道父類才可以）】 **能夠控制這個類的構造的時候，才可以使用繼承。 · 裝飾者模式 **包裝的物件和被包裝的物件都要實現

ava中JFrame類中函式addWindowListener（new WindowAdapter）

在java編寫的過程中常常遇到樣的一段程式碼 frame.addWindowListener(new WindowAdapter() { @Override public void windowClosing(WindowEvent e) {

SLAM中“camera類中座標轉換"方法解讀

/* p_p : position_pexil ; p_c：position_camera ; p_w : position_world ; T_c_w : 歐式矩陣(包含R,t資訊) from camera to world cpp功能：實現關於pe

JAVA中Object類中的方法以及finalize函式作用

Object是所有類的父類，任何類都預設繼承Object。一、Object類中的方法 1．clone方法保護方法，實現物件的淺複製，只有實現了Cloneable接口才可以呼叫該方法，否則丟擲CloneNotSupportedException異常。主要是JA

java中一個類中能如何宣告多個構造方法

public class A{public A(){} //構造1public A(i

c++中對類中私有成員中的靜態變數初始化

1.static成員的所有者是類本身和物件，但是多有物件擁有一樣的靜態成員。從而在定義物件時不能通過建構函式對其進行初始化。 2.靜態成員不能在類定義裡邊初始化，只能在class body外初始化。 3.靜態成員仍然遵循public，private，protected訪問準

Java中Class類中兩個值得注意的進行型別動態轉換的方法

Java中的Class類有兩個重要的方法：cast()和asSubclass()。這兩個方法都是用於Class類進行執行時(run-time)階段的型別轉換的。下面來看看他們的定義和使用：第一個方法asSubclass() public <U> Clas

java中Scanner類中的close()方法的作用

import java.util.Scanner;public class Test {public static void main(String[] args) {Scanner input=new Scanner(System.in);System.out.print

Java中Arrays類中的binarySearch方法詳解

1.它有很多過載的方法： static int 使用二分搜尋法來搜尋指定的 byte 型陣列，以獲得指定的值。 static int (byte[] a, int fromIndex, int toIndex, byte key) 使用二分搜尋法來搜尋指定的 byte

Java中Executors類中幾種建立各型別執行緒池的方法及例項

Executors：提供了一系列靜態工廠方法用於建立各種執行緒池。 1.Executors.newCachedThreadPool建立可變執行緒池如果執行緒池長度超過處理需要，可靈活回收空閒執行緒，若無可回收，則新建執行緒。核心執行緒池大小為0，最大為Integer.MA

幾個java中String類中最常用的方法

常見的String方法 String和char陣列的裝換，char c[]=str.toCharArray(); String str = new String(c)；取出String字串物件中的某個字元：str.charAt(3); String和byte陣列的轉換：byte b[] =

pytorch中Linear類中weight的形狀問題原始碼探討

相關推薦