pytorch 中的grid_sample和affine_grid

阿新 • • 發佈：2018-11-13

pytorch 中提供了對Tensor進行Crop的方法，可以使用GPU實現。具體函式是torch.nn.functional.affine_grid和torch.nn.functional.grid_sample。前者用於生成二維網格，後者對輸入Tensor按照網格進行雙線性取樣。

grid_sample函式中將影象座標歸一化到$[-1, 1]$，其中0對應-1，width-1對應1。

affine_grid的輸入是仿射矩陣(Nx2x3)和輸出Tensor的尺寸(Tensor.Size(NxHxWx2))，輸出的是歸一化的二維網格。

在Faster R CNN中，用到了Crop Pooling，需要在feature map 中裁剪出與proposal region 對應的部分，可以使用這兩個函式實現。具體參考

http://www.telesens.co/2018/03/11/object-detection-and-classification-using-r-cnns/#ITEM-1455-4

下面進行簡單的實驗：

首先生成一個1x1x5x5的Tensor變數
裁剪視窗為x1 = 2.5, x2 = 4.5, y1 = 0.5, y2 = 3.5，size為1x1x3x2，根據座標設定theta矩陣
進行裁剪，並與numpy計算結果相比較。

a = torch.rand((1, 1, 5, 5))
print(a)

# x1 = 2.5, x2 = 4.5, y1 = 0.5, y2 = 3.5
# out_w = 2, out_h = 3
size = torch.Size((1, 1, 3, 2))
print(size)

# theta
theta_np = np.array([[0.5, 0, 0.75], [0, 0.75, 0]]).reshape(1, 2, 3)
theta = torch.from_numpy(theta_np)
print('theta:')
print(theta)
print()

flowfield = torch.nn.functional.affine_grid(theta, size)
sampled_a = torch.nn.functional.grid_sample(a, flowfield.to(torch.float32))
sampled_a = sampled_a.numpy().squeeze()
print('sampled_a:')
print(sampled_a)

# compute bilinear at (0.5, 2.5), using (0, 3), (0, 4), (1, 3), (1, 4)
# quickly compute(https://blog.csdn.net/lxlclzy1130/article/details/50922867)
print()
coeff = np.array([[0.5, 0.5]])
A = a[0, 0, 0:2, 2:2+2]
print('torch sampled at (0.5, 3.5): %.4f' % sampled_a[0,0])
print('numpy compute: %.4f' % np.dot(np.dot(coeff, A), coeff.T).squeeze())

執行結果為：

可以看到結果是相同的

pytorch 中的grid_sample和affine_grid

pytorch 中提供了對Tensor進行Crop的方法，可以使用GPU實現。具體函式是torch.nn.functional.affine_grid和torch.nn.functional.grid_sample。前者用於生成二維網格，後者對輸入Tensor按照網格進行雙線性取樣。 grid_sample

pytorch中required_grad和detach的澄清

最近和別人討論，發現了自己以前的認識錯誤的地方。程式碼中的detach和required_grad的引入是減少了計算量，required_grad=false會計算誤差，不計算wb的梯度（原因在於一個網路如果是ABC層這樣的連線方式，B不求梯度，但是A還是會獲得梯度，這就需要計算B的誤差，

pytorch 中的view和permute的用法

view相當於numpy中resize()的功能，但是用法可能不太一樣.可以參考：https://blog.csdn.net/york1996/article/details/81949843 view只能用在contiguous的variable上。如果在view之前用了transpose,p

pytorch中資料載入和處理例項

pytorch中資料載入和處理例項 **A lot of effort in solving any machine learning problem goes in to preparing the data. PyTorch provides many tools to make d

pytorch中的卷積和池化計算方式

TensorFlow裡面的padding只有兩個選項也就是valid和same pytorch裡面的padding麼有這兩個選項，它是數字0,1,2,3等等，預設是0 所以輸出的h和w的計算方式也是稍微有一點點不同的：tf中的輸出大小是和原來的大小成倍數關係，不能任意的輸

pytorch中的torch.utils.data.Dataset和torch.utils.data.DataLoader

首先看torch.utils.data.Dataset這個抽象類。可以使用這個抽象類來構造pytorch資料集。要注意的是以這個類構造的子類，一定要定義兩個函式一個是__len__，另一個是__getitem__，前者提供資料集size，而後者通過給定索引獲取資料和標籤。__

Pytorch中的squeeze()和unsqueeze()函式

在numpy庫中，經常會出現“秩為1的一維陣列”（come from 吳恩達的深度學習，目前還沒有搞清楚numpy中如此設計的意圖）。比如：注意這裡的a的shape是[3] ，既不是 [1,3] 也不是 [3,1]。這就說明它既不是行向

PyTorch中的資料查詢和篩選

本文原始碼基於版本1.0，互動介面基於0.4.1 import torch 按照指定軸上的座標進行過濾 index_select() 沿著某tensor的一個軸dim篩選若干個座標 >>> x = torch.randn(3, 4) # 目標矩陣 &

Pytorch中nn.ModuleList 和 nn.Sequential的不同

摘錄自 nn.ModuleList is just like a Python list. It was designed to store any desired number of nn.Module’s. It may be useful, for instance,

pytorch中網路loss傳播和引數更新理解

相比於2018年，在ICLR2019提交論文中，提及不同框架的論文數量發生了極大變化，網友發現，提及tensorflow的論文數量從2018年的228篇略微提升到了266篇，keras從42提升到56，但是pytorch的數量從87篇提升到了252篇。 TensorFlow: 228--->

volatile 和 requires_grad在pytorch中的意思

Backward過程中排除子圖 pytorch的BP過程是由一個函式決定的，loss.backward()，可以看到backward()函式裡並沒有傳要求誰的梯度。那麼我們可以大膽猜測，在BP的過程中，pytorch是將所有影響loss的Variable都求了一次梯

pytorch中的L2和L1正則化，自定義優化器設定等操作

在pytorch中進行L2正則化，最直接的方式可以直接用優化器自帶的weight_decay選項指定權值衰減率，相當於L2正則化中的λλ，也就是： Lreg=||y−y^||2+λ||W||2(1)(

JS中isPrototypeOf 和hasOwnProperty 的區別

另一個 strong 是否指定不同名稱功能成員 eof 1、isPrototypeOf isPrototypeOf是用來判斷指定對象object1是否存在於另一個對象object2的原型鏈中，是則返回true，否則返回false。格式如下： object1.is

Mybatis中javaType和jdbcType對應關系

mat brush true real default url define red tools MyBatis 通過包含的jdbcType類型 BIT FLOAT CHAR TIMESTAMP OTHER

odoo系統中name_search和name_get用法

打印 per sequence not 添加 product xpath ret 領料單自動帶出工序和工序序號,兩個條件都能搜索,並且兩個都帶出來顯示在前端: # 輸入工序序號會自動帶出工序名// def name_search(self, cr,user,name=

Python在函數中使用*和**接收元組和列表

eight argument ron err 由於 .net 表示方法 class 當要使函數接收元組或字典形式的參數的時候，有一種特殊的方法，它分別使用*和**前綴。這種方法在函數需要獲取可變數量的參數的時候特別有用。[註意] [1] 由於在args變量前有*前綴

關於JS面向對象中原型和原型鏈以及他們之間的關系及this的詳解

它的 .proto com js面向對象 text doc 技術分享回調函數回調一：原型和原型對象： 1.函數的原型prototype：函數才有prototype，prototype是一個對象，指向了當前構造函數的引用地址。 2.函數的原型對象__proto__：所有

C#中&和&&，|和||區別

.com blank img cnblogs png ref bsp 筆記區別當兩者都為邏輯運算符時。其實沒什麽差別。 &&和||當已經確定結果時，不會對第二個操作數求值。也不知道什麽情況會用到這個差別。做個筆記好了。 http://blog.cs

Python中sort()和sorted()的區別

-s 可變對象傳遞內置函數 ict pan 16px nbsp lin 1、sort()是可變對象（字典）的方法，無參數，無返回值， sort（）會改變可變對象，因此無需返回值。例如： list: 1 >>> a = [4,3,7,8] 2 >

pytorch 中的grid_sample和affine_grid

相關推薦