Pytorch 實現sobel運算元的卷積操作詳解
阿新 • • 發佈:2020-01-13
卷積在pytorch中有兩種實現,一種是torch.nn.Conv2d(),一種是torch.nn.functional.conv2d(),這兩種方式本質都是執行卷積操作,對輸入的要求也是一樣的,首先需要輸入的是一個torch.autograd.Variable()的型別,大小是(batch,channel, H,W),其中batch表示輸入的一批資料的數目,channel表示輸入的通道數。
一般一張彩色的圖片是3,灰度圖片是1,而卷積網路過程中的通道數比較大,會出現幾十到幾百的通道數。H和W表示輸入圖片的高度和寬度,比如一個batch是32張圖片,每張圖片是3通道,高和寬分別是50和100,那麼輸入的大小就是(32,3,50,100)。
如下程式碼是卷積執行soble邊緣檢測運算元的實現:
import torch import numpy as np from torch import nn from PIL import Image from torch.autograd import Variable import torch.nn.functional as F def nn_conv2d(im): # 用nn.Conv2d定義卷積操作 conv_op = nn.Conv2d(1,1,3,bias=False) # 定義sobel運算元引數 sobel_kernel = np.array([[-1,-1,-1],[-1,8,-1]],dtype='float32') # 將sobel運算元轉換為適配卷積操作的卷積核 sobel_kernel = sobel_kernel.reshape((1,3)) # 給卷積操作的卷積核賦值 conv_op.weight.data = torch.from_numpy(sobel_kernel) # 對影象進行卷積操作 edge_detect = conv_op(Variable(im)) # 將輸出轉換為圖片格式 edge_detect = edge_detect.squeeze().detach().numpy() return edge_detect def functional_conv2d(im): sobel_kernel = np.array([[-1,dtype='float32') # sobel_kernel = sobel_kernel.reshape((1,3)) weight = Variable(torch.from_numpy(sobel_kernel)) edge_detect = F.conv2d(Variable(im),weight) edge_detect = edge_detect.squeeze().detach().numpy() return edge_detect def main(): # 讀入一張圖片,並轉換為灰度圖 im = Image.open('./cat.jpg').convert('L') # 將圖片資料轉換為矩陣 im = np.array(im,dtype='float32') # 將圖片矩陣轉換為pytorch tensor,並適配卷積輸入的要求 im = torch.from_numpy(im.reshape((1,im.shape[0],im.shape[1]))) # 邊緣檢測操作 # edge_detect = nn_conv2d(im) edge_detect = functional_conv2d(im) # 將array資料轉換為image im = Image.fromarray(edge_detect) # image資料轉換為灰度模式 im = im.convert('L') # 儲存圖片 im.save('edge.jpg',quality=95) if __name__ == "__main__": main()
原圖片:cat.jpg
結果圖片:edge.jpg
以上這篇Pytorch 實現sobel運算元的卷積操作詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。