1. 程式人生 > 程式設計 >Pytorch 實現sobel運算元的卷積操作詳解

Pytorch 實現sobel運算元的卷積操作詳解

卷積在pytorch中有兩種實現,一種是torch.nn.Conv2d(),一種是torch.nn.functional.conv2d(),這兩種方式本質都是執行卷積操作,對輸入的要求也是一樣的,首先需要輸入的是一個torch.autograd.Variable()的型別,大小是(batch,channel, H,W),其中batch表示輸入的一批資料的數目,channel表示輸入的通道數。

一般一張彩色的圖片是3,灰度圖片是1,而卷積網路過程中的通道數比較大,會出現幾十到幾百的通道數。H和W表示輸入圖片的高度和寬度,比如一個batch是32張圖片,每張圖片是3通道,高和寬分別是50和100,那麼輸入的大小就是(32,3,50,100)。

如下程式碼是卷積執行soble邊緣檢測運算元的實現:

import torch
import numpy as np
from torch import nn
from PIL import Image
from torch.autograd import Variable
import torch.nn.functional as F
 
 
def nn_conv2d(im):
  # 用nn.Conv2d定義卷積操作
  conv_op = nn.Conv2d(1,1,3,bias=False)
  # 定義sobel運算元引數
  sobel_kernel = np.array([[-1,-1,-1],[-1,8,-1]],dtype='float32')
  # 將sobel運算元轉換為適配卷積操作的卷積核
  sobel_kernel = sobel_kernel.reshape((1,3))
  # 給卷積操作的卷積核賦值
  conv_op.weight.data = torch.from_numpy(sobel_kernel)
  # 對影象進行卷積操作
  edge_detect = conv_op(Variable(im))
  # 將輸出轉換為圖片格式
  edge_detect = edge_detect.squeeze().detach().numpy()
  return edge_detect
 
def functional_conv2d(im):
  sobel_kernel = np.array([[-1,dtype='float32') #
  sobel_kernel = sobel_kernel.reshape((1,3))
  weight = Variable(torch.from_numpy(sobel_kernel))
  edge_detect = F.conv2d(Variable(im),weight)
  edge_detect = edge_detect.squeeze().detach().numpy()
  return edge_detect
 
def main():
  # 讀入一張圖片,並轉換為灰度圖
  im = Image.open('./cat.jpg').convert('L')
  # 將圖片資料轉換為矩陣
  im = np.array(im,dtype='float32')
  # 將圖片矩陣轉換為pytorch tensor,並適配卷積輸入的要求
  im = torch.from_numpy(im.reshape((1,im.shape[0],im.shape[1])))
  # 邊緣檢測操作
  # edge_detect = nn_conv2d(im)
  edge_detect = functional_conv2d(im)
  # 將array資料轉換為image
  im = Image.fromarray(edge_detect)
  # image資料轉換為灰度模式
  im = im.convert('L')
  # 儲存圖片
  im.save('edge.jpg',quality=95)
 
if __name__ == "__main__":
  main()

原圖片:cat.jpg

結果圖片:edge.jpg

以上這篇Pytorch 實現sobel運算元的卷積操作詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。