在PyTorch中使用深度自編碼器實現影象重建

阿新 • • 發佈：2020-08-03

作者|DR. VAIBHAV KUMAR
編譯|VK
來源|Analytics In Diamag

人工神經網路有許多流行的變體，可用於有監督和無監督學習問題。自編碼器也是神經網路的一個變種，主要用於無監督學習問題。

當它們在體系結構中有多個隱藏層時，它們被稱為深度自編碼器。這些模型可以應用於包括影象重建在內的各種應用。

在影象重建中，他們學習輸入影象模式的表示，並重建與原始輸入影象模式匹配的新影象。影象重建有許多重要的應用，特別是在醫學領域，需要從現有的不完整或有噪聲的影象中提取解碼後的無噪聲影象。

在本文中，我們將演示在PyTorch中實現用於重建影象的深度自編碼器。該深度學習模型將以MNIST手寫數字為訓練物件，在學習輸入影象的表示後重建數字影象。

自編碼器

自編碼器是人工神經網路的變體，通常用於以無監督的方式學習有效的資料編碼。

他們通常在一個表示學習方案中學習，在那裡他們學習一組資料的編碼。網路通過學習輸入資料的表示，以非常相似的方式重建輸入資料。自編碼器的基本結構如下所示。

該體系結構通常包括輸入層、輸出層和連線輸入和輸出層的一個或多個隱藏層。輸出層與輸入層具有相同數量的節點，因為它要重新構造輸入。

在它的一般形式中，只有一個隱藏層，但在深度自動編碼器的情況下，有多個隱藏層。這種深度的增加減少了表示某些函式的計算成本，也減少了學習某些函式所需的訓練資料量。其應用領域包括異常檢測、影象處理、資訊檢索、藥物發現等。

在PyTorch中實現深度自編碼器

首先，我們將匯入所有必需的庫。

import os
import torch 
import torchvision
import torch.nn as nn
import torchvision.transforms as transforms
import torch.optim as optim
import matplotlib.pyplot as plt
import torch.nn.functional as F
from torchvision import datasets
from torch.utils.data import DataLoader
from torchvision.utils import save_image
from PIL import Image

現在，我們將定義超引數的值。

Epochs = 100
Lr_Rate = 1e-3
Batch_Size = 128

以下函式將用於PyTorch模型所需的影象轉換。

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

使用下面的程式碼片段，我們將下載MNIST手寫數字資料集，併為進一步處理做好準備。

train_set = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_set = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

train_loader = DataLoader(train_set, Batch_Size=Batch_Size, shuffle=True)
test_loader = DataLoader(test_set, Batch_Size=Batch_Size, shuffle=True)

讓我們看看關於訓練資料及其類的一些資訊。

print(train_set)

print(train_set.classes)

在下一步中，我們將定義用於定義模型的Autoencoder類。

class Autoencoder(nn.Module):
    def __init__(self):
        super(Autoencoder, self).__init__()

        #編碼器
        self.enc1 = nn.Linear(in_features=784, out_features=256) # Input image (28*28 = 784)
        self.enc2 = nn.Linear(in_features=256, out_features=128)
        self.enc3 = nn.Linear(in_features=128, out_features=64)
        self.enc4 = nn.Linear(in_features=64, out_features=32)
        self.enc5 = nn.Linear(in_features=32, out_features=16)

        #解碼器 
        self.dec1 = nn.Linear(in_features=16, out_features=32)
        self.dec2 = nn.Linear(in_features=32, out_features=64)
        self.dec3 = nn.Linear(in_features=64, out_features=128)
        self.dec4 = nn.Linear(in_features=128, out_features=256)
        self.dec5 = nn.Linear(in_features=256, out_features=784) # Output image (28*28 = 784)

    def forward(self, x):
        x = F.relu(self.enc1(x))
        x = F.relu(self.enc2(x))
        x = F.relu(self.enc3(x))
        x = F.relu(self.enc4(x))
        x = F.relu(self.enc5(x))

        x = F.relu(self.dec1(x))
        x = F.relu(self.dec2(x))
        x = F.relu(self.dec3(x))
        x = F.relu(self.dec4(x))
        x = F.relu(self.dec5(x))

        return x

現在，我們將建立Autoencoder模型作為上面定義的Autoencoder類的一個物件。

model = Autoencoder()
print(model)

現在，我們將定義損失函式和優化方法。

criterion = nn.MSELoss()
optimizer = optim.Adam(net.parameters(), lr=Lr_Rate)

以下函式將啟用CUDA環境。

def get_device():
    if torch.cuda.is_available():
        device = 'cuda:0'
    else:
        device = 'cpu'
    return device

下面的函式將建立一個目錄來儲存結果。

def make_dir():
    image_dir = 'MNIST_Out_Images'
    if not os.path.exists(image_dir):
        os.makedirs(image_dir)

使用下面的函式，我們將儲存模型生成的重建影象。

def save_decod_img(img, epoch):
    img = img.view(img.size(0), 1, 28, 28)
    save_image(img, './MNIST_Out_Images/Autoencoder_image{}.png'.format(epoch))

將呼叫下面的函式來訓練模型。

def training(model, train_loader, Epochs):
    train_loss = []
    for epoch in range(Epochs):
        running_loss = 0.0
        for data in train_loader:
            img, _ = data
            img = img.to(device)
            img = img.view(img.size(0), -1)
            optimizer.zero_grad()
            outputs = model(img)
            loss = criterion(outputs, img)
            loss.backward()
            optimizer.step()
            running_loss += loss.item()

        loss = running_loss / len(train_loader)
        train_loss.append(loss)
        print('Epoch {} of {}, Train Loss: {:.3f}'.format(
            epoch+1, Epochs, loss))

        if epoch % 5 == 0:
            save_decod_img(outputs.cpu().data, epoch)

    return train_loss

以下函式將對訓練後的模型進行影象重建測試。

def test_image_reconstruct(model, test_loader):
     for batch in test_loader:
        img, _ = batch
        img = img.to(device)
        img = img.view(img.size(0), -1)
        outputs = model(img)
        outputs = outputs.view(outputs.size(0), 1, 28, 28).cpu().data
        save_image(outputs, 'MNIST_reconstruction.png')
        break

在訓練之前，模型將被推送到CUDA環境中，並使用上面定義的函式建立目錄來儲存結果影象。

device = get_device()
model.to(device)
make_dir()

現在，將對模型進行訓練。

train_loss = training(model, train_loader, Epochs)

訓練成功後，我們將在訓練中視覺化損失。

plt.figure()
plt.plot(train_loss)
plt.title('Train Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.savefig('deep_ae_mnist_loss.png')

我們將視覺化訓練期間儲存的一些影象。

Image.open('/content/MNIST_Out_Images/Autoencoder_image0.png')

Image.open('/content/MNIST_Out_Images/Autoencoder_image50.png')

Image.open('/content/MNIST_Out_Images/Autoencoder_image95.png')

在最後一步，我們將測試我們的自編碼器模型來重建影象。

test_image_reconstruct(model, testloader)

Image.open('/content/MNIST_reconstruction.png')

所以，我們可以看到，自訓練過程開始時，自編碼器模型就開始重建影象。第一個epoch以後，重建的質量不是很好，直到50 epoch後才得到改進。

經過完整的訓練，我們可以看到，在95 epoch以後生成的影象和測試中，它可以構造出與原始輸入影象非常匹配的影象。

我們根據loss值，可以知道epoch可以設定100或200。

經過長時間的訓練，有望獲得更清晰的重建影象。然而，通過這個演示，我們可以理解如何在PyTorch中實現用於影象重建的深度自編碼器。

參考文獻：

Sovit Ranjan Rath, “Implementing Deep Autoencoder in PyTorch”
Abien Fred Agarap, “Implementing an Autoencoder in PyTorch”
Reyhane Askari, “Auto Encoders”

原文連結：https://analyticsindiamag.com/hands-on-guide-to-implement-deep-autoencoder-in-pytorch-for-image-reconstruction/

歡迎關注磐創AI部落格站：
http://panchuang.net/

sklearn機器學習中文官方文件：
http://sklearn123.com/

歡迎關注磐創部落格資源彙總站：
http://docs.panchuang.net/

在PyTorch中使用深度自編碼器實現影象重建

作者|DR. VAIBHAV KUMAR 編譯|VK 來源|Analytics In Diamag 人工神經網路有許多流行的變體，可用於有監督和無監督學習問題。自編碼器也是神經網路的一個變種，主要用於無監督學習問題。

pytorch-自編碼器與變分自編碼器-有損影象壓縮

筆記摘抄 importtorch fromtorch import nn, optim fromtorch.utils.data import DataLoader fromtorchvision import transforms, datasets

【異常檢測】DAGMM：結合深度自編碼器器和GMM的端到端無監督網路（二）：程式碼實戰（PyTorch）

技術標籤：paper研讀機器學習異常檢測無監督學習程式碼部分基於PyTorch1.6.0，使用網路入侵異常檢測資料集KDDCUP99來訓練和評測，完整程式碼見：GitHub。

帶掩碼的自編碼器MAE詳解和Pytorch程式碼實現

監督學習是訓練機器學習模型的傳統方法，它在訓練時每一個觀察到的資料都需要有標註好的標籤。如果我們有一種訓練機器學習模型的方法不需要收集標籤，會怎麼樣?如果我們從收集的相同資料中提取標籤呢?這種型別的學習

深度學習專案示例使用自編碼器進行模糊影象修復

影象模糊是由相機或拍攝物件移動、對焦不準確或使用光圈配置不當導致的影象不清晰。為了獲得更清晰的照片，我們可以使用相機鏡頭的首選焦點重新拍攝同一張照片，或者使用深度學習知識重現模糊的影象。由於我的專長不

基於圖嵌入的高斯混合變分自編碼器的深度聚類(Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG)

基於圖嵌入的高斯混合變分自編碼器的深度聚類 Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG

tensorflow實現簡單的自編碼器

1 # 自編碼器 2 #匯入相關庫 3 import numpy as np 4 import sklearn.preprocessing as prep 5 import tensorflow as tf

[tensorflow2.0]採用自定義層和模型在minist資料集上實現VAE(變分自編碼器)

技術標籤：tensorflowpython 使用keras的API進行搭建 from tensorflow.keras import layers

VAE(變分自編碼器的torch實現) —— jupyter實現(注意tqdm模組不同)

簡單實現了torch版本的變分自編碼器參考大佬TensorFlow版本的VAE：膜拜大佬 import os

pytorch中的自定義反向傳播,求導例項

pytorch中自定義backward()函式。在影象處理過程中，我們有時候會使用自己定義的演算法處理影象，這些演算法多是基於numpy或者scipy等包。

pytorch中的自定義資料處理詳解

pytorch在資料中採用Dataset的資料儲存方式，需要繼承data.Dataset類，如果需要自己處理資料的話，需要實現兩個基本方法。

pytorch中使用cuda擴充套件的實現示例

以下面這個例子作為教程，實現功能是element-wise add；（pytorch中想呼叫cuda模組，還是用另外使用C編寫介面指令碼）

PHP中迭代器的簡單實現及Yii框架中的迭代器實現方法示例

本文例項講述了PHP中迭代器的簡單實現及Yii框架中的迭代器實現方法。分享給大家供大家參考，具體如下：

在pytorch中動態調整優化器的學習率方式

在深度學習中，經常需要動態調整學習率，以達到更好地訓練效果，本文紀錄在pytorch中的實現方法，其優化器例項為SGD優化器，其他如Adam優化器同樣適用。

07 Python 中的迭代器實現原理

在數學中，集合表示由一個或多個確定的元素所構成的整體。在 Python 中，列表、元組、集合可以用於表示數學中的集合。

Keras搭建自編碼器操作

簡介：傳統機器學習任務任務很大程度上依賴於好的特徵工程，但是特徵工程往往耗時耗力，在視訊、語音和視訊中提取到有效特徵就更難了，工程師必須在這些領域有非常深入的理解，並且需要使用專業演算法提取這些資料

keras自動編碼器實現系列之卷積自動編碼器操作

圖片的自動編碼很容易就想到用卷積神經網路做為編碼-解碼器。在實際的操作中，

基於RNN自編碼器的離群點檢測

作者|David Woroniuk 編譯|VK 來源|Towards Data Science 什麼是異常異常，通常稱為異常值，是指資料中不符合資料系列總體行為的資料點、資料序列或模式。因此，異常檢測就是檢測不符合更廣泛資料中的模式的資料點

「Netty系列」介紹下Netty中常用的編碼器和解碼器

技術標籤：Nettyjavanetty網路協議週末文章走起。前面文章介紹Netty相關知識點。接下來將介紹下在通訊過程中用的編碼器和解碼器。這裡會不會聯想到諜戰戲裡面。傳送情報者怕情報洩露，所以對情報行加密然後傳

SpringBoot中使用 JWT + 攔截器實現登入驗證

舊的方法存在缺點之前的策略是，UUID + redis + 攔截器的思路。伺服器端在驗證 roomid 和 password相匹配之後，使用UUID 生成一個字串作為 token ，接著往 Redis 服務中寫入一個對映(token, roomid)，設定過期時

在PyTorch中使用深度自編碼器實現影象重建

自編碼器

在PyTorch中實現深度自編碼器

相關推薦