Deep Learning（深度學習）學習筆記整理系列之（六）AutoEncoder自動編碼器

阿新 • • 發佈：2019-01-28

轉處：http://blog.csdn.net/zouxy09/article/details/8775524

Deep Learning（深度學習）學習筆記整理系列

作者：Zouxy

version 1.0 2013-04-08

宣告：

1）該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參考文獻。具體的版本宣告也參考原文獻。

2）本文僅供學術交流，非商用。所以每一部分具體的參考資料並沒有詳細對應。如果某部分不小心侵犯了大家的利益，還望海涵，並聯系博主刪除。

3）本人才疏學淺，整理總結的時候難免出錯，還望各位前輩不吝指正，謝謝。

4）閱讀本文需要機器學習、計算機視覺、神經網路等等基礎（如果沒有也沒關係了，沒有就看看，能不能看懂，呵呵）。

5）此屬於第一版本，若有錯誤，還需繼續修正與增刪。還望大家多多指點。大家都共享一點點，一起為祖國科研的推進添磚加瓦（呵呵，好高尚的目標啊）。請聯絡：[email protected]

目錄：

一、概述

二、背景

接上

九、Deep Learning的常用模型或者方法

9.1、AutoEncoder自動編碼器

Deep Learning最簡單的一種方法是利用人工神經網路的特點，人工神經網路（ANN）本身就是具有層次結構的系統，如果給定一個神經網路，我們假設其輸出與輸入是相同的，然後訓練調整其引數，得到每一層中的權重。自然地，我們就得到了輸入I的幾種不同表示（每一層代表一種表示），這些表示就是特徵。自動編碼器就是一種儘可能復現輸入訊號的神經網路。為了實現這種復現，自動編碼器就必須捕捉可以代表輸入資料的最重要的因素，就像PCA那樣，找到可以代表原資訊的主要成分。

具體過程簡單的說明如下：

1）給定無標籤資料，用非監督學習學習特徵：

在我們之前的神經網路中，如第一個圖，我們輸入的樣本是有標籤的，即（input, target），這樣我們根據當前輸出和target（label）之間的差去改變前面各層的引數，直到收斂。但現在我們只有無標籤資料，也就是右邊的圖。那麼這個誤差怎麼得到呢？

如上圖，我們將input輸入一個encoder編碼器，就會得到一個code，這個code也就是輸入的一個表示，那麼我們怎麼知道這個code表示的就是input呢？我們加一個decoder解碼器，這時候decoder就會輸出一個資訊，那麼如果輸出的這個資訊和一開始的輸入訊號input是很像的（理想情況下就是一樣的），那很明顯，我們就有理由相信這個code是靠譜的。所以，我們就通過調整encoder和decoder的引數，使得重構誤差最小，這時候我們就得到了輸入input訊號的第一個表示了，也就是編碼code了。因為是無標籤資料，所以誤差的來源就是直接重構後與原輸入相比得到。

2）通過編碼器產生特徵，然後訓練下一層。這樣逐層訓練：

那上面我們就得到第一層的code，我們的重構誤差最小讓我們相信這個code就是原輸入訊號的良好表達了，或者牽強點說，它和原訊號是一模一樣的（表達不一樣，反映的是一個東西）。那第二層和第一層的訓練方式就沒有差別了，我們將第一層輸出的code當成第二層的輸入訊號，同樣最小化重構誤差，就會得到第二層的引數，並且得到第二層輸入的code，也就是原輸入資訊的第二個表達了。其他層就同樣的方法炮製就行了（訓練這一層，前面層的引數都是固定的，並且他們的decoder已經沒用了，都不需要了）。

3）有監督微調：

經過上面的方法，我們就可以得到很多層了。至於需要多少層（或者深度需要多少，這個目前本身就沒有一個科學的評價方法）需要自己試驗調了。每一層都會得到原始輸入的不同的表達。當然了，我們覺得它是越抽象越好了，就像人的視覺系統一樣。

到這裡，這個AutoEncoder還不能用來分類資料，因為它還沒有學習如何去連結一個輸入和一個類。它只是學會了如何去重構或者復現它的輸入而已。或者說，它只是學習獲得了一個可以良好代表輸入的特徵，這個特徵可以最大程度上代表原輸入訊號。那麼，為了實現分類，我們就可以在AutoEncoder的最頂的編碼層新增一個分類器（例如羅傑斯特迴歸、SVM等），然後通過標準的多層神經網路的監督訓練方法（梯度下降法）去訓練。

也就是說，這時候，我們需要將最後層的特徵code輸入到最後的分類器，通過有標籤樣本，通過監督學習進行微調，這也分兩種，一個是隻調整分類器（黑色部分）：

另一種：通過有標籤樣本，微調整個系統：（如果有足夠多的資料，這個是最好的。end-to-end learning端對端學習）

一旦監督訓練完成，這個網路就可以用來分類了。神經網路的最頂層可以作為一個線性分類器，然後我們可以用一個更好效能的分類器去取代它。

在研究中可以發現，如果在原有的特徵中加入這些自動學習得到的特徵可以大大提高精確度，甚至在分類問題中比目前最好的分類演算法效果還要好！

AutoEncoder存在一些變體，這裡簡要介紹下兩個：

Sparse AutoEncoder稀疏自動編碼器：

當然，我們還可以繼續加上一些約束條件得到新的Deep Learning方法，如：如果在AutoEncoder的基礎上加上L1的Regularity限制（L1主要是約束每一層中的節點中大部分都要為0，只有少數不為0，這就是Sparse名字的來源），我們就可以得到Sparse AutoEncoder法。

如上圖，其實就是限制每次得到的表達code儘量稀疏。因為稀疏的表達往往比其他的表達要有效（人腦好像也是這樣的，某個輸入只是刺激某些神經元，其他的大部分的神經元是受到抑制的）。

Denoising AutoEncoders降噪自動編碼器：

降噪自動編碼器DA是在自動編碼器的基礎上，訓練資料加入噪聲，所以自動編碼器必須學習去去除這種噪聲而獲得真正的沒有被噪聲汙染過的輸入。因此，這就迫使編碼器去學習輸入訊號的更加魯棒的表達，這也是它的泛化能力比一般編碼器強的原因。DA可以通過梯度下降演算法去訓練。

下續

Deep Learning（深度學習）學習筆記整理系列之（七）

Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep Learning的學習系列是整理自網上很大牛和機器

Deep Learning（深度學習）學習筆記整理系列之（一）

Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep Learning的學習系列是整理自網上很大牛和機

Deep Learning（深度學習）學習筆記整理系列之（四）

Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep Learning的學習系列是整理自網上很大牛和機器

Deep Learning（深度學習）學習筆記整理系列之（三）

Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep Learning的學習系列是整理自網上很大牛和機器

Deep Learning（深度學習）學習筆記整理系列之（六）

轉自：http://blog.csdn.net/zouxy09/article/details/8781396 Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

Deep Learning（深度學習）學習筆記整理系列之（八）

轉自：http://blog.csdn.net/zouxy09/article/details/8782018 Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

Deep Learning（深度學習）學習筆記整理系列之（七）Convolutional Neural Networks卷積神經網路

轉處：http://blog.csdn.net/zouxy09/article/details/8781543/ Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

Deep Learning（深度學習）學習筆記整理系列之（六）AutoEncoder自動編碼器

轉處：http://blog.csdn.net/zouxy09/article/details/8775524 Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

Deep Learning（深度學習）學習筆記整理系列三

學習能力架構 -s 解釋區別初始化 filter 大牛 ted Deep Learning（深度學習）學習筆記整理系列聲明： 1）該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參考文獻。具體的版本聲明

Deep Learning（深度學習）學習筆記整理系列四

輸入刪除 encoder 添加 http 標簽聯系稀疏初級 Deep Learning（深度學習）學習筆記整理系列聲明： 1）該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參考文獻。具體的版本聲明也

Deep Learning（深度學習）學習筆記整理系列七

試圖能夠多層深度學習註意理解 pap http 相關 Deep Learning（深度學習）學習筆記整理系列聲明： 1）該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參考文獻。具體的版本聲明也

Deep Learning（深度學習）學習筆記整理系列(概括的很好)----之四（自編碼）

Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參考文獻。具體的版

Deep Learning（深度學習）學習筆記整理系列

一、概述 Artificial Intelligence，也就是人工智慧，就像長生不老和星際漫遊一樣，是人類最美好的夢想之一。雖然計算機技術已經取得了長足的進步，但是到目前為止，還沒有一臺電腦能產生“自我”的意識。是的，在人類和大量現成資料的幫助下

Deep Learning（深度學習）學習筆記整理系列（五）

Deep Learning（深度學習）學習筆記整理系列（六）

Deep Learning 1_深度學習UFLDL教程：Sparse Autoencoder練習（斯坦福大學深度學習教程）

1前言本人寫技術部落格的目的，其實是感覺好多東西，很長一段時間不動就會忘記了，為了加深學習記憶以及方便以後可能忘記後能很快回憶起自己曾經學過的東西。首先，在網上找了一些資料，看見介紹說UFLDL很不錯，很適合從基礎開始學習，Adrew Ng大牛寫得一點都不裝B，感覺非常好

Deep Learning 4_深度學習UFLDL教程：PCA in 2D_Exercise（斯坦福大學深度學習教程）

前言本節練習的主要內容：PCA，PCA Whitening以及ZCA Whitening在2D資料上的使用，2D的資料集是45個數據點，每個資料點是2維的。要注意區別比較二維資料與二維影象的不同，特別是在程式碼中，可以看出主要二維資料的在PCA前的預處理不需要先0均值歸一化，而二維自然影象需要先

Deep Learning 3_深度學習UFLDL教程：預處理之主成分分析與白化_總結（斯坦福大學深度學習教程）

1PCA ①PCA的作用：一是降維；二是可用於資料視覺化；注意：降維的原因是因為原始資料太大，希望提高訓練速度但又不希望產生很大的誤差。 ② PCA的使用場合：一是希望提高訓練速度；二是記憶體太小；三是希望資料視覺化。 ③用PCA前的預處理：(1)規整化特徵的均值大致為0；(

Deep Learning 19_深度學習UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大學深度學習教程）

基礎知識概述 CNN是由一個或多個卷積層（其後常跟一個下采樣層）和一個或多個全連線層組成的多層神經網路。CNN的輸入是2維影象（或者其他2維輸入，如語音訊號）。它通過區域性連線和權值共享，再通過池化可得到平移不變特徵。CNN的另一個優點就是易於訓練

Deep Learning 8_深度學習UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大學深度學習教程）

前言 2.實驗環境：win7， matlab2015b，16G記憶體，2T硬碟 3.實驗內容：Exercise: Implement deep networks for digit classification。利用深度網路完成MNIST手寫數字資料庫中手寫數字的識別。即：用6萬個已標註資料（即：6萬

Deep Learning（深度學習）學習筆記整理系列之（六）AutoEncoder自動編碼器

相關推薦