1. 程式人生 > >超解析度重建之SRCNN

超解析度重建之SRCNN

這裡主要講深度學習用在超解析度重建上的開山之作SRCNN。超解析度技術(Super-Resolution)是指從觀測到的低解析度影象重建出相應的高解析度影象,在監控裝置、衛星影象和醫學影像等領域都有重要的應用價值。SR可分為兩類:從多張低解析度影象重建出高解析度影象和從單張低解析度影象重建出高解析度影象。基於深度學習的SR,主要是基於單張低解析度的重建方法,即Single Image Super-Resolution (SISR)。

SR方法主要可以分為四種模型:基於邊緣,基於影象統計,基於樣本(基於補丁)的方法。本文的SRCNN網路結構非常簡單,僅僅只有三層網路就是實現了SR。網路結構如下圖所示:

主要分為三個步驟:

Step1 影象塊的提取和特徵表示,利用卷積網路的性質提取影象塊的特徵。公式:

Step2 非線性對映。將第一步的n1維特徵對映到n2維。公式如下:

做非線性對映可以增加層數。

Step3 重構。再做一次卷積進行重構,類似於傳統方法的平均處理。公式如下:

這種方法與稀疏編碼的關係如下圖所示:

實驗的一些細節:發現使用單通道效果更好,不容易陷入區域性最優解,最後一層的學習率要非常小才收斂。

參考:Super-Resolution Convolutional Neural Network SRCNN, PAMI 2016, 程式碼)