1. 程式人生 > >【論文閱讀】Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel......

【論文閱讀】Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel......

開發十年,就只剩下這套架構體系了! >>>   

題目:採用高效的亞畫素卷積神經網路實現實時單影象和視訊的超解析度          CVPR 2016  收錄

摘要:

近年來,基於深度神經網路的多模型在單幅影象超解析度重建精度和計算效能方面都取得了很大的成功。在這些方法中,低解析度(LR)輸入影象在重建前使用一個濾波器(通常是雙三次插值)被放大到高解析度(HR)空間。這意味著超解析度(SR)操作是在HR空間中執行的。我們證明這是次優的,並增加了計算複雜度

。本文提出了第一個卷積神經網路(CNN)能夠實時SR的1080p視訊單次K2 GPU。為了實現這一目標,我們提出了一種新穎的CNN結構,其中特徵圖提取在LR空間。此外,我們還引入了一種高效的亞畫素卷積層,該層學習了一組上標濾波器,將最終的LR特徵圖提升到HR輸出中。通過這樣做,我們有效地取代了手工製作的雙三次插值濾波器,SR通道具有更復雜的放大過濾器,專門針對每個特徵圖進行訓練,我們使用來自公共可用資料集的影象和視訊來評估所提議的方法,並表明它的效能明顯更好(影象+0.15dB,影象+0.39dB)並且比之前基於深度學習方法的速度快了一個數量級。

程式碼地址:https://github.com/drakelevy/ESPCN-TensorFlow

程式碼地址:https://github.com/leftthomas/ESPCN

程式碼地址:https://github.com/wangxuewen99/Super-Resolution/tree/master/ESPCN

優點:卷積操作直接在LR影象上進行,達到效率提升;高效的亞畫素卷積層,將LR特徵圖提升到HR尺寸,然後再輸出;

缺點:雖然速度提升了,但是HR不同的尺寸需要進行不同的訓練,還是要重新訓練才能得