1. 程式人生 > 實用技巧 >Large Receptive Field Networks for High-Scale Image Super-Resolution,CVPRW 2018

Large Receptive Field Networks for High-Scale Image Super-Resolution,CVPRW 2018

G. Seif and D. Androutsos, “Large Receptive Field Networks for High-Scale Image Super-Resolution,” 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

Motivation:
SR是一個不適定問題,存在一張LR影象對應多張HR影象問題。LR中包含HR中較少的高頻細節,這在縮放因子較大時尤為明顯。論文K. Simonyan and A. Zisserman. Very deep convolutional networks for large-scale image recognition. CoRR, abs/1409.1556, 2014.提出增加深度神經網路的感受野可以捕獲更多的空間內容,進而提高網路效能。根據這一思路,很多SR工作通過使用更多的網路層數和遞迴來增加網路的深度,進而形成大的感受野,學習更復雜的image-to-image的對映。上面的做法存在一些問題:產生大量的網路引數、犧牲了網路速度、訓練困難(需仔細設計學習率和梯度裁剪)。

針對上述問題,本文試圖在不增加網路層數和引數數量的情況下,增大SR網路的感受野,進而提高SR網路效能。

Contribution:
本文提出了兩種增大感受野的方法:一維可分離濾波器(one-dimensional separable filters);空洞卷積(atrous convolutions)。一維可分離濾波器通過使用更大的一維卷積核來增大感受野;空洞卷積使用卷積濾波器權重之間的空間來增大感受野。兩種方法相比使用標準卷積,增大了感受野,在不增加網路深度和引數數量情況下,提升了SR網路效能。
在這裡插入圖片描述
Introduction:
基本的網路結構:
在這裡插入圖片描述
基本網路中ResBlocks的結構:
在這裡插入圖片描述
使用標準卷積核時,ResBlock使用(a)結構是最優的,EDSR中使用了這種結構;使用一維可分離卷積時,(a)結構仍然是最優的。下圖中A、B、C、D依次表示上述四種結構。

在這裡插入圖片描述
三種卷積(標準卷積核、一維可分離卷積核、空洞卷積核):
在這裡插入圖片描述
一維可分離卷積(LRFNet-S):
標準卷積和一維可分離卷積結果比較:在SR網路中使用的多是標準卷積核(如:33或55),由Table 2中的Baseline知,標準卷積核的size為77時效能最優,隨著size增大網路效能先變好再變差;LRFNet-S使用一維可分離卷積核(如:13,31或15,5*1),隨著卷積核size增大,網路效能增加。由Table 3知使用一維可分離卷積核相較標準卷積核,在很大程度上減小了網路的引數量。
在這裡插入圖片描述
在這裡插入圖片描述

空洞卷積(LRFNet-A):
Table 4比較了標準卷積和不同空洞率的空洞卷積。空洞卷積實際卷積核大小:K=k+(k-1)(r-1),k為原始卷積核大小,r為空洞卷積引數空洞率。表中Baseline表示使用標準卷積,1-2表示基本網路的12個ResBlocks中前6個空洞率為1(空洞率為1時即標準卷積),後六個空洞率為2;1-2-3表示ResBlocks前4個空洞率用1,中間4個用2,後4個用3。由結果知,在scale較大時,使用空洞率較大的卷積SR效果更好。

在這裡插入圖片描述
聯合使用一維可分離卷積和空洞卷積(LRFNET-SA):
由Table 5知,將兩者聯合使用結果並不會更好,相比只是用一維可分離卷積,聯合使用效果會變差。
在這裡插入圖片描述

比較一維可分離卷積和空洞卷積:
空洞卷積在scale較大時,表現較好;一維可分離卷積在scale較小時,表現較好。
在這裡插入圖片描述
Gain:
對研究大scale超分有點幫助,一般SR網路使用標準卷積(如:3*3),論文證明了隨著kernel size的增大,SR效果先變好再變差。空洞卷積在大scale下SR效果可能更好。論文沒有開原始碼,網路的整體結構應該是參考EDSR做的,改變了網路的卷積方式。
論文中的Baseline是EDSR嗎?感覺好像是