《EDVR: Video Restoration with Enhanced Deformable Convolutional Networks》論文閱讀之EDVR

阿新 • • 發佈：2020-10-20

在CVPR 2019 Workshop NTIRE 2019 視訊恢復比賽中，來自商湯科技、港中文、南洋理工、深圳先進技術研究院的聯合研究團隊獲得了全部四個賽道的所有冠軍！

近日，作者們已經將所使用的EDVR演算法論文釋出於arXiv，並稱程式碼將於本月開源。

NTIRE Workshop 全稱為：

paper :EDVR

code:EDVR

內容簡介

視訊恢復不是影象恢復的簡單應用，因其含有大量的時空冗餘資訊可以利用。

下圖是對同一區域，使用目前最好的影象超分辨演算法RCAN恢復和使用EDVR演算法視訊超解析度的結果，可以明顯看出，視訊超分辨出的結果能看到更多的細節。

演算法創新點

作者認為要解決視訊增強，必須要解決兩大問題：

1. 影象對齊（Alignment）。

視訊相鄰幀存在一定的抖動，必須先對齊才能進一步處理融合。以往這可以使用光流演算法處理，但本文中作者發明了一種新的網路模組PCD 對齊模組，使用Deformable卷積進行視訊的對齊，整個過程可以端到端訓練。

2. 時空資訊融合（Fusion）。

挖掘時域（視訊前後幀）和空域（同一幀內部）的資訊融合。本文中作者發明了一種時空注意力模型進行資訊融合。

作者發明的EDVR演算法架構：

其中PCD 對齊模組，使用金字塔結構級聯的Deformable卷積構建，如下圖：

作者發明的時空注意力融合模型TSA如下圖：

實驗結果

作者將EDVR演算法應用於三個視訊超解析度資料集上的數值結果如下（請點選檢視大圖）：

可見該文提出的演算法在Vid4資料集上大部分是最高或者次高精度，而在Vimeo-90K-T 與REDS4 資料集上都是精度指標最高的。

下圖是該文演算法超解析度效果示例（請點選檢視大圖）：

上圖中對模糊車牌的恢復是不是很神奇！這會是很有用的應用領域。

下面的表格列出了本次比賽前五名的成績，EDVR取得了毫無爭議的第一，並且大多數情況是大幅超越第二名！

論文地址：

https://arxiv.org/abs/1905.02716v1

開源地址：

https://github.com/xinntao/EDVR

參考文獻

1.https://www.jiqizhixin.com/articles/2019-05-20-16

《EDVR: Video Restoration with Enhanced Deformable Convolutional Networks》論文閱讀之EDVR

在CVPR 2019 Workshop NTIRE 2019 視訊恢復比賽中，來自商湯科技、港中文、南洋理工、深圳先進技術研究院的聯合研究團隊獲得了全部四個賽道的所有冠軍！

理解 Deformable Convolutional Networks

理解 Deformable Convolutional Networks Feng Nie AI Scientist 1 空洞卷積 1.1 理解空洞卷積在影象分割領域，影象輸入到CNN（典型的網路比如FCN）中，FCN先像傳統的CNN那樣對影象做卷積再pool

pytorch實現 | Deformable Convolutional Networks | CVPR | 2017

文章轉載自微信公眾號：【機器學習煉丹術】，請支援原創。這一篇文章，來講解一下可變卷積的程式碼實現邏輯和視覺化效果。全部基於python，沒有C++。大部分程式碼來自：https://github.com/oeway/pytorch-deform-co

SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS 論文筆記

SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS Thomas N. Kipf、MaxWelling Published as a conference paper at ICLR 2017

Learning local feature descriptors with triplets and shallow convolutional neural networks 論文閱讀筆記

Learning local feature descriptors with triplets and shallow convolutional neural networks 題目翻譯：學習 local feature descriptors使用 triplets 還有淺的卷積神經網路。讀罷此文，只覺收穫滿滿，同時另

Visualizing and Understanding Convolutional Networks論文復現筆記

目錄Visualizing and Understanding Convolutional Networks 論文復現筆記AbstractIntroductionApproachVisualization with a Deconvnet關於Deconvnet的實現Convnet Visualization對於一個給定的Feature map，論文中

【DMCP】2020-CVPR-DMCP Differentiable Markov Channel Pruning for Neural Networks-論文閱讀

DMCP 2020-CVPR-DMCP Differentiable Markov Channel Pruning for Neural Networks Shaopeng Guo（sensetime 商湯）

【論文筆記（5）ECCV2020】Graph convolutional networks for learning with few clean and many noisy labels

Graph convolutional networks for learning with few clean and many noisy labels AbstractIntroductionRelated WrokProblem formulationCleaning with graph convolutional networksLearning a classi

自監督- Multi-Stage Self-Supervised Learning for Graph Convolutional Networks on Graphs with Few Labeled Nodes

標籤: 自監督、圖神經動機首先, 由於很難改變 GCNs 固有的淺層結構, 如何設計一種基於 GCNs 的一致高效的訓練演算法來提高其在標籤節點較少的圖上的泛化效能？

深度學習論文翻譯解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

論文標題：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition　　　　　　標題翻譯：用於視覺識別的深度卷積神經網路中的空間金字塔池

深度學習論文翻譯解析（十）：Visualizing and Understanding Convolutional Networks

論文標題：Visualizing and Understanding Convolutional Networks 　　標題翻譯：視覺化和理解卷積網路

Fully Convolutional Networks for Semantic Segmentation

FCN論文地址：https://arxiv.org/abs/1411.4038 FCN原始碼地址：https://github.com/shelhamer/fcn.berkeleyvision.org

圖神經網路論文閱讀(十六) GraLSP: Graph Neural Networks with Local Structural Patterns,AAAI 2020

本文作者來自香港科技大學、北大和北郵，其中包含宋國傑老師和石川老師，這兩位都是國內研究圖表示學習的翹楚了。之前讀石川團隊論文的時候自己犯傻發郵件問了一個比較弱智的問題，石川老師還是讓學生耐心幫

Very Deep Convolutional Networks for Large-Scale Image Recognition-VGGNet解讀

作者：HYH 日期：2020-9-10 論文期刊：ICLR2015 標籤：VGG 論文：《Very Deep Convolutional Networks for Large-Scale Image Recognition》

Long-term Recurrent Convolutional Networks for Visual Recognition and Description

視覺識別和描述的長期遞迴卷積網路摘要：基於深度卷積網路的模型主導了最近的影象解釋任務。我們調查了也經常使用的模型是否對涉及序列，視覺和其他方面的任務有效。我們描述了一類遞迴卷積體系結構，它是

FCN論文解讀：FCN-Fully Convolutional Networks for Semantic Segmentation

FCN原文作為語義分割領域的開山之作，對其進行研究和閱讀幾乎是入門語義分割領域的基礎，這篇部落格整理了自己閱讀該論文的一些心得感悟和收穫。

論文閱讀筆記《Automatic Fabric Defect Detection with a Multi-Scale Convolutional Denoising Autoencoder Net》

核心思想本文提出一種多尺度卷積去噪自動編碼器網路（MSCDAE）實現了對布匹紡織物缺陷的無監督檢測，演算法的思路其實並不複雜，作者使用正樣本對卷積自動編碼器（CAE）進行訓練，使得其具備提取織物特

《Character-level Convolutional Networks for Text Classification》

Character-level Convolutional Networks for Text Classification 概述：驗證使用字元級的CNN進行文字分類任務的可能性

論文：Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 閱讀筆記

一、論文 (16)Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks https://arxiv.org/abs/1604.02878

論文閱讀筆記《Convolutional Neural Networks for Steel Surface Defect Detection from Photometric Stereo》

小樣本學習&元學習經典論文整理||持續更新核心思想本文提出一種使用光度立體影象（Photometric Stereo Images）對鋼軌表面缺陷進行檢測的方法，關於光度立體影象我沒找到特別詳細的介紹，大體的概

《EDVR: Video Restoration with Enhanced Deformable Convolutional Networks》論文閱讀之EDVR

內容簡介

演算法創新點

實驗結果

相關推薦