1. 程式人生 > 其它 >SRCNN:基於深度學習的超解析度開山之作回顧

SRCNN:基於深度學習的超解析度開山之作回顧

本文提供了與SRCNN論文的總結和回顧,如果你對於影象的超解析度感興趣,一定要先閱讀這篇論文,他可以說是所有基於深度學習的超解析度模型的鼻祖

卷積神經網路通常用於分類,目標檢測,影象分割等與某些與影象有關的問題中。在本文中,將介紹CNN 如何用於單影象超解析度(SISR)。這有助於解決與計算機視覺相關的各種其他問題。在CNN出現之前,傳統的方法是使用最近鄰插值、雙線性或雙三次插值等上取樣方法,也可以取得不錯的效果。

  • Nearest Neighbors Interpolation — 最近鄰插值是一種簡單明瞭的方法。它為每個插值點選擇最近畫素的值,而不考慮任何其他畫素的值。
  • Bilinear Interpolation (BLI) — 雙線性插值 這是一種在影象的一個軸上進行線性插值,然後再移動到另一個軸的技術。因為它產生了一個接受域大小為 2x2 的二次插值,所以它在保持合理速度的同時優於最近鄰插值。
  • Bicubic Interpolation(BCI) — 雙三次插值與雙線性插值一樣,雙三次插值 (BCI) 在兩個軸上進行。與 BLI 相比,BCI 考慮 4x4 畫素,從而產生更平滑的輸出,具有更少的偽影,但速度要慢得多。

本文介紹的SRCNN 模型基本由三個使用步驟組成:

  • 區塊補丁提取和表示
  • 非線性對映
  • 重建

相關工作

一般情況下 SISR (Single Image Super Resolution,)可以總結為以下4種方法——預測模型、基於邊緣的方法、影象統計方法和基於補丁(或基於樣本)的方法。SRCNN 使用基於補丁的方法。利用輸入影象內部樣本的自相似性屬性來生成補丁。SRCNN 使用稀疏編碼公式來對映低解析度和高解析度的補丁,並且影象考慮了 YCbCr 顏色通道。

用於影象恢復的深度學習

大多數影象恢復深度學習方法都是去噪驅動的。雖然自編碼器不能提供從低解析度到高解析度影象的端到端對映,但是在去噪影象領域表現得非常好,而SRCNN 專注於解決這個問題。

 

完整文章:

https://www.overfit.cn/post/e0f8f992ac8d43f1945564b1fd0f14b6