論文閱讀筆記——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》
這篇論文是CVPR 2018 (Spotlight),是本人團隊小夥伴餘可的作品~
程式碼連結:https://github.com/yuke93/RL-Restore
專案主頁:http://mmlab.ie.cuhk.edu.hk/projects/RL-Restore/
論文連結:https://arxiv.org/pdf/1804.03312.pdf
開篇給出本文得中心,通過深度強化學習來做Image Restoration
a toolbox consisting of small-scale convolutional networks of different complexities and specialized in different tasks.通過不同規模的小尺度卷積網路來實現不同情況下的影象復原。而不像傳統的影象復原,要麼一個網路只針對一種問題,要麼一個大網路來handdle所有的問題。 作者提出的RL-Restore,通過學習從工具箱中選擇適當工具的策略,以逐步恢復損壞影象的質量(learns a policy to select appropriate tools from the toolbox to progressively restore the quality of a corrupted image)。We formulate a stepwise reward function proportional to how well the image is restored at each step to learn the action policy(我們制定逐步獎勵函式,與每一步恢復影象的程度成正比,以瞭解行動政策).We also devise a joint learning scheme to train the agent and tools for better performance in handling uncertainty(我們還設計了一個聯合學習計劃來訓練代理和工具,以便在處理不確定性方面獲得更好的效能).
由於CNN的判別特性,大部分的模型之前被訓練用來處理特定的低層視覺任務。近期的一些影象復原工作(如VDSR、DnCNN等)證實了一個CNN網路可以處理多種失真型別或不同失真程度的降質影象,這為解決混合失真問題提供了新的思路。但是,這類演算法均選用了複雜度較高的網路模型,帶來了較大的計算開銷。另外,這些演算法的網路均使用同一結構處理所有影象,未考慮一些降質程度較低的影象可以使用更小的網路進行復原。
針對現有影象復原CNN演算法模型複雜,計算複雜度高的問題,本文提出的RL-Restore演算法彌補了這些不足,以更加高效靈活的方式解決了複雜的影象復原問題。
當前流行的影象復原理念認為解決複雜的影象復原問題需要一個大型的CNN,而本文提出了一種全新的解決方案,即使用多個小型CNN專家以協作的方式解決困難的真實影象復原任務。RL-Restore演算法的主要思路是設計一系列基於小型CNN的復原工具,並根據訓練資料學習如何恰當地組合使用它們。這是因為現實影象或多或少受到多種失真的影響,針對複雜失真的影象學習混合使用不同的小型CNN能夠有效的解決現實影象的復原問題。不僅如此,因為該演算法可以根據不同的失真程度選取不同大小的工具,相較於現有CNN模型,這一新方法使用的引數更少,計算複雜度更低。
本文提出的RL-Restore演算法貢獻如下:
1)基於強化學習的影象復原。
2)提出一個用於同時訓練代理(agent)和工具(tool)的聯合學習框架。使得框架可以有效處理中間過程中新引入的未知失真。
3)動態組成的工具鏈效能優於人工設計的網路,且計算量較少。我們的方法更易懂,因為它展示了混合失真是如何一步一步被去除的。
參考:https://blog.csdn.net/qq_27022241/article/details/82951036