騰訊 ARC 實驗室公開 AI 模型：能令低解析度圖變高清，可在 GitHub 上下載

阿新 • • 發佈：2021-09-04

下面來欣賞一些高糊圖片“整個世界都清晰了”的魔法時刻：

無論是動漫還是真實影象，是不是都清晰還原了？

以上就是由騰訊 ARC 實驗室最新發表的影象超解析度模型完成的。

與前人工作相比，它可以更有效地消除低分辯率影象中的振鈴和 overshoot 偽影；

面對真實風景圖片，能更逼真地恢復細節，比如樹枝、岩石、磚塊等。

除了上面這些官方的 demo，我們也試了一下，效果還比較滿意：

如果你也想試試，可在 GitHub 上下載該模型的可執行檔案，Windows/Linux/MacOS 都可以，且不需要 CUDA 或 PyTorch 的支援。

下好以後只需在終端執行以下命令即可使用：

./realesrgan-ncnn-vulkan.exe-iinput.jpg-ooutput.png

基於 ESRGAN 的改進研究

這個模型被命名為 Real-ESRGAN，總的來說，就是通過模擬高解析度影象變低分辯率過程中的各種退化，然後看到一張糊圖後倒推出來它的高清圖。

而它是對超分“前輩”ESRGAN 的進一步研究。

ESRGAN 曾贏得 ECCV2018 PIRM-SR 挑戰賽中的第一名，但它在恢復具有未知和複雜退化（degradation）的低解析度影象方面，也就是盲超解析度（Blind Super-Resolution）上做的還不夠好。

而相比 ESRGAN，Real-ESRGAN 使用合成數據進行訓練，引入了高階退化建模以更全面逼真地模擬複雜的影象退化，重點考慮了合成過程中常見的振鈴和 overshoot 偽影。

還採用了一個具有譜歸一化（Spectral Normalization）的 U-Net 鑑別器，來提高鑑別器的效能並穩定訓練過程，最終實現了“青出於藍勝於藍”的效果。

下面就進入具體原理講解：

通常情況下，真實影象 y 首先與模糊核（blur kernel）k 進行卷積，然後執行具有比例因子 r 的下采樣操作，通過新增噪聲 n 獲得低解析度影象 x。一般還得再加個 JPEG 壓縮，即：

而獲得高清影象的過程就是求解 y 的過程（其中 D 表示退化過程）。

然而只採用這一經典的退化模擬，訓練後的模型只能處理部分影象，更復雜的退化（尤其是未知噪聲和某些偽影）仍無法解決：

所以研究人員就引出了高階退化過程來模擬出更真實全面的退化，它包含多個重複的經典退化過程，每個又具有不同的退化超參：

下圖為 Real-ESRGAN 進行退化模擬的示意圖：

採用的是二階退化，具體來說：

在模糊（blur）退化方面，為了包含更多不同的核形狀，Real-ESRGAN 採用了廣義高斯模糊核和 plateau-shaped 分佈。

降噪（noise）方面，除了顏色噪聲和灰度噪聲，還模擬了兩種常見型別：

（1）加性高斯噪聲：其噪聲強度受高斯分佈標準差控制；
（2）泊松噪聲：其噪聲強度與影象資訊成正比。

resize 也就是經典退化模擬裡的下采樣，在這裡為了產生更多模糊影象，就改成了上取樣 + 下采樣的組合操作。resize 方法中，由於最近鄰插值會導致錯位，最後就只考慮了面積、雙線性和雙三次插值。

JPEG 壓縮，能帶來塊偽影。下圖為 OpenCV 與 DiffJPEG 的壓縮效果對比，Real-ESRGAN 採用的是 DiffJPEG。

而在 Real-ESRGAN 重點關注的偽影方面：

主要針對非常常見的振鈴偽影（下圖左 1 左 2，看起來像“鬼影”）和 overshoot 偽影（下圖右 2 右 1，看起來像“鋸齒”）。

採用了 sinc 濾波器來模擬這兩者：

以上，退化模擬搞定後，就可以開始訓練了。

Real-ESRGAN 的生成器沿用了 ESRGAN 的 RRDBNet，還擴充套件了原始的 ×4 ESRGAN 架構，以執行 resize 比例因子為 ×2 和 ×1 的超解析度放大。

判別器則由 VGG 型升級為 U-Net 型，以具備更強的判別能力，處理複雜的輸出以及生成關於區域性紋理的精確梯度反饋。

另外，U-Net 架構和複雜的退化給訓練帶來了不穩定性，為此，還採用了譜歸一化來穩定模型訓練，這也有助於緩解 GAN 帶來的過度銳化以及偽影。

除偽影、恢復紋理細節的效果優於其他方法

最終可以看到，Real-ESRGAN 在去除偽影和恢復紋理細節方面都明顯優於以前的方法：

消融實驗也發現採用二階退化模型的效果最好、通過 sinc 濾波器的可以跟好地去除偽影、SN+UNet 的組合取得了最佳的視覺效果、引入更多的模糊核，模型效果還可以進一步提升（分別對應下面四組圖）：

當然，他們也發現三個表現不夠好的效果，比如線條扭曲、出現了其他偽影。

總而言之，作者表示：盲影象超分仍處於初步探索階段，之前的 BSRGAN 以及本文的 Real-ESRGAN 可為該領域提供一個非常好的基線。

團隊介紹

Wang Xintao，畢業於浙江大學本科，香港中文大學博士（師從湯曉鷗），現在是騰訊 ARC 實驗室（深圳應用研究中心）的研究員。研究興趣集中在影象/視訊的超解析度恢復。ESRGAN 的一作。

謝良彬，中國科學院深圳先進技術研究所碩士一年級學生，師從董超教授。

董超，中國科學院深圳先進技術研究院碩導，畢業於北理工本科，香港中文大學博士。曾任商湯科高階研究經理，谷歌學術引用 14416 次，h 指數 22。

單瀛，騰訊 PCG 應用研究中心（ARC）主任。

論文地址：點此直達

Colab 試玩地址：點此直達

GitHub 專案地址：點此直達

騰訊 ARC 實驗室公開 AI 模型：能令低解析度圖變高清，可在 GitHub 上下載

下面來欣賞一些高糊圖片“整個世界都清晰了”的魔法時刻：無論是動漫還是真實影象，是不是都清晰還原了？

老舊動漫秒變高清，B站推出通用 AI 影象超解析度模型：採用百萬級動漫資料訓練，二次元老婆更漂亮了

感謝網友馬凌曙的線索投遞！

騰訊收購《努努之歌：英雄聯盟外傳》開發商的多數股權，成為大股東

3 月 16 日訊息，開發《努努之歌：英雄聯盟外傳》的工作室 Tequila Works 釋出公告，2022 年 3 月 15 日，騰訊成為遊戲開發工作室的大股東。Tequila Works 負責人 Luz Sancho 表示：“我們很高興與騰訊合作，使 Teq

騰訊新專利公開：判斷玩家位置，提升防沉迷檢測準確度

2 月 24 日訊息國家智慧財產權局官網 2 月 19 日公開了由騰訊申請的一項防沉迷發明專利。騰訊申請的此項發明 “可以提升區分沉迷使用者的準確度，從而實現優秀的防沉迷效果”。

騰訊新專利公開：針對玩家位置的遊戲防沉迷方法

國家智慧財產權局於近日公開了騰訊的一項新專利「防沉迷方法、裝置、伺服器和儲存介質」，這是一項針對玩家地理位置的遊戲防沉迷方法。

騰訊老照片修復演算法開源：細節到頭髮絲，3 種預訓練模型可下載，曾登頂 GitHub 熱榜第一

還記得這個能將老照片修復到纖毫畢現的 GFPGAN 嗎？現在，它的程式碼正式開源了！官方已經在 GitHub 上傳了 3 個預訓練模型，3 個版本的效果區別如下：其中，V1.3 是最近更新的一版，修復效果更加自然。同時還能在低

騰訊追賬老乾媽後續：“一言難盡”背後的合作到底是什麼？

http://www.caixin.com/2020-07-01/101574145.html import java.util.Objects; import org.aspectj.lang.ProceedingJoinPoint;

騰訊 PCG 部門中秋禮物曝光：人手一臺華為 Mate Xs 5G 手機

9 月 30 日訊息明天就是中國傳統節日中秋節，相信很多公司都給員工發放了中秋禮物。現在，網上曝光了騰訊 PCG（平臺與內容事業群）的中秋禮物——人手一臺華為 Mate Xs 5G 手機。

騰訊組織架構整改引思考：中小團隊要怎樣搭建架構？

原文網址：https://www.infoq.cn/article/UoWc9uUtVIrm-azWOglu 2019 年 1 月 4 日，騰訊宣佈成立技術委員會，也代表之前宣佈的架構調整終於拉開序幕。那麼中小團隊要如何搭建自己的團隊架構呢？本文將會對

騰訊視訊釋出極光 T6 投影儀：主打 3D 影院，到手價 4899 元

10 月 15 日訊息經常用智慧電視的第三方客戶端看節目的朋友都知道，騰訊視訊的 TV 端應用名為騰訊極光（雲視聽極光），今天，該品牌推出定製投影儀產品——騰訊極光 T6 投影儀，10 月 20 日正式發售。

騰訊關聯公司公開 “低俗影象的識別方法”相關專利

1 月 27 日訊息企查查 App 顯示，1 月 22 日，騰訊科技（深圳）有限公司公開 “低俗影象的識別方法、裝置、裝置及計算機可讀儲存介質”專利，公開號為 CN112257661A。

騰訊2020年Q4財報：手遊收入是PC遊戲收入3.6倍

騰訊控股今日釋出截至2020年12月31日止第四季度及全年業績公告。公告顯示，騰訊控股2020年第四季度營收1336.69億元，同比增長26%；本公司權益持有人應占盈利為593.02億元，同比增長175%。

騰訊升級員工買房安居福利：買房最高可申請免息借款 90 萬

4 月 30 日下午訊息，騰訊宣佈推出安居計劃 Plus 方案，在原安居計劃借款額度基礎上，新增 Plus 借款額度。根據披露的安居計劃 Plus 方案，本輪調整後，騰訊員工可從公司最高申請到 90 萬元免息借款資金支援，用於個

騰訊視訊五折大促：VIP 年卡 128 元、超級影視 VIP 年卡 244 元

2021 年 4 月 10 日起，騰訊視訊 VIP 會員漲價，提高至單月 30 元，季卡提高至 68 元、年卡提高至 253 元，超級影視 VIP 價格則維持不變。

瞄準客廳玩家，騰訊推出家庭遊娛套裝：大屏玩手遊

5 月 29 日訊息騰訊在5 月 16 日遊戲年度釋出會上公開了一款「分體設計超級手柄」，騰訊先遊昨日宣佈，家庭遊娛套裝「指揮官」正式開啟預約，包含遊娛機 + 分體式遊娛手柄。

傳騰訊新總部內部徵名：目前排第一的是“鵝城”

前段時間，騰訊新總部“企鵝島”專案的開建引起熱議。騰訊方面證實，目前正在進行基坑支護施工。據悉，專案分一期和二期，馬化騰投資370億，落地深圳大鏟灣地面積80.9萬平方米，總建築面積200萬平方米。

騰訊成立天美西雅圖工作室：主攻 PC 和主機端的 3A 射擊遊戲

6 月 23 日訊息騰訊天美在今日發推表示，天美在美國西雅圖成立了新遊戲工作室，該工作室將致力於開發 PC 和主機端的射擊類 3A 大作。

騰訊推出“Q 次元”App：主打年輕人多元群組社群

7 月 5 日訊息據 Tech 星球，騰訊在近日上線了“Q 次元”App，該 App 定位一站式多元群組社群，專為年輕人打造。

(更新，非極速版) 騰訊 QQ 音樂新 App 曝光：新 Logo 亮相，即將釋出

7 月 19 日訊息據酷安網友 @爛爛的你爆料，騰訊 QQ 音樂有望推出 QQ 音樂新版本，即將釋出，預計將進行內測。據網友最新反饋，該產品並非是 QQ 音樂極速版。

揮別“版權大戰”時代，騰訊音樂遭反壟斷調查：“版權≠一勞永逸”

這是《反壟斷法》實施以來，對違法實施經營者集中採取必要措施，恢復市場競爭狀態的第一起案件。

騰訊 ARC 實驗室公開 AI 模型：能令低解析度圖變高清，可在 GitHub 上下載

基於 ESRGAN 的改進研究

除偽影、恢復紋理細節的效果優於其他方法

團隊介紹

相關推薦