各路 StyleGAN 大彙總，包括全景圖生成、影象到影象翻譯等

阿新 • • 發佈：2021-11-15

StyleGAN 在各種影象處理和編輯任務上，表現很驚豔。

然而，“幹一種活”就得換個體系重新“培訓”一次，太麻煩。

終於，有人細細研究了一下，發現：

其實只通過預訓練和潛空間上的一點小操作，就可以讓 StyleGAN 直接上手各種“活兒”，包括全景圖生成、從單張影象生成、特徵插值、影象到影象翻譯等等。

更厲害的是，它在這些“活兒”上的表現還完全不輸每一位單項 SOTA 選手。

作者順勢做了個全面整理寫成了一篇論文，相關討論在 reddit 上直接收穫了 700 + 的熱度：

網友紛紛感嘆：這總結真的是太酷了！

All You Need：預訓練 + 一點空間操作

方法都非常簡單，我們一個一個來。

前提：fi∈RB×C×H×W 表示 StyleGAN 第 i 層的中間特徵（intermediate features）。

1、空間操作實現直觀和逼真的影象

由於 StyleGAN 是全卷積的，我們可以調整 fi 的空間維度，從而在輸出影象中引起相應的空間變化。

用簡單的空間操作（如 padding 和 resize），可以生成更直觀和真實的影象。

比如下圖通過複製灌木和樹叢來擴充套件背景，與導致紋理模糊等瑕疵的原始 resize 相比，在特徵空間中可以保持更真實的紋理。

2、特徵插值

對 StyleGAN 中間層進行拼貼可以實現影象資訊混合，但要拼接的兩張圖差異太大時效果往往不好。

但採用特徵插值就沒問題。

具體操作方法：在每個 StyleGAN 層，分別使用不同的潛噪聲生成 fAi 和 fBi。然後用下面這個公式將它倆進行平滑地混合，然後再傳遞到下一個卷積層進行同樣的操作。

其中 α∈ [0, 1] B×C×H×W 是一個 mask，如果用於水平混合，則 mask 將從左到右變大。

和對應模型的定性和定量比較：

該特徵插值法能夠無縫地混合兩幅影象，而 Suzuki 等人的結果存在明顯的偽影。

使用者研究中，與 Suzuki 等人相比，87.6% 的人也更喜歡該方法。

使用者研究包含 40 人，每人需比較不同方法下的 25 對影象。

3、從單個影象生成

除了在不同影象之間進行特徵插值，我們還可以在單個影象中應用它。

具體操作方法：在一些特徵層中，選擇相關的 patches，並將其與其他區域混合，在空間上進行復制。使用移位運算子 Shift（・）：

這和 SinGAN 的功能相同，不過 SinGAN 涉及取樣，而該方法只需要手動選擇用於特徵插值的 patches.

和 SinGAN 的定性和定量比較：

該方法生成的影象更加多樣化和真實；SinGAN 則未能以“有意義”的方式改變教堂結構，併產生不夠真實的雲彩和風景。

使用者研究中，83.3% 的人更喜歡該方法生成的新影象。

4、改進 GAN 反演

GAN 反演的目的是在 W + 空間中定位一個樣式碼（style code），通過該樣式碼合成與給定目標影象相似的影象。

Wulff 等人的模型認為，在簡單的非線性變換下，W + 空間可以用高斯分佈建模。然而，在屬性轉移設定中，需要反轉源影象和參考影象，效果並不令人滿意。

最近的研究表明，與 W + 相比，利用 σ 進行面部操作的效能更好。

但作者發現，沒有任何變換的 σ 空間也可以建模為高斯分佈。

然後在這個空間而不是在 GAN 反轉期間，施加相同的高斯先驗。

效果比較：

該方法在影象重建和可編輯性方面獲得了顯著改進。

5、影象到影象翻譯

得益於上部分 σ 空間的效果，作者建議在影象到影象翻譯時 freeze 產生 σ 的仿射變換層（affine transformation layer），這一簡單的變化能夠更好地保留影象翻譯的語義（注意下圖 d 中嘴的形狀）。

此外，作者發現：

（1）可以在所有空間維度上使用常數 α 來執行連續翻譯；

（2）通過選擇要執行特徵插值的區域來執行區域性影象翻譯；

（3）以及使用改進的 GAN 反演在真實人臉上執行人臉編輯和翻譯；

這樣獲得的效果也更佳。

6、全景生成

作者通過“編織”兩幅影象的混合（span）生成全景圖，方法如圖所示：

重複這個過程可以生成任意長度的全景影象。

而且該方法不僅限於一次混合兩個影象、也不限於只在水平方向生成。

一些示例：

7、屬性轉移

為了使特徵插值能夠更好地用於任意人物姿勢的影象的屬性轉移，作者選擇在源影象和參考影象之間執行姿勢對齊，具體就是對齊 W + 空間樣式程式碼的前 2048 個維度。

然後就可以應用特徵插值將所選特徵進行源圖到目標圖的轉移了。

與現有方法比較：

Collins 等人的方法沒有準確地轉移細節屬性，Suzuki 等人在姿勢不匹配時產生的影象不夠真實。

而作者的方法既準確又真實。

使用者根據真實感和準確性進行選擇的結果也進一步驗證了該方法的優越性。

ps. 此外還可以在任意區域執行轉移，比如無縫融合兩邊眼睛明顯不同的兩半臉：

以上就是無需特定架構或訓練正規化、在 StyleGAN 模型潛空間中執行一些操作和微調，就能與其他影象處理任務達到同等或更佳效能的具體方法。

你覺得如何？還有什麼需要補充的嗎？歡迎在評論區留言。

論文地址：

https://arxiv.org/abs/2111.01619

專案地址：

https://github.com/mchong6/SOAT

各路 StyleGAN 大彙總，包括全景圖生成、影象到影象翻譯等

StyleGAN 在各種影象處理和編輯任務上，表現很驚豔。然而，“幹一種活”就得換個體系重新“培訓”一次，太麻煩。終於，有人細細研究了一下，發現：其實只通過預訓練和潛空間上的一點小操作，就可以讓 StyleGAN 直接上

王者榮耀迴應伺服器崩了：已處理完成，將陸續補發相應賠償，包括英雄碎片 * 3、面板碎片 * 3 等

9 月 4 日訊息今天晚上，#王者榮耀崩了#衝上微博熱搜，據網友反饋，王者榮耀遊戲突發故障，遊戲無法進入。有的網友表示，無法進行匹配和排位、巔峰賽等。

17 款移動應用涉嫌超範圍採集個人隱私資訊被點名，包括哈囉出行、58 同城等

12 月 20 日訊息，據新華社，國家計算機病毒應急處理中心近期通過網際網路監測發現了 17 款移動應用存在隱私不合規行為，違反網路安全法、個人資訊保護法相關規定，涉嫌超範圍採集個人隱私資訊。未向用戶明示申請的

Java後端面試題大彙總，衝刺金三銀四

技術標籤：Java面試系列演算法資料庫分散式redismysql 一、Java基礎 1. String類為什麼是final的。

Oracle匯入（impdp）比較大的資料，包括建立表空間、建立使用者、匯入資料等；含expdp及其它

一、以 sys管理員身份登入sqlplus，開啟命令列（cmd.exe），語法： sqlplus sys/Manager001 as sysdba

微信公佈 7 月朋友圈十大謠言，包括“奧運冠軍楊倩被獎勵 1600 萬”等

7 月 31 日訊息，網路的快速發展加上社交平臺的便利，使得資訊傳播速度日期加快。不過，便捷的網路和平臺也成為一些謠言高發地，尤其是我們在刷朋友圈的過程中，經常會看到各種各樣危言聳聽的訊息。今天，微信官方對

微信公佈 9 月朋友圈十大謠言，包括接通電話手機裡的錢就會被轉走等

10 月 5 日訊息，網路的快速發展加上社交平臺的便利，使得資訊傳播速度日期加快。不過，便捷的網路和平臺也成為一些謠言高發地，尤其是我們在刷朋友圈的過程中，經常會看到各種各樣危言聳聽的訊息。日前，微信官方對

微信公佈 10 月朋友圈十大謠言，包括牙膏能殺滅幽門螺桿菌等

11 月 4 日訊息，微信安全中心近日公佈了 10 月份的朋友圈十大謠言，包括牙膏能殺滅幽門螺桿菌等。網路的快速發展加上社交平臺的便利，使得資訊傳播速度日期加快。提醒廣大家友，擦亮眼睛，不輕信未知來源的網路資訊

Oracle GoldenGate(ogg)安裝經驗大彙總，採坑總結，絕對乾貨！

Oracle GoldenGate(ogg)安裝經驗大彙總，採坑總結，絕對乾貨！一下是安裝ogg過程中遇到的問題和解決辦法，絕對良心乾貨，抽空會寫更詳細的安裝教程。更多精彩內容請點選

微信公佈四月朋友圈十大謠言，包括“5 月 1 日之後全國將關閉所有的遊戲”等

感謝網友 SP_CE 的線索投遞！

遊戲直播大聯姻，騰訊整合虎牙、鬥魚，但「宮鬥」尚未平息

凡是過去 , 皆為序章。 10 月 12 日晚間，虎牙與鬥魚聯合宣佈雙方已簽訂 “合併協議與計劃”。在恩怨糾葛了數年後，國內兩大頭部遊戲直播平臺虎牙和鬥魚終於拋開成見，成為了一家人。百億美元遊戲直播新公司的序幕也

微軟 Win11 介面 UI 設計首批適配截圖工具、計算器和郵件等 App：支援黑暗模式，功能更豐富

8 月 13 日訊息今天微軟釋出了 Windows 11 預覽版 Build 22000.132，累積更新補丁為 KB5005190，面向 Dev 開發和 Beta 測試頻道的內測人員釋出。這個預覽版本帶來了全新的微軟 Teams 聊天，升級後的截圖工具、計算器

小米 MIUI 12.5 增強版第二批穩定版今日開始逐步推送，包括 Redmi Note 8/Note 9/Note 10 等機型

10 月 8 日訊息據 Redmi 紅米手機官方微博，今日，MIUI12.5 增強版第二批穩定版開始逐步推送。官方海報顯示，本次更新的系統版本為 MIUI 12.5.9 穩定版內測。瞭解到，本次穩定版內測開始逐步推送，包含的 Redmi 機

鴻蒙 HarmonyOS 生態亮點搶先看，華為開發者大會 HDC 2021 主題演講、技術論壇內容公佈：嘉賓包括餘承東、王成錄等

10 月 21 日訊息，華為開發者大會 2021 卡片已經出現在鴻蒙 HarmonyOS 手機上，另外華為官方已經公佈了開發者大會 HDC 2021 主題演講內容和演講嘉賓陣容等。後者包括餘承東、龔體、王成錄、張平安、何剛。獲悉，華為

AILabel實現圖片標註功能，包括圖片縮放、平移，文字，矩形、圓形，多邊形等標註（Vue專案使用步驟）

具體的方法使用說明見文件： http://ailabel.com.cn/public/ailabel/api/index.html vue專案使用步驟

蘋果承諾增加清潔能源供應商，包括 SK 海力士和意法半導體等

蘋果公司週三表示，其 175 家供應商現已承諾使用清潔能源為 iPhone 製造商開展工作，幫助將超過 900 萬千瓦的清潔能源帶入電力系統。新一輪供應商比該公司去年報告的 70 家供應商和近 800 萬千瓦的電力有所增加，這是

淘寶釋出“2021 年度十大商品”，露肩“疫苗裝”、搪瓷痰盂等入選

12 月 22 日訊息，今日淘寶釋出“2021 年度十大商品”，頻上熱搜的奧運冠軍“楊倩同款小黃鴨髮卡”、年初火到海外的“搪瓷痰盂”、熱播劇《覺醒年代》周邊等網紅話題商品高票入選。瞭解到，年度十大商品是根據在淘寶

五菱汽車：GSEV 系列車型累計銷量達 75 萬，包括巨集光 MINIEV、五菱 NanoEV、KiWi EV 等

1 月 6 日訊息，今日，五菱汽車通過微信公眾號表示，包括巨集光 MINIEV、五菱 NanoEV、KiWi EV 等在內 GSEV 系列車型累計銷量破 75 萬。瞭解到，五菱汽車指出，根據資料統計，中國每賣出 2 輛小型新能源車，就有 1

抖音：全面治理「不良直播 PK 內容」違規行為，包括叫囂引戰、惡意炒作、低俗懲罰等

3 月 11 日訊息，抖音官方微博今晚表示，即日起，抖音直播將全面治理「不良直播 PK 內容」違規行為，我們希望與每一位主播共同推動直播行業的健康發展，營造風清氣正的網路文化家園。抖音直播在此倡議：抵制低俗內容

曝蘋果正測試至少 9 款基於 M2 晶片的新 Mac，包括 M2 標準版、M2 Pro、M2 Max 以及 M2 Ultra

4 月 15 日訊息，據彭博社 Mark Gurman 援引開發者日誌報道，蘋果公司正在內部測試下一代 M2 晶片的幾種變體以及將配備這些晶片的最新 Mac。目前“至少”有 9 臺新的 Mac 正在開發中，它們使用四種不同的 M2 晶片。

各路 StyleGAN 大彙總，包括全景圖生成、影象到影象翻譯等

All You Need：預訓練 + 一點空間操作

相關推薦