L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing閱讀筆記
阿新 • • 發佈:2022-05-22
L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing
2021 CVPR L2M-GAN: Learning To Manipulate Latent Space Semantics for Facial Attribute Editing (thecvf.com)
(個人理解,歡迎指正錯誤)
Introduction
本文是一篇面部屬性編輯的文章,雖然與人臉匿名是兩個角度,但是任務是相通的。
面部屬性編輯有兩點要求:1、目標屬性特徵應當正確出現在編輯後的人臉上;2、任何不相關的面部特徵均不應當在編輯後被修改。針對以上兩點要求,面部屬性編輯的解決方案有兩類:1、空間感知;2、潛在空間的因子分解。空間感知假設被編輯特徵有良好的區域性性,但對於諸如性別、年齡等全域性特徵效果不好。潛在空間的因子分解旨在探索一個已經訓練好的GAN模型的潛在空間,將其分解為與不同屬性相關的部分。但這種策略不是端到端的訓練,容易陷入區域性最優解。 文章的L2M-GAN以一種端到端的方式實現了對潛在空間的任意特徵的正交化拆解。
Methodology
文中並未提過網路細節,原始碼也未公開訓練程式碼,通過前項傳播的evaluate過程彙總出如下網路細節,僅供參考。
PersonalOpinions
本文的特徵解耦網路style transformer結構簡單直觀,用正交作損失進行優化,效果良好。人臉中的特徵相互關聯,尤其是一些全域性特徵,如年齡,身份,性別等無法通過空間感知進行特徵分割,L2M-GAN為複雜全域性特徵的分割提供了一條可行路徑,實現了編輯目標屬性特徵的同時,任何不相關的特徵均不應當被明顯修改。