基於GAN的人臉光照處理

阿新 • • 發佈：2019-01-02

原文連結：Face Image Illumination Processing Based on Generative Adversarial Nets

摘要:眾所周知，光照的變化會嚴重影響二維人臉分析演算法的效能，如人臉標記和人臉識別。不幸的是，在大多數實際應用中，照明條件通常是不受控制和不可預測的。為了解決這個問題，已經有很多方法被開發出來，但是效果很差，特別是對於光線條件極端的影象。此外，傳統的光照處理方法大多隻在灰度影象上顯示，對人臉影象的對齊要求非常嚴格，在實際應用中應用有限。本文提出了一種基於生成對抗性網路(GAN)的人臉影象光照處理問題，並將其作為一種風格轉換任務進行重構。關鍵的見解是在不知道它們的真實分佈的情況下，使用GAN在兩個域之間的強大對映能力。在這種新視野下，我們開發了一種新的多尺度對偶判別網路，並利用多尺度對偶學習來進行視覺逼真的光照處理。我們提倡利用傳統方法的洞見，在影象質量評價中加入重構學習和兩項新的損失項，以加強除生成影象細節外的所有其他光照的保護。在CMU Multi-PIE和FRGC資料集上的實驗表明，該方法可以獲得良好的光照歸一化結果，並保持了良好的視覺質量。

網路架構：

網路架構圖

對於該網路架構的理解：首先，有一個生成器G和兩個判別器D。生成器的輸入是原始人臉影象x，以及目標的光照強度c'，通過G生成一張目標光照的人臉影象 $\tilde{x}$ '。此時將 $\tilde{x}$ '於原始影象x輸入判別器D1中，D1對x和 $\tilde{x}$ '的真假作出判斷，看是否是合成影象。然後對 $\tilde{x}$ '和x的光照強度進行分類，分類損失分別優化G和D1（分開的）。D2對另外任選的一個目標光照強度下的人臉影象 $\tilde{y}$ '和 $\tilde{x}$ '的真假作出判斷，並識別出各自的身份去優化G和D2.（此處作者並未明確說出是識別哪個影象的身份，但是我認為既然是優化G和D，那麼應該是二者都識別的）。輸出的 $\tilde{x}$ '和輸入影象的光照強度c重新通過G重構x為 $\tilde{x}$

, $\tilde{x}$ 和 $\tilde{x}$ '之間的損失為重構損失，後面會有提到。我們期望的目的是D1能將 $\tilde{x}$ '的光照識別為c'，D2能將 $\tilde{x}$ '的身份識別為l。

損失函式：

1、判別器損失函式

$L_{adv}$ 和 $L_{cls}$ 對應的定義如下：

其中，α1和α2是權重引數。 $D_{src}$ 為判別器輸出的為真實影象的概率。G希望式（3）、（4）最小化，而D1和D2希望他們最大化。在式（5）、（6）中， $\hat{x}$ 代表被分類的影象，而 $\hat{c}$ 代表 $\hat{x}$ 被對應的判別器分類的結果。

2、生成器損失函式

基礎損失：

將 $\hat{x}$ '的光照強度歸為 $\tilde{c}$ '，身份判別為 $\tilde{l}$ '，產生的損失定義為（7），其中α1和α2是超引數，用於控制光照強度和身份的重要性，論文中都是用了1.

重構損失：

為了進一步保證翻譯後的影象在只改變輸入中與光照相關的部分的同時保留輸入影象的內容，彌補訓練資料的不足，論文對生成器應用了迴圈一致性損失，定義為式（8）。可以看出該損失計算的就是網路架構圖最上面的那部分。作者們說他們首先採用了L1正則化作為重構損失。

SSIM（結構相似度）損失：

其中ux、uy分別表示影象X和Y的均值，σX、σY分別表示影象X和Y的方差，σXY表示影象X和Y的協方差，即

（圖片來自：https://www.cnblogs.com/vincent2012/archive/2012/10/13/2723152.html）

c1、c2、c3為常數，為了避免分母為0的情況，通常取c1=(k1*L)^2, c2=(k2*L)^2, c3=c2/2, 一般地k1=0.01, k2=0.03, L 是畫素值範圍，論文中為1.式（9）、（10）、（11）組合在一起有：

取α, β, γ為1，則

SSIM越接近1，兩個影象之間越相似。最終用於訓練的SSIM損失為：

PSNR（Peak signal-to-noise ratio）峰值信噪比損失：

首先彩色影象3通道的的均方誤差為：

PSNR為：

其中MAXx為x中畫素的最大值，論文中為1.最終的PSNR損失為：

30為作者們的經驗值，取正則化PSNR的值。

最終，G的損失函式為：

其中，α3=10和α4=5

訓練演算法：

其中Kd = 5， Kg = 1， T= 1000。在前500次迭代中，G和D的學習率都是0.0001，後面逐漸線性衰減至0.λgp = 10。另外，為了效能更優，作者們把式（3）、（4）利用WGAN的改進方法替換為：

因為沒有原始碼，所以更多的細節無法知道。

實驗效果圖：

想說的：

國內的論文都很少提供程式碼，所以不能學到更細節的東西。而且論文裡面的網路架構給的並不是很明確，生成網路如何實現、判別器網路如何實現？和CycleGAN或者patchsGAN有什麼區別都不得而知。

感覺這個就是CycleGAN的一個擴充套件與應用，不同域之間的轉換對映，這個是多個域到一個域，還可以一個域到多個域。

基於GAN的人臉光照處理

原文連結：Face Image Illumination Processing Based on Generative Adversarial Nets 摘要:眾所周知，光照的變化會嚴重影響二維人臉分析演算法的效能，如人臉標記和人臉識別。不幸的是，在大多數實際應用中，照明條件通常是不受控制和

基於XCK325T數據處理PXIE板FMC載板

PXIE板卡、FMC載板、數據處理板、PXIE301http://www.tsingetech.com/index.phpty=product&cl=12&info=2&third=20&detail=86#content是一款基於PXI Express總線

GIS+=地理信息+行業+大數據——基於雲環境流處理平臺下的實時交通創新型app

實時數據 system nts 趨勢數據接口下載 hub time 路由應用程序已經是近代的一個最重要的IT創新。應用程序是連接用戶和數據之間的橋梁，提供即時訪問信息是最方便且呈現的方式也是easy理解的和令人愜意的。然而，app開發人員。

第十八節、基於傳統圖像處理的目標檢測與識別(HOG+SVM附代碼)

當我陰影 .fig 來源 end 映射形狀 itl eee 其實在深度學習分類中我們已經介紹了目標檢測和目標識別的概念、為了照顧一些沒有學過深度學習的童鞋，這裏我重新說明一次：目標檢測是用來確定圖像上某個區域是否有我們要識別的對象，目標識別是用來判斷圖片上這個對象是什麽

AugGAN：基於GAN的影象資料增強

資料增強方法無疑是需要重點研究的基本任務之一，因為我們的主流深度學習演算法還是一個有監督過程。臺灣國立清華大學在ECCV2018發表了一篇AugGAN開始把GAN用在資料增強方面了，當然，這並不是這個領域的第一篇。不過很具有參考意義，也很能解決實際問題。所以特地寫一個blog研究一番。讀本文需

kafka叢集Broker端基於Reactor模式請求處理流程深入剖析-kafka商業環境實戰

本套技術專欄是作者（秦凱新）平時工作的總結和昇華，通過從真實商業環境抽取案例進行總結和分享，並給出商業應用的調優建議和叢集環境容量規劃等內容，請持續關注本套部落格。期待加入IOT時代最具戰鬥力的團隊。QQ郵箱地址：[email protected]，如有任何學術交流，可隨時聯絡。

【資訊科技】【2015.05】【含原始碼】基於彩色色調影象處理的目標跟蹤

本文為美國阿肯色大學（作者：ZacharyR. Sabey）的學士論文，共44頁。如今，許多工業和商業應用開始使用無人系統來提高生產力，並降低生產和人力成本。這些應用中的大多數產品都是半無人化的，它們仍然需要人類來啟動或接收連續的指令。隨著影象處理技術、攝像機處理能力和更高效的車

為什麼GAN不能處理離散的資料?

最近我們小組的一個任務是要學習兩個分佈資料之間的對映關係,我們的資料形式是,其中分別是維的資料,我們想到了用GAN來學習這兩個分佈之間的對映關係,後來發現效果不太好,迭代一次該模型就對真樣本資料和假樣本資料傻傻分不清,真假概率都為0.5,後來查詢到GAN原來不適合處理離散的資

在樹莓派下的opencv用（C++）對視訊做人臉檢測和人臉模糊處理

#include "opencv2/objdetect.hpp" #include "opencv2/highgui.hpp" #include "opencv2/imgproc.hpp" #include <iostream> #include &

3DGIS第五章基於GPU的優化處理

早期的三維場景繪製，顯示卡只是為螢幕上顯示畫素提供一個快取，所有的圖形處理都是由CPU單獨完成，而渲染一個複雜的三維場景，需要在短時間內處理幾百萬個三角形頂點和光柵化上百萬個畫素，擅長於執行序列工作的CPU實際上難以勝任這項任務，速度上達不到要求。所以，若要求在PC上實時

關於wxpy的小實驗（一）：實現登入微信、訊息接收、處理、回覆和人臉檢測處理反饋

概述：本文主要是博主想分享一下最近在學習python和opencv時做的一些小實驗和作為自己程式設計之路剛開始的一個小筆記。在剛接觸python時發現了有一個叫wxpy的東西，他可以實現讓微信自動接收、

Pix2Pix-基於GAN的影象翻譯

語言翻譯是大家都知道的應用。但影象作為一種交流媒介，也有很多種表達方式，比如灰度圖、彩色圖、梯度圖甚至人的各種標記等。在這些影象之間的轉換稱之為影象翻譯，是一個影象生成任務。多年來，這些任務都需要用不同的模型去生成。在GAN出現之後，這些任務一下子都可以用同

Android OpenGLES2.0（十六）——3D模型貼圖及光照處理（obj+mtl）

在Android OpenGLES2.0（十四）——Obj格式3D模型載入中實現了Obj格式的3D模型的載入，載入的是一個沒有貼圖，沒有光照處理的帽子，為了呈現出立體效果，“手動”加了光照，擁有貼圖的紋理及光照又該怎麼載入呢？模型檔案本篇部落格例子中

node.js解決跨域,express是基於webpack中的處理方式

<script language="javascript" type="text/javascript"> function login(){ var code=escape($("#username").val()); var co = hex

【影象處理】人臉預處理工具FaceTools

前言：在做人臉分析的時候，常常要求人臉資料已經經過檢測、歸一化、對齊等操作，然而我們網上下載的資料庫，大部分是沒有經過這一些處理的，所以也經常需要我們自己寫程式來完成這些資料預處理。雖然網上都有現成的一些人臉檢測和關鍵點檢測的可執行檔案提供，但是，使用起

【FPGA筆記】基於FPGA的影象處理

影象處理系統設計注意點：1.將演算法開發和FPGA實現分離用軟體的影象處理環境可以使用大批量的影象樣本進行測試及除錯演算法，再將演算法對映到硬體上，這樣大大節省了硬體調試周期。2.演算法的精度影象處理的演算法中，大部分需要採用浮點數運算，而浮點數運算再FPGA中是非常不划算的

基於Python簡單影象處理，識別驗證碼！

基本識別原理概述： 1、每一幅影象在構成上，都是由一個個畫素組成的矩陣，每一個畫素為單元格。 2、彩色影象的畫素的由三原色（紅，綠，藍）構成元組，灰度影象的畫素是一個單值，每個畫素的值範圍為（0,255）。問題來源某系統門戶登陸介面如下：現在我們要實現自動的驗證碼識

C# 基於免費人臉識別SDK完成人臉識別和註冊

一，準備工作 1.Afoge視訊引數類 using AForge.Video.DirectShow; using System; using System.Collections.Generic; using System.Linq; using System.Text; using

基於GPU的影象處理輸出bmp格式的圖再轉換為tga精度損失問題。

我最近在搞影象處理，我的步驟是（1）先把要處理的圖片讀進GPU然後用CS處理（2）把CS的輸出存到磁碟，此時資料是未壓縮的BMP格式（3）美術同事可能想要其他格式的圖片如tga，所以用ps的批處理把圖片轉為tga或者其他格式。下面就來看看這個過程的精度損失原始輸出值是0.

alloy團隊基於canvas的圖片處理外掛AlloyImage

題外話：這篇文章主要是因為前端時間寫專案過程中自己學習的alloy的圖片處理外掛AlloyImage的使用中間遇到了一些問題在這裡寫出來希望對有的朋友有所幫助這個是alloy團隊的github專案地址 https://github.com/AlloyTe