1. 程式人生 > >業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影象

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影象

你能看出上面兩張圖片,哪張是真的,哪張是假的麼?文摘菌是分不出來,太像了!

 

這種以假亂真的圖片生成技術來源於一種左右互博術—生成對抗網路(GAN)。

 

這一概念由機器學習研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因為該模型的輸出為影象一類的資訊,而非與輸入資料相關的預測值(比如“該影象是否是根熱狗”的預測);“對抗網路”則是因為該模型使用兩組貓鼠遊戲一般相互競爭的神經網路,就像收銀員和偽造者鬥智鬥勇一樣:一方試圖欺騙另一方認為它拿的真實鈔票,而另一方則試圖區分鈔票的真偽。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962

, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴
 

其實,最開始的那一批生成對抗網路(GAN)影象很容易就能被發現不是真實照片。

 

比如2014年的這些圖片:

 

Radford等,2014,無監督代表學習與深度卷積生成對抗網路(也被縮寫為DCGAN)

 

但2017年10月釋出的最新GAN生成影象就不那麼好區分了:

 

Karras等,2017,改進質量、穩定性與變化程度的GAN網路(也被縮寫為PGAN或ProGAN)

 

如何識別出GAN生成的影象?應該著重強調面部的問題,因為絕大多數研究者們都是使用人臉影象來進行試驗的,並且許多人臉影象中會出現的問題經常也會在其他型別影象中出現。

 

以下是識別虛假影象的幾個要點:

 

看似畫筆塗上的直髮

 

 

長髮很容易出現這種超級直的效果——只有一小把的話看起來其實還挺好的,但一大把直髮看起來就像是有人用畫刀或者大筆刷塗了一把丙烯酸顏料上去一樣。

 

難以辨認的文字

 

 

 

訓練於生成人臉的GAN模型不太能夠抓住背景中的複雜結構。此外,GAN模型同時顯示訓練資料的原始與映象版本,這意味著他們不太能夠抓住文字的特徵因為它一般只在單一方向出現。

 

超現實風格背景

 

 

GAN模型生成人臉很可信的一個原因就是,所有的訓練資料都被歸一化了。這意味著,當涉及到例如眼睛與耳朵的位置與渲染問題時,GAN模型的可變度會很小。另一方面,背景則可以包含任何內容了。對於GAN模型來說,模擬出一個像樣的背景實在有些過分了——他們最終一般就複製出一般性的紋理樣背景,而非“真實”場景。

 

不對稱性

 

 

GAN模型有時很難處理影象中的長距離依賴性。儘管在訓練資料中耳環一類的配飾通常都是成對出現,生成影象中通常並非如此。還有這種情況:人眼通常看向同一方向並呈現相同顏色,但生成影象中的眼睛經常是對對眼,還可以是異瞳色呢。高度或大小非常不匹配的耳朵也是一種常見的不對稱性。

 

奇怪的牙齒

 

 

GAN模型能夠勝任生成一般性的場景,但目前為止它還不太能夠搞定半規則重複細節問題,比如牙齒。有時GAN模型會產生錯位牙齒,或者以很奇怪的方式拉伸或收縮單個牙齒。這個問題在其他領域也出現過,比如磚類影象的紋理合成問題。

 

凌亂的頭髮

 

 

這是識別GAN生成影象最快方法之一。通常情況下,GAN會讓頭髮看起來盤曲打結,在肩膀周圍隨機形成一縷一縷的髮束,並在額頭上留下厚厚的雜散毛髮。髮型可以非常多變,還可以擁有許多細節,因此它是最難以用GAN捕捉的特徵之一。非毛髮類物體有時甚至可以被變成頭髮狀紋理。

 

安能辨我是雄雌

 

 

這個GAN模型是在CelebA資料集的一個子集上訓練的,其中包含約一萬個名人的20萬張人臉影象。在這個資料集中,我沒有見到有誰有面部毛髮,耳環或者化妝;但GAN模型還是經常分不清不同性別特徵。更一般地說,我覺得這是因為GAN模型並不總是學習人類社會所強調的二元論(比如這裡的“非男即女”)。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

半規則噪聲

 

有些本應當為單色的區域可能會出現具有水平或垂直條帶的半規則噪聲。在本例中,可能是因為模型在試圖模仿布料的質地。舊一點的GAN模型一般噪聲模式更明顯,我們稱之為“棋盤效應”(Checkerboard Artifacts)。

棋盤效應:

https://distill.pub/2016/deconv-checkerboard/

 

染色問題

 

一些顏色較淺並且為純色的區域可能會出現多色調染色問題,比如衣領、脖子與眼白(未在本例出現)。

 

真實影象的例子

 

 

看看這些清晰的背景文字,對稱的耳環,大小相同的牙齒以及細節豐富的髮型。學習完以上這些小技巧後你可以試試玩一些小遊戲,來看你是不是真的能夠區分真假圖片啦。

遊戲:http://nikola.mit.edu/experiment

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴