Deepfake 新剋星：火眼金睛鑑假臉，還能推算造假模型的結構

阿新 • • 發佈：2021-06-20

6 月 18 日報道，看看下面這些人的照片，你能看出什麼問題嗎？

這些或微笑或笑容滿面的人，都是假的，由一個名為 StyleGAN 的著名人工智慧（AI）模型生成，現實生活中並不存在。

Deepfake 深度偽造技術愈發強大，令人們難以分辨它所偽造影象的真假，一旦這一技術被大規模用於惡意意圖，則將後患無窮。

對此，Facebook 與密歇根州立大學（MSU）合作，提出了一種新研究方法，不僅能檢測出假圖片，而且能通過逆向工程，發現偽造出這個假圖的 AI 生成模型是如何設計的。

值得注意的是，有些生成模型是此前從未見過的，通過一系列超引數分析，這種新研究方法仍能找出一些偽造圖片的共同來源。

這將幫助有效追蹤到各種社交網路上傳播的以假亂真的圖片，以及發現協同虛假資訊或使用深度偽造發起的其他惡意攻擊。

Facebook 研究科學家 Tal Hassner 稱：“在標準基準上，我們得到了最先進的結果。”

用“指紋”鑑定影象的來源

Facebook 的新 AI 方法，是如何工作的？

▲模型解析流程

研究人員首先通過指紋估計網路（FEN）運行了一組深度偽造影象，來估計 AI 生成模型留下的指紋細節。

什麼是指紋？

對於人類而言，指紋就像個人標識一樣，具有不變性、唯一性、可分類性。

具備類似特徵的標識也存在於裝置上。例如在數碼攝影中，因製造過程的不完善，特定裝置會在其產生的每張影象上留下獨特的圖案，可被用於識別產生影象的數碼相機。這種圖案被稱之為裝置指紋。

同樣，影象指紋是生成模型在生成的影象中留下的獨特圖案，能用來識別影象來自的生成模型。

在深度學習時代前，研究人員常用一套小型的、手工製作的、眾所周知的工具來生成圖片。這些生成模型的指紋通過其手工特徵來估計。而深度學習使得工具能無限生成影象，致使研究人員不可能通過手工特徵來識別指紋屬性。

由於可能性無窮無盡，研究人員決定根據指紋的一般屬性，使用不同的約束條件來估計指紋，這些屬性包括指紋大小、重複性質、頻率範圍和對稱頻率響應。

然後，這些約束通過不同的損失函式被反饋到 FEN 中，以強制生成的指紋具有這些所需的屬性。指紋生成完成後，就能用作模型解析的輸入。

通過識別這些影象中的獨特指紋，Facebook 的 AI 可以分辨出哪些偽造影象由同一個生成模型建立。

▲影象歸因：找出哪些影象由同一個生成模型產生

模擬超引數，推斷 deepfake 模型結構

每個生成模型，都有自己獨特的超引數。

超引數是被用於指導模型自學過程的變數。比如模型的網路結構、訓練損失函式型別的超引數設定，都會對生成影象的方式和結果產生影響。

如果能弄清楚各種超引數，則可以由此找出建立某一影象的生成模型。

為了更好地理解超引數，Facebook 團隊將生成模型比作是一種汽車，其超引數則是各種特定的發動機部件。不同的汽車可能看起來很相似，但在引擎蓋下，它們可以有非常不同的引擎和元件。

研究人員稱，其逆向工程技術有點像根據聲音來識別汽車的部件，即使此前從未聽說過這輛車。

▲逆向工程技術能找出未知模型的特徵

一旦系統能夠始終如一地將真指紋與深度偽造指紋分開，它就會將所有假指紋轉儲到一個解析模型中，以模擬出它們的各種超引數。

通過其模型解析方法，研究人員可以估計用於建立 deepfake 的模型網路結構，比如有多少層，或者被訓練了什麼損失函式。

為了便於訓練，他們對網路結構中的一些連續引數進行了歸一化處理，並對損失函式型別進行了層次學習。

由於生成模型在網路架構和訓練損失函式方面存在很大差異，從 deepfake 或生成影象到超引數空間的對映，使他們能夠批判性地理解用於建立它的模型的特徵。

▲通過模型解析，可以推斷出未知模型是如何設計的

從 100 個生成模型，合成 10 萬張假圖

為了測試這一方法，密歇根州立大學的研究團隊將從 100 個公開可獲得的生成模型中生成的 10 萬張合成影象，整合到一個偽造影象資料集中。

這 100 個生成模型中的每一個，都對應著一個由整個科學界研究人員開發和共享的開源專案。一些開源專案已經發布了偽造圖片。

在這種情況下，密歇根州立大學的研究團隊隨機挑選了 1000 張圖片。在開源專案沒有任何可用偽造影象的情況下，研究團隊執行他們釋出的程式碼，生成 1000 張合成影象。

考慮到測試影象可能來自現實世界中不可見的生成模型，研究團隊通過交叉驗證來模擬現實世界的應用，以訓練和評估其模型對資料集的不同分割。

▲從 100 個生成模型中每一個生成的影象在左邊產生一個估計的指紋，在右邊產生一個相應的頻譜。許多頻譜顯示出不同的高頻訊號，而有些頻譜看起來彼此相似。

除了模型解析，其 FEN 可以用於 deepfake 檢測和影象歸因。對於這兩個任務，研究人員添加了一個淺層網路，輸入估計的指紋並執行二值（深 deepfake 檢測）或多類分類（影象歸屬）。

雖然 Facebook 的指紋估計不是為這些任務量身定製的，但研究人員稱，他們仍然取得了具有競爭力的技術水平的結果，這表明其指紋估計具有出色的泛化能力。

來自 100 個生成模型的深度偽造影象的多樣化集合意味著其模型是通過代表性選擇建立的，具有更好的泛化跨人類和非人類表示的能力。

儘管一些用於生成深度偽造的原始影象是公開可用的人臉資料集中的真實個人影象，密歇根州立大學研究團隊開始了法醫風格的分析，使用深度偽造影象，而不是用於建立它們的原始影象。

由於該方法涉及將深度偽造影象解構到其指紋，研究團隊分析了該模型能否將指紋映射回原始影象內容。

結果表明，這種情況沒有發生，這證實了指紋主要包含生成模型留下的痕跡，而不是原始深度偽造的內容。

所有用於這項研究的假臉影象，以及逆向工程過程的所有實驗，都來自密歇根州立大學。

密歇根州立大學將向更廣泛的研究社群開放資料集、程式碼和訓練模型，以促進各個領域的研究，包括深度偽造檢測、影象歸因和生成模型的逆向工程。

結語：深偽 vs 防深偽，長期的貓鼠遊戲

Facebook 與密歇根州立大學的這一研究，推動了 deepfake 檢測的理解邊界，引入了更適合真實世界部署的模型解析概念。

這項工作將為研究人員和從業人員提供工具，以更好地調查協調虛假資訊事件，使用深度偽造，併為未來的研究開闢新的方向。

但值得注意的是，即便是最先進的結果，也未必全然可靠。去年 Facebook 舉辦深度檢測大賽，獲勝演算法只能檢測到 AI 操縱的視訊的 65.18%。

研究人員認為，使用演算法發現 deepfake，仍是一個“未解決的問題。”部分原因是，生成 AI 領域非常活躍，每天都有新的技術釋出，任何檢測器幾乎不可能完全跟上。

當被問及是否會出現這種新方法無法檢測到的生成模型時，Hassner 同意：“我預計會這樣。”他認為，deepfake 研發與 deepfake 檢測的研發，“將繼續是一場貓鼠遊戲”。

Deepfake 新剋星：火眼金睛鑑假臉，還能推算造假模型的結構

6 月 18 日報道，看看下面這些人的照片，你能看出什麼問題嗎？這些或微笑或笑容滿面的人，都是假的，由一個名為 StyleGAN 的著名人工智慧（AI）模型生成，現實生活中並不存在。

黑科技DeepFake檢測方法：利用心跳做訊號，還能「揪出」造假模型

本文轉載自機器之心。選自arXiv 作者：Umur Aybars Ciftci等機器之心編譯編輯：陳萍

這款新工具可調整微軟 Win11 設定：自稱“真正的 PowerToys”，還能刪除預裝應用程式

8 月 14 日訊息外媒 Neowin 報道，GitHub 上一位使用者名稱為“buildbybel”的開發者建立了一個名為“ThisIsWin11\"（TIW11）的新工具，據該開發者稱，這個新軟體有點像一站式商店，用於個性化定製你的 Windows 11

【IT之家評測室】OPPO Enco Free2 體驗：42dB 深度降噪，還能“量耳定製”

在上個月底的 Reno6 系列釋出會上，OPPO 釋出了 Enco Free2 無線降噪耳機，OPPO Enco 家族再次迎來一位新成員。自 2019 年底 OPPO 釋出第一款真無線耳機 OPPO Enco Free 以來，OPPO TWS 耳機新品如雨後春筍般湧現，諸

民間大神發力，成功製作出《賽博朋克 2077》地鐵系統 Mod：包含 19 個地鐵站，還能切換視角

12 月 20 日訊息，遊戲《賽博朋克 2077》在 2018 年 E3 展上公佈的預告片中，主角 V 乘坐地鐵的畫面成為了經典的一幕。然而，到了實際遊戲中，《賽博朋克 2077》卻沒有地鐵功能，這也成了很多玩家對遊戲的指責點。現

英雄聯盟迴應S10總決賽黃牛票：都是假的，大家不要上當受騙

10 月 15 日訊息10 月 31 日，2020 英雄聯盟S10全球總決賽將在上海舉辦，有黃牛將觀賽票炒至最高近 3 萬元一張。

巨集碁推出威武騎士遊戲本新配置：i5+GTX 1650 Ti，5299 元

10 月 20 日訊息巨集碁現已上架威武騎士遊戲本新配置，i5-10200H+8GB 記憶體 + 512GB SSD+ GTX 1650 Ti，預售價 5299 元。

端到端問答新突破：百度提出RocketQA，登頂MSMARCO榜首！

*歡迎關注【百度NLP】官方公眾號，及時獲取自然語言處理領域核心技術乾貨！！ **閱讀原文：https://mp.weixin.qq.com/s/K_7_LgMZf1MuS4IJI6gdsw

小米推出機藝重塑新服務：舊機創意裝裱，199 元 - IT之家

2 月 20 日訊息根據小米商城官方的訊息，小米商城上線新服務 “機”藝重塑服務，可將舊款的小米手機進行創意裝裱，售價為 199 元。

黃光裕張近東新對壘：國美重返戰場，蘇寧斷臂求生

2 月 28 日，隨著一紙公告，蘇寧易購股權變更塵埃落定。深圳國資 148 億接盤蘇寧 23% 股份，成為蘇寧易購的最大持股方。

華為公開新專利：後視鏡自適應調節，可提升駕駛安全性

3 月 8 日訊息華為技術有限公司在 3 月 5 日公開一項名稱為 “後視鏡自適應調節方法及裝置”的專利，專利公開號為 CN112440881A，專利申請日期為 2019 年 8 月 31 日。該專利主要內容是人工智慧領域中的一種後視鏡

英偉達展示深圳新辦公室：配備專業遊戲室，還有大型咖啡廳

3 月 11 日訊息近日，英偉達深圳辦公室入駐新址，升級後的英偉達辦公室更加寬敞、舒適、充滿現代感。今天，英偉達官方釋出了幾張圖片進行了展示。

美國新提案：投 940 億美元，讓該國更多人用上網際網路

3 月 12 日，當地時間週四，美參眾兩院 30 名民主黨議員公佈了一項總額 940 億美元的新提案，旨在改善全美的網際網路接入服務，讓更多美國人能用得上網際網路。

蘋果新專利：擴大手機電池容量，有望提高 iPhone 續航

3月14日訊息美國專利商標局在本週四公佈了多項蘋果最新專利，其中包括三項與電池技術相關的專利，可以延長電池使用壽命、擴大電池容量、縮小裝置尺寸，並檢測電池膨脹狀況，從而使裝置更加便攜，同時還可保證使用者安

6G 新進展：中國專利最多，華為今年 7 月或將發射衛星

相比正在開啟“畫卷”的 5G 來說，6G 顯得很“縹緲”，6G 是什麼，我們還不知道。

Eipc訴訟蘋果新進展：這就是個香蕉，女士

隨著Epic訴蘋果案的審理進入第二週，雙方暫時脫離了反壟斷法，在法庭上就香蕉是否應該穿衣服展開激烈“爭論”。

百度 App 搜尋新規：禁止頁面內容摺疊，提高使用者瀏覽體驗

6 月 1 日訊息據 36 氪訊息，百度在近日推出了搜尋新規則，新規則要求在百度 App 內，通過搜尋分發的頁面 (智慧小程式、H5 頁面)，以及各級頁面主體內容在展示完全之前不允許摺疊。

論 AI 能幹什麼：一鍵讓二次元老婆微笑，還能把貓臉瞬間變成狗臉

給一行二次元老婆的臉蛋；下一行就能讓她們全部微笑起來：或者對於鏟屎官們來說，把老虎貓變成？，把狗變成狼？，還可以把老虎變成貓：

美國出臺最嚴自動駕駛新規：L2~L5 全覆蓋，本月已調查 30 起特斯拉事故

6 月 30 日訊息美國東部時間 6 月 29 日，美國國家公路交通安全管理局（NHTSA）釋出了史上最嚴的自動駕駛監管命令。

全球 PC 市場新變局：蘋果 M1 攻城，微軟 Win11 守土

去年蘋果 M1 晶片的推出，今年 Windows 11 的釋出，都在不停攪動著本已陷入沉寂的 PC 市場。

Deepfake 新剋星：火眼金睛鑑假臉，還能推算造假模型的結構

用“指紋”鑑定影象的來源

模擬超引數，推斷 deepfake 模型結構

從 100 個生成模型，合成 10 萬張假圖

結語：深偽 vs 防深偽，長期的貓鼠遊戲

相關推薦