英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

阿新 • • 發佈：2021-12-13

繼 GauGAN2 之後，英偉達推出了一個 GAN 的“超級縫合體”——PoE GAN。PoE GAN 可以接受多種模態的輸入，文字描述、影象分割、草圖、風格都可以轉化為圖片。

而且它可以同時接受以上幾種輸入模態的任意兩種組合，這便是 PoE 的含義。

所謂 PoE 是 Hinton 在 2002 年提出的“專家乘積”（product of experts）概念，每個專家（單獨模型）被定義為輸入空間上的一個概率模型。

而每種單獨的輸入模態都是合成影象必須滿足的約束條件，因此滿足所有約束的一組影象是滿足每個約束集合的交集。

假設每種約束的聯合條件概率分佈都服從高斯分佈，就用單條件概率分佈的乘積來表述交集的分佈。

在此條件下，為了使乘積分佈在一個區域具有高密度，每個單獨的分佈需要在該區域具有高密度，從而滿足每個約束。而 PoE GAN 的重點是如何將每種輸入混合在一起。

PoE GAN 的設計

PoE GAN 的生成器使用全域性 PoE-Net 將不同型別輸入的變化混合起來。

我們將每個模態輸入編碼為特徵向量，然後使用 PoE 彙總到全域性 PoE-Net 中。解碼器不僅使用全域性 PoE-Net 的輸出，還直接連線分割和草圖編碼器，以此來輸出影象。

全域性 PoE-Net 的結構如下，這裡使用一個潛在的特徵向量 z0 作為樣本使用 PoE，然後由 MLP 處理以輸出特徵向量 w。

在鑑別器部分，作者提出了一種多模態投影鑑別器，將投影鑑別器推廣到處理多個條件輸入。與計算影象嵌入和條件嵌入之間單個內積的標準投影鑑別器不同，這裡要計算每個輸入模態的內積，並將其相加以獲得最終損失。

隨意變換輸入的 GAN

PoE 可以在單模態輸入、多模態輸入甚至無輸入時生成圖片。

當使用單個輸入模態進行測試時，PoE-GAN 的表現優於之前專門為該模態設計的 SOTA 方法。

例如在分割輸入模態中，PoE-GAN 優於此前的 SPADE 和 OASIS。

在文字輸入模態中，PoE-GAN 優於文字到影象模型 DF-GAN、DM-GAN+CL。

當以模式的任意子集為條件時，PoE-GAN 可以生成不同的輸出影象。下面展示了 PoE-GAN 的隨機樣本，條件是兩種模式（文字 + 分割、文字 + 草圖、分割 + 草圖）在景觀影象資料集上。

PoE-GAN 甚至還能沒有輸入，此時 PoE-GAN 就會成為一個無條件的生成模型。以下是 PoE-GAN 無條件生成的樣本。

團隊介紹

論文通訊作者是英偉達著名工程師劉洺堉，他的研究重點是深度生成模型及其應用。英偉達 Canvas 和 GauGAN 等有趣的產品均出自他手。

論文一作是黃勳，北京航空航天大學本科畢業，康奈爾大學博士，現在在英偉達工作。

論文地址：
https://arxiv.org/abs/2112.05130
PoE：
https://www.cs.toronto.edu/~hinton/absps/icann-99.pdf
投影鑑別器：
https://arxiv.org/abs/1802.05637

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

繼 GauGAN2 之後，英偉達推出了一個 GAN 的“超級縫合體”——PoE GAN。PoE GAN 可以接受多種模態的輸入，文字描述、影象分割、草圖、風格都可以轉化為圖片。而且它可以同時接受以上幾種輸入模態的任意兩種組合，這便

英偉達推出全新 DPU 處理器透露未來三年 DPU 發展路線圖

10 月 6 日訊息，在 GTC2020秋季站上，NVIDIA 宣佈推出一款新型處理器DPU，以及以DOCA為特色的資料處理單元，DOCA是一種新型的資料中心基礎架構處理器體系結構，可實現具有突破性的網路、儲存、安全效能。

英偉達推出 Jetson TX2 NX：面向大眾市場的高效能 AI 產品

2月25日訊息根據英偉達官方的訊息，全新的 Jetson TX2 NX 現已推出，為入門級嵌入式和邊緣產品提供新一代 AI 效能。官方稱其效能是 Jetson Nano 2.5 倍，並且兼具 Jetson Nano 和 Jetson Xavier NX 的外形尺寸和引腳

英偉達推出 AI 繪畫工具 Canvas：將簡單塗鴉變成真實自然景觀

6 月 24 日訊息英偉達今日正式推出 AI 人工智慧繪畫工具 Canvas 測試版。這款應用可以利用英偉達 RTX 系列顯示卡，以簡單的步驟建立風景畫。該工具提供 15 中不同的材質畫筆可選，內建 9 種樣式。

英偉達推出 RTX A2000 專業卡：70W 的“3060 刀卡”，十月上市

8 月 11 日訊息英偉達今日釋出了安培家族中最迷你的 RTX 顯示卡 ——RTX A2000，這是一款面向桌面工作站的專業卡，體積只有 RTX 3090 顯示卡的一半。

美國能源部接近採購英偉達版超級計算機，英特爾版已推遲數月

北京時間 8 月 25 日早間訊息，據報道，知情人士透露，由於美國能源部的一個重要實驗室想要購買的英特爾超級計算機已經推遲數月，所以他們即將達成一項協議，將購買一臺用英偉達和 AMD 晶片製造的超級計算機。

微軟和英偉達推出迄今為止訓練最大最強的語言模型 MT-NLG

10 月 12 日訊息語言模型（Language Model）簡單來說就是一串詞序列的概率分佈，主要作用是為一個長度為 m 的文字確定一個概率分佈 P，表示這段文字存在的可能性。大家之前可能或多或少聽說過 GPT-3，OpenAI 最新的

英偉達推出全新 Jetson AGX Orin ：全球最小、功能最強大、能效最高 AI 超算

11 月 9 日訊息，今天，英偉達推出全新 Jetson AGX Orin 機器人計算機，官方稱其為全球最小、功能最強大、能效最高的 AI 超級計算機，用於機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算。英偉達表示，Jets

英偉達推出 497.09 版顯示卡驅動，正式支援 RTX 2060 12GB 顯示卡

12 月 2 日訊息，今日英偉達正式釋出了 RTX 2060 12GB 版顯示卡，相比此前的 6GB 視訊記憶體版本 CUDA 核心數有了小幅提升，與 RTX 2060 Super 一致，均為 2176 個。與此同時，英偉達推出了 GeForce497.09 版顯示卡

英偉達推出第 4 代 Max-Q 技術：CPU / GPU 智慧協作，電池模式續航提升

1 月 7 日訊息，今日英偉達正式推出第 4 代 Max-Q 技術，讓輕薄遊戲本和設計本擁有更出色效能，提供更長的續航時間。官方表示，遊戲玩家和創作者對膝上型電腦的效能期望與日俱增，對時尚外觀和長效續航的追求也不會

英偉達在以色列大舉招聘研發人員，2023 年推出首款基於 ARM 的 HPC CPU

1 月 19 日訊息，據 VideoCardz 報道，隨著英偉達擴大其研發團隊，該公司正在以色列大舉招聘。NVIDIA 首席技術官 Micheal Kagan 證實，該公司正在建立一個新的 CPU 團隊，以在瞬息萬變的 HPC 市場（高效能運算）中建

英偉達推出新款 T1000 8GB 入門級專業顯示卡，GTX 1650 效能

2 月 11 日訊息，據 Tom\'s Hardware 訊息，英偉達新款入門級專業顯示卡T1000 8GB 現已開始上市。瞭解到，英偉達 T1000 入門級專業顯示卡基於上一代圖靈 TU117 GPU，擁有 896 個 CUDA 核心，配備 4GB 或 8GB GDDR6

英偉達推出 RTX 3080 級 GeForce NOW 雲遊戲月度訂閱服務，20 美元 / 月

3 月 13 日訊息，英偉達現已正式推出 GeForce NOW RTX 3080 Tier 月度訂閱服務，每月 19.99 美元（約 127.14 元人民幣）。瞭解到，在此之前，RTX 3080 Tier的 GeForce NOW 只能以 99.99 美元（約 635.94 元人民幣）

一鍵實時共享 3D 資產，英偉達推出面向遊戲開發者的 Omniverse

3 月 23 日報道，今日，在線上遊戲開發者大會（GDC）上，英偉達（NVIDIA）宣佈推出面向遊戲開發者的 NVIDIA Omniverse 全新功能，並宣佈多款支援 DLSS 渲染技術的新遊戲。Omniverse 使開發者能夠更輕鬆地共享資產、對

訊息稱英偉達 RTX 3060Ti 效能對標 2070Super，售價約 2721 元

9月27日訊息今日外媒 videocardz 確認了英偉達 RTX 3060Ti 將在 RTX3070 之後推出。隨後，爆料者 @harukaze5719 透露了更多的資訊，RTX 3060 Ti 預計將採用 GA104-200 核心，擁有 4864 個 FP32 CUDA 單元，顯示卡

英偉達 RTX A6000 12 月開始供貨，聯想戴爾將推新款工作站

10 月 7 日訊息10 月 5 日，英偉達釋出了兩款用於專業用途的顯示卡：RTXA6000 和 RTXA40，均採用最新的安培架構。其中 RTXA6000 用於工作站，RTXA40 用於伺服器。

英偉達 CFO：就算沒礦潮，安培顯示卡業績也相當喜人

3月3日訊息NVIDIA 首席財務官 Colette Kress 昨日參加了 Raymond James 機構投資者經紀人線上會議並發表了一些有趣的言論，特別是在英偉達成功推出的 Ampere 架構 GeForce RTX 3000 系列顯示卡方面。

英偉達 GeForce NOW 雲遊戲會員更名，漲價至 9.99 美元 / 月

3月21日訊息英偉達官方於 3 月 18 日釋出訊息，表示為 GeForce NOW 雲遊戲服務推出了新的訂閱套餐，將此前的 Founders 創始人版訂閱更新為 Priority membership，價格為 9.99 美元 / 月或者 99.99 美元 / 年。

曝英偉達 RTX3050/3050Ti 將提前釋出上市，最快下個月

4 月 30 日訊息根據博板堂的訊息，英偉達用於筆記本的RTX3050/3050Ti 可能提前釋出上市，最快下個月。

英偉達 DLSS 技術首次登陸 VR 遊戲，包含《無人深空》等三款

5 月 20 日訊息根據外媒 techpowerup 訊息，英偉達 DLSS 技術又登陸了 9 款新遊戲，這些遊戲可以利用 GeForce RTX 系列顯示卡的加速單元提高在高解析度遊戲時的效能。新遊戲包括：《邪惡之中》（AMID EVIL）、《阿隆

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

PoE GAN 的設計

隨意變換輸入的 GAN

團隊介紹

相關推薦