2D 圖片變 3D：最新 3D GAN 可生成三維幾何資料，模型速度提升 7 倍

阿新 • • 發佈：2021-12-21

2D 圖片變 3D，還能給出 3D 幾何資料？

英偉達和斯坦福大學聯合推出的這個 GAN，真是重新整理了 3D GAN 的新高度。

而且生成畫質也更高，視角隨便搖，面部都沒有變形。

與過去傳統的方法相比，它在速度上能快出 7 倍，而佔用的記憶體卻不到其十六分之一。

最厲害的莫過於還可給出 3D 幾何資料，像這些石像效果，就是根據提取的位置資訊再渲染而得到的。

甚至還能實時互動編輯。

該框架一經發布，就在推特上吸引了大量網友圍觀，點贊量高達 600+。

怎麼樣？是不是再次重新整理你對 2D 升 3D 的想象了？

顯隱混合 + 雙重鑑別

事實上，只用一張單視角 2D 照片生成 3D 效果，此前已經有許多模型框架可以實現。

但是它們要麼需要計算量非常大，要麼給出的近似值與真正的 3D 效果不一致。

這就導致生成的效果會出現畫質低、變形等問題。

為了解決以上的問題，研究人員提出了一種顯隱混合神經網路架構（hybrid explicit-implicit network architecture）。

這種方法可以繞過計算上的限制，還能不過分依賴對影象的上取樣。

從對比中可以看出，純隱式神經網路（如 NeRF）使用帶有位置編碼（PE）的完全連線層（FC）來表示場景，會導致確定位置的速度很慢。

純顯式神經網路或混合了小型隱式解碼器的框架，雖然速度更快，但是卻不能保證高解析度的輸出效果。

而英偉達和斯坦福大學提出的這個新方法 EG3D，就

將顯式和隱式的表示優點結合在了一起。

它主要包括一個以 StyleGAN2 為基礎的特徵生成器和對映網路，一個輕量級的特徵解碼器，一個神經渲染模組、一個超解析度模組和一個可以雙重識別位置的 StyleGAN2 鑑別器。

其中，神經網路的主幹為顯式表示，它能夠輸出 3D 座標；解碼器部分則為隱式表示。

與典型的多層感知機制相比，該方法在速度上可快出 7 倍，而佔用的記憶體卻不到其十六分之一。

與此同時，該方法還繼承了 StyleGAN2 的特性，比如效果良好的隱空間（latent space）。

比如，在資料集 FFHQ 中插值後，EG3D 的表現非常 nice：

該方法使用中等解析度（128 x 128）進行渲染，再用 2D 影象空間卷積來提高最終輸出的解析度和影象質量。

這種雙重鑑別，可以確保最終輸出影象和渲染輸出的一致性，從而避免在不同檢視下由於卷積層不一致而產生的問題。

▲兩圖中左半邊為最終輸出效果，右半邊為渲染輸出

而沒有使用雙重鑑別的方法，在嘴角這種細節上就會出現一些扭曲。

▲左圖未使用雙重鑑別；右圖為 EG3D 方法效果

資料上，與此前方法對比，EG3D 方法在 256 解析度、512 解析度下的距離得分（FID）、識別一致性（ID）、深度準確性和姿態準確性上，表現都更好。

團隊介紹

此項研究由英偉達和斯坦福大學共同完成。

共同一作共有 4 位，分別是：Eric R. Chan、Connor Z. Lin、Matthew A. Chan、Koki Nagano。

其中，Eric R. Chan 是斯坦福大學的一位博士研究生，此前曾參與過一些 2D 影象變 3D 的方法，比如 pi-GAN。

Connor Z. Lin 是斯坦福大學的一位正在讀博二的研究生，本科和碩士均就讀於卡內基梅隆大學，研究方向為計算機圖形學、深度學習等。

Matthew A. Chan 則是一位研究助理，以上三人均來自斯坦福大學計算機成像實驗室（Computational Imaging Lab）。

Koki Nagano 目前就職於英偉達，擔任高階研究員，研究方向為計算機圖形學，本科畢業於東京大學。

論文地址：

https://arxiv.org/abs/2112.07945

參考連結：

https://matthew-a-chan.github.io/EG3D/

2D 圖片變 3D：最新 3D GAN 可生成三維幾何資料，模型速度提升 7 倍

2D 圖片變 3D，還能給出 3D 幾何資料？英偉達和斯坦福大學聯合推出的這個 GAN，真是重新整理了 3D GAN 的新高度。而且生成畫質也更高，視角隨便搖，面部都沒有變形。與過去傳統的方法相比，它在速度上能快出 7 倍，而

中汽協：預計 2 月汽車銷量 145.2 萬輛，同比增長 3.7 倍

3月6日訊息根據中國汽車工業協會統計的重點企業旬報情況預估，2021 年 2 月，汽車行業銷量預估完成 145.2 萬輛，環比下降 42%，同比增長 3.7 倍；細分車型來看，乘用車銷量同比增長 3.7 倍，商用車銷量同比增長 2.2

3D物聯網工廠車間監控資訊三維視覺化管理

工業虛擬3d模擬車間管理系統，是突破以往二維維管理系統的全新選擇，能夠更加直觀展示車間產線的管理情況，商迪3D開發3d模擬車間管理視覺化系統，是通過傾斜攝影技術或者根據甲方提供廠房車間的實際圖片，通過3D建模

GAN 靠「偽造思維」登上 Nature 子刊：腦機介面訓練速度提升 20 倍

GAN 這回玩了票大的，把手伸向了“人腦思維”。沒錯，直接就是一個“合成思維”—— 生成用來餵給腦機介面的那種大腦活動資料。作者表示，這是 AI 首次在該領域被應用。並且這項技術一舉把訓練腦機介面系統提取、分析

乾貨：用好這13款VSCode外掛，工作效率提升10倍

文章每週持續更新，原創不易，「三連」讓更多人看到是對我最大的肯定。可以微信搜尋公眾號「後端技術學堂」第一時間閱讀（一般比部落格早更新一到兩篇）

sql語句：db2根據某欄位合併多行資料，將相同組中多行例合併到一個欄位

技術標籤：db2資料庫sql 原資料合併後資料按name欄位分組，合併house，aaa欄位*合併資料後的缺點就是有重複的的，這個是本人接受不了的，限於技術有限，只能湊合的用了，業務要求多，技術不過關哎。。。

“金剛狼戰士”：對受傷士兵細胞 “重新程式設計”，癒合速度快 5 倍

北京時間 2 月 23 日訊息，據國外媒體報道，目前，美國軍方正在研究一項技術，可對士兵患者的細胞 “重新程式設計”，使其擁有類似科幻電影《金剛狼》中的特殊能力，其傷口癒合速度比普通人快 5 倍。

英偉達 Jarvis 1.0 工具詳解：開發速度提升 10 倍，延時不到 300 毫秒

2 月 27 日報道，憑藉聽、讀、譯三大功能，對話式人工智慧（AI）正逐漸深入人們的生活，成為解放雙手和提高生產力的關鍵工具。

《傳頌之物：斬2》釋出第三支預告片本作將於7月22日發售

發行商Aquaplus和開發團隊Tamsoft今日（7月8日）推出了動作RPG《傳頌之物：斬2》的第三支預告片，該片講述了“Oshtor’s Sword”的傳奇故事內容。

學者：科技企業 "大小周" 不一定違法，要給足雙倍以上加班費

7 月 18 日訊息今年 7 月以來，多家網際網路公司接連宣佈取消“大小周”模式，例如快手、位元組跳動、美團等。

科學家：宇宙“造型”可能像個三維“甜甜圈”

北京時間 8 月 5 日訊息，假如我們的宇宙是一個甜甜圈的形狀，那麼你開著一艘宇宙飛船、一直朝著一個方向前進，終有一日會回到原點。不僅如此，物理學家或許還能測出這個宇宙的大小。

三星：正在開發 8 層 TSV 的 DDR5 記憶體模組，容量達 DDR4 兩倍

8 月 22 日訊息在 HotChips 33 大會上，三星確認正在開發具有 8 層 TSV（直通矽通孔）的 DDR5 記憶體模組，是 DDR4 記憶體容量的兩倍。這意味著理論上，512GB 記憶體模組是可能實現的。

國家測繪局：“天地圖”未使用谷歌地球影像資料，那麼資料哪裡來的？

早在2010年10月21日，中國公眾版國家地理資訊公共服務平臺“天地圖”網站正式開通。作為中國區域內資料資源最全的地理資訊服務網站,“天地圖”將為公眾提供權威、可信、統一的地理資訊服務，打造網際網路地理資訊服

工信部：汽車晶片供應鏈緊張問題仍比較嚴峻，將全面提升供給能力

9 月 13 日訊息工信部新聞發言人田玉龍今日表示，總的來看，晶片供應鏈緊張的問題還是要存在一段時間，當前這個問題還是比較嚴峻。田玉龍稱，下一步，我們將加強協調力度，加強供應鏈精準對接，使汽車晶片能夠在供給

華米黃汪：下月釋出旗下最高屏佔比新品，蘋果 Apple Watch 7 沒血壓功能略感意外

9 月 15 日訊息蘋果在今日凌晨的 2021 秋季新品釋出會上正式釋出了Apple Watch Series 7 智慧手錶，擁有更高的屏佔比，比上代增大了 20%，螢幕邊框比上代窄了 40%，最高亮度提升 70%。華米科技創始人、CEO 黃汪在微

2021 MSU 世界視訊編碼器大賽：愛奇藝 QAV1 綜合性能成績第一，最大編碼速度提升 50 倍

11 月 2 日訊息，2021 年莫斯科國立大學（Moscow State University）舉辦的 MSU 世界視訊編碼器大賽成績揭曉，此次大賽同往年一樣有非常多 TOP 企業團隊來參賽，包括愛奇藝、華為、騰訊、阿里、英特爾、谷歌等。愛奇

《我的世界》中國版 RTX 正式版上線：新增重慶、潮州、龍宮三張國風地圖，且效能提升最高 2 倍以上

11 月 14 日訊息，在昨日舉行的《我的世界》2021 年開發者大會上，官方正式推出了《我的世界》中國版 RTX 正式版。同時，《我的世界》中國版 RTX 正式版還上線了與英偉達 RTX 聯動的三張國風地圖。藉助實時光線追蹤

微信 macOS 版 3.2.2.1 Beta 釋出：免打擾群可收進“摺疊群聊”，置頂聊天可摺疊

11 月 17 日訊息，今天騰訊微信團隊推送釋出了微信 macOS 版 3.2.2.1 Beta 應用更新，通過該更新，可以把免打擾的群收進「摺疊的群聊」；置頂聊天過多時，可以將其摺疊；修復了一些已知問題。下面是更新內容可以把免

國內在運單體容量最大的海上風電場全部機組正式投運：年上網電量可達 14.89 億度，減少二氧化碳排放量約 86 萬噸

11 月 26 日訊息，據中國廣核集團公眾號，國內目前單體容量最大的海上風電場 —— 中廣核汕尾後湖 50 萬千瓦海上風電專案全部機組 91 颱風機全部併網發電，正式投產運營。據介紹，汕尾後湖海上風電專案場址位於廣東

微信 macOS 版 3.2.2 正式版釋出：免打擾群可收進“摺疊群聊”，置頂聊天可摺疊

感謝網友美滋滋_ 的線索投遞！

2D 圖片變 3D：最新 3D GAN 可生成三維幾何資料，模型速度提升 7 倍

顯隱混合 + 雙重鑑別

團隊介紹

相關推薦