谷歌最新視訊摳圖術：影子煙霧都能摳，新增水印更順滑，還開源

阿新 • • 發佈：2021-09-02

如何更順滑的新增水印？

谷歌的這項新技術，讓文字簡直就像貼在地面上，哪怕是在沙塵橫飛的場景裡。

方法也很簡單。

只需輸入一段視訊，和指定物件的粗略蒙版。

那這個物件的所有相關場景元素，都能解鎖！

比如人和狗的影子。

還有黑天鵝緩緩拂過的漣漪~

以及上述那個賽車疾馳過後激起的沙塵。

不管是任意物件和主體，不論怎麼移動，所有元素都能摳出來。

這就是谷歌最新的視訊分層技術 ——omnimatte，入選 CVPR 2021 Oral。

目前這項技術已開源。

如何實現

計算機視覺在分割影象或視訊中的物件方面越來越有效，然而與物件相關的場景效果。

比如陰影、反射、產生的煙霧等場景效果常常被忽略。

而識別這些場景效果，對提高 AI 的視覺理解很重要，那谷歌這項新技術又是如何實現的呢？

簡單來說，用分層神經網路渲染方法自監督訓練 CNN，來將主體與背景影象分割開來。

由於 CNN 的特有結構，會有傾向性地學習影象效果之間的相關性，且相關性卻強，CNN 越容易學習。

輸入一段有移動物體的視訊，以及一個或者多個標記主體的粗略分割蒙版。

首先，使用現成的分割網路比如 Mask RCNN，來講這些主體分成多個遮罩層和背景噪聲圖層，並按照某種規則進行排序。

比如，在一個騎手、一輛自行車以及幾個路人的場景中，就會把騎手和自行車歸入一個層，把人群歸入第二層。

omnimatte 模型是一個二維 UNet，逐幀處理視訊。每一幀都用現成的技術來計算物體掩碼，來標記運動中的主體，並尋找和關聯蒙版中未捕捉到的效果，比如陰影、反射或者煙霧，重建輸入幀。

為了保證其他靜止的背景元素不被捕獲，研究人員引入了稀疏損失。

此外，還計算了視訊中每一幀和連續幀之間的密集光流場，為網路提供與該層物件相關的流資訊。

最終生成 Alpha 影象（不透明度圖）和 RGBA 彩色影象，尤其 RGBA 影象，簡直可以說是視訊/影象剪輯法寶！

目前這一技術已經開源，配置環境如下：

Linux
Python 3.6+
英偉達 GPU + CUDA CuDNN

有什麼用途

技術效果如此，那有什麼樣的用途呢？

首先就可以複製或者刪除影象。

還有順滑地切換背景。

還可以實現這一經典操作，讓原本依次掉水的小孩一起入水~

背後的團隊

最後再來說一下背後的團隊。

這項研究由谷歌研究院、牛津大學以及魏茨曼科學研究所共同完成。

其中，論文一作是牛津大學四年級博士生 Erika Lu，曾是谷歌實習生，在麻省理工學院獲得了電腦科學與工程學士學位。

論文連結：

https://arxiv.org/pdf/2105.06993.pdf

谷歌最新視訊摳圖術：影子煙霧都能摳，新增水印更順滑，還開源

如何更順滑的新增水印？谷歌的這項新技術，讓文字簡直就像貼在地面上，哪怕是在沙塵橫飛的場景裡。

谷歌 Pixel 7 渲染圖曝光：基於 CAD 製作，有望 10 月推出

感謝網友肖戰割割的線索投遞！

谷歌高階總監談無障礙設計：公司也有失能症員工，此類需求非殘障人群獨有

北京時間 4 月 21 日下午訊息，近日，Google（谷歌）舉辦無障礙圓桌會議，谷歌全球無障礙和包容性團隊高階總監 Eve Andersson 與一眾媒體聊了聊谷歌無障礙產品、團隊以及選擇無障礙的理由。眾所周知，谷歌的軟體開發

谷歌最新模型pQRNN：效果接近BERT，引數量縮小300倍

摘要:文字分類是NLP最常見的應用之一，有了BERT之後更是可以通過小批量資料精調達到不錯的效果。但在對速度要求高、沒有錢買GPU、移動裝置部署的場景下，還是得用淺層網路。今天就跟大家介紹Google最近新

谷歌 Chrome 瀏覽器畫中畫新曝光：視訊會議支援一鍵靜音 / 結束通話 / 開關攝像頭

3月29日訊息外媒 techtsp 報道，在過去的 12 個月裡，由於流行疫情的影響，我們在家裡工作和玩耍的時候，視訊會議一直佔據著主導地位。

谷歌最新薪資曝光：研究崗年薪最高達 200 多萬，但遠遜於人事主管

作為全球有名的科技巨頭，谷歌無疑是給工資最大方的企業之一。那麼，在谷歌工作的員工每年究竟能賺多少錢？

谷歌 Android 12 Beta 3 釋出：API 31 SDK 提前推出，支援“滾動截圖”

7 月 15 日消息穀歌已向 Pixel 手機推送了 Android 12 Beta 3 更新，本次更新為“增量 Beta 質量版本”，官方建議開發人員繼續進行相容性測試。

谷歌年度旗艦 Pixel 5 釋出：放棄高通頂級晶片，699 美元

10月1日訊息今日凌晨，谷歌正式釋出了年度旗艦 Pixel 5 手機，搭載支援 5G 的驍龍 765G 處理器，售價 699 美元。

淘寶AI摳圖體驗：媲美PS的高效工具

大家上淘寶買東西多了去了，但又有多少人，知道淘寶出品了很多黑科技？為了服務廣大商家，淘寶提供了很多非常好用的工具，例如之前介紹過的自動生成海報，就是其中典型。但淘寶的黑科技不僅限於此，今天，再來給大家

谷歌與全球出版商糾紛持續：10億美元不夠，法國加入戰局

據報道，法國的一家上訴法院週四確認，谷歌必須與法國出版商就內容付費問題展開溝通，為在該國簽署行業性協議開闢道路。

效能媲美BERT，但引數量僅為1/300，這是谷歌最新的NLP模型

點選上方，選擇星標或置頂，不定期資源大放送！閱讀大概需要15分鐘 Follow小博主，每天更新前沿乾貨

百度新聞谷歌新聞_每日新聞摘要：到目前為止，Google I / O提供的最佳資訊

百度新聞谷歌新聞 Google’s yearly developer conference started yesterday, and the keynote was chock-full of announcements, demos, and some utterly mind-blowing tech. From Assistant to

谷歌創新過剩又一犧牲品：緊急定位應用Trusted Contacts將下架

據報道，谷歌近日突然釋出公告，稱將於 12 月開始停止使用該公司的緊急定位共享應用 Trusted Contacts。並且，該應用已經從 Google Play 商店下架。除此之外，谷歌還告知 Trusted Contacts 的現有使用者，可以嘗試使

澳大利亞高官迴應谷歌威脅關閉該國搜尋業務：科技巨頭為新聞內容付費不可避免

1 月 25 日上午訊息，澳大利亞聯邦財長弗萊登伯格（Josh Frydenberg）警告網際網路巨頭，為新聞內容付費 “不可避免”。

谷歌摺疊屏手機專利公佈：有望用於自家 Pixel 手機

2月3日訊息目前三星是可摺疊手機市場的領軍品牌，並提供了 Fold 和 Flip 兩種形態，均採用向內摺疊設計。根據外媒 WindowsUnited 報道，谷歌申請的兩項摺疊屏手機專利近日獲得通過，概述了可摺疊手機中的最重要元素—

谷歌正改進 Chrome 瀏覽器效能：啟動更快，記憶體使用減少 - IT之家

2 月 20 日訊息據 WindowsLatest 報道，根據多個程式碼提交，谷歌正在開發 “PartitionAlloc-everywhere”功能，以提高 Chrome 瀏覽器在 Windows 10、Android、Linux 以及可能的其他平臺上的效能。

谷歌 Pixel 5a 渲染圖曝光

2月23日訊息知名爆料者 @OnLeaks（Steve Hemmerstoffer）現已放出 Google Pixel 5a 渲染圖和部分資訊。

谷歌 Pixel 5a 實拍樣張曝光：超廣角相機 1200 萬畫素，搭載驍龍 765G

4 月 26 日訊息就在不久前，有海外使用者在Android 12 開發版的檔案中尋找資訊，發現了未釋出的谷歌 Pixel 5a 引數資訊。這款手機代號“Barbet”，將配備高通驍龍 765G 處理器。根據外媒 GSMArena 訊息，這款手機的

谷歌 Android Studio 4.2 釋出：IntelliJ 平臺更新

5 月 18 日訊息據谷歌官方訊息，Android Studio 4.2 現已釋出，並可從穩定版釋出渠道中下載。谷歌表示，此版本的重心在於推出經過升級的 IntelliJ 平臺以及一些新功能。

谷歌瀏覽器 Chrome 91 版本更新：自動凍結閒置標籤組，選單外觀優化

5 月 26 日訊息據外媒 9to5Google 報道，在繼 90 版 Chrome 瀏覽器在 Android、Mac、Windows 和 Linux 平臺上都發布之後，谷歌推出了 Chrome 瀏覽器 91 版本，91 版 Chrome 瀏覽器帶來了一系列新功能和外觀。

谷歌最新視訊摳圖術：影子煙霧都能摳，新增水印更順滑，還開源

如何實現

有什麼用途

背後的團隊

相關推薦