1. 程式人生 > 資訊 >清華首個虛擬學生華智冰露臉唱歌,小冰公司:實現完全虛擬生成不存在的面部

清華首個虛擬學生華智冰露臉唱歌,小冰公司:實現完全虛擬生成不存在的面部

9 月 30 日訊息 近日清華虛擬學生華智冰彈唱歌曲的視訊走紅網路,這也是團隊首次釋出其正面露臉視訊。華智冰是由清華大學計算機系、北京智源研究院、智譜 AI 和小冰公司聯合培養,是中國首個原創虛擬學生,已在清華園裡開啟學習和研究生涯

小冰公司對此發表了宣告,宣告中小冰解釋了華智冰專案的初衷:希望能夠以智慧模型作為核心,試驗預訓練模型能夠帶來哪些技術與應用方面的驚喜。

小冰公司在宣告中還稱,新的產品化技術實現了完全虛擬生成不存在的面部,且具有足夠豐富的 features,從而能夠實現精度更高的視覺化互動內容。視訊中人物的面部特徵,包括人臉、表情、口型等,全部由人工智慧小冰框架 X Avatar 生成並進行融合

;視訊中的人物肢體、動作,包括手持吉他彈唱,來源於小冰團隊成員魚子醬醬錄製的原始視訊模版。視訊中的歌聲,由人工智慧小冰框架 X Studio 生成。

據悉,華智冰將師從清華大學唐傑教授,即日起開啟在清華大學的學習和研究生涯。

瞭解到,華智冰是由清華大學計算機系、北京智源研究院、智譜 AI 和小冰公司聯合培養,可以作詩作曲,生成圖畫,還將具有一定的推理和情感互動的能力,而她來到清華的第一年將通讀“天下書”,不斷地為其輸入各種語料;第二年進入“精讀”階段,引導華智冰對語料背後的邏輯有更深刻的理解;第三年則培養她的創造力,從此有望在多項認知智慧上超過人類。華智冰智商和情商雙高,可以作詩、作畫、創作劇本殺,還具有一定的推理和情感互動的能力。不同於一般的虛擬人物,華智冰背後依託的是中國“悟道”超大規模人工智慧模型。

以下為小冰公司的具體宣告:

隨著視覺化互動內容(如短視訊)的不斷深化,對於人物出鏡互動的需求越來越多。但是,由於人類的行為存在各種不穩定性,常常給商業機構和品牌方帶去很大的風險與不確定性。對此,越來越多的商業機構、內容製作方與品牌方,呼喚一種安全可控的虛擬人類內容(含商業代言)產品化技術。

但是,已往付諸產品化的技術存在諸多問題:它無法像真實人類一樣,生成足夠豐富的面部 features,且無法打通生成與替換的端到端流程。因此,只能實現真實人類面部間的替換,精度質量不足。

更嚴重的問題是,以往的方法無法從根源上避免隱私侵權風險。

新的產品化技術實現了完全虛擬生成不存在的面部,且具有足夠豐富的 features,從而能夠實現精度更高的視覺化互動內容。尤其是,由於從根源上避免了使用任何真實人類面部的可能性,有效阻斷以往技術無法避免的隱私侵權問題。從隱私角度,是一個重要的進步。

我們相信,虛擬人將成為未來視訊內容的主要提供者之一,而安全、可控、無隱私風險和侵權風險是其前提。因此,小冰一直在這一趨勢方向上進行探索,並從不同方面對這一領域做拓展研究。小冰與清華大學計算機系合作華智冰專案,正是在預訓練模型方面進行合作,希望能夠以智慧模型作為核心,試驗預訓練模型能夠帶來哪些技術與應用方面的驚喜。

這次傳播的視訊,來自小冰釋出會的進展彙報展示,為華智冰能力續寫了一些新的進展,demo 小冰框架下最新的面部生成和 3D 視訊封裝技術成果。具體來說:視訊中人物的面部特徵,包括人臉、表情、口型等,全部由人工智慧小冰框架 X Avatar 生成並進行融合;視訊中的人物肢體、動作,包括手持吉他彈唱,來源於小冰團隊成員魚子醬醬錄製的原始視訊模版。視訊中的歌聲,由人工智慧小冰框架 X Studio 生成。

除此之外,華智冰除了 3D 面部生成,以及歌聲合成的優化,還有其他很多更底層的、涉及數字人“大腦”的新技術應用,例如在有機融合了知識圖譜和預訓練模型後,可以讓數字人有常識和推理能力。華智冰正在不斷“成長”中,還會有更多最新技術的應用,敬請期待。

小冰公司

2021 年 9 月 29 日