1. 程式人生 > 其它 >虛擬數字人很忙

虛擬數字人很忙

最近,虛擬數字人有點忙,在直播,品牌營銷,企業服務上都看到虛擬數字人身影。虛擬數字人跟元宇宙有什麼關係,我們一起來說說。

一、虛擬數字人概念

1、定義

“虛擬數字人”一詞最早源於 1989 年美國國立醫學圖書館發起的“可視人計劃”(Visible Human Project, YHP)。其指存在於非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創造及使用,並具有多重人類特徵(外貌特徵、人類表演能力、人類互動能力等)的綜合產物。

  • 外貌特徵:具有特定的相貌、性別和性格等人物特徵
  • 人類表演能力:擁有人的行為,具有用語言、面部表情和肢體動作表達的能力
  • 人類互動能力:擁有人的思想,具有識別外界環境、並能與人交流互動的能力

“人”是其中的核心的因素,高度擬人化為使用者帶來的親切感、關懷感與沉浸感是多數消費者的核心使用動力。能否提供足夠自然逼真的相處體驗,將成為虛擬數字人在各個場景中取代真人,完成語音互動方式升級的重要標準。 

2、發展歷程

從最早的手工繪製到現在的 CG(Computer Graphics,電腦繪圖)、人工智慧合成,虛擬數字人大致經歷了萌芽、探索、初級和成長四個階段。

二、虛擬數字人相關技術

1、虛擬數字人通用系統框架

虛擬數字人系統一般情況下由人物形象、語音生成、動畫生成、音視訊合成顯示、互動等 5 個模組構成。

  • 人物形象:根據人物圖形資源的維度,可分為 2D 和 3D 兩大類,從外形上又可分為卡通、擬人、寫實、超寫實等風格
  • 語音生成模組和動畫生成模組:可分別基於文字生成對應的人物語音以及與之相匹配的人物動畫
  • 音視訊合成顯示模組:將語音和動畫合成視訊,再顯示給使用者
  • 互動模組:使數字人具備互動功能,即通過語音語義識別等智慧技術識別使用者的意圖,並根據使用者當前意圖決定數字人後續的語音和動作,驅動人物開啟下一輪互動

互動模組根據其有無,可將數字人分為互動型數字人和非互動型數字人。

  • 非互動型數字人:系統依據目標文字生成對應的人物語音及動畫,併合成音視訊呈現給使用者
  • 互動型數字人:根據驅動方式的不同可分為智慧驅動型和真人驅動型
  • 智慧驅動型數字人:該人物模型是預先通過AI技術訓練得到可通過文字驅動生成語音和對應動畫,業內將此模型稱為TTSA(Text To Speech & Animation)人物模型
  • 真人驅動型數字人:真人根據視訊監控系統傳來的使用者視訊,與使用者實時語音,同時通過動作捕捉採集系統將真人的表情、動作呈現在虛擬數字人形象上,從而與使用者進行互動

(智慧驅動型虛擬數字人運作流程)

2、三大核心技術

為了實現“擬人化”,技術層面主要體現為以下三點:

  • CG建模/影象遷移技術:影響外觀呈現。體現為虛擬數字人外觀的擬人程度
  • NLP互動技術:影響互動體驗。以對話能力為核心,該技術繼續在虛擬數字人中發揮核心作用,可以視作為虛擬數字人的腦
  • CV等深度學習模型:影響驅動效果。受資料量、計算框架、關鍵特徵點等因素深刻影響。能否呈現自然的面部表情變動、肢體變動等,在極大程度上取決於語音驅動的深度模型效果

三、虛擬數字人產業應用

1、行業現狀

按照產業應用,可以將虛擬數字人劃分為兩類,服務型虛擬數字人和身份型虛擬數字人。“量子位虛擬數字人產業報告”預測,在2030年,我國虛擬數字人整體市場規模將達到2700億。其中,得益於虛擬IP的巨大潛力,以及虛擬第二分身的起步,身份型虛擬數字人將佔據主導地位,約1750億,並逐步成為Metaverse中的重要一環。服務型虛擬數字人則相對穩定發展,多模態AI助手仍有待進一步發展,多種對話式服務升級至虛擬數字人形態,總規模超過950億。 

2、產業劃分

虛擬數字人的產業鏈從下到上分為基礎層、平臺層、應用層,下層賦能上層並不斷合作形成了多元的商業模式。

  • 基礎層:為虛擬數字人提供基礎軟硬體支撐,硬體包括顯示裝置、光學器件、感測器、晶片等,基礎軟體包括建模軟體、渲染引擎
  • 平臺層:包括軟硬體系統、生產技術服務平臺、AI 能力平臺,為虛擬數字人的製作及開發提供技術能力
  • 應用層:指虛擬數字人技術結合實際應用場景領域,切入各類,形成行業應用解決方案,賦能行業領域

3、虛擬IP應用Case

虛擬IP相對於真人IP,解決了MCN對特定IP長期穩定持有的問題,以偶像/網紅為核心場景,在直播、代言等領域均有所發展。由於我國的短視訊和直播業態正在迅速發展,面對高頻、碎片且實時的IP運營需求,虛擬IP更能夠適應這一趨勢。代言領域,歐萊雅(M姐)、花西子(花西子)已開始有所嘗試,通過虛擬IP打造完全符合品牌調性的虛擬代言人。

四、總結

技術是進入行業的核心門檻,需要進入玩家在機器視覺、語音互動和自然語言處理方面都具有深厚的技術積累,並將三者進行有機結合。當前虛擬數字人向自我管理的演化,認知智慧、靈活性、個性化、情感化都是虛擬數字人需要進一步提升的技術方面。

儘管技術壁壘增加了商業化成本,但虛擬數字人給元宇宙打開了更大的想象空間。你是否也想擁有一個虛擬數字人呢?

參考文獻:

《2020 年虛擬數字人發展白皮書》中國人工智慧產業發展聯盟總體組,中關村數智人工智慧產業聯盟數字人工作委員會

《虛擬數字人深度產業報告》量子位