1. 程式人生 > 其它 >視訊雲的全景藍圖,想象力的允諾之地

視訊雲的全景藍圖,想象力的允諾之地

視訊有邊界嗎?

在過去,答案是肯定的。

那時視訊可能會被鎖在電視機裡,關在大銀幕中。可隨著越來越多的硬體裝置進入家庭,隨著網路技術層層變革,隨著計算能力持續升級,隨著視訊的編解碼能力不斷提升…… 視訊,已然成為一種新的資訊載體,而作為新時代大視訊產業的底座,視訊雲就被賦予了可以變革社會的關鍵使命。

7 月 10 日,“Imagine”——2021 阿里雲視訊雲全景創新峰會暨全球視訊雲創新挑戰賽決賽頒獎典禮在北京舉辦。關於視訊未來的發展前景,關於視訊雲的全景藍圖,關於學術界、藝術界、創投界多界聯動,關於開發者與音視訊技術領域的多維探索,通過這場峰會的觀點碰撞,我們似乎已然能夠窺到未來視訊發展的康莊之路。

從視訊化到超視訊化,視訊雲角色加碼

在前幾年,視訊化一詞被越來越多的提及。那麼什麼是視訊化

簡單來講,就是資訊的傳遞逐漸加入了視訊作為載體。由於視訊生產門檻持續的降低,使用者接受度不斷提高,使用者使用時長也在不斷增加,內容全視訊化時代已然到來。與此同時,視訊不僅僅在消費領域大放異彩,在教育、會議、醫療、金融等各行各業也在衍生出新的需求。

使用者花在視訊上的整體時間消耗明顯在增加,整個社會基於視訊在各種各樣的業務場景中的互動也上升明顯。“內容在更多的向視訊演進,互動的形式更加多樣,相比以前的視訊化來講,這是一個超視訊化時代。” 阿里巴巴研究員、阿里雲智慧視訊雲負責人林昊如此定義當前的這些變化。

想要定義一個時代,就需要了解這個時代。林昊解釋稱超視訊化時代有五大特點,超內容,超互動、超連結、超語言能力及超未來圖景。解析來看,其意味著視訊的形式持續演進,互動更加豐富,其傳播跨越了語言限制,並且還能夠以 AR、VR 等途徑影響到大眾的日常。

那麼超視訊化的時代是怎樣到來的呢?林昊認為 5G 起到了重要的推動作用,5G 的大頻寬推動了 AI 與 IoT 發展為智聯網;5G 激活了超高清視訊與 VR/AR,使得網路峰值速率達到了 20Gbit/s,無線介面延時 1ms,解析度顯著提升;更為重要的,5G 開拓了數字內容的新業態,無論是數字遊戲、互動娛樂、影視動漫、立體影像還是數字表演等,視訊的表現能力和形式都得到了極大的豐富。

更為關鍵的還在於,雲 + 視訊形成了場景革新的催化劑,讓虛實結合成為了可能。雲邊端一體化協同讓邊緣算力上移,雲端算力下沉,降低了處理壓力和時延問題;而云端一體化的音視訊技術使得雙端體驗一致成為可能;AI 技術發展後實現了視訊全鏈路的賦能,智慧化顛覆了以往的內容生產方式;同時,混合現實技術也突破了內容和互動的新形態,使得物理世界和數字世界的最後一道壁壘被打破連結起來,讓視訊這一載體擁有了更多的可能。

喬布斯說過,“在較低的頻寬下,人們傳遞的是資訊,更高的頻寬將用來傳遞情感。” 超視訊化時代的誕生不僅僅是因為頻寬的提升,還因為技術的演進。

技術演進則分為了兩大方向,即內容的演進和互動的演進。內容的演進路徑遵循更大密度、更多維度、更多感官、拓撲空間四大特徵,其具體表現也就形成了從文字、到影象、影音、直播短視訊、資訊及知識的視訊化,乃至全場景內容視訊化,最終形成沉浸式內容形態。互動的演進則遵循了多端連結、多人共享、打破空間、虛實無縫融合的特徵,演進路徑就形成了從線下、線上、互動全場景線上化到沉浸式互動的過程。

由此不難發現,沉浸式互動和內容形態將會是我們能夠探知的真正未來。“資訊將會從一個互動物件,自然地傳遞到另一個互動物件。而數字將與物理共存並增強。

像《頭號玩家》一樣的互動方式絕非天方夜譚。當然,在一切想象力的背後都是技術的深度挖掘,視訊的背後不會是對 AI、資料、編解碼等單點技術的升級,而是要求以視訊云為基礎的整個技術體系的打造。視訊雲不僅僅是雲端的技術,還要在視訊整體技術上不斷演進,不管是三維化還是全息化,都要不斷的演進和佈局,最終讓視訊與場景有更多結合,從而實現數智化音視訊賦能的 “雲上創新,價值創造”。

大視訊產業的底座,視訊雲的行業演進

伴隨超視訊化發展,網際網路也在發展。而在評估某一行業的價值時,已經不再是用裝置數,而是時間數。當網際網路各個領域的紅利已經近乎枯竭之時,視訊相關領域卻在去年表現出巨大的紅利。並且艾瑞研究院副總經理徐樊磊表示,這一紅利還將持續下去。

從行業發展的角度來看,現階段的大視訊產業具有碎片化、去中心化、高清化、實時性等一系列的特點,也就是說在需求端大家對於視訊的追求越發趨於 “短、頻、快”,追求極致畫質體驗,需要實時音視訊,實時互動重塑視訊應用價值,從而覆蓋到金融服務、醫療、公共事業、社交、教育、諮詢等諸多行業。

而如果我們把視角抬高,縱覽人類歷史當中資訊傳播的歷程,那麼視訊在其中扮演的角色也十分重要。最初,人類的溝通更多的是肢體語言,其對體力要求很高且容易歧義;隨後,人類有了語言,其不會有體力問題卻會被空間時間束縛,且很難傳承下去;後來我們有了文字,傳承千年已然無憂,但是文字天生的門檻和資訊豐富度的缺乏促使視訊的出現。而視訊也在持續演進,從最初的電視,到離線的播放器視訊,再到現在的實時音視訊以及互動視訊。

而視訊依然不是完美的,其主要問題有兩點,第一是視訊的線性問題,其雖然可以快進到某個地方卻無法實現全域性縱覽;第二則是修改相比文字較慢,難度也更高。而基於這些問題,行業會越來越多的來與視訊進行結合。也就是說視訊已經不再是行業,而是一種底層的基礎能力,基於視訊雲打造的視訊應用會成為必選項。視訊成為必選項,因此可以說,“視訊雲是新時代大視訊產業的底座”。

行業與視訊的深度結合其影響絕不僅僅是產品,很多行業的格局因此而改變。但是由於行業的複雜性存在,其對於視訊能力的訴求各不相同卻又有一定的共同之處。首先便是要求易於整合、易於計量,其需要以更低的成本、更彈性的擴縮容以實現雲上的嘗試,能夠敏捷試錯快速投入生產。

因此,視訊雲需要在生產、處理、傳輸、消費等不同環節提供不同的解決方案和流程加持。除了視訊本身被雲服務深度和分工細化之外,其還能夠大幅降低製作高質量、有價值視訊的門檻。

這一過程中雲服務對視訊的加持極為重要,在視訊生產環節,視訊雲能夠提供智慧化的內容處理能力,大幅提高創作效率和實現高效的媒資管理。在處理環節,視訊雲通過視訊處理和智慧編碼,達到成本和畫質的最優平衡。在傳輸環節,視訊雲基於 CDN 智慧加速,雲邊端協同,降低傳輸時延和節省頻寬成本。在最終的消費環節,視訊雲還能提供美顏、美聲、沉浸式互動等多元化玩法豐富使用者體驗。

視訊雲在結合了行業之後自身也在持續的演進。現階段視訊雲雖然主要集中在網際網路和泛娛樂領域中,但其已然具備了不同環節中提供支援的能力,能夠在各個行業中持續深度演進發展;同時,視訊雲解決方案也給了使用者更多選擇,無論是應用級能力,還是行業性通用型平臺企業,不同維度不同使用者,能夠有不同的答案。

此外,視訊雲在技術層面依然在追求極致,其雖然並未真正成熟,去解決高清化、實時化和互動性的問題,但是軟體定義一切的理念正在協同硬體處理如路由器、儲存、計算等諸多環節;同時,低程式碼開發也在大量的視訊雲及視訊產業中出現,其可以讓從業者更快速、更敏捷的呼叫功能,提升易用性,實現易呼叫、易整合。

未來,基於視訊雲有可能會打造更多的創新,其能夠為使用者提供更多的連結,更低的門檻,展現更普惠的能量。視訊雲這種技術對於視訊整體行業及大視訊產業而言,就是成為了一個底座功能。

視訊雲的可持續發展,技術的難點與突破

視訊雲作為產業底座,其一大特質便是相容幷包。尤其是當下,使用者對於視訊互動性、呈現方式和沉浸式體驗需求增加,AI 的深度融入將會成為視訊雲及視訊產業創新的關鍵。當視訊雲在社交、娛樂、教育等領域開荒拓土之時,深度學習也在影象、語音、語言、大資料特徵提取等多個方面持續發揮出巨大價值。可以說,未來視訊雲技術的突破,一定程度上將由基於深度學習的人工智慧所驅動。

在活動最後的圓桌論壇中,中國科學院計算技術研究所智慧資訊處理實驗室研究員王樹徽則表示,深度學習時代帶來了第三次人工智慧的興起,此次興起主要以應用為目的,使得深度學習技術在很多工有著良好效果,但其核心卻存在問題。因此,想要實現視訊技術的突破,從深度學習內在機理方面應當解決三大技術問題

  • 第一,現有的深度學習太過依賴資料,其對資料的處理效能和對知識的利用是不夠的,所以基於這個考慮做網路多模態跨媒體資料的知識構建將會是未來的一大重要發展方向;
  • 第二,要建好知識庫,來支撐機器系統的推理工作,從而讓機器能夠對任意不同來源的資料形成舉一反三的推理能力。
  • 第三,早期的時候人對計算機來說是不對等的,比如內容創作時的人機協同。而在核心過程當中,演算法、系統和人之間是需要可信的,相互的信賴、協作及可信賴的推理將會是為了主要需要解決的問題。

當然,AI 雖然有很多問題存在,卻也一樣在視訊之中發揮了重要作用。達摩院資深演算法專家謝宣鬆表示,AI 在視訊方面發揮的作用主要分成兩類,第一類是最基礎的視訊或者影象的理解,包括分類、打標、檢測、分割等等;第二類與生產類相關,比如生產、編輯、加工、擦除、擦入等等,其中還包括底層視覺相關的增強等。

視訊的影象增強是 AI 的一大應用方向,解析度低時候視訊的資訊量體驗將會非常差,更生動的色彩也會讓體驗加分;而更加沉浸式的體驗則是為了發展的方向。如果想要打造一款 4K 內容,細節、流暢度和色彩比如是需要關注的重點。但是從技術角度來看以下三大問題必須要直接面對,第一,越是追求細節就越可能出現瑕疵,如何保證細節還原且能夠保證瑕疵控制,這是很核心的技術;第二,演算法的源頭是資料,資料的源頭普遍有兩種,如低解析度和高解析度,低畫質和高畫質,資料獲取最終往往需要用人工方式這種高成本的方式解決,這也是一大難點;第三,在 AI 技術實踐當中,把效果和效率平衡做好也是一個問題。

當前 AI 也在朝著兩個維度走,一個是走向消費者,為大家服務,另一個則是深入到各行各業來降本提效,創造各種各樣的機會。

當然,驅動創新和技術升級的,歸根結底依然是人。那麼 AI 熱度已經高漲很多年了,很多學校也開啟了 AI 相關人才與教育,但對於市場和行業而言,人才缺乏問題依然嚴重,那麼人才都去哪裡了呢?王樹徽表示,他帶過的研究生大多數都已經加入了行業戰場,學校已經給行業輸送了大量的人才,但是因為行業發展實在太快,高水平人才本就稀少,不同實驗室定位不同,也無法盲目擴大規模。

同時,實驗室的研究是把問題從現實中剝離出來再通過數學的方法來解決問題的,可是企業對於學生的要求是不同的,他們會希望企業瞭解業務並用以實踐。從學術研究到業務應用這本身就有很長的鏈條,學生難以實現即插即用。而意識到這一點的顯然不僅僅是學校,還有行業和企業。

今年阿里雲聯手英特爾主辦、與優酷戰略技術合作的全球視訊雲創新挑戰賽在此次峰會上舉辦最終的頒獎典禮。本屆大賽由天池平臺和阿里雲視訊雲承辦,聚焦於視訊雲技術在全行業的應用與創新領域,吸引了全球 23 個國家、4000 餘支參賽戰隊,大賽分為 “演算法 “和” 創新應用 “兩大賽道,充分發掘人才,鼓勵並期待參賽者激發未來更多的想象力。

此外,阿里雲天池平臺在此次峰會上還發布了天池資料集開源計劃,涵蓋電商、金融、物流、醫療、能源等 60 多個有真實業務場景的產業稀缺資料集,希望通過開放真實的業務場景和資料,與各界社會力量一道打造專業的科研大資料平臺。

視訊雲的發展成為了時代的選擇,也變革了商業與社會,化作大視訊產業的底座;視訊雲技術可以充滿想象力,突破時間與空間,也能讓人與人的溝通更加無縫和愜意。

未來已來,全新的視訊化世界,你準備好了嗎?


本次視訊雲全景創新峰會的所有演講內容,後續會在「 視訊雲技術」公眾號陸續釋出。

「視訊雲技術」你最值得關注的音視訊技術公眾號,每週推送來自阿里雲一線的實踐技術文章,在這裡與音視訊領域一流工程師交流切磋。公眾號後臺回覆【技術】可加入阿里雲視訊雲產品技術交流群,和業內大咖一起探討音視訊技術,獲取更多行業最新資訊。