1. 程式人生 > 資訊 >位元組跳動 AVG 編碼技術新突破:讓視訊縮小 13%

位元組跳動 AVG 編碼技術新突破:讓視訊縮小 13%

3 月 1 日訊息,據聯合視訊專家組 JVET 官網顯示,位元組跳動 AVG(先進視訊團隊)今年 2 月發起一項視訊壓縮的技術提案,該提案能夠在優化壓縮質量的同時,節約至少 13% 的儲存和頻寬。例如,一段 180 分鐘 H.266/VVC 標準的高清視訊(1080P 解析度),大約需要 3GB 的資料體積,應用新技術後只需要 2.6GB。

視訊是由一張張圖片連線起來的動態影象序列,視訊編解碼則是視訊應用的底層核心技術,作用是對影象進行壓縮和數字編碼,以儘可能小的頻寬傳送高質量的視訊資料。H.266/VVC 能夠在不影響畫質的情況下,把視訊位元速率降低到前一代標準 H.265/HEVC 的一半。本來只夠放標清視訊的網速,也能流暢播放高清視訊。

此次位元組跳動 AVG 提出的新演算法,旨在通過深度學習技術構建減少視訊壓縮失真的濾波器 (DAM),主幹是基於殘差單元堆疊的深度卷積網路,輔以自適應模型選擇以最大程度適應特性複雜的自然視訊。所謂殘差單元是指通過引入跳層連線,允許網路把注意力放在變化的殘差上,這與視訊影象幀之間的殘差有異曲同工之妙,比如武林高手決鬥,“劍光一閃”,每一幀影象絕大部分內容是相同的,閃動的劍光形成殘差,這也是視訊編碼壓縮的重點關注物件。

實驗結果顯示,相比 H.266/VVC 最新標準,位元組跳動的 DAM 解決方案能夠為視訊編碼效能帶來顯著提升,亮度訊號 Y 可實現 10.28% 的效能增益,兩個色度訊號 U 和 V,效能增益也分別達到 28.22% 和 27.97%,在視訊質量有所優化的同時,至少還可縮小 13% 的資料體積。

據悉,AVG 的各項研究成果,也將通過 BVC 編碼器的升級換代投入應用,包括抖音、西瓜視訊、今日頭條等App 的視訊類內容處理,以及雲端計算、雲遊戲等基礎架構領域。

根據公開報道,位元組跳動 AVG 在美國加州建立研發團隊,成員有來自高通、微軟、英特爾等巨頭的資深研究員,也有出身海內外頂級院校的新生代。在此前 JVET 制定新一代國際視訊編解碼標準 H.266/VVC 的過程中,位元組跳動 AVG 累計提交 260 + 項技術提案,其中 130 + 項被採納,被採納提案數和採納率均排在世界前列,是 H.266/VVC 核心演算法的主要貢獻者之一。