SoaringLee_fighting的技術專欄
Date: 2018.10.13
1、參考
2、前言
視訊壓縮編碼領域對於視訊訊號傳輸和儲存具有重要的意義。在國際組織的聯合開發中,產生了很多重要的視訊編解碼標準。主要國際組織包括MPEG、ITU、Google、Microsoft、AVS工作組。本文旨在簡要分析視訊編解碼標準的發展歷程。主要標準有:JPEG、MJPEG、JPEG2000、H.261、MPEG-1、H.262/MPEG-2、H.263、MPEG-4 (Part2/ASP)、H.264/MPEG-4 (Part10/AVC)、H.265/MPEG-H (Part2/HEVC)、H.266/VVC、VP8/VP9、AV1、AVS1/AVS2、SVAC1/SVAC2、XVC等。
3、主要視訊編碼標準發展歷程
4、JPEG
https://en.wikipedia.org/wiki/JPEG JPEG 是Joint Photographic Experts Group(聯合影象專家小組)的縮寫,是第一個國際影象壓縮標準。JPEG影象壓縮演算法能夠在提供良好的壓縮效能的同時,具有比較好的重建質量,被廣泛應用於影象、視訊處理領域。
5、MJPEG
M-JPEG(Motion- Join Photographic Experts Group)技術即運動靜止影象(或逐幀)壓縮技術,廣泛應用於非線性編輯領域可精確到幀編輯和多層影象處理,把運動的視訊序列作為連續的靜止影象來處理,這種壓縮方式單獨完整地壓縮每一幀,在編輯過程中可隨機儲存每一幀,可進行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬體和軟體實現。但M-JPEG只對幀內的空間冗餘進行壓縮。不對幀間的時間冗餘進行壓縮,故壓縮效率不高。採用M-JPEG數字壓縮格式,當壓縮比7:1時,可提供相當於Betecam SP質量影象的節目。
JPEG標準所根據的演算法是基於DCT(離散餘弦變換)和可變長編碼。JPEG的關鍵技術有變換編碼、量化、差分編碼、運動補償、霍夫曼編碼和遊程編碼等
M-JPEG的優點是:可以很容易做到精確到幀的編輯、裝置比較成熟。缺點是壓縮效率不高。
此外,M-JPEG這種壓縮方式並不是一個完全統一的壓縮標準,不同廠家的編解碼器和儲存方式並沒有統一的規定格式。這也就是說,每個型號的視訊伺服器或編碼板有自己的M-JPEG版本,所以在伺服器之間的資料傳輸、非線性製作網路向伺服器的資料傳輸都根本是不可能的。
6、JPEG2000
JPEG 2000 (JP2) is an image compression standard and coding system. It was created by the Joint Photographic Experts Group committee in 2000 with the intention of superseding their original discrete cosine transform-based JPEG standard (created in 1992) with a newly designed, wavelet-based method. The standardized filename extension is .jp2 for ISO/IEC 15444-1 conforming files and .jpx for the extended part-2 specifications, published as ISO/IEC 15444-2. The registered MIME types are defined in RFC 3745. For ISO/IEC 15444-1 it is image/jp2.
7、H.261
H.261視訊編碼標準誕生於1988年,可謂是視訊壓縮編碼發展的第一個里程碑。因為從H.261開始,視訊編碼方法採用了沿用至今的基於波形的混合編碼方法。H.261標準主要目標是用於視訊會議和可視電話等高實時性、低位元速率的視訊影象傳輸場合。
在H.261標準產生的時代,由於各國的電視制式不一致,因此不能直接互通。為了解決資料來源格式不相容的問題,H.261定義了一種公共中間格式CIF(Common Intermediate Format)。編碼的目標格式首選轉換為CIF格式進行編碼和傳輸,接收端進行解碼後再轉換為各自的格式。H.261規定的CIF格式視訊的亮度解析度為352×288,QCIF格式的亮度解析度為176×144。
H.261信源編碼所採用的技術:
- 幀內編碼/幀間編碼判定:根據幀與幀之間的相關性判定——相關性高使用幀間編碼,相關性低使用幀內編碼。
- 幀內編碼:對於幀內編碼幀,直接使用DCT編碼8×8的畫素塊。
- 幀間編碼/運動估計:使用以巨集塊為基礎的運動補償預測編碼;當前巨集塊從參考幀中查詢最佳匹配巨集塊,並計算其相對偏移量(Vx, Vy)作為運動向量;編碼器使用DCT、量化編碼當前巨集塊和預測巨集塊的殘差訊號;幀間編碼/運動估計:使用以巨集塊為基礎的運動補償預測編碼;當前巨集塊從參考幀中查詢最佳匹配巨集塊,並計算其相對偏移量(Vx, Vy)作為運動向量;編碼器使用DCT、量化編碼當前巨集塊和預測巨集塊的殘差訊號;
- 環路濾波器:實際上是一個數字低通濾波器,濾除不必要的高頻資訊,以消除方塊效應;環路濾波器:實際上是一個數字低通濾波器,濾除不必要的高頻資訊,以消除方塊效應;
8、MPEG-1
MPEG-1標準於1993年8月公佈,用於傳輸1.5Mbps資料傳輸率的數字儲存媒體運動影象及其伴音的編碼。該標準包括五個部分:
第一部分說明了如何根據第二部分(視訊)以及第三部分(音訊)的規定,對音訊和視訊進行復合編碼。第四部分說明了檢驗解碼器或編碼器的輸出位元流符合前三部分規定的過程。第五部分是一個用完整的C語言實現的編碼和解碼器。
該標準從頒佈的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以後的版本都帶有一個MPEG-1軟體解碼器,可攜式MPEG-1攝像機等等。
9、MPEG-2/H.262
MPEG組織於1994年推出MPEG-2壓縮標準,以實現視/音訊服務與應用互操作的可能性。 MPEG-2標準是針對標準數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,編碼位元速率從每秒3兆位元~100兆位元,標準的正式規範在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標準。
MPEG-2影象壓縮的原理是利用了影象中的兩種特性:空間相關性和時間相關性。這兩種相關性使得影象中存在大量的冗餘資訊。如果我們能將這些冗餘資訊去除,只保留少量非相關資訊進行傳輸,就可以大大節省傳輸頻帶。而接收機利用這些非相關資訊,按照一定的解碼演算法,可以在保證一定的影象質量的前提下恢復原始影象。一個好的壓縮編碼方案就是能夠最大限度地去除影象中的冗餘資訊。
MPEG-2的編碼影象被分為三類,分別稱為I幀,P幀和B幀。
I幀影象採用幀內編碼方式,即只利用了單幀影象內的空間相關性,而沒有利用時間相關性。P幀和B幀影象採用幀間編碼方式,即同時利用了空間和時間上的相關性。P幀影象只採用前向時間預測,可以提高壓縮效率和影象質量。P幀影象中可以包含幀內編碼的部分,即P幀中的每一個巨集塊可以是前向預測,也可以是幀內編碼。B幀影象採用雙向時間預測,可以大大提高壓縮倍數。
MPEG-2的編碼碼流分為六個層次。為更好地表示編碼資料,MPEG-2用句法規定了一個層次性結構。它分為六層,自上到下分別是:影象序列層、影象組(GOP)、影象、巨集塊條、巨集塊、塊。
10、H.263
H.263是國際電聯ITU-T的一個標準草案,是為低碼流通訊而設計的。但實際上這個標準可用在很寬的碼流範圍,而非只用於低碼流應用,它在許多應用中可以認為被用於取代H.261。H.263的編碼演算法與H.261一樣,但做了一些改善和改變,以提高效能和糾錯能力。.263標準在低位元速率下能夠提供比H.261更好的影象效果,兩者的區別有:(1)H.263的運動補償使用半象素精度,而H.261則用全象素精度和迴圈濾波;(2)資料流層次結構的某些部分在H.263中是可選的,使得編解碼可以配置成更低的資料率或更好的糾錯能力;(3)H.263包含四個可協商的選項以改善效能;(4)H.263採用無限制的運動向量以及基於語法的算術編碼;(5)採用事先預測和與MPEG中的P-B幀一樣的幀預測方法;(6)H.263支援5種解析度,即除了支援H.261中所支援的QCIF和CIF外,還支援SQCIF、4CIF和16CIF,SQCIF相當於QCIF一半的解析度,而4CIF和16CIF分別為CIF的4倍和16倍。
1998年IUT-T推出的H.263+是H.263建議的第2版,它提供了12個新的可協商模式和其他特徵,進一步提高了壓縮編碼效能。如H.263只有5種視訊源格式,H.263+允許使用更多的源格式,影象時鐘頻率也有多種選擇,拓寬應用範圍;另一重要的改進是可擴充套件性,它允許多顯示率、多速率及多解析度,增強了視訊資訊在易誤碼、易丟包異構網路環境下的傳輸。另外,H.263+對H.263中的不受限運動向量模式進行了改進,加上12個新增的可選模式,不僅提高了編碼效能,而且增強了應用的靈活性。H.263已經基本上取代了H.261。
11、MPEG-4 (Part2/ASP)
運動影象專家組MPEG 於1999年2月正式公佈了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標準。
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮演算法,它是針對數字電視、互動式繪圖應用(影音合成內容)、互動式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通訊及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、儲存、檢索等應用領域普遍採用的統一資料格式。
12、H.264/MPEG4 Part10 AVC
H.264是由ISO/IEC與ITU-T組成的聯合視訊組(JVT)制定的新一代視訊壓縮編碼標準。在ISO/IEC中該標準命名為AVC (Advanced Video Coding),作為MPEG-4標準的第10個選項;在ITU-T中正式命名為H.264標準。
13、H.265/HEVC
H.265是ITU-T VCEG 繼H.264之後所制定的新的視訊編碼標準。H.265標準圍繞著現有的視訊編碼標準H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼質量、延時和演算法複雜度之間的關係,達到最優化設定。具體的研究內容包括:提高壓縮效率、提高魯棒性和錯誤恢復能力、減少實時的時延、減少通道獲取時間和隨機接入時延、降低複雜度等。H264由於演算法優化,可以低於1Mbps的速度實現標清數字影象傳送;H265則可以實現利用1~2Mbps的傳輸速度傳送720P(解析度1280*720)普通高清音視訊傳送。
14、VP8/VP9
15、AV1
16、AVS1/AVS2
AVS1標準是中國自主研發的音視訊編解碼標準,主要用於國內衛星電視的壓縮傳輸,其壓縮率相較於H.264要低一些,在使用範圍和推廣上也不如H.264。
17、SVAC1/SVAC2
SVAC(Surveillance Video and Audio Coding),安全防範監控音視訊編解碼技術,該技術標準是有中星微和公安一所針對視訊監控應用提出的音視訊編碼標準,該標準2010年12月23日釋出,於2011年5月1日開始實施。
SVAC標準的主要技術特點有以下幾點:
1)高精度,支援8bit~10bit; 2)支援幀內4x4預測與變換量化,支援自適應幀-場編碼(AFF)和CABAC等技術。 3)支援ROI變質量編碼和SVC可伸縮編碼。 4)支援監控專用資訊,資料安全保護和加密認證。
THE END!