iOS學習-即時通訊音視訊(一)之視訊編解碼之理論

阿新 • • 發佈：2018-12-28

參考大神：http://www.52im.net/thread-228-1-1.html
實時音視訊技術 = 音視訊處理技術 + 網路傳輸技術的橫向技術應用集合體。
視訊為何需要壓縮？
1.未經壓縮的數字視訊的資料量巨大 2. 儲存困難，一張DVD只能儲存幾秒鐘的未壓縮數字視訊 3. 傳輸困難 1M的頻寬傳輸1秒的數字電視視訊需要大約4分鐘
視訊主要壓縮了什麼？
原始視訊壓縮的目的是去除冗餘資訊，可以去除的包括：
  1.空間冗餘：影象相鄰畫素之間有較強的相關性
2.時間冗餘：視訊序列的相鄰影象之間的內容相似
  3.編碼冗餘：不同畫素值出現的概率不同
  4.視覺冗餘：人的視覺系統對某些細節不敏感
5.知識冗餘：規律性的結構可由先驗知識和背景知識得到
資料壓縮分為:
   無失真壓縮: 壓縮前/解壓縮後圖像完全一致X=X' , 壓縮比低(2:1~3:1), 典型格式例如:Winzip,JPEG-LS
   有失真壓縮: 壓縮前解壓縮後圖像不一致X≠X', 壓縮比高(10:1~20:1), 利用人的視覺系統的特性. 典型格式例如: MPEG-2, H.264/AVC, AVS
編碼器(Encoder): 壓縮訊號的裝置或程式
解碼器(Decoder):解壓縮訊號的裝置或程式
編解碼器(Codec):編解碼器對
編解碼的技術流程和原理

編解碼器的實現平臺:
  超大規模積體電路VLSI
  ASIC, FPGA
  數字訊號處理器DSP
  軟體
編解碼器產品:
  機頂盒數字電視攝像機監控器
視訊編碼標準: 相容不同廠家生產的編碼器壓縮的碼流能夠被不同廠家的加碼器解碼
   標準編解碼器可以進行批量生產,節約成本
主流視訊編碼標準:
(MPEG-2)  (MPEG-4 Simple Profile )    (H.264/AVC) (AVS) (VC-1)
標準化組織 ITU VECG ISO MPEG
視訊傳輸: 通過傳輸系統將壓縮的視訊碼流從ongoing編碼端傳輸到解碼端
傳輸系統: 網際網路地面無線廣播衛星
視訊傳輸面臨的問題:
   傳輸系統不可靠: 頻寬限制訊號衰減噪聲干擾傳輸延遲
   視訊傳輸出現的問題: 不能解碼出正確的視訊視訊播放延遲
視訊傳輸差錯控制: 差錯控制(Error Control) 解決視訊傳輸過程中由於資料丟失或延遲導致的問題
差錯控制技術有: 通道編碼差錯控制技術編碼器差錯恢復解碼器差錯隱藏
視訊傳輸中Qoss質量保證引數: 資料包的端到端的延遲頻寬:位元/秒資料包的流失率資料包的延遲時間的波動
影象是人對視覺感知的物質再現.三維自然場景的物件包括:深度,紋理和亮度資訊. 二維影象: 紋理和亮度資訊.
視訊是連續的影象. 視訊由多幅影象構成,包含物件的運動資訊, 又稱為運動影象.
數字視訊可以理解為自然場景空間和時間的數字取樣表示.
  空間取樣的主要技術指標為: 解析度(Resolution) 畫素(Pixel)
  時間取樣的主要技術指標為: 幀率(幀/秒)
數字視訊系統的構成和執行原理
採集: 照相機攝像機處理: 編解碼器, 傳輸裝置顯示: 顯示器
人類視覺系統HVS的構成:眼睛神經大腦
HVS特點: 對高頻資訊不敏感
   對高對比度更敏感
   對高度資訊比色度資訊更敏感
   對運動的資訊更敏感
針對HVS的特點,數字視訊系統的設計應該考慮的因素:
   丟棄高頻資訊,只編碼低頻資訊
   提高邊緣資訊的主觀質量
   降低色度的解析度
   對感興趣區域(Region of interseting, ROI) 進行特殊處理
  RGB色彩空間: 三原色分別是紅(R), 綠(G),藍(B) ,任何顏色都可以通過按一定比例混合三原色產生
   有RGB三原色組成廣泛用於BMP, TIFF, PPM等每個色度成分通常用8bit表示[0 255]
   YUV色彩空間: Y: 高度分量 UV: 兩個色度分量 YUV能更好的反映HVS特點
   RGB可以轉化到YUV空間,主流的編解碼標準的壓縮物件都是YUV影象
YUV影象可以根據HVS的特點, 對色度進行分量取樣,可以降低視訊資料量
  根據亮度和色度分量的取樣比率,YUV影象通常有以下幾種分量方式: 4:4:4 4:2:2 4:2:0
  根據YUV影象的亮度,解析度定義了幾種影象格式: SQCIF 128*96   QCIF CIF 4CIF SD HD
  如何理解幀和場影象
一幀影象包括兩場如一幀影象分為0 ~ 9行 , 0,2,4,6,8 叫頂場 1,3,5,7,9叫底場
逐行影象是指: 一幀影象的兩場在同一時間得到, ttop = tbot
隔行影象是指: 一幀影象的兩場在不同時間得到, ttop ≠ tbot

iOS學習-即時通訊音視訊(一)之視訊編解碼之理論

iOS學習-即時通訊音視訊(一)之視訊編解碼之理論

即時通訊音視訊開發（一）：視訊編解碼之理論概述

即時通訊音視訊開發（六）：如何開始音訊編解碼技術的學習

即時通訊音視訊開發（四）：視訊編解碼之預測技術介紹

即時通訊音視訊開發（三）：視訊編解碼之編碼基礎

即時通訊音視訊開發（二）：視訊編解碼之數字視訊介紹

即時通訊音視訊開發（十）：實時語音通訊的迴音消除技術詳解

即時通訊音視訊開發（九）：實時語音通訊的迴音及迴音消除概述

即時通訊音視訊開發（八）：常見的實時語音通訊編碼標準

即時通訊音視訊開發（七）：音訊基礎及編碼原理入門

即時通訊音視訊開發（五）：認識主流視訊編碼技術H.264

各種音視訊編解碼學習詳解之編解碼學習筆記（十二）：其他編解碼（M-JPEG，Motion JPEG 2000，DivX）

即時通訊音視訊聊天室開發建議

即時通訊音視訊開發（包含2種NDK環境配置）

Linux學習總結（二十一）正則三劍客之awk

機器學習web服務化實戰：一次吐血的服務化之路

SpringBoot+Netty開發IM即時通訊系列（一）

Netty實戰 IM即時通訊系統（一）IM系統簡介

IM即時通訊專案講解(一)--實現類似qq微信表情面板無縫切換

即時通訊、線上教學、視訊會議——伺服器頻寬計算說明與網路品質測試

iOS學習-即時通訊音視訊(一)之視訊編解碼之理論

相關推薦