1. 程式人生 > >Y U V與Y,Cb,Cr有什麼區別

Y U V與Y,Cb,Cr有什麼區別

從技術上角度區分,顏色空間可考慮分成如下三類: 

ØRGB 型顏色空間/計算機圖形顏色空間:這類模型主要用於電視機和計算機的顏色顯示系統。例如,RGB,HSI, HSL和HSV等顏色空間。 

ØXYZ 型顏色空間/CIE顏色空間:這類顏色空間是由國際照明委員會定義的顏色空間,通常作為國際性的顏色空間標準,用作顏色的基本度量方法。例如,CIE 1931 XYZ,L*a*b,L*u*v和LCH等顏色空間就可作為過渡性的轉換空間。 

Ø YUV型顏色空間/電視系統顏色空間:由廣播電視需求的推動而開發的顏色空間,主要目的是通過壓縮色度資訊以有效地播送彩色電視影象。例 如,YUV,YIQ,ITU-R BT.601 Y'CbCr, ITU-R BT.709 Y'CbCr和SMPTE-240M Y'PbPr等顏色空間。


4顏色空間的轉換

不同顏色可以通過一定的數學關係相互轉換: 

Ø有些顏色空間之間可以直接變換。例如,RGB和HSL,RGB和 HSB,RGB和R'G'B', R'G'B'和Y'CrCb,CIE XYZ和CIE L*a*b*等。 

Ø有些顏色空間之間不能直接變換。例如,RGB 和CIE La*b*, CIE XYZ和HSL,HSL和Y'CbCr等,它們之間的變換需要藉助其他顏色空間進行過渡。 

R'G'B'和Y'CbCr兩個彩色空間之間的轉換關係用 下式表示: 

Y = 0.299R + 0.587G + 0.114B 

Cr = (0.500R - 0.4187G - 0.0813B) + 128 


Cb = (-0.1687R - 0.3313G + 0.500B) + 128

二、彩色電視的制式及其顏色空間 

1、彩色電視制式 

目前世界上現行的彩色電視制式有三種:NTSC 制、PAL制和SECAM制。這裡不包括高清晰度彩色電視HDTV (High-Definition television)。 

NTSC(National Television Systems Committee)彩色電視制是1952年美國國家電視標準委員會定義的彩色電視廣播標準,稱為正交平衡調幅制。美國、 加拿大等大部分西半球國家,以及日本、韓國、菲律賓等國和中國的臺灣採用這種制式。 

NTSC彩色電視制的主要特性是:

  (1) 525行/幀, 30幀/秒(29.97 fps, 33.37 ms/frame)  (2) 高寬比:電視畫面的長寬比(電視為4:3;電影為3:2;高清晰度電視為16:9)  (3) 隔行掃描,一幀分成2場(field),262.5線/場  (4) 在每場的開始部分保留20掃描線作為控制資訊,因此只有485條線的可視資料。Laser disc約~420線,S-VHS約~320線  (5) 每行63.5微秒,水平回掃時間10微秒(包含5微秒的水平同步脈衝),所以顯示時間是53.5微秒。  (6) 顏色模型:YIQ  一幀影象的總行數為525行,分兩場掃描。行掃描頻率為15 750 Hz, 週期為63.5μs;場掃描頻率是60 Hz,週期為16.67 ms;幀頻是30 Hz,週期33.33 ms。每一場的掃描行數為525/2=262.5行。除了兩場的場回掃外,實際傳送影象的行數為480行。 

由於NTSC制存在相位敏感造成彩色失真的缺 點,因此德國(當時的西德)於1962年制定了PAL(Phase-Alternative Line)制彩色電視廣播標準,稱為逐行倒相正交平衡 調幅制。德國、英國等一些西歐國家,以及中國、朝鮮等國家採用這種制式。 

PAL電視制的主要掃描特性是  (1) 625行(掃描線)/幀,25幀/秒(40 ms/幀)  (2) 長寬比(aspect ratio):4:3  (3) 隔行掃描,2場/幀,312.5行/場  (4) 顏色模型:YUV法國制定了SECAM (法文:Sequential Coleur Avec Memoire)彩色電視廣播標準,稱為順序傳送 彩色與儲存制。法國、蘇聯及東歐國家採用這種制式。世界上約有65個地區和國家試驗這種制式。 

這種制式與PAL制類似,其差別是SECAM 中的色度訊號是頻率調製(FM),而且它的兩個色差訊號:紅色差(R'-Y')和藍色差(B'-Y')訊號是按行的順序傳輸的。法國、俄羅斯、東歐和中東 等約有65個地區和國家使用這種制式,影象格式為4:3,625線,50 Hz,6 MHz電視訊號頻寬,總頻寬8 MHz。 

2、彩色電視的顏色空間 

在彩色電視中,用Y、C1, C2彩色表示法分別表示亮度訊號和兩個色差訊號,C1,C2的含義與具體的應用有關。在NTSC彩色電視制中,C1,C2分別表示I、Q兩個色差訊號;在 PAL彩色電視制中,C1,C2分別表示U、V兩個色差訊號;在CCIR 601數字電視標準中,C1,C2分別表示Cr,Cb兩個色差訊號。所謂色差是指基色訊號中的三個分量訊號(即R、G、B)與亮度訊號之差。 

NTSC的YIQ顏色空間與RGB顏色空間的轉換關係如 下: 

Y=0.30R+0.59G+0.11B 

I=0.74(R-Y)-0.27(B-Y) =  0.60R+0.28G+0.32B 

Q=0.48(R-Y)-0.27(B-Y) =  0.21R+0.52G+0.31B 

PAL的YUV顏色空間與RGB顏色空間的轉換關係如下: 

Y=0.30R+0.59G+0.11B 

U=0.493(B-Y) = -0.15R-0.29G+0.44B 

Q=0.877(R-Y) =  0.62R-0.52G-0.10B 

三、視訊影象取樣 

模擬視訊的數字化包括不少技術問題,如電視訊號具有不同的制式而且採用複合的YUV訊號方式,而計算機工作在RGB空間;電視機是隔行掃描,計算機顯示器大多逐行掃描;電檢視像的解析度與顯示器的解析度 也不盡相同等等。因此,模擬視訊的數字化主要包括色彩空間的轉換、光柵掃描的轉換以及解析度的統一。 

模擬視訊一般採用分量數字化方式,先把複合視訊訊號中的亮度和色度分離,得到YUV或YIQ分量,然後用三個模/數轉換器對三個分量分別取樣並進行數字化,最後再轉換成RGB空間。 

1、影象子取樣 

對彩色電視影象進行取樣時,可以採用兩種取樣方法。一種是使用相同的取樣頻率對影象的 亮度訊號(Y)和色差訊號(Cr,Cb)進行取樣,另一種是對亮度訊號和色差訊號分別採用不同的取樣頻率進行採 樣。如果對色差訊號使用的取樣頻率比對亮度訊號使用的取樣頻率低,這種取樣就稱為影象子取樣(subsampling)。由於人的視覺對亮度訊號的敏感度 高於對色差的敏感度,這樣做利用人的視覺特性來節省訊號的頻寬和功率,通過選擇合適的顏色模型,可以使兩個色差訊號所佔的頻寬明顯低於Y的頻寬,而又不明 顯影響重顯彩色影象的觀看。 

目前使用的子取樣格式有如下幾種:  (1) 4:4:4 這種取樣格式不是子取樣格式,它是指在每條掃描線上每4個連續的取樣點取4個亮度Y樣本、4個紅色差Cr樣本和4個藍色差Cb樣本,這就相當於每個畫素用 3個樣本表示。
  (2) 4:2:2 這種子取樣格式是指在每條掃描線上每4個連續的取樣點取4個亮度Y樣本、2個紅色差Cr樣本和2個藍色差Cb樣本,平均每個畫素用2個樣本表示。
  (3) 4:1:1 這種子取樣格式是指在每條掃描線上每4個連續的取樣點取4個亮度Y樣本、1個紅色差Cr樣本和1個藍色差Cb樣本,平均每個畫素用1.5個樣本表示。
  (4) 4:2:0 這種子取樣格式是指在水平和垂直方 向上每2個連續的取樣點上取2個亮度Y樣本、1個紅色差Cr樣本和1個藍色差Cb樣本,平均每個畫素用1.5個樣 本表示。 

2、CIF、QCIF和SQCIF格式

為了既可用625行的電檢視像又可用525行 的電檢視像,CCITT規定了稱為公用中解析度格式CIF(Common Intermediate Format),1/4公用中解析度格式(Quarter-CIF,QCIF)和(Sub-Quarter Common Intermediate Format,SQCIF)格式對電檢視像進行取樣。 

CIF格式具有如下特性: 

(1)電檢視像的空間解析度為家用錄影 系統(Video Home System,VHS)的解析度,即352×288。 

(2)使用非隔行掃描(non-interlaced scan)。 

(3)使用NTSC幀速率,電檢視像的最大幀速率為30 000/1001≈29.97幅/秒。 

(4)使用1/2的PAL水平解析度,即288線。 

(5)對亮度和兩個色差訊號(Y、Cb和Cr)分量分別進行編碼,它們的取值範圍同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等於240,最小值等於16。 

下面為5 CIF 圖 像格式的引數說明。引數次序為圖象格式亮度取樣的象素個數(dx) 亮度取樣的行數 (dy) 色度取樣的象素個數(dx/2) 色度取樣的行數(dy/2)”

sub-QCIF 128      96     64     48 

QCIF        176   144     88     72 

CIF           352   288   176   144 

4CIF         704   576   352   288

16CIF    1408  1152  704   576 

H.263數字視訊壓縮

一、視訊壓縮編碼的基本概念

視訊壓縮的目標是在儘可能保證視覺效果的前提下減少視訊資料率。視訊壓縮比一般指壓縮後的資料量與壓縮前的資料量之比。

在視訊壓縮中常需用到以下的一些基本概念:

有損和無失真壓縮:在視訊壓縮中有損(Lossy )和無損(Lossless)的概念與靜態影象中基本類似。 無失真壓縮也即壓縮前和解壓縮後的資料完全一致。有失真壓縮意味著解壓縮後的資料與壓縮前的資料不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的影象或 音訊資訊,而且丟失的資訊不可恢復。丟失的資料率與壓縮比有關,壓縮比越小,丟失的資料越多,解壓縮後的效果一般越差。此外,某些有失真壓縮演算法採用多次重 復壓縮的方式,這樣還會引起額外的資料丟失。

幀內和幀間壓縮:幀內(Intraframe)壓縮也稱為空間壓縮(Spatial compression)。當壓縮一幀影象時,僅考慮本幀的資料而不考慮相鄰幀之間的冗餘資訊,這實際上與靜態影象壓縮類似。幀內壓縮一般 達不到很高的壓縮。

    採用幀間(Interframe)壓縮是基於許多視訊或動畫的連 續前後兩幀具有很大的相關性,或者說前後兩幀資訊變化很小的特點。也即連續的視訊其相鄰幀之間具有冗餘資訊,根據這一特性,壓縮相鄰幀之間的冗餘量就可以 進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporal compression),它通過比較時間軸上不同幀之間的資料進行壓縮。幀間壓縮一般是無損 的。

    3 對稱和不對稱編碼:對稱性(symmetric)是壓縮編碼的一個關鍵特徵。對稱意味著壓縮和解壓縮佔用相同的計算處理能力和時間, 對稱演算法適合於實時壓縮和傳送視訊,如視訊會議應用就以採用對稱的壓縮編碼演算法為好。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮 時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視訊的時間比回放(解壓縮)該視訊的時間要多得多。

二、H.263壓縮編碼格式

1 H.263壓縮編碼格式

        H.263 視訊編碼標準是專為中高質量運動 影象壓縮所設計的低位元速率影象壓縮標準。H.263 採用運動視訊編碼中常見的編碼方法,將編碼過程分為幀內編碼和幀間編碼兩個部分。I幀內用改進的DCT 變換並量化,在幀間採用1/2 象素運動向量預測補償技術,使運動 補償更加精確,量化後適用改進的變長編碼表(VLC)地量化資料進行熵編碼,得到最終的編碼係數。