1. 程式人生 > >數字視訊相關概念整理

數字視訊相關概念整理

    這些內容,都是百度,google上整理來的,因為專案需要,給自己掃掃盲。。。

1.什麼是"幀"?

在最早的電影裡面,一幅靜止的影象被稱做一"幀(Frame)",影片裡的畫面是每一秒鐘有24幀,為什麼是24幀,這個數字是怎麼來的,因為人類眼睛的視覺暫留現象正好符合每秒24幀的標準,所以用多也沒有意義還會浪費電影膠片,增加成本,所以就是24幀。

2.什麼是"行"?

在我們用的傳統CRT模似電視裡面,一個電子束在水平方向的掃描被稱之為行,或行掃描。

3.什麼是"場"?

在我們用的傳統CRT模似電視裡面,一個行掃描,按垂直的方向掃描被稱之為場,或場掃描。

4. 什麼是NTSC制式?

NTSC(National Television System Committee)制式是1952年由美國國家電視制定委員會制定的彩色電視廣播標準。美國、加拿大、以及中國臺灣、韓國、菲律賓等國家採用的是這種制式。這種制式的彩色頻寬為3.58Mhz,伴音頻寬為6.0Mhz,每秒30幀畫面。

5. 什麼是PAL制式?

PAL(Phase Alternating Line),是1965年制定的電視制,主要應用於中國、香港、中東地區和歐洲一帶。這種制式的彩色頻寬為4.43Mhz伴音頻寬為6.5Mhz,每秒25幀畫面,還有一種是SECAM制式德國地區採用的制式,因為應用比較少,就不多做介紹了。

6. 為何NTSC製為每秒30幀,而PAL制式每秒25幀?

這是因為採用NTSC的國家的市電為110V60HZ,所以電視裡的場頻訊號直接就取樣了交流電源的頻率60HZ,因為兩場組成一幀,所以60除以2等於30正好就是電視的幀數了,而我國的市電為220V50HZ,所以原因同上就是每秒25幀了。

7.什麼是逐行?

電視的每幀畫面是由若干條水平方向的掃描線組成的、PAL製為625行/幀,NTSC製為525行/幀。如果這一幀畫面中所有的行是從上到下一行接一行地連續完成的,或者說掃描順序是1、2、3……525,我們就稱這種掃描方式為逐行掃描。

8.什麼是隔行?

實際上,普通電視的一幀畫面需要由兩遍掃描來完成,第一遍只掃描奇數行,即第l、3、5……525行,第二遍掃描則只掃描偶 數行,即第2、4、6……524行,這種掃描方式就是隔行掃描。一幅只含奇數行或偶數行的畫面稱為一“場(Field)”,其中只含奇數行的場稱為奇數場或前場 (Top Field), 只含偶數行的場稱為偶數場或後場(Bottom Field)。也就是說一個奇數場加上一個偶數場等於一幀(一幅圖象)。

    電視制式

    電視訊號的標準簡稱制式,可以簡單地理解為用來實現電檢視像或聲音訊號所採用的一種技術標準。(一個國家或地區播放節目時所採用的特定製度和技術標準)。

    基帶視訊是一種簡單的模擬訊號,由視訊模擬資料和視訊同步資料構成,用於接收端正確地顯示影象。訊號的細節取決於應用的視訊標準或者"制式"--NTSC(美國全國電視標準委員會,National Television Standards Committee)、PAL(逐行倒相,Phase Alternate Line)以及SECAM(順序傳送與儲存彩色電視系統,法國採用的一種電視制式,SEquential Couleur Avec Memoire)。在PC領域,由於使用的制式不同,存在不相容的情況。就拿解析度來說,有的制式每幀有625線(50Hz),有的則每幀只有525線(60 Hz),後者是北美和日本採用的標準,統稱為NTSC。

PAL電視標準,每秒25幀,電視掃描線為625線,奇場在前,偶場在後,標準的數字化PAL電視標準解析度為    720*576, 24位元的色彩位深,畫面的寬高比為4:3。 

NTSC電視標準,每秒29.97幀(簡化為30幀),電視掃描線為525線,偶場在前,奇場在後,標準的數字化NTSC電視標準解析度為720*486, 24位元的色彩位深,畫面的寬高比為4:3。

這裡補充一下:

畫素比是影象中的一個畫素的寬度與高度之比,而幀縱橫比則是指影象的一幀的寬度與高度之比。如某些D1/DV NTSC影象的幀縱橫比是4:3,但使用方形畫素(1.0畫素比)的是640×480,使用矩形畫素(0.9畫素比)的是720×480。DV基本上使用矩形畫素,在NTSC視訊中是縱向排列的,而在PAL制視訊中是橫向排列的。使用計算機圖形軟體製作生成的影象大多使用方形畫素。 由於計算機產生的影象的畫素比永遠是1:1,而由於電視裝置所產生的視訊影象,就不一定是1:1,如我國的PAL制畫素比就是16:15=1.07。同時,PAL制規定畫面寬高比為4:3。根據寬高比的定義來推算, PAL製圖像解析度應為768*576,這是在畫素為1:1的情況下,可PAL制的解析度為720*576。因此,實際PAL製圖像的畫素比是768:720=16:15=1.07。也就是通過把正方形畫素“拉長”的方法,保證了畫面的4:3的寬高比例。

通常,一個視訊訊號是由一個視訊源生成的,比如攝像機、VCR或者電視調諧器等。為傳輸影象,視訊源首先要生成-個垂直同步訊號(V SYNC)。這個訊號會重設接收端裝置(PC顯示器),保徵新影象從螢幕的頂部開始顯示。發出VSYNC訊號之後,視訊源接著掃描影象的第一行。完成後,視訊源又生成一個水平同步訊號,重設接收端,以便從螢幕左側開始顯示下一行。並針對影象的每一行,都要發出一條掃描線,以及一個水平同步脈衝訊號。

    另外,NTSC標準還規定視訊源每秒鐘需要傳送30幅完整的影象(幀)。假如不作其它處理,閃爍現象會非常嚴重。為解決這個問題,每幀又被均分為兩部分,每部分2 62.5行。一部分全是奇數行,另一部分則全是偶數行。顯示的時候,先掃描奇數行,再掃描偶數行,就可以有效地改善影象顯示的穩定性,減少閃爍。目前世界上彩色電視主要有三種制式,即N TSC、PAL和SECAM制式,三種制式目前尚無法統一。中國大部分地區使用PAL制式,日本、韓國及東南亞地區與美國等歐美國家使用NTSC制式,俄羅斯則使用SECAM制式。中國內市場上買到的正式進口的DV產品都是PAL制式。制式的區分主要在於其幀頻(場頻)的不同、分解率的不同、訊號頻寬以及載頻的不同、色彩空間的轉換關係不同等等。 具體詳細內容,請看http://baike.baidu.com/view/6053.htm

    數字視訊

    數字視訊就是先用攝像機之類的視訊捕捉裝置,將外界影像的顏色和亮度資訊轉變為電訊號,再記錄到儲存介質(如錄影帶)。這要用到模擬視訊的數字化。模擬視訊的數字化包括不少技術問題,如電視訊號具有不同的制式而且採用複合的YUV訊號方式,而計算機工作在RGB空間;電視機是隔行掃描,計算機顯示器大多逐行掃描;電檢視像的解析度與顯示器的解析度也不盡相同等等。因此,模擬視訊的數字化主要包括色彩空間的轉換、光柵掃描的轉換以及解析度的統一。

模擬視訊一般採用分量數字化方式,先把複合視訊訊號中的亮度和色度分離,得到YUV或YIQ分量,然後用三個模/數轉換器對三個分量分別進行數字化,最後再轉換成RGB空間。     取樣     根據電視訊號的特徵,亮度訊號的頻寬是色度訊號頻寬的兩倍。因此其數字化時可採用幅色取樣法,即對訊號的色差分量的取樣率低於對亮度分量的取樣率。用Y:U:V來表示YUV三分量的取樣比例,則數字視訊的取樣格式分別有4:2:0,4:1:1、4:2:2和4:4:4多種。電檢視像既是空間的函式,也是時間的函式,而且又是隔行掃描式,所以其取樣方式比掃描器掃描影象的方式要複雜得多。分量取樣時採到的是隔行樣本點,要把隔行樣本組合成逐行樣本,然後進行樣本點的量化,YUV到RGB色彩空間的轉換等等,最後才能得到數字視訊資料.     為了在PAL、NTSC和 SECAM電視制式之間確定共同的數字化引數,國家無線電諮詢委員會(CCIR)制定了廣播級質量的數字電視編碼標準,稱為CCIR 601標準。在該標準中,對取樣頻率、取樣結構、色彩空間轉換等都作了嚴格的規定,主要有: 1、取樣頻率為f s=13.5MHz 2、解析度與幀率 3、根據f s的取樣率,在不同的取樣格式下計算出數字視訊的資料量: 這種未壓縮的數字視訊資料量對於目前的計算機和網路來說無論是儲存或傳輸都是不現實的,因此在多媒體中應用數字視訊的關鍵問題是數字視訊的壓縮技術。     SMPTE表示單位     通常用時間碼來識別和記錄視訊資料流中的每一幀,從一段視訊的起始幀到終止幀,其間的每一幀都有一個唯一的時間碼地址。根據動畫和電視工程師協會SMPTE(Society of Motion Picture and Television Engineers)使用的時間碼標準,其格式是:小時:分鐘:秒:幀,或 hours:minutes:seconds:frames。一段長度為00:02:31:15的視訊片段的播放時間為2分鐘31秒15幀,如果以每秒30幀的速率播放,則播放時間為2分鐘31.5秒。     根據電影、錄影和電視工業中使用的幀率的不同,各有其對應的SMPTE標準。由於技術的原因NTSC制式實際使用的幀率是29.97fps而不是30fps,因此在時間碼與實際播放時間之間有0.1%的誤差。為了解決這個誤差問題,設計出丟幀(drop-frame)格式,也即在播放時每分鐘要丟2幀(實際上是有兩幀不顯示而不是從檔案中刪除),這樣可以保證時間碼與實際播放時間的一致。與丟幀格式對應的是不丟幀(nondrop-frame)格式,它忽略時間碼與實際播放幀之間的誤差。     視訊壓縮 由於視訊是連續的靜態影象,因此其壓縮編碼演算法與靜態影象的壓縮編碼演算法有某些共同之處,但是運動的視訊還有其自身的特性,因此在壓縮時還應考慮其運動特性才能達到高壓縮的目標。在視訊壓縮中常需用到以下的一些基本概念:     1>.有損和無失真壓縮 視訊壓縮中有損(Lossy )和無損(Lossless)的概念與靜態影象中基本類似。無失真壓縮也即壓縮前和解壓縮後的資料完全一致。多數的無失真壓縮都採用RLE行程編碼演算法。有失真壓縮意味著解壓縮後的資料與壓縮前的資料不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的影象或音訊資訊,而且丟失的資訊不可恢復。幾乎所有高壓縮的演算法都採用有失真壓縮,這樣才能達到低資料率的目標。丟失的資料率與壓縮比有關,壓縮比越小,丟失的資料越多,解壓縮後的效果一般越差。此外,某些有失真壓縮演算法採用多次重複壓縮的方式,這樣還會引起額外的資料丟失。     2>.幀內和幀間壓縮     幀內(Intraframe)壓縮也稱為空間壓縮(Spatial compression)。當壓縮一幀影象時,僅考慮本幀的資料而不考慮相鄰幀之間的冗餘資訊,這實際上與靜態影象壓縮類似。幀內一般採用有失真壓縮演算法,由於幀內壓縮時各個幀之間沒有相互關係,所以壓縮後的視訊資料仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。採用幀間(Interframe)壓縮是基於許多視訊或動畫的連續前後兩幀具有很大的相關性,或者說前後兩幀資訊變化很小的特點。也即連續的視訊其相鄰幀之間具有冗餘資訊,根據這一特性,壓縮相鄰幀之間的冗餘量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporal compression),它通過比較時間軸上不同幀之間的資料進行壓縮。幀間壓縮一般是無損的。幀差值(Frame differencing)演算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少資料量。     3>.對稱和不對稱編碼     對稱性(symmetric)是壓縮編碼的一個關鍵特徵。對稱意味著壓縮和解壓縮佔用相同的計算處理能力和時間,對稱演算法適合於實時壓縮和傳送視訊,如視訊會議應用就以採用對稱的壓縮編碼演算法為好。而在電子出版和其它多媒體應用中,一般是把視訊預先壓縮處理好,爾後再播放,因此可以採用不對稱(asymmetric)編碼。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視訊的時間比回放(解壓縮)該視訊的時間要多得多。例如,壓縮一段三分鐘的視訊片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有三分鐘。     位速說明     位速是指在一個數據流中每秒鐘能通過的資訊量。您可能看到過音訊檔案用 “128–Kbps MP3” 或 “64–Kbps WMA” 進行描述的情形。Kbps 表示 “每秒千位元數”,因此數值越大表示資料越多:128–Kbps MP3 音訊檔案包含的資料量是 64–Kbps WMA 檔案的兩倍,並佔用兩倍的空間。(不過在這種情況下,這兩種檔案聽起來沒什麼兩樣。原因是什麼呢?有些檔案格式比其他檔案能夠更有效地利用資料,64–Kbps WMA 檔案的音質與 128–Kbps MP3 的音質相同。)需要了解的重要一點是,位速越高,資訊量越大,對這些資訊進行解碼的處理量就越大,檔案需要佔用的空間也就越多。     為專案選擇適當的位速取決於播放目標:如果您想把製作的 VCD 放在 DVD 播放器上播放,那麼視訊必須是 1150 Kbps,音訊必須是 224 Kbps。典型的 206 MHz Pocket PC 支援的 MPEG 視訊可達到 400 Kbps—超過這個限度播放時就會出現異常。     格式 MPEG-1 用於傳輸1.5Mbps資料傳輸率的數字儲存媒體運動影象及其伴音的編碼,經過MPEG-1標準壓縮後,視訊資料壓縮率為1/100-1/2 00,音訊壓縮率為1/6.5。MPEG-1提供每秒30幀352*240解析度的影象,當使用合適的壓縮技術時,具有接近家用視訊制式(VHS)錄影帶的質量。MPEG-1允許超過70分鐘的高質量的視訊和音訊儲存在一張CD-ROM盤上。VCD採用的就是MPEG-1的標準,該標準是一個面向家庭電視質量級的視訊、音訊壓縮標準。     MPEG-2     主要針對高清晰度電視(HDTV)的需要,傳輸速率為10Mbps,與MPEG-1相容,適用於1.5-60Mbps甚至更高的編碼範圍。MPEG-2有每秒30幀704*480的解析度,是MPEG-1播放速度的四倍。它適用於高要求的廣播和娛樂應用程式,如:DSS衛星廣播和DVD,MPEG-2是家用視訊制式(VHS)錄影帶解析度的兩倍。     DAC     即數/模轉裝換器,一種將數字訊號轉換成模擬訊號的裝置。DAC的位數越高,訊號失真就越小。影象也更清晰穩定。     AVI AVI是將語音和影像同步組合在一起的檔案格式。它對視訊檔案採用了一種有失真壓縮方式,但壓縮比較高,因此儘管面面質量不是太好,但其應用範圍仍然非常廣泛。AVI支援256色和RLE壓縮。AVI資訊主要應用在多媒體光碟上,用來儲存電視、電影等各種影像資訊。     RGB     對一種顏色進行編碼的方法統稱為“顏色空間”或“色域”。“顏色空間”都可定義成一個固定的數字或變數。RGB(紅、綠、藍)只是眾多顏色空間的一種。採用這種編碼方法,每種顏色都可用三個變數來表示-紅色綠色以及藍色的強度。記錄及顯示彩色影象時,R GB是最常見的一種方案。但是,它缺乏與早期黑白顯示系統的良好相容性。因此,件多電子電器廠商普遍採用的做法是,將RGB轉換成YUV 顏色空間,以維持相容,再根據需要換回RGB格式,以便在電腦顯示器上顯示彩色圖形。     YUV    YUV(亦稱YCrCb)是被歐洲電視系統所採用的一種顏色編碼方法(屬於PAL)。YUV主要用於優化彩色視訊訊號的傳輸,使其向後相容老式黑白電視。與RGB視訊訊號傳輸相比,它最大的優點在於只需佔用極少的頻寬(RGB要求三個獨立的視訊訊號同時傳輸)。其中“Y”表示明亮度(Lumina nce或Luma),也就是灰階值;而“U”和“V”表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用於指定畫素的顏色。亮度Y,通過RGB輸入訊號來建立的,方法是將RGB訊號的特定部分疊加到一起。“色度”則定義了顏色的兩個方面-色調與飽和度,分別用Cr和Cb來表示。其中,Cr反映了RGB輸入訊號紅色部分R與RGB訊號亮度值Y之間的差異。而Cb反映的是RGB輸入訊號藍色部分B與RGB訊號亮度值Y之同的差異。即Y,R-Y,B-Y.這就是所謂的色差訊號,或者叫分量訊號。     YIQ     是 NTSC(National Television Standards Committee)電視系統標準。Y 是提供黑白電視彩色電視的亮度訊號(Luminance),即亮度(Brightness),I 代表In-phase,色彩從橙色到青色,Q 代表Quadrature-phase,色彩從紫色到黃綠色。     複合視訊和S-Video     NTSC和PAL彩色視訊訊號是這樣構成的--首先有一個基本的黑白視訊訊號,然後在每個水平同步脈衝之後,加入一個顏色脈衝和一個亮度訊號。因為彩色訊號是由多種資料“疊加”起來的,故稱之為“複合視訊”。S -Video則是一種訊號質量更高的視訊介面,它取消了訊號疊加的方法,可有效避免一些無謂的質量損失。它的功能是將RGB三原色和亮度進行分離處理。     Ultrascale     Ultra6cale是Rockwell(洛克威爾)採用的一種掃描轉換技術。可對垂直和水平方向的顯示進行任意縮放。在電視這樣的隔行掃描裝置上顯示逐行視訊時,整個過程本身就己非常麻煩。而採用 UltraScale技木,甚至還能像在電腦顯示器上那祥,進行類似的縱橫方向自由伸縮。     YUV和YCbCr     YCbCr是DVD、攝像機、數字電視等消費類視訊產品中,常用的色彩編碼方案。YCbCr 有時會稱為 YCC.。Y'CbCr 在模擬分量視訊(analog component video)中也常被稱為 YPbPr。YCbCr不是一種絕對色彩空間,是YUV壓縮和偏移的版本。     正如幾何上用座標空間來描述座標集合,色彩空間用數學方式來描述顏色集合。常見的3 個基本色彩模型是RGB,CMYKYUV。     YCbCr 則是在世界數字組織視訊標準研製過程中作為ITU - R BT1601 建議的一部分,其實是YUV經過縮放和偏移的翻版。其中Y與YUV 中的Y含義一致,Cb,Cr 同樣都指色彩,只是在表示方法上不同而已。YUV 和 Y、Cr、Cb對於數位電路而言:YUV 和 Y、Cr、Cb只是相差128YUV沒有負值,Y、Cr、Cb最高位為符號位,U = Cr + 128V = Cb +128。     在YUV 家族中,YCbCr 是在計算機系統中應用最多的成員,其應用領域很廣泛,JPEGMPEG均採用此格式。一般人們所講的YUV大多是指YCbCr。     YUV主要取樣格式     人的肉眼對視訊的Y分量更敏感,因此在通過對色度分量進行子取樣來減少色度分量後,肉眼將察覺不到的影象質量的變化。主要的取樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用,其含義為:每個點儲存一個 8bit 的亮度值(也就是Y值),每 2x2 個點儲存一個 Cr 和Cb 值,影象在肉眼中的感覺不會起太大的變化。所以,原來用 RGB(R,G,B 都是 8bit unsigned) 模型,每個點需要 8x3=24 bits.而現在僅需要 8+(8/4)+(8/4)=12bites,平均每個點佔12bites。這樣就把影象資料壓縮了一半。     4:2:0表示每4個畫素有4個亮度分量,2個色度分量 (YYYYCbCr),僅取樣奇數掃描線,是行動式視訊裝置(MPEG-4)以及電視會議(H.263)最常用格式;4:2:2表示每4個畫素有4個亮度分量,4個色度分量(YYYYCbCrCbCr),是DVD、數字電視、HDTV 以及其它消費類視訊裝置的最常用格式;4:4:4表示全畫素點陣(YYYYCbCrCbCrCbCrCbCr),用於高質量視訊應用、演播室以及專業視訊產品。具體取樣格式的區別請看http://liufan5005.blog.163.com/blog/static/267101732010024490231/     YCbCr與RGB的相互轉換     Y=0.299R+0.587G+0.114B     Cb=0.564(B-Y)     Cr=0.713(R-Y)     R=Y+1.402Cr     G=Y-0.344Cb-0.714Cr     B=Y+1.772Cb

色度學概念:

亮度:

實際調整的是訊號的偏置(offset),也就是直流電平。在數字領域裡就是加上或減去一個值。然後在螢幕上就能看到亮暗的變化。
比如未經處理的訊號範圍是0-255,增加亮度40,那就新的範圍就是40-255。在模擬電視中不會被截掉,既便高度調到很高,也可以分辨。而在LCD中,超出255會被截掉,導致“白成一片”。

對比度:

影象的對比度黑白分明。對比度越高越好,表示白的越白,黑的越黑。越能體現真實的場景。
動態對比度:通過調製背光或者影象內容來達到更高的對比度值。
在暗的場景的時候如果降低背光,能得到更低的黑對應亮度值。
在亮的場景的亮度值除以此時黑的亮度值,就能得到更高的對比度。

色溫:

一般都使用CA-210的儀器來調整色溫。比如紅色有很多種,怎樣知道再現的紅色是真正的呢?
色溫就是體現顏色是否正確的指標。
在不同亮度等級應該有相同的色溫。
在不同的機器上應該有相同的色溫。

色調:

在技術上說,色調指的是顏色的波長。
比如說紅色,在同樣相同的波長下,低飽和度的時候顯示出來是棕色。高飽和度下是大紅色。高亮度值的時候是粉紅色。但是,它們都是相同波長的紅光。
飽和度:

指的是色彩的純度,純度越高表現越鮮明,純度較低表現則較黯淡。如果RGB三原色越鮮豔,那麼顯示器可以表示的顏色範圍就越廣。提高色彩飽和度的方法是提高背光亮度和液晶的透光度,這需要廠商更高的技術和成本

伽馬:

攝像機和顯示裝置都 不是線性的。在顯示裝置中,在訊號幅度小的時候的改變導致的影象上的改變和訊號幅度大的時候導致的改變是不相等的。
這種非線性處理就稱作伽馬。一般採用2.2係數。

伽馬矯正:

在顯示的時候,純屬的GRB訊號必須經過伽馬校正後在非線性的顯示裝置中才能得到最終純屬的影象顯示。
所有CRT的伽馬係數是固定的。
而平板的伽馬係數可能因為不同公司的產品而不同。