1. 程式人生 > >淺談視音訊

淺談視音訊

一、三基色原理和混色

1、三基色原理:

(1)互逆性:自然界中任何顏色都可以通過三基色進行混合得到。反過來,三基色也可以組成幾乎所有顏色(因為三基色具有獨立性,無法被合成)。

(2)獨立性:三基色中任何一種都無法由其餘兩種合成。

(3)混合性:三基色比例不同,最終混合色的色調和飽和度也不同。

(4)疊加性:混合色的亮度等於三基色亮度之和。

2、混色法:

將三基色按一定比例混合在一起得到彩色的方法。

如圖1所示為三基色混色圖


圖1

點選這裡檢視三基色調配公式

二、亮度方程

Y=0.3R+0.59G+0.11B

其中Y表示混合色的亮度,RGB分別表示紅綠藍三種光線的亮度。

當RGB都等於1時,混合色為白色,亮度最亮。當RGB都相等且小於1時,混合色為灰色。當RGB都等於0時,混合色為黑色。當RGB都小於1大於0時,混合色為彩色,Y表示彩色的亮度。

三、RGB轉YUV

RGB和YUV都是色彩空間,它們也可以互相轉換。因為採用YUV格式進行資料傳輸可以有效的減少傳數頻寬和資料傳輸量,所以國際電信聯盟規定,電視訊號在傳輸前必須進行色彩空間的轉換。當然YUV還有相容黑白電視機的特點。詳細介紹請點選這裡!

RGB轉YUV公式如下:

YUV和RGB相互轉換的公式如下:

(RGB取值範圍均為0到255)

Y=0.299R+0.577G+0.114B

U=-0.147R-0.289G+0.436B

V=0.615R-0.515G-0.1B


R=Y+1.14V

G=Y-0.39U-0.58V

B=Y+2.03U

四、WAV介紹

WAV(Waveform audio format)是微軟與IBM公司所開發的一種聲音編碼格式,它符合RIFF(Resource Interchange File Format)檔案規範,用於儲存Windows平臺的音訊資訊資源,被Windows平臺及其應用程式所廣泛支援,也是其音樂發燒友中常用的指定規格之一。由於此音訊格式未經過壓縮,所以在音質方面不會出現失真的情況,但檔案的體積因而在眾多音訊格式中較為大。該格式支援多種音訊數字,取樣頻率和聲道,標準格式化的WAV檔案和CD格式一樣,也是44.1K的取樣頻率,16位量化數字,因此在聲音檔案質量和CD相差無幾!每個WAVE檔案的頭四個位元組便是“RIFF”。WAVE檔案由檔案頭和資料體兩大部分組成。其中檔案頭又分為RIFF/WAV檔案標識段和聲音資料格式說明段兩部分。WAVE檔案各部分內容及格式見下表。


常見的聲音檔案主要有兩種,分別對應於單聲道(11.025KHz取樣率、8Bit的取樣值)和雙聲道(44.1KHz取樣率、16Bit的取樣值)。取樣率是指:聲音訊號在“模→數”轉換過程中單位時間內取樣的次數。取樣值是指每一次取樣週期內聲音模擬訊號的積分值。   對於單聲道聲音檔案,取樣資料為八位的短整數(short int 00H-FFH);而對於雙聲道立體聲聲音檔案,每次取樣資料為一個16位的整數(int),高八位和低八位分別代表左右兩個聲道。 
WAVE檔案資料塊包含以脈衝編碼調製(PCM)格式表示的樣本。WAVE檔案是由樣本組織而成的。在單聲道WAVE檔案中,聲道0代表左聲道,聲道1代表右聲道。在多聲道WAVE檔案中,樣本是交替出現的。

 PCM資料的存放方式:   樣本1 樣本2 
8位單聲道 0聲道 0聲道 
8位立體聲 0聲道(左) 1聲道(右) 0聲道(左) 1聲道(右) 16位單聲道 0聲道低位元組 0聲道高位元組 0聲道低位元組 0聲道高位元組 
16位立體聲 0聲道(左)低位元組 0聲道(左)高位元組 1聲道(右)低位元組 1聲道(右) 高位元組