1. 程式人生 > >I2S音訊匯流排學習(一)數字音訊技術

I2S音訊匯流排學習(一)數字音訊技術

               

IIS音訊匯流排學習(一)數字音訊技術

一、聲音的基本概念

    聲音是通過一定介質傳播的連續的波。圖1 聲波重要指標:
  1. 振幅:音量的大小
  2. 週期:重複出現的時間間隔
  3. 頻率:指訊號每秒鐘變化的次數
聲音按頻率分類:圖2 聲音的頻率(語音訊號頻率範圍:300Hz-3kHz)聲音的傳播攜帶了資訊,它是人類傳播資訊的一種主要媒體。 聲音的三種類型:
  1. 波形聲音:包含了所有聲音形式
  2. 語音:不僅是波形聲音,而且還有豐富的語言內涵(抽象→提取特徵→意義理解)
  3.  音樂:與語音相比,形式更規範。音樂是符號化的聲音。

二、聲音的數字化

1.聲音訊號的型別

  • 模擬訊號(自然界、物理)
  • 數字訊號(計算機)

2.聲音數字化過程

圖3 聲音數字化過程

3.聲音數字化過程示意圖

圖4 聲音數字化過程示意圖

4.聲音數字化三要素

取樣頻率

量化位數

聲道數

每秒鐘抽取聲波幅度樣本的次數

每個取樣點用多少二進位制位表示資料範圍

使用聲音通道的個數

取樣頻率越高

聲音質量越好

資料量也越大

量化位數越多

音質越好

資料量也越大

立體聲比單聲道的表現力豐富,但資料量翻倍

11.025kHz

22.05 kHz

44.1  kHz

8位=256

16位=65536

單聲道

立體聲

5.聲音數字化的資料量

音訊資料量=取樣頻率×量化位數×聲道數/8(位元組/秒)

取樣頻率

(kHz)

量化位數

(bit)

資料量(KB/s)

單聲道

立體聲

11.025

8

10.77

21.35

16

21.53

43.07

22.05

8

21.53

43.07

16

43.07

86.13

44.1

8

43.07

86.13

16

86.13

172.27

三、音訊的檔案格式

1.WAV檔案

WAV是Microsoft/IBM共同開發的PC波形檔案。因未經壓縮,檔案資料量很大。特點:聲音層次豐富,還原音質好

2.MP3檔案

MP3(MPEG Audio layer3)是一種按MPEG標準的音訊壓縮技術製作的音訊檔案。特點:高壓縮比(11:1),優美音質

3.WMA檔案

WMA(Windows Media Audio)是Windows Media格式中的一個子集(音訊格式)。特點:壓縮到MP3一半

4.MIDI檔案

MIDI(樂器數字介面)是由一組聲音或樂器符號的集合。特點:資料量很小,缺乏重現自然音

四、數字音訊壓縮標準

1.音訊壓縮方法概述

圖5 壓縮編碼技術是指用某種方法使數字化資訊的編位元速率降低的技術

音訊訊號能壓縮的基本依據:

①聲音訊號中存在大量的冗餘度;②人的聽覺具有強音能抑制同時存在的弱音現象。

音訊訊號壓縮編碼的分類:

①無失真壓縮(熵編碼)霍夫曼編碼、算術編碼、行程編碼②有失真壓縮波形編碼--PCM、DPCM、ADPCM 、子帶編碼、向量量化引數編碼--LPC混合編碼--MPLPC、CELP

2.音訊壓縮技術標準

分類

標準

說明

電話語

音質量

G.711

取樣8kHz,量化8bit,位元速率64kbps

G.721

採用ADPCM編碼,位元速率32kbps

G.723

採用ADPCM有失真壓縮,位元速率24kbps

G.728

採用LD-CELP壓縮技術,位元速率16kbps

調幅廣

播質量

G.722

取樣16kHz,量化14bit,位元速率224(64)kbps

高保真

立體聲

MPEG

音訊

取樣44.1kHz,量化16bit,位元速率705kbps (MPEG三個壓縮層次,384-64kbps)

五、音效卡

1.音效卡的主要功能

音效卡是負責錄音、播音和聲音合成的一種多媒體板卡。其功能包括:①錄製、編輯和回放數字音訊檔案②控制和混合各聲源的音量③記錄和回放時進行壓縮和解壓縮④語音合成技術(朗讀文字)⑤具有MIDI介面(樂器數字介面)

2.晶片型別

  • CODEC晶片(依賴CPU,價格便宜)
  • 數字訊號處理器DSP(不依賴CPU)