1. 程式人生 > >音訊處理入門筆記

音訊處理入門筆記

ES: Echo Suppresion 

EES: Enhanced Echo Suppresion

AEC: Acoustic Echo Cancellation 聲學回聲消除。在一般的VOIP軟體或視訊會議系統中,假設我們只有A和B兩個人在通話,首先,A的聲音傳給B,B然後用喇叭放出來,而這時B的MIC呢則會採集到喇叭放出來的聲音,然後傳回給A,如果這個傳輸的過程中時延足夠大,A就會聽到一個和自己剛才說過的話一樣的聲音,這就是回聲,聲學回聲消除器的作用就是在B端對B採集到的聲音進行處理,把採集到聲音包含的A的聲音去掉再傳給A,這樣,A就不會聽到自己說過的話了。就是說,在B端,接收到A說的話以後,要把這些話音資料傳給回聲消除器做參考,然後再傳給音效卡,音效卡再放出來,這有一段延時,這時,B再採集,然後傳給回聲消除器,與那個參考資料比較,從採集到的資料中把頻域和參考資料相同的部分消除掉。


NS: Noise Suppression 噪音抑制

NLP: Nonlinear Procession 去除殘留的回聲和背景噪聲

NC: Noise Control

NR: Noise Reduction 降噪

CC: Clarity Control 清晰度控制

VAD: Voice Activity Detection 靜音檢測。靜音檢測(VAD)將檢測被編碼的音訊資料是語音還是靜音或背景噪聲

DRC: Dynamic Range Control

AGC: Automatic Gain Control 自動增益控制。不同的裝置,錄音效果會有較大幅度的變動,自動增益控制(AGC)就是用來處理這種現象的。它提供了一種調整訊號為參考音量的方法。這對VOIP(voice over IP)是非常有用的,因為它不需要再手動去調整麥克風增益。第二個好處是,將麥克風增益設定為保守(低)級別,可有效避免削波。

VBR: Variable Bit-Rate

CBR: Constant Bit-Rate

ABR: Average bit-rate

DTX: Discontinuous Transmission 非連續傳輸。非連續性傳輸(DTX)是靜音檢測(VAD)/變位元率(VBR)操作的額外選項,它能夠在背景噪聲固定時,完全的停止傳輸。

CNG: Comfort Noise Generator 舒適噪音生成。在非變位元率的情況下,檢測非語音週期並對用足夠的位元數重新生成的背景噪聲進行編碼。這個叫“舒適噪聲生成(CNG)”。

音訊加速器(Audio Accelerator):即音訊處理單元,有些廠家又叫APU(Audio Processing Unit),好比計算機機的cpu,決定著音效卡的音訊處理能力。完全意義上的音訊加速器由DSP(Digital Singnal Processor)和I/O控制器構成。I/O控制器即是輸入/輸出控制器,針對音效卡的輸入/輸出進行控制。如果說一塊音效卡沒有DSP,而只是一塊I/O卡(比如絕大多數主機板上自帶的AC97音效卡)那它所有的資料處理就只有交由CPU來完成。這將意味著增加CPU的負擔,和低下的效能。

Codec:Codec一詞由Coder和Decoder兩個英文詞組合而成,表示為多媒體數字訊號解碼器,專門負責模擬訊號到數字訊號的轉換(ADC)以及數字訊號到模擬訊號的轉換(DAC)工作。計算機音效卡處理的訊號全是數字訊號,而音效卡接收到的或者最終輸出的訊號大部份是模擬訊號。從外辦輸入的訊號,如CD、話筒等必須經過a/d轉換後才能由音效卡進行處理,然後又經過d/a轉換後最終送入楊聲器,被我們的耳朵所聽到。因此Codec的質量直接決定著進出音效卡的訊號質量。

音效卡的工作流程:MIDI、數字輸入、模擬輸入等訊號--->通各種介面輸入--->由晶震產生取樣頻率給Codec進行模/數轉換--->交給DSP+I/O器進行訊號處理和分配--->再由DAC或Codec進行數/模轉換--->最後由放大電路放大--->輸出至模擬輸出介面

AC97(Audio Codec 97):一種規範。

Amplitude(增益/衰減):對於一個音訊訊號進行放大(正增益),或者衰減(負增益),是DSP一個最基本的功能。而這些操作實質上就是對電流脈衝的增強和減小。在電路中,可以通過電阻實現這項功能。

Filter(濾波器):濾波器也是DSP的基礎功能,所謂濾波器,就是過濾掉符合特定條件的聲音,比如常見的頻率濾波器。常見的頻率濾波器包括低通濾波器(Low pass filter),高通濾波器(High pass filter),帶通濾波器(band pass filter)等。他們都是用來過濾掉特定的頻率,比如低通濾波器。
低通濾波器,顧名思義就是讓低頻訊號通過,而其他訊號則被過濾掉,一般音響系統中習慣使用低通濾波器分離出單獨的超重低音通道來,從而組成X.1系統。
高通濾波器,就是允許高頻訊號通過,而將其他訊號拒之門外。
帶通濾波器比較有意思,它會讓需要的頻段順利通過,而阻止不需要的頻段。
陷波濾波器(band reject filter)像一個倒置的帶通濾波器,它會阻止需要的頻段,而讓不需要的頻段順利通過。
濾波器對於DSP的重要意義在於能夠分離出不同的頻段,從而進行相關的操作。

震盪器:是一個產生波形的裝置,它能夠發出規則的或者迴圈的正弦波、方波、三角波和鋸齒波。而這些波形擁有不同的用途,比如正弦波可以當作激勵來使用。因此在音訊資料中新增不同種類的波,就可以製造出各種絢麗的效果來,比如鑲邊等。

Delay(延時):所謂的延時,就是沿著時間軸移動音訊資料,從而使得聲音聽起來要延後一些,在DSP中實現這項功能也是非常簡單的。

ADSR(音色包絡):震盪器產生波形後,如果不加以控制,則這些波形將會一直震盪下去,這當然不是我們需要的。因此,我們需要給波形加上起止的控制,這就是ADSR包絡了。A代表Attack,指的是聲音從開始發聲到最大振幅的過程;D代表Decay,指的是聲音從最大振幅開始衰減的一段;S指的是Sustain,指的是聲音衰減到一定位置維持住的過程;R代表Release,指的是停止發聲後到聲音消失的過程。有了ADSR,我們就能夠控制一個波形的起止位置,從而實現我們想要的效果。

Gate門限:Gate應該算是計算機演算法中的邏輯術語了。所謂門,就是按照一定的條件處理資料,符合條件的在門的一邊,不符合條件的在門的另一邊。門在DSP中主要用作按照條件對音訊資料進行分離。

EQ:被稱為均衡(Equalizer),是DSP必備的高檔功能之一。EQ基本作用是通過對聲音某一個或多個頻段進行增益或衰減,達到調整音色的目的。當然,EQ還有一個顯著的功能,降噪。因此對於聲音的整體音色有著很大的影響。
EQ通過將聲音中各頻率的組成泛音等級加以修改,專為某一類音樂進行優化,增強人們的感覺。常見包括:正常、搖滾、流行、舞曲、古典、柔和、爵士、金屬、重低音和自定義。
EQ通常包括如下引數:F(requency),頻率――這是用於設定你要進行調整的頻率點用的引數;G(ain),增益――用於調整在你設定好的F值上進行增益或衰減的引數;Q(uantize)――用於設定你要進行增益或衰減的頻段“寬度”。要注意的一點是:當你設定的Q值越小的時候,你所處理的頻段就越寬,而當你設定的Q值越大的時候,你所處理的頻段就越窄。
從控制的方式來說,EQ有圖形EQ和參量EQ兩種。

SRC:就是Sample Rate Convertor取樣頻率轉換器,intel AC'97規範約定了音效卡需要經過這樣一個處理過程,即將所有訊號重新轉換成一個統一的取樣率輸出。SRC如果進行了非整數倍的轉換的話,比如44100->48000,會有較大的噪聲或者諧波出現,這些噪聲因轉換器的質量高低、演算法好壞而定,不優秀的演算法會比較嚴重的影響聽感。既然SRC是一個可能破壞音質的過程,為什麼會有這麼一個產物呢?前面就說過,AC'97是為了節省成本而訂,SRC的結果可以為音效卡省下一顆Crystal。SRC一般都通過軟體運算轉換,這樣受驅動版本的影響非常之大,例如Live!系列,SRC品質最好的是Windows Server2003 自帶的驅動,也有使用硬體SRC的,例如:CS4630音訊加速器。硬體SRC的品質往往大大優於軟體的SRC,SRC品質的好壞的重要性甚至比Codec的檔次更重要。

Crystal:中文名就是石英晶體振盪器或者簡稱晶振。常見的音效卡都支援44.1kHz和48kHz的訊號輸入。

參考:

2、AC 97