音訊演算法speex中的aec分析以及解析
演算法原理:
Speex的AEC是以NLMS(Normalized Least Mean Square)為基礎,用MDF(multidelay block frequency domain)頻域實現,最終推匯出最優步長估計:殘餘回聲與誤差之比。最優步長等於殘餘回聲方差與誤差訊號方差之比。 只有改與洩露係數相關部分的程式碼,才是對效果影響最大的地方,因為根據洩露係數,最終會估計出濾波器的最優步長。
使用例項:
測試程式碼:
#include "speex/speex_echo.h" #include "speex/speex_preprocess.h" #include <stdio.h> #include <stdlib.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #define NN 128 #define TAIL 1024 int main(int argc, char **argv) { FILE *echo_fd, *ref_fd, *e_fd; short echo_buf[NN], ref_buf[NN], e_buf[NN]; SpeexEchoState *st; SpeexPreprocessState *den; int sampleRate = 8000; if (argc != 4) { fprintf(stderr, "testecho mic_signal.sw speaker_signal.sw output.sw\n"); exit(1); } echo_fd = fopen(argv[2], "rb"); ref_fd = fopen(argv[1], "rb"); e_fd = fopen(argv[3], "wb"); st = speex_echo_state_init(NN, TAIL); den = speex_preprocess_state_init(NN, sampleRate); speex_echo_ctl(st, SPEEX_ECHO_SET_SAMPLING_RATE, &sampleRate); speex_preprocess_ctl(den, SPEEX_PREPROCESS_SET_ECHO_STATE, st); while (!feof(ref_fd) && !feof(echo_fd)) { fread(ref_buf, sizeof(short), NN, ref_fd); fread(echo_buf, sizeof(short), NN, echo_fd); speex_echo_cancellation(st, ref_buf, echo_buf, e_buf); speex_preprocess_run(den, e_buf); fwrite(e_buf, sizeof(short), NN, e_fd); } speex_echo_state_destroy(st); speex_preprocess_state_destroy(den); fclose(e_fd); fclose(echo_fd); fclose(ref_fd); return 0; }
命令: ./testecho speaker1.wav micin1.wav out1.wav
測試結果:
最新的speex的aec效果非常的好,超出了我的想象,回聲消除效果不是一般的好,看來是speex更新了不少,因為自從2007年之後,speex很長一段時間都沒有更新過程式碼。有興趣的同學可以聽一下消回聲後的和之前的音訊對比。
程式碼解析:
初始化中,第一個引數是每次處理的幀長度,這個一般是從10ms(80) 到30ms(240) 的處理長度,太長和太短都不是很好,filter_length 也是一個長度,它實際上就是speaker到rec之間的時間差。這個在不同裝置上是不同的,跟產品的使用場景,結構,以及軟體耗時有關係,一般的是可以測試出來的。
系統預設的消回聲取樣是8k的,如下所示,假如你想改變取樣頻率,
/* This is the default sampling rate */
427 st->sampling_rate = 8000;
428 st->spec_average = DIV32_16(SHL32(EXTEND32(st->frame_size), 15), st->sampling_rate);
要使用下面的函式:speex_preprocess_state_init(NN,sampleRate)
speex_echo_ctl(st, SPEEX_ECHO_SET_SAMPLING_RATE, &sampleRate);
引數都可以以下這些:
46 /** Obtain frame size used by the AEC */
47 #define SPEEX_ECHO_GET_FRAME_SIZE 3
48
49 /** Set sampling rate */
50 #define SPEEX_ECHO_SET_SAMPLING_RATE 24
51 /** Get sampling rate */
52 #define SPEEX_ECHO_GET_SAMPLING_RATE 25
53
54 /* Can't set window sizes */
55 /** Get size of impulse response (int32) */
56 #define SPEEX_ECHO_GET_IMPULSE_RESPONSE_SIZE 27
57
58 /* Can't set window content */
59 /** Get impulse response (int32[]) */
60 #define SPEEX_ECHO_GET_IMPULSE_RESPONSE 29
最重要的函式登場了:這個函式,非常的好用,估計只要看一下入參,你就知道怎麼使用了。具體的使用就看上面的例子吧。
void speex_echo_cancellation(SpeexEchoState *st, const spx_int16_t *in, const spx_int16_t *far_end, spx_int16_t *out)
假如在預處理中有些引數設定,需要呼叫預處理函式再把輸出的結果處理一下,假如預處理沒有了,那就不需要了。
speex_preprocess_run(den, e_buf);
其實,程式碼流程就這麼簡單,但是,想把系統效果除錯的很好,還是要花不少功夫的。
注意事項:
1 AEC的線性演算法處理不了Non-linear distortion(非線性失真)
2 在其它預處理前 先呼叫AEC
3 speex的aec並不是很適合音響系統裡,音響中要慎用。耳機中效果還挺好。
4 實驗用的音訊資料就不放到這裡了,有誰需要可以留言郵箱,我發個你。
&n