1. 程式人生 > >【論文:麥克風陣列增強】Microphone Array Post-Filtering For Non-Stationary Noise Suppression

【論文:麥克風陣列增強】Microphone Array Post-Filtering For Non-Stationary Noise Suppression

ted speech 增強 gin rop pro 完全 ack 理論

作者:桂。

時間:2017-06-08 08:01:41

鏈接:http://www.cnblogs.com/xingshansi/p/6957027.html

原文鏈接:http://pan.baidu.com/s/1nvp1bJF


前言

理論上借助VAD可以實現噪聲估計,但這是遠遠不夠的,例如在low-SNR場景下,甚至Noise是non-staitonary,原文交代了噪聲估計的重要性:

The majority of the VAD algorithms encounter problems in low-SNR conditions, particularly when the noise is nonstationary [1,2]. Also, some of those algorithms require tuning. Having an accurate VAD algorithm in a nonstationary environment might not be sufficient in speech-enhancement applications, as an accurate noise estimate is required at all times, even during speech activity. Noise-estimation algorithms that continuously track the noise spectrum are therefore more suited for speech-enhancement applications in nonstationary scenarios. This is a particularly challenging task, as we need to somehow estimate the noise spectrum even during speech activity. However, as we will see in this chapter, this can be accomplished by exploiting a few key properties of the speech signal.

一、Single Microphone Noise Spectrum Estimation

這個思路就是借助之前文章裏提到的OMLSA算法,omlsa算法主要分為四個模塊:

1-log-MMSE估計器;2-priori SNR估計;3-語音不存在概率估計;4-基於MCRA/IMCRA的噪聲估計。

MCRA結構圖:

技術分享

細節可以參考之前的文章,這裏就不再重復了。

二、Microphone Array Post-Filtering

原理框圖

技術分享

其中

技術分享

D分兩個部分是假設噪聲由穩態噪聲、瞬態噪聲兩部分組成。

對每一個分支分別計算平均功率譜,並借助MCRA實現噪聲譜估計,這兩個操作的具體細節參考之前的文章。

定義變量(還起了一個名字TBRR技術分享

技術分享

其中技術分享,可以看出技術分享也可以理解成語音存在概率,這樣一來判斷語音不存在概率的時候相當於多了一個評價的準則,如果綜合兩個弱分類器實現強分類就是接下來的問題了。

回顧single-channel中的q(語音不存在概率)定義式

技術分享

給出multi-channel中的q定義式

技術分享

其中技術分享,其實兩個評價準則結合主要體現在or上。

剩下的操作與single-channel就完全一致了。

【論文:麥克風陣列增強】Microphone Array Post-Filtering For Non-Stationary Noise Suppression