不要用speex做靜音檢測vad

阿新 • • 發佈：2019-02-12

speex從1.2版本開始支援靜音檢測vad（還有降噪、回聲消除、自動增益控制agc、抖動buffer、重取樣等一堆功能）等針對語音的預處理功能，實現在libspeexdsp庫中。

真正用起來後，發現各種坑！

首先我打開了降噪、agc和vad，結果預處理後的音訊播放起來有電流突突聲（不知道怎麼形容，看圖）

因為speex初始化時frame size填的20ms幀長，所以各位從上圖可以看到，每隔20ms，波形會出現一個突變，突變從20ms對齊處開始，持續1.5ms左右

將降噪和agc關閉後，現象不變，還跟上圖一樣

察看speexdsp原始碼中的preprocess.c檔案，發現speex_preprocess_state_init函式預設開啟降噪，不過我用speex_preprocess_ctl函式顯式關閉後，結果還是如上圖。而speex_preprocess_run函式裡面有段註釋嚇到我了

   /* If noise suppression is off, don't apply the gain (but then why call this in the first place!) */

speexdsp的降噪也是擺設，開啟降噪功能後，背景噪聲根本沒有任何減少（還增加了它自己引入的電流突突聲）

speexdsp還有個問題：即使是單純的背景噪聲，它也可能將其檢測為語音，感覺它是單純基於頻域，即只要屬於高頻成分，一律認為是人聲

以上兩點導致vad功能完全不可用

最後附上程式碼，好奇的同學可以自行嘗試

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <stdint.h>
#include <assert.h>
#include <speex/speex_preprocess.h>
#define SAMPLE_RATE (16000)
#define FRAME_SIZE (20) //ms
#define SAMPLES_PER_FRAME (SAMPLE_RATE/1000 * FRAME_SIZE)//每毫秒16個樣點
#define FRAME_BYTES (SAMPLES_PER_FRAME * 2)//每個樣點2位元組（單通道）
int main()
{
    size_t n = 0;
    FILE *inFile = fopen("/run/shm/rec_whp.raw", "rb");
    FILE *outFile = fopen("/run/shm/rec_spx2.raw", "wb");
    char *buf = malloc(FRAME_BYTES);
    assert(buf != NULL);

    SpeexPreprocessState *state = speex_preprocess_state_init(FRAME_SIZE, SAMPLE_RATE);
    int denoise = 0;
    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_DENOISE, &denoise); //關閉降噪
    //speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_NOISE_SUPPRESS, &noiseSuppress); //設定噪聲的dB
    //speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_AGC, &agc);//增益
    //speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_AGC_LEVEL,&agcLevel);//設定增益的dB

    //int vad = 1, vadProbStart = 80, vadProbContinue = 65;
    int vad = 1, vadProbStart = 99, vadProbContinue = 99;
    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_VAD, &vad); //靜音檢測
    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_PROB_START , &vadProbStart); //Set probability required for the VAD to go from silence to voice
    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_PROB_CONTINUE, &vadProbContinue); //Set probability required for the VAD to stay in the voice state (integer percent)
    while (1)
    {
        n = fread(buf, 2, SAMPLES_PER_FRAME, inFile);
        if (n == 0)
            break;
        speex_preprocess_run(state, (spx_int16_t*)(buf));
        fwrite(buf, 2, SAMPLES_PER_FRAME, outFile);
    }

    free(buf);
    fclose(inFile);
    fclose(outFile);
    speex_preprocess_state_destroy(state);
    return 0;
}

編譯執行：

gcc squelch.c -lspeexdsp
./a.out

還好我最終用自己想出來的方法實現了靜音檢測，雖然應用範圍較窄，但符合我們的使用場景

不要用speex做靜音檢測vad

speex從1.2版本開始支援靜音檢測vad（還有降噪、回聲消除、自動增益控制agc、抖動buffer、重取樣等一堆功能）等針對語音的預處理功能，實現在libspeexdsp庫中。真正用起來後，發現各種坑！首先我打開了降噪、agc和vad，結果預處理後的音訊播放起來有電

音頻自動增益與靜音檢測算法附完整C代碼

kron gmm input del led sampler 文件 += frame 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長度音頻的音量強度，而分析之後，很多類似的需求，肯定是做音頻增益，提高音量諸如此類做法。

音頻自動增益與靜音檢測算法附完整C代碼【轉】

free 例如般的 ron nbsp bsp log 梳理 .cn 轉自：https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長

Android上用speex做迴音消除

1. 問題我們在做語音實時對講的時候往往會碰到一個瓶頸，這個瓶頸就是在不戴耳機的情況下會有很大的迴音，本文就討論如何解決。 2.解決方式：（1）其實有做了同一時間只有一端能夠說或者聽，類似於對講機，這種雖然是實時的，但是體驗不好，還不如微信；（

手把手教用matlab做無人駕駛（九）--專案1：使用單目相機檢測車道線

現在介紹一個專案，這個專案跟優達學城的課程有點像，可以學習一下.。不管是含有ADAS功能的車還是依賴於多種感測器設計的自動駕駛汽車，它們需要的感測器都包括超聲波、雷達、鐳射雷達和攝像頭。接下來的專案闡述的是用單目相機實現自動駕駛過程中一部分內容，實現的內容如下： 1

用GoldWave實現音樂的靜音效果

在剪輯視訊中插播一段音樂能夠烘托整個視訊的氛圍，但是有一些片段需要降低音樂聲音設定靜音來凸顯視訊原來的聲音，達到突出主題的效果。這時候就可以用到我們的GoldWave軟體，GoldWave操作簡單十分方便，今天就來教大家用GoldWave實現音樂靜音效果。首先我們在中文網站上下載Gol

【論文筆記】用形狀做擋風玻璃上的雨滴檢測《Detection Of Raindrop With Various Shapes On A Windshield》

《Detection of Raindrop with Various Shapes on a Windshield》 1 介紹 2 雨滴檢測方法在白天和夜晚使用不同的演算法。通過整幅影象的強度水平判斷是白天還是夜晚。 2.1 白天的雨滴檢測方法這個方法假設

電腦靜音工作，又聽不到12306的來票音樂，糾結啊！但春節前工作多工重，不能安心工作，就動手做個“無聲購票彈窗”工具吧！

當你在辦公室裡面工作，周圍有老闆、領導，但又著急買春節的火車票怎麼辦？開著電腦聲音，出票火車鳴笛聲沒聽到，QQ聊天工具等不和諧的聲音放出來了怎麼辦？為了不讓別人聽見你在買票，只好把聲音關了，但這樣你就不知道有票來了！所以只好不斷的偷偷切換視窗，看票來了沒有，弄得工作都沒有心情。有時候即使這

永遠不要試圖用NULL做比較

SELECT CASE WHEN NULL <> NULL THEN 0 ELSE 1 END,CASE WHEN NULL = NULL THEN 0 ELSE 1 END,CASE NULL WHEN NULL THEN 0 ELSE 1 END,CASE W

VAD（靜音抑制）

語音啟用檢測\靜音抑制目的是從聲音訊號流裡識別和消除長時間的靜音期，以達到在不降低業務質量的情況下節省話路資源的作用，它是IP電話應用的重要組成部分。靜音抑制可以節省寶貴的頻寬資源，可以有利於減少使用者感覺到的端到端的時延。注意事項背景噪聲問題：即如何在較大的背景噪

用iptables做軟路由實現共享上網

iptables 軟路由共享上網我們平時使用的大多數家用路由器都是通過NAT（Network Address Translation，網絡地址轉換）功能實現共享上網的，iptables是linux內核裏整合的一個ip信息包過濾系統，使用iptables配置nat就可以實現和家用路由器一樣的上網效果。

R語言用nls做非線性回歸以及函數模型的參數估計

nes 線性 -s legend 最小值 fun des and start 非線性回歸是在對變量的非線性關系有一定認識前提下，對非線性函數的參數進行最優化的過程，最優化後的參數會使得模型的RSS（殘差平方和）達到最小。在R語言中最為常用的非線性回歸建模函數是nls，下面以

用郵箱做網頁

text 軟件開發工具 kdt itl dia section ear 軟件界面 https://zhidao.baidu.com/question/438466707.html qq郵箱郵件怎麽做成網頁發送？？郵件當成網頁發送是不是很酷呢，看看我的經驗

webform復合控件以及用來做年月日選擇日期的DropDownList控件

.cn 清除 tro cti run horizon lis document 重新自動提交（不用刷新）的屬性： AutoPostBack="True" 1、RadioButtonList 單選集合 -屬性：RepeatDirection：Vertical （垂

用ionic做的列表向左滑動，出現刪除等功能按鈕

ann 需要 balance -o tails details edate sts tran 廢話不多說，直接上代碼 html代碼： <ul class="lists" ng-repeat="list in lists"> <

IPHONE6 近來1年不會開放NFC的API給開發人員，也就是僅僅能用來做支持了如今

company its put ech tran repo article -s cati IPHONE6 近來1還不會開放NFC的API給開發人員，也就是僅僅能用來做支持了如今,可是能夠肯定的是，以後肯定會放發出來的。就像指紋傳感器一樣，如今也開放出來了。前

2017-6-4 用jQuery 做大圖輪播

length move val orm fun margin window blog cli <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.aspx.cs" Inherits="_De

改進Vim體驗：在插入模式下移動光標，我不要用方向鍵！alt快捷鍵使用技巧！

targe 判斷映射 tar 什麽 nbsp .vimrc 一次 time 改進Vim體驗：在插入模式下移動光標，我不要用方向鍵！alt快捷鍵使用技巧！大家都知道，我們在插入模式下編輯代碼的時候若想寫完這一部分後，移動到鄰近的一部分，如下一個單詞的後面，是很復雜的

怎麽用cookie做一個選項卡？

eight splay i++ 作用 code round tab 多網站個性化什麽是cookie? Cookies雖然一般都以英文名呈現，但是它還是有一個可愛的中文名“小甜餅”。Cookies是指服務器暫存放在你的電腦裏的txt格式的文本文件資料，主要用

千鋒故事——用良心做教育，只做好的教育

學習心得 java 杭州電腦故事杭州校區JavaEE講師施澤磊當坐在講臺上，看著臺下一雙雙求知的眼神緊盯

不要用speex做靜音檢測vad

相關推薦