後處理邏輯整理
阿新 • • 發佈:2020-08-20
1. 文書處理(WordPro) -|編碼轉換 -|對映引數儲存 -|文字轉音素序列 -|轉換中間計算 2. 特徵處理(c++庫或) -| 特徵矩陣儲存計算 -| 特徵矩陣平滑 -| 特徵矩陣轉mel圖計算 3. 波形處理(c++庫) -| 進行首末尾silence剔除:librosa.effects.trim -|固定引數:trim_top_db=50,trim_fft_size=2048, trim_hop_size=512 -| -| 計算去預加重過濾-| 波形平滑
-|1.分段: 活動語音樣本檢測分段。
-|2.樣本均值: 計算每個分段的樣本均值。
-|3.分段均值: 計算上一步分段均值的均值。
-|4.平滑: 當前活動樣本*分段均值/當前樣本均值。
-| 能量對齊
-|取絕對值最大值
-|取樣/max
-|*32767
-|float32轉int6