語音識別語料歸一化處理的方法

阿新 • • 發佈：2019-01-22

在進行語音識別模型的訓練和測試語料收集的過程中，我們需要對收集到的語料進行歸一化處理。

收集到的語料應每個命令詞或句子單個截下來，對其進行歸一化處理。因為即使是同一個人，在讀不同的命令詞的時候，音量也會不一樣。特別是在語料錄製的過程中，由於志願者的逐漸疲憊，後面錄的命令詞的聲音，可能會偏弱一些。

對語料進行歸一化處理的基本原理是：取一段語料中幅度最大的點將其幅度拉大到接近1，記錄拉大的比例，再將其他所有點均按這個比例拉伸。這個操作可以在Audacity等音訊處理軟體中進行處理，也可以使用以下方法進行操作：（該方法由全志演算法友商提供，僅供全志內部使用，不對外開放，但自己實現其實也很簡單）

處理方法

（1）將do_pcm工具複製到ubuntu PC的任意目錄下。chmod 777 do_pcm。此時執行該工具會列印如下幫助資訊：

[email protected]:~/test$ ./do_pcm
pcm file process:
   [ -h]:    show help information
   [ -i]:    input file path
   [ -o]:    output file path
   [ --nchi]:    number of input file channels, default 1
   [ --ncho]:    number of output file channels, default 1
   [ --ichi]:    channel index select from input file: 0,1,...(default 0,i.e, mean val)
   [ -b]:    bitwidht default 16
   [ --ri]:    input sample rate, default 16000
   [ --ro]:    output sample rate, default 16000
   [ --norm]:    whether or not to do pcm offline normalization, default 0
   [ -v]:    get split version needed 0
   [ --hp]:    high pass
   [ --ali]:    align pcm by m_sequence,default 0
   [ --delay]:    for two channel signal to calculate delay
   [ --ali_s]:    align pcm ,seconds to start with,default 0
   [ --ali_e]:    align pcm , seconds to end with ,default -1,which means 3min inputs
   [ --split]:    split pcm by m_sequence,default 0, 1 means split words,2 means split person by start, 3 means split person by end
   [ --ms_cut_s]:    start pos in ms
   [ --ms_cut_e]:    end pos in ms
   [ --snr]:    snr calculate

（2）使用Audacity或其他音訊處理軟體從採集到的語料中擷取單個命令詞，儲存為一個.wav檔案。

（3）在ubuntu PC上使用命令./do_pcm -i in.pcm -o out.pcm --norm對語料進行處理，得到的out.pcm則為一個處理好的語料檔案，如：

幅度調整範圍是-32767-72767

歸一化處理前好的兩個語料的對比（上方為處理前語料的音軌，下方為處理好語料的音軌）：

頻譜圖對比：

語音識別語料歸一化處理的方法

語音識別語料歸一化處理的方法

利用numpy對矩陣進行歸一化處理的方法

python對樣本進行歸一化處理

機器學習中資料的歸一化處理

資料特徵歸一化/標準化方法

weka學習（二）歸一化處理

Arcgis+Python實現對柵格歸一化處理

利用keras中image.ImageDataGenerator.flow_from_directory()實現從資料夾中提取圖片和進行簡單歸一化處理

OpenCV對影象的光照歸一化處理

機器學習數據預處理——標準化/歸一化方法總結

數字影象處理之歸一化方法

資料處理之標準化/歸一化方法

資料預處理的幾個方法：白化、去均值、歸一化、PCA

第9章優化方法和歸一化

資料的標準化，歸一化方法總結

資料預處理——標準化、歸一化、正則化

記錄“歸一化”方法

機器學習資料處理時label錯位對未來資料做預測機器學習經典模型簡單使用及歸一化（標準化）影響

資料的兩種歸一化方法

資料預處理--輸入歸一化/標準化/放縮

語音識別語料歸一化處理的方法

相關推薦