1. 程式人生 > >kaldi語音特徵預處理-mfcc特徵與標籤對齊(一)

kaldi語音特徵預處理-mfcc特徵與標籤對齊(一)

  學習kaldi已經接近兩個月了,終於將kaldi中語音的特徵資料提取出來,對於其分幀的標籤進行對齊,即將輸入到TensorFlow搭建的模型中,下面詳細的講解一下如何提取語音的特徵以及對音素標籤進行對齊,提取語音MFCC+delta+deltas的39維度特徵在上將部落格已經講完,可以翻看前面部落格,下面著重講一下如何提取語音的的對齊特徵。

  以thchs30語料進行試驗,對mono模型的對齊特徵進行提取:

  1:原始phone下的音素標籤;



  2:進入kaldi/src/bin/ ,執行./ali-to-phones,詳細指令碼如下所示;

  3:然後在命令列輸入 set nu/set nonu可以檢視行數;


 

從標籤可以看出,對於thchs訓練集中,第一句話一共分為979幀,和上面的音素符號進行了對齊。如有不懂歡迎留言。