Kaldi aishell2 GMM訓練步驟

阿新 • • 發佈：2018-11-22

中文語音識別的aishell2推出已經有一段時間了，由於沒有aishell2的語料庫，有資格的可以申請，所以拿aishell1的15G語料進行訓練，所以寫了相關的指令碼處理aishell1的語料庫，來適配aishell2，可以參考我的github 倉庫aishell2-gmm-train ，branch為：gmm-train。

語料準備

下載完aishell1的語料後，將data_aishell.tgz解壓後的語料放在egs/aishell2目錄下的recipes（自己建立的），將解壓後的語料按照github上的路徑存放，然後先執行

trans_create.sh指令碼，此指令碼根據aishell_transcript_v0.8.txt生成dev test train目錄所需的trans.txt（wav名與所講內容的對應關係，注意二者中間是tab製表符，空格會導致訓練時spk2utt等檔案內容為空），再執行wav_create.sh指令碼，生產（wav名與 wav路徑的對應關係）

訓練指令碼的修改

1. 註釋了大辭典發音字典相關程式碼，指定了aishell1解壓resource_aishell.tgz後的字典，見修改內容：https://github.com/xiangxyq/aishell2-gmm-train/blob/gmm-train/s5/local/prepare_dict.sh

2. 語言模型訓練時，註釋了kaldi_lm的訓練及srilm的訓練方式，自己利用ngram命令生成相關的語言模型，https://github.com/xiangxyq/aishell2-gmm-train/blob/gmm-train/s5/local/train_lms.sh

3. GMM訓練時，在MFCC特徵提取時，沒有采用aishell2 pitch的特徵提取方式，因為pitch增加了相應的維度，導致kaldi自帶的online-gmm-decode-faster解碼器維度不匹配，修改成make_mfcc.sh指令碼，註釋掉了 subset the training data for fast startup相關程式碼，並修改了部分訓練時的錯誤，https://github.com/xiangxyq/aishell2-gmm-train/blob/gmm-train/s5/local/run_gmm.sh

注：以上指令碼中，註釋掉了三音素和DNN的相關訓練，如有問題，歡迎拍磚。

Kaldi aishell2 GMM訓練步驟

語料準備

訓練指令碼的修改

Kaldi aishell2 GMM訓練步驟

Kaldi中thchs30訓練自己資料集的步驟

[轉]kaldi基於GMM做分類問題

[轉]kaldi ASR: DNN訓練

Kaldi各種已經訓練好的模型

Tensorflow Object_detection的訓練步驟

TensorFlow 訓練多個loss函式技巧：訓練步驟，凍結部分層（freeze some scopes），從tensorboard檢查問題

人臉檢測：MTCNN的訓練步驟和樣本的處理,文字描述

Haar 特徵訓練步驟詳

kaldi訓練thchs30詳細步驟

在ubuntu下安裝kaldi基本步驟

訓練神經網絡的一般步驟

kaldi中文語音識別thchs30模型訓練程式碼功能和配置引數解讀

在伺服器上執行kaldi說話人識別模型訓練程式遇到的小問題

Kaldi 對說話人識別GMM-UBM的MAP 引數更新和對數似然概率解讀

Ubuntu14.04安裝CUDA8.0+kaldi詳細步驟

kaldi訓練模型的過程

Kaldi thchs30手札（六）說話人自適應訓練（SAT)、FMLLR以及quick訓練（line 87-104)

kaldi 學習筆記-三音素訓練1(Decision Tree)

Kaldi中的plda的訓練以及computer-socre

Kaldi aishell2 GMM訓練步驟

語料準備

訓練指令碼的修改

相關推薦