基於kaldi、thchs30 的離線中文識別
阿新 • • 發佈:2019-01-02
具體操作細節可檢視一下網址:
http://blog.csdn.net/lijin6249/article/details/51838936?locationNum=4&fps=1 點選開啟連結
第一步就是要跑通thchs30的例子,這是清華的中文語音識別例子
第二部做本地識別可檢視上面網址,不過有兩處不對
1、如下圖所示地方要改成final.mat,上面網址的是12.mat
2、如下圖所示地方也要改
ac_model=${data_file}/models/$ac_model_type
trans_matrix=""
audio=${data_file}/audio
改後:
解釋原因:
可用file 命令檢視final.mat、final.mdl檔案
在tri2b下的final.mat、final.mdl檔案都是指向性檔案,不是資料和模型,所以需要把真正的資料和模型烤過來,就是12.mat 、35.mdl檔案
在tri4b下的final.mat、final.mdl檔案,final.mat是真的資料檔案,所以不用拷其他.mat檔案,final.mdl檔案還是指向性檔案,所以還要拷過來它指向的檔案
實際上解碼只要3個檔案就行了,一個模型檔案(final.mdl ),words.txt,和HCLG.fst,一個是字典,一個是有限狀態機。這3個檔案
不過由於上面說的指向性的原因需要把指向的真正的檔案拷過來