1. 程式人生 > >基於kaldi、thchs30 的離線中文識別

基於kaldi、thchs30 的離線中文識別

具體操作細節可檢視一下網址:

http://blog.csdn.net/lijin6249/article/details/51838936?locationNum=4&fps=1  點選開啟連結

第一步就是要跑通thchs30的例子,這是清華的中文語音識別例子

第二部做本地識別可檢視上面網址,不過有兩處不對

1、如下圖所示地方要改成final.mat,上面網址的是12.mat


2、如下圖所示地方也要改

ac_model=${data_file}/models/$ac_model_type
trans_matrix=""
audio=${data_file}/audio

改後:

解釋原因:

可用file 命令檢視final.mat、final.mdl檔案

在tri2b下的final.mat、final.mdl檔案都是指向性檔案,不是資料和模型,所以需要把真正的資料和模型烤過來,就是12.mat 、35.mdl檔案

在tri4b下的final.mat、final.mdl檔案,final.mat是真的資料檔案,所以不用拷其他.mat檔案,final.mdl檔案還是指向性檔案,所以還要拷過來它指向的檔案

實際上解碼只要3個檔案就行了,一個模型檔案(final.mdl ),words.txt,和HCLG.fst,一個是字典,一個是有限狀態機。這3個檔案

不過由於上面說的指向性的原因需要把指向的真正的檔案拷過來