語音識別概述
阿新 • • 發佈:2017-09-07
nod 參考 ges idt tomat sphinx sta 系統 node
?? · ?? = ?? 表示在字串 a 後面連接上字串 b 形成字串 c
後驗概率最大,即為判別結果
HTK Hvite解碼器 Sphinx解碼器 TODE解碼器,生硬,修改繁瑣。
WFST 擴充,簡單高效。
有限狀態機模型被用於大詞匯量連續中文語音識別系統中。
其操作思路是將傳統語音識別系統中的數學模型,分別轉換成有限狀態機模型,再將轉換後的模型進行有效地整合及優化,得到搜索空間。
有限狀態自動機(Finite-state Automata,FSA)
用點表示狀態,帶箭頭的方向線段表示轉移,轉移上的字符為輸入字元;用加粗圓圈表示初始狀態,雙線圓圈表示終止狀態
節點 (Node) 即狀態 (state)
由字元所構成的有限長度詞序列成為字串
將兩個字串連接在一起的操作稱為連接運算例:
一個字串不包含任何字元,則稱為空字串
加權有限狀態轉換器(WFST)是有限狀態機的一種特殊形式
合並前
合並後
隱馬爾可夫模型
參考文獻:基於WFST的中文語音識別解碼器的研究
語音識別概述