1. 程式人生 > >語音識別概述

語音識別概述

nod 參考 ges idt tomat sphinx sta 系統 node

技術分享

後驗概率最大,即為判別結果

技術分享

HTK Hvite解碼器 Sphinx解碼器 TODE解碼器,生硬,修改繁瑣。

WFST 擴充,簡單高效。

有限狀態機模型被用於大詞匯量連續中文語音識別系統中。

其操作思路是將傳統語音識別系統中的數學模型,分別轉換成有限狀態機模型,再將轉換後的模型進行有效地整合及優化,得到搜索空間。

有限狀態自動機(Finite-state Automata,FSA)

技術分享

用點表示狀態,帶箭頭的方向線段表示轉移,轉移上的字符為輸入字元;用加粗圓圈表示初始狀態,雙線圓圈表示終止狀態

節點 (Node) 即狀態 (state

由字元所構成的有限長度詞序列成為字串

將兩個字串連接在一起的操作稱為連接運算例:

?? · ?? = ?? 表示在字串 a 後面連接上字串 b 形成字串 c

一個字串不包含任何字元,則稱為空字串

加權有限狀態轉換器(WFST)是有限狀態機的一種特殊形式

技術分享

技術分享

技術分享

技術分享

合並前

技術分享

合並後

技術分享

技術分享

            隱馬爾可夫模型

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享技術分享

技術分享

技術分享

         技術分享

參考文獻:基於WFST的中文語音識別解碼器的研究

語音識別概述