1. 程式人生 > >語音識別學習資料入門整理

語音識別學習資料入門整理

語音識別 AI

GMM-HMM語音識別模型 原理篇

隱馬爾科夫模型-HMM-A Tutorial On Hidden Markov Models


0.概念:

語音信號處理/模式識別/統計分析,

1.算法:

常用的深度學習算法,包括
cnn/dnn/rnn/lstm;
GMM/SVM/CRF/MaxEnt/HMM;
對CTC 有經驗;

2.框架:

熟悉至少一種深度學習框架,包括 kaldi, tensorflow, caffe, mxnet 等;
常用工具如 Caffe, CNTK, TensorFlow, Pytorch, Kaldi, CTC 技術
熟握 Kaldi, SRiLM, RNNLM, TensorFlow 等社區開源工具中的一種及以上

3.語言:

精通C/C++,Python,Shell編程語言,對數據結構和算法設計有深刻理解;
熟悉C/C++或Python等任意一種編程語言

4.paper:

在學術會議期刊發表過相關論文者優先,有算法優化經驗者優先
在相關國際會議或主流期刊上發表論文者優先(ICASSP,Interspeech,ASRU)
在Interspeech,ICASSP等語音學術會議中有論文發表者優先。

4.領域:

計算機、信號處理、自動化


http://www.inf.ed.ac.uk/teaching/courses/asr/

視頻:數位語音處理概論

http://ocw.aca.ntu.edu.tw/ntu-ocw/ocw/cou/104S204/1

https://book.douban.com/review/8658211/#comments

語音識別學習資料入門整理