1. 程式人生 > >kaldi 在ubuntu上的安裝手記

kaldi 在ubuntu上的安裝手記

備註:本篇文章是有kaldi學習 語音深度學習群(群號:367623211)裡的@冒頓同志寫的,本人代發。在這裡感謝@冒頓同學的努力……歡迎大家積極學習……

一、安裝所有相關軟體包

sudo apt-get install autoconf,automake,gcc,libtool,subversion,libatlas-dev,libatlas-base-dev,gfortran
二、下載kaldi到目錄kaldi-trunk
svn co https://svn.code.sf.net/p/kaldi/code/trunk kaldi-trunk
三、編譯安裝使用到的工具
cd kaldi-trunk/tools
make
四、配置kaldi
cd ../src
./configure
五、編譯kaldi
make all
六、執行例子yesno
cd ../egs/yesno/s5
./run.sh
參考結果:
decode.sh: feature type is delta
%WER 0.00 [ 0 / 240, 0 ins, 0 del, 0 sub ] exp/mono0a/decode_test_yesno/wer_1
七、執行例子timit
1、在kaldi-trunk/egs/timit目錄下建立data目錄
cd
mkdir kaldi-trunk/egs/timit/data
2、把timit.rar裡面的東西拷貝到kaldi-trunk/egs/timit/data 中,我的資料是rar格式的,所以在windows下解壓,然後winscp拷貝
3、修改執行環境:修改kaldi-trunk/egs/timit/s5中的cms.sh,預設是執行#a)JHU cluster,改成執行#c)run it local
#a) JHU cluster options
#export train_cmd="queue.pl -l arch=*64"
#export decode_cmd="queue.pl -l arch=*64,mem_free=2G,ram_free=2G"
#export mkgraph_cmd="queue.pl -l arch=*64,ram_free=4G,mem_free=4G"
#export cuda_cmd=run.pl
#b) BUT cluster options
#export train_cmd="queue.pl -q
[email protected]
@blade -l ram_free=1200M,mem_free=1200M"
#export decode_cmd="queue.pl -q [email protected]@blade -l ram_free=1700M,mem_free=1700M"
#export decodebig_cmd="queue.pl -q [email protected]@blade -l ram_free=4G,mem_free=4G"
#export cuda_cmd="queue.pl -q [email protected]@pco203 -l gpu=1"
#export cuda_cmd="queue.pl -q
[email protected]
"
#export mkgraph_cmd="queue.pl -q [email protected]@servers -l ram_free=4G,mem_free=4G"
#c) run it locally...
export train_cmd=run.pl
export decode_cmd=run.pl
export cuda_cmd=run.pl
export mkgraph_cmd=run.pl
4、修改run.sh 更改資料位置
timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT修改為
timit=/root/kaldi-trunk/egs/timit/data
5、執行例子
     cd
     cd kaldi-trunk/egs/timit/s5
 經過漫長的等待:出結果了
在整個過程中,出了N多錯誤,分別在cygwin,vmware虛擬機器,真機上安裝除錯了N次,現將遇到的問題總結如下:如果有相同問題的,可以參考
一、svn co https://svn.code.sf.net/p/kaldi/code/trunk kaldi-trunk 出錯
    1、未安裝subversion 
     解決:sudo apt-get install subversion
    2、找不到https://kaldi.svn.sourceforge.net/svnroot/kaldi/trunk  
    解決:換成https://svn.code.sf.net/p/kaldi/code/trunk
二、tools裡面make出錯
   1、 sctk-2.4.0-20091110-0958.tar.bz2 解壓出錯。這個是因為壓縮工具不支援bz2的解壓。
   解決:修改Makefile,將所有的    sctk-2.4.0-20091110-0958.tar.bz2 改成sctk-2.4.0-20091110-0958.tar.gz
  2、缺少gcc,automake,autoconf,gfortran,libtool
  解決:安裝相應的軟體包。
三、src裡面./configure 或者make 出錯
1、Could not find libatlas.so in any of the obvious places, will most likely try static:
  找不到libatlas.so  
    解決:sudo apt-get install libatlas-base-dev ,libatlas-dev
四、執行yesno例子出錯
1、找不到libfstscript.so.1
   fstarcsort: error while loading shared libraries: libfstscript.so.1: cannot open shared object file: No such file or directory
 解決:find libfstscript.so.1 然後把這個檔案拷貝到/usr/lib
2、找不到libfst.so.1
fstarcsort: error while loading shared libraries: libfst.so.1: cannot open shared object file: No such file or directory
 解決:findlibfst.so.1 然後把這個檔案拷貝到/usr/lib
五、執行timit 例子出錯:
1、找不到測試資料
timit_data_prep.sh: Spot check of command line argument failed
Command line argument must be absolute pathname to TIMIT directory
with name like /export/corpora5/LDC/LDC93S1/timit/TIMIT
   解決:修改run.sh 中的 timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT,使他指向你的資料位置
2、找不到qsub
  qsub not found.
 解決:修改cmd.sh :註釋掉#a)下面的命令,開啟#c)下面的選項。