1. 程式人生 > >各領域公開資料集下載

各領域公開資料集下載

使用的資料集

THCHS30是Dong Wang, Xuewei Zhang, Zhiyong Zhang這幾位大神釋出的開放語音資料集,可用於開發中文語音識別系統。

為了感謝這幾位大神,我是跪在電腦前寫的本帖程式碼。

下載中文語音資料集(5G+):

1 2 3 4 5 6 7 $wget http://data.cslt.org/thchs30/zip/wav.tgz $wget http://data.cslt.org/thchs30/zip/doc.tgz $wget http://data.cslt.org/thchs30/zip/lm.tgz # 解壓 $tar xvf
wav.tgz $tar xvf doc.tgz $tar xvf lm.tgz

在開始之前,先好好檢視一下資料集。

訓練