Kaldi語料的兩種切分/組織方式及其處理

阿新 • • 發佈：2017-09-10

out pad ati bottle pri 特征提取文件的 code val

text中每一個文本段由一個音頻索引（indexed by utterance）
使用該方式的egs：librispeech、timit、thchs30、atc_en、atc_cn
語料的組織形式為：
一個音頻（包含一個語句）對應一個文本（包含一個文本段）
或
一個音頻（包含一個語句）對應一個文本（包含多個文本段）中的一個文本段
text中每一個文本段由一個時間片索引（indexed by segment）
- 使用該方式的egs：
  tedlium、atc0_comp_LDC94S14A
  時間片由segments文件指定，通常位於data/train, data/test, data/dev中
- 處理方式：
  以tedlium為例，語料的組織形式為一個音頻sph（包含多個語句）對應一個文本stm（包含多個文本段）
  stm，kaldi使用的一種文本組織形式（文本格式），tedlium的例子：
  AaronHuey_2010X 1 AaronHuey_2010X 223.12 232.68 <o,f0,female> we appropriated land for(2) trails and(2) trains to shortcut through the heart of the lakota nation <sil> the treaties were(2) out the window <sil> in response three tribes led by the lakota chief {SMACK} red cloud <sil> (AaronHuey_2010X-223.12-232.68-F0_F-S27)
  
  stm文件的格式：
  <file-name> <?> <speaker-name> <segment-begin> <segment-end> <LABEL> <TEXT> <segment>
  文本：db/TEDLIUM_release1/$set/stm/*.stm（其中包含了時間片信息）
  音頻：db/TEDLIUM_release1/$set/sph/*.sph
  tedlium/s5/run.sh調用了local/prepare_data.sh，其中對stm文件進行格式化，包括去除顯式的靜音標註和生成segments文件
  
  segments文件的格式：
  <utterance-id> <recording-id> <segment-begin> <segment-end>
  其中，segment-begin和segment-end以秒為單位。它們指明了一段發音在一段錄音中的時間偏移量。"recording-id" 和在"wav.scp"中使用的是同一個標識字符串。再次聲明一下，這只是一個任意的標識字符串，你可以隨便指定。
  Kaldi中隱含地對靜音SIL進行處理，不需要顯式標註。但是這並不意味著其他噪聲不需要顯式標註，如：

BRH	Breath	呼吸
CGH	Cough	咳嗽
NSN	Noise	噪聲
SMK	Smack	拍擊聲
UM	UM	嗯
UHH	UH	噓

在特征提取、在線訓練、解碼時需要判斷語料是哪種組織方式，即尋找segments：

../steps/make_*.sh

../steps/nnet2/dump_bottleneck_features.sh

../steps/<online/>nnet*/align.sh

../steps/<online/>nnet*/decode.sh

../steps/online/nnet2/dump_nnet_activations.sh

../steps/online/nnet2/get_egs.sh

../steps/online/nnet2/get_egs*.sh

Kaldi語料的兩種切分/組織方式及其處理

out pad ati bottle pri 特征提取文件的 code val text中每一個文本段由一個音頻索引（indexed by utterance）使用該方式的egs：librispeech、timit、thchs30、atc_en、atc_cn 語料

JSP頁面中兩種頁面include方式及其區別

JSP頁面可以進行巢狀，巢狀有兩種方法<%@include %>(靜態的)與<jsp:include>(動態的) 【準備知識】 JSP在首次執行時主要有以下幾個步驟： 1、JSP程式碼翻譯為Java程式碼； 2、Java程式碼便宜為class； 3、

設計模式：單例模式的三種創建方式及其各自的優缺點

singleton dmi 創建檢查 public pos return style tin 單例模式：確保一個類僅僅有一個實例，並提供全局訪問點。在Java中實現單例模式須要私有的構造器，一個靜態方法和一個靜態變量。確定在性能和資源上的限制，怎樣選擇適當的方案來

圖的兩種遍歷方式

繼續 div input traversal 遍歷 n) logs i++ memset 圖的遍歷有兩種：深度優先和廣度優先。本文中，深度優先使用遞歸實現，每次遞歸找到第一個與當前結點相連且未輸出過的結點繼續往下遞歸，直至所有結點都已輸出。廣度優先將開始結點的所有鄰接結點全

Shiro源代碼分析之兩種Session的方式

amp msg cto 開源 request cannot pad turn ssa 1、Shiro默認的Session處理方式  <bean id="s

華為telnet的兩種連接方式

telnet要求R2能遠程登陸上R1（使用password）方式第一種方式：[R1][R1]int e0/0/0[R1-Ethernet0/0/0]ip address 12.1.1.1 24[R1]user-interface vty 0 4[R1-ui-vty0-4]authentication-mode

html5中的Web Storage包括了兩種存儲方式：sessionStorage和localStorage。

htm local 本地存儲方式刪除數據 tor web 兩種 session html5中的Web Storage包括了兩種存儲方式：sessionStorage和localStorage。 sessionStorage用於本地存儲一個會話（session）中的數據，

Tiled Editor 圖塊的兩種導入方式

點擊編輯 edi 面板 src 選擇 .cn 測試工程一、圖塊集圖塊的導入。　　打開或者創建地圖後，新建新圖塊。　　彈出新圖塊面板　　　　圖塊類型選擇 “基於圖塊集圖塊”，一定要選擇“嵌入地圖”，否則需要另存為其他類型的文件，生成遊戲工程無法解析的

第63天：json的兩種聲明方式

添加 shift ddr rom ole 們的刪除按鈕 pop 一、 json 兩種聲明方式 1、對象聲明 var json = {width:100,height:100} 2、數組聲明 var man = [ // 數組的 js

Cassandra兩種登錄方式cassandra-cli / csqlsh

cassandra兩種登錄方式cassandra-cli / csqlsh（1）cassandra-clicassadnra-cli命令在cassandra2.2中被拋棄，以後登錄訪問cassandra可以使用cqlsh[tnuser@sht-sgmhadoopdn-02 cassandra]$ cassan

jmeter常用額兩種錄制方式

就是圖片 body 方式技術 mage 錄制 image jmeter代理 1、Badboy錄制默認打開就是錄制狀態， 2、jmeter代理錄制錄制東西太多 jmeter常用額兩種錄制方式

斑馬打印機客戶端GET和POST，以及後端兩種打印方式。

syn box orm sub make sys jquery 1.2 ace 斑馬打印機客戶端GET和POST，以及後端兩種打印方式。背景環境：打印機安裝在客戶端外網。當用戶登錄時，通過ajax取服務器數據，返回打印機命令，然後客戶端通過JS發送給斑馬打印機。 1、使用

【Spark】篇---Spark中yarn模式兩種提交任務方式

方式 div -s and clas client 命令 yarn 模式一、前述 Spark可以和Yarn整合，將Application提交到Yarn上運行，和StandAlone提交模式一樣，Yarn也有兩種提交任務的方式。二、具體 1、yarn

Tomcat 9.0 7 的兩種開機啟動方式與web頁面管理

Tomcat 9.0 7 開機啟動方式 Tomcat WEB管理 tomcat開機啟動項目環境系統平臺： CentOS Linux release 7.4.1708 (Core) 內核 3.10.0-693.el7.x86_64 最小化安裝配置jdk環境去oracle官網

類的兩種創建方式（通過元類創建類）

通過默認 font HA self print pri div inf 首先我們需要明確一點：python中，一切皆對象 class Student: 　　pass zhangsan = Student() 對象有什麽特點： 1.可以被引用 a = zhangsan 2.

用Python和NetCore、Shell分別開發一個Ubuntu版的定時提醒（附NetCore跨平臺的兩種發布方式）

not 代碼程序異常 read bsp install dia alt Python3 與 C# 基礎語法對比：https://www.cnblogs.com/dotnetcrazy/p/9102030.html 平時經常用定時提醒來提高工作效率，到了Linux。。

SSH的兩種登錄方式

nbsp src ssh root 配置服務服務端允許 style 不重復 ssh客戶端使用的是Xshell，windows環境。第一種方式，用戶名密碼方式原理如下：客戶端發起ssh請求之後，服務器把自己的公鑰傳給客戶端客戶端輸入服務器密碼通過公鑰加密之後傳

python中的字典兩種遍歷方式

方法 clas items color 兩種方法 pan code bsp for dic = {"k1":"v1", "k2":"v2"} for k in dic: print(dic[K]) for k, v in dic.items(): pri

MyBatis兩種傳參方式的區別

傳參方式 type 方式數值參數識別 jdbc 直接 tis $與#的區別 select * from T_PRINT_LAYOUT where D_RECID = ${recId} 最後生成的SQL為： select * from T_PRINT_LAYO

關於搜索elasticsearch的數據條數大於10000的坑 max_result_window的兩種設置方式

推薦們的 max 需求 scroll 大於 pan 報錯進行當用elasticsearch進行深度分頁查詢時的size-from大於10000的時候，就會報錯“”，官方推薦是scroll查詢返回結果是無序的不滿足業務需求,所以還是通過設置最大返回結果數來達到我們的目

Kaldi語料的兩種切分/組織方式及其處理

相關推薦