說話人識別開集open-set和閉集close-set的區別
阿新 • • 發佈:2018-11-07
先引用知乎上 @LEON晉 大神解釋的說話人識別對說話人準確率判斷的兩個評分標準:
在一批本該全部正確(TRUE)的列表中出現幾個沒識別出正確的語音,這個就是錯誤拒識FR(False Rejection),是Miss的;在一批本該全部錯誤(Flase)的列表中出現了幾個沒識別出錯誤的語音,就是錯誤的語音被認為對了,FA(False Acceptance),是Flase Alarm的。然後各自佔的比例:FR = Miss / Total_TRUE;FA= False Alarm/ Total_False,對說話人識別準確率EER的理論:EER
開始說說開集open-set和閉集close-set是啥:
聲紋識別(說話人識別)需要三個資料,訓練,註冊和測試。
訓練用的資料是普遍人(並不是準備使用該說話人識別系統的人)的語音資料。
一般註冊和測試是用同一個人(目標)不同的語音
開集 我自己個人理解是open-set,就是測試的人沒在模型上註冊他們的聲紋就去測試了,意思就是,在識別系統中沒有該說話人的語音特徵,但他硬要去挑戰說話人識別系統的權威,去看看該系統是不是很聰明。如大大們所說的,看系統是否能把他給拒了。
判斷是否在註冊集中也像他們所說的,設個 threshold, 若大於則說明該人註冊過了,在話語集中,小於則在集外。 FA的不變或增加
閉集 就是註冊和測試是用同一個人(目標)不同的語音,直接做1:N或者1:1的說話人識別,你們都很熟悉的就是閉集啦!