1. 程式人生 > >說話人識別開集open-set和閉集close-set的區別

說話人識別開集open-set和閉集close-set的區別

先引用知乎上 @LEON晉 大神解釋的說話人識別對說話人準確率判斷的兩個評分標準:

在一批本該全部正確(TRUE)的列表中出現幾個沒識別出正確的語音,這個就是錯誤拒識FR(False Rejection),是Miss的;在一批本該全部錯誤(Flase)的列表中出現了幾個沒識別出錯誤的語音,就是錯誤的語音被認為對了,FA(False Acceptance),是Flase Alarm的。然後各自佔的比例:FR = Miss / Total_TRUE;FA= False Alarm/ Total_False,

對說話人識別準確率EER的理論:EER

開始說說開集open-set和閉集close-set是啥:

聲紋識別(說話人識別)需要三個資料,訓練,註冊和測試。

訓練用的資料是普遍人(並不是準備使用該說話人識別系統的人)的語音資料。

一般註冊和測試是用同一個人(目標)不同的語音

開集 我自己個人理解是open-set,就是測試的人沒在模型上註冊他們的聲紋就去測試了,意思就是,在識別系統中沒有該說話人的語音特徵,但他硬要去挑戰說話人識別系統的權威,去看看該系統是不是很聰明。如大大們所說的,看系統是否能把他給拒了。

判斷是否在註冊集中也像他們所說的,設個 threshold, 若大於則說明該人註冊過了,在話語集中,小於則在集外。 FA的不變或增加

閉集 就是註冊和測試是用同一個人(目標)不同的語音,直接做1:N或者1:1的說話人識別,你們都很熟悉的就是閉集啦!