A Rank-Order Distance based Clustering Algorithm for Face Tagging
【論文閱讀】A Rank-Order Distance based Clustering Algorithm for Face Tagging
原文連結:2011_CVPR_A Rank-Order Distance based Clustering Algorithm for Face Tagging
Rank-Order distance, which measures the dissimilarity between two faces using their neighboring information in the dataset. The Rank-Order distance is motivated by an observation that faces of the same person usually share their top neigh- bors. |
|
由於人臉的複雜場景,比如光照、姿態、表情等因素,絕對距離的度量方式可能會造成相同人的不同照片相似度很低,而不同人的照片反而相似度很高,所以單純的L1或L2距離已不再適用。
由於大部分家庭照片都拍攝於不同的環境,對於人臉聚類會有一些要求和挑戰:
1、相簿中的人臉通常會在高維空間形成幾個臉部簇,並具有不同的密度,大小和形狀。這種非均勻分佈使得絕對距離(例如,兩個人臉識別特徵之間的L1或L2距離)容易失敗。如下圖所示,男孩的群集比女孩的群集更稀疏。如果我們在這個例子中使用絕對距離,那麼這個在中間男孩的臉更接近女孩群。
2、人臉檢測通常會返回一些背景中不感興趣或不喜歡的人臉。通常,我們不想標記這些面孔。聚類演算法應該能夠處理這些噪聲和異常值。
3、演算法的執行時間應該滿足快速使用者互動的要求。
由於複雜的人臉分佈,同一人的所有人臉通常由幾個子叢集組成。由於這些子聚類相對比較緊密,因此可以通過簡單的閾值法以Rank-Order距離來強健地識別它們。然而,由於光照,姿態,表達等變化的干擾,子簇之間的連線通常較弱且稀疏。為了解決這個問題,我們提出了一種基於排序距離的聚類演算法,以迭代方式合併子簇凝聚的方式。聚類演算法結合了聚類級別的秩距離和聚類級別的距離。在每個迭代步驟中,合併任意兩個具有較小Rank-Order距離和較小歸一化距離的人臉聚類。以這種方式,來自同一個人的不同子叢集被有效連線。
Rank-order distance來度量兩個人臉的相似度。這個距離是基於一個有趣的觀察:同一個人的兩張臉有許多共享的top鄰居,但是來自不同人的人臉的鄰居通常差異很大。
Rank-Order Distance
演算法流程
該演算法的時間複雜度是O(N2)O(N2),其中DRDR和DNDN對應的兩個閾值是固定引數,而K近鄰是可以選擇的引數,該引數大小直接影響最後聚類的簇數目。