1. 程式人生 > >A Rank-Order Distance based Clustering Algorithm for Face Tagging

A Rank-Order Distance based Clustering Algorithm for Face Tagging

【論文閱讀】A Rank-Order Distance based Clustering Algorithm for Face Tagging

2018-04-04

一篇關於人臉聚類的文章

原文連結:2011_CVPR_A Rank-Order Distance based Clustering Algorithm for Face Tagging

Rank-Order distance, which measures the dissimilarity between two faces using their neighboring information in the dataset.

The Rank-Order distance is motivated by an observation that faces of the same person usually share their top neigh- bors.

 

 

由於人臉的複雜場景,比如光照、姿態、表情等因素,絕對距離的度量方式可能會造成相同人的不同照片相似度很低,而不同人的照片反而相似度很高,所以單純的L1或L2距離已不再適用。

由於大部分家庭照片都拍攝於不同的環境,對於人臉聚類會有一些要求和挑戰:

1、相簿中的人臉通常會在高維空間形成幾個臉部簇,並具有不同的密度,大小和形狀。這種非均勻分佈使得絕對距離(例如,兩個人臉識別特徵之間的L1或L2距離)容易失敗。如下圖所示,男孩的群集比女孩的群集更稀疏。如果我們在這個例子中使用絕對距離,那麼這個在中間男孩的臉更接近女孩群。

2、人臉檢測通常會返回一些背景中不感興趣或不喜歡的人臉。通常,我們不想標記這些面孔。聚類演算法應該能夠處理這些噪聲和異常值。

3、演算法的執行時間應該滿足快速使用者互動的要求。

由於複雜的人臉分佈,同一人的所有人臉通常由幾個子叢集組成。由於這些子聚類相對比較緊密,因此可以通過簡單的閾值法以Rank-Order距離來強健地識別它們。然而,由於光照,姿態,表達等變化的干擾,子簇之間的連線通常較弱且稀疏。為了解決這個問題,我們提出了一種基於排序距離的聚類演算法,以迭代方式合併子簇凝聚的方式。聚類演算法結合了聚類級別的秩距離和聚類級別的距離。在每個迭代步驟中,合併任意兩個具有較小Rank-Order距離和較小歸一化距離的人臉聚類。以這種方式,來自同一個人的不同子叢集被有效連線。

Rank-order distance來度量兩個人臉的相似度。這個距離是基於一個有趣的觀察:同一個人的兩張臉有許多共享的top鄰居,但是來自不同人的人臉的鄰居通常差異很大。

Rank-Order Distance

1

演算法流程

img

該演算法的時間複雜度是O(N2)O(N2),其中DRDR和DNDN對應的兩個閾值是固定引數,而K近鄰是可以選擇的引數,該引數大小直接影響最後聚類的簇數目。

參考資料:https://pminmin.github.io/2016/12/13/rank-order/