1. 程式人生 > >2018.09.06

2018.09.06

  • Exploiting Transitivity for Learning Person Re-identification Models on a Budget,Sourya Roy, UC Riverside ; Sujoy Paul, UC Riverside; Neal Young, UC Riverside ; Amit Roy-Chowdhury, UC Riverside

摘要

這是一篇很與眾不同的論文,文章主要分析如何最低工作量的標註一個ReID資料集,目的是減少人工標註的費力投入。論文利用了一個很簡單的思路:如下圖所示, P_k^i 表示第 k

 個相機的第 i 張行人圖片。現在加入我們標註 P_1^1-P_2^1 和 P_1^1-P_3^2 都是正樣本對,那麼我們可以得到 P_2^1-P_3^2 也是正樣本對。同理如果我們經過標註得到 P_1^1-P_3^1 是負樣本對,那麼我們可以推出 P_2^1-P_3^1 也是負樣本對。當然,我們依然不知道 P_2^2-P_3^1 是什麼關係。論文就在研究這個問題,文圖論的相關理論推導,介紹了許多公式的約束,

選取B個點或者直線數量,在構造三角形約束的時候有至少要有一個positive edge,至少要選擇2條邊,選那種使得至少有1個positive的概率最大的triangle。用到了兩個方法,一個是1/2 max-cut,之後的原理公式就沒有看懂了。

因此我沒有看懂。最終的結論是大概只需要標註8%~15%的資料,就可以得到整個資料集的標註結果。

文章中用到了max-cut演算法

max-cut演算法:將圖分成兩部分,使得劃分的邊數最多。或者說話分的邊上的權重最大。

二分圖:圖中的頂點分成兩個互不相交的點集,邊分別連線的是不同的資料集的點

Multiscale Representation for Partial Face Recognition Under Near Infrared Illumination
解決partial face中不同size的圖片大小的問題。計算量很大。一共有55個patches,就訓練了55個MDSCNN,計算量還可想而知。每一個patch都會計算一個權重,最後根據不同patches的不同權重來計算兩張image之間的dissimilarity

 

常用的分佈:0-1 分佈   2項分佈    泊松分佈   均勻分佈    高斯分佈    指數分佈

bagging與boosting區別:

整合學習的三個關鍵點:弱分類器的選擇、訓練分類器的資料集的選擇方式、分類器的組合方式

cnn網路的特徵平移不變性

    

 

看到這幅圖,是不是有什麼想法,卷積神經網路低層獲得是紋理  線條類的特徵。上層獲得的是比較抽象、語義資訊更豐富的特徵。如果將不同層的特徵抽取融合、part 與global loss結合,以及注意力模型當中是否可以加入global模型資訊來進行行人識別

疑惑點:到底multi-scale指的是什麼?STN網路學到的有意義的feature是什麼

網路有全連線層的要求輸入固定大小尺寸的圖片