1. 程式人生 > >幾個視訊中行為識別的底層特徵及程式碼

幾個視訊中行為識別的底層特徵及程式碼

1. 比較出名的是Ivan Laptev的 3D Harris,這是一個可執行檔案,用起來比較方便,是Harris在3維空間的擴充套件,檢測到特徵點之後是用HOG和HOF進行表示。一共的特徵維數是162維。點選這裡進入下載介面。

2. P. Dollar的cuboids角點檢測,方法大致是用1D的gabor進行濾波。檢測到角點之後,作者的實驗表明直接用cuboids裡面的梯度作為表示,然後再進行降維。我認為這個方法的缺點是降維之前的維數太高,求協方差矩陣特徵值所花費的時間比較多(一般降維前的特徵都是上萬維的)。但是這個演算法的一個好處是可以控制每個視訊提特徵點的個數。所以現在這個特徵用的人是最多的。程式碼需要給作者發郵件獲取。

3. Alexander Klaser的3D HOG不需要進行特徵點檢測,是對視訊進行稠密取樣,提取3D HOG特徵。點選這裡下載。這種稠密取樣的特徵在UCF Sports這個資料庫上面的效果很好。


4. Paul Scovanner 的3D SIFT,同樣也是將影象中很火的SIFT擴充套件到3維情況。但是這個特徵用的人相對較少。 點選這裡下載。