1. 程式人生 > >用核化的相關濾波器來高速跟蹤

用核化的相關濾波器來高速跟蹤

原文來自 Joao F. Henriques 等人的“High-Speed Tracking with Kernelized Correlation Filters”,原工作見12年的ECCV,現有工作見15年的PAMI。

本文後面提及的“我們”預設指原作者。
另外,為與演算法課程的內容區分,將“algorithm”譯為“方法”。你管我~ ╭( ̄m ̄*)╮

摘要

大多目前的濾波器的核心部分是一個可分性濾波器,該濾波器的任務是區分目標與周圍環境。為解決自然影象中的變化,典型的方法是用平移和縮放的樣本塊(patches)來訓練分類器。這樣的樣本集充滿冗餘 - 將所有重疊的畫素約束為相同的畫素

。基於這一簡單的觀察,為包含上千個平移的影象塊的資料集提出了一分析模型。可用離散傅立葉變換對角化已有的迴圈矩陣,極大降低了儲存和計算量。有趣的是,對於線性迴歸,我們的公式與相關濾波器等價(一些最快的有競爭力的跟蹤器常用相關濾波器);然而,對於核迴歸,不同於其它核方法(複雜度與其線性部分相同),提出新的核化的相關濾波器(Kernelized Correlation Filter)。在核化的相關濾波器的基礎上,提出通過線性核,擴充套件線性相關濾波器至多通道,我們稱為“對偶的相關濾波器(Dual Correlation Filter)”。儘管每秒執行上百幀,且用到的程式碼行數很少(方法 1),KCF和DCF仍在包含50
個視訊的基準資料集上超越了Struck或TLD。為進一步發展,該跟蹤框架已開源。

1 簡介

2 相關工作

2.1 檢測後跟蹤(tracking-by-detection)

2.2 取樣平移和相關性跟蹤

2.3 後續工作

此處偷懶,略去n個字。o(‵▽′)ψ

3 貢獻

之前提出該工作的初版。首次表明,用迴圈平移的樣本關聯嶺迴歸(Ridge Regression)與經典的相關濾波器。從而可用O(nlogn)的快速傅立葉變換來快速學習(而不是計算代價高昂的矩陣代數)。儘管受限於單通道影象,仍提出了第1個核化的相關濾波器。另外,提出計算所有迴圈平移的閉式解。其計算代價同樣為O

(nlogn),並被派生至徑向基與點積核。

目前的工作很大程度上附加了初版的工作。用更簡單的對角化來獲得原結果(46)。擴充套件原工作至多通道,用先進的特徵使效果有很大提升(7)。在原結果的基礎上新增大量新的分析和直觀的解釋。也將原實驗從12個視訊擴充套件至50個視訊,並新增基於方向梯度直方圖(HOG,而不是原畫素(raw pixel))的KCF跟蹤器的變種。用線性核,另外提出計算代價很低但效果逼近非線性核的一個線性多通道濾波器。稱之為對偶的相關濾波器(DCF),並表明DCF如何關聯一系列最近的計算代價更高的多通道濾波器。實驗上,KCF已優於無特徵提取的線性濾波器。使用HOG特徵後,使線性DCF與非線性KCF的效果遠優於頂級跟蹤器(Struck或TLD),同時以每秒上百幀舒適執行。

4 元件

本節,為不同平移後提取的影象塊提出一分析模型,計算線性迴歸的影響。並表明線性迴歸與經典的相關濾波器間的聯絡。這些元件使我們能研究57節中更復雜的演算法。

4.1 線性迴歸

這裡將關注嶺迴歸,因為嶺迴歸可輸出簡單的閉式解,並可實現接近更成熟方法(如支援向量機)的效果。訓練的目的,是為尋找函式f(z)=wTz,該函式可最小化樣本xi與它們的迴歸目標yi上的平方誤差。

minwi(f(xi)yi)2+λ||w||2.(1)
其中,λ為控制過擬合的正則引數。該最小化目標函式有閉式解,
w=(XTX+λI)1XTy.(2)
4.4節起,計算會在頻域,頻域中的數值通常為複數。此時用方程(2)的複雜版本即可求解,
w=(XHX+λI)1XHy.(3)
其中,XH為Hermitian 轉置,即XH=(X)T,且XX的複數共軛。對於實數矩陣,方程(3)等價方程(2)

總的來說,求解大的線性方程阻礙瞭解的實時計算。所以,下一段將看到可超越該限制的xi的特例。

4.2 迴圈移位(cyclic shift)

為表述簡潔,這裡將關注單通道的一維訊號。可直接泛化至多通道的二維影象(7)。

考慮一個n×1的向量x,該向量表示感興趣物體的1個影象塊,將其看作基樣本(base sample)。目標是訓練基樣本(1個正例)和平移基樣本得到的若干個假樣本(視為反例)。用迴圈移位操作符來平移一維向量,得到置換矩陣(permutation matrix)

P=010...0001...0000..................1100...0.(4)

則乘積Px=[xn,x1,x2,...,xn1]Tx平移1個元素,形成小平移。可用矩陣的乘方Pux來鏈式移位u次,從而實現更大平移u為負數時朝反方向移位。用該方法水平移動後的1維訊號和

相關推薦

相關濾波器高速跟蹤

原文來自 Joao F. Henriques 等人的“High-Speed Tracking with Kernelized Correlation Filters”,原工作見12年的ECCV,現有工作見15年的PAMI。 本文後面提及的“我們”

基於相關濾波器跟蹤-效果直逼Struck和TLD跟蹤

原文:http://cvlab.hanyang.ac.kr/tracker_benchmark_v10.html 作者ECCV2012的文章就被我關注過,速度驚人的快。2015年新作出來了。發文以供同行參閱。 Kernelized Correlation Filters J

KCF(相關濾波)跟蹤公式推導筆記(1)——線性情況下濾波器的解

線上性條件下,利用迴圈矩陣,最終的解為 w^=x^∗⊙y^x^∗⊙x^+λ(1)(1)w^=x^∗⊙y^x^∗⊙x^+λ 即為論文原文的(12)式,其中: (1)x^x^即F(x)F(x),表示xx的離散傅立葉變換 (2)字母右上角的星號表示共軛

@XmlType的propOrder屬性 指定序列的順序。

預設情況下,Jaxb編組出來的xml中的欄位順序是隨機的,你可以使用@XmlType的propOrder屬性 來指定序列化的順序。 第一步:定義java類時,使用@XmlType(propOrder = { "id", "name", "age","book"})指

相關濾波-KCF-視訊跟蹤演算法解析(1)

動機: 大部分基於檢測的視訊跟蹤演算法,當選取充足的樣本時,計算量太大無法保證跟蹤演算法的實時性,因此,大部分基於檢測的演算法都以犧牲樣本的數量來保證演算法的實時性。這使得跟蹤演算法的魯棒性比較差。因此,有沒有一種比交好的方法,既能保證實時性又能儘量選取足夠的的樣本進行訓

10、自學——Linux的學習進度與任務【戶和戶組相關操作】

sha256 用戶授權 gpasswd upm 登錄 shel 默認 不同 管理 用戶和用戶組相關操作 用戶和用戶組定義:     用戶:資源獲取標識符(資源分配),是安全權限模型的可信要素之一      用戶組:用戶組是指多個用戶的集合,方便對一類需要同樣權限的用戶授權

【轉】正則相關鏈接

blog class bsp src rop 折疊 img detail link 正則化,歸一化的概念 基於Matlab介紹正則化方法 正則化方法:L1和L2 regularization、數據集擴增、dropout 基於Matlab介紹機器學習中的正則化,理解

DAY5新建戶 及相關配置文件

img 創建用戶 技術 userdel 補充 配置 2.3 useradd 建立 1、新建用戶,查看用戶文件信息2、補充:手動建用戶2.1、 更改用戶信息2.2、手動建立用戶需要手動建家目錄2.3、手動建立用戶需要手動建用戶郵箱3、建立用戶可以指定文件信息 1、新建

linux strace-跟蹤進程的系統調或是信號產生情況,lstrace-跟蹤己醜年調庫函數情況,進程跟蹤調試命令

如何獲取 shel ++ 快速 靜態 exec 疑難雜癥 reat 案例 本工具可以用來做大多數排除,比如mount一個NFS,很慢,找不出原因,我們可以使用strace命令來跟中mount這個經常所有的調用過程。 strace 命令是一種強大的工具,它能夠顯示所有由

跟著辛星PHP的反射機制實現插件

red 實現 track 這一 列表 each 方法 fun 繼承 我的博文的前一篇解說了PHP的反射機制是怎麽回事,假設讀者還不清楚反射機制,能夠搜索下或者看我的博文,都是不錯的選擇。我們開始解說一下怎麽用PHP來實現插件機制。所謂插件機制。就是我們定義

Linux 戶管理相關命令

root sudo 1、root用戶創建用戶,同時創建 /home 下用戶目錄,將此用戶加入 sudo 組。useradd walker -m -g sudo2、root用戶創建或修改密碼。passwd walker*** walker ***本文出自 “walker的流水賬” 博客,請務必保留此出處

sqlserver戶角色相關的權限

sql log 相關 -1 色相 img sqlserve mage 用戶角色 sqlserver用戶角色相關的權限

戶、戶組相關的4個文件

網絡 linux 4個文件跟用戶、組密切相關: (本文以centos7為實驗版本) 存放用戶信息的文件:/etc/passwd ##存放用戶名稱、shell等信息 /etc/shadow ##存放用戶密碼等信息 存放用戶組信息的文件:/etc/group ##存放組名等

新建戶的相關文件

網絡 linux /etc/login.defs 針對文本內容我們進行簡要說明cat /etc/login.defs ##以下僅摘出部分字段進行分析 MAIL_DIR /var/spool/mail ##創建用戶時對應的郵箱路徑 PASS_MAX_DAYS 99999 #

樹鏈剖分寫LCA

ostream 第一次 pri def -- != dfs roo truct 當兩個點在一條鏈上,它們的LCA就是深度較小的那個點。 於是這種樹鏈剖分寫LCA的思想就是把要求的兩個點想辦法靠到一條鏈上。 而且要靠到盡量更優的一條鏈上(重鏈)。 做法: 預處理出每

Day21-獲取戶請求相關信息及請求頭

ping blog drive erl inf erp string handler 127.0.0.1 1. request裏面還包含請求頭等信息,可以打印看一下。 views.py中的程序 from django.shortcuts import render,Ht

TP5.0 mysql 使用函數時 怎樣數組的方式查詢

comm 表達式 字段 stat name 例子 ref www. where 今天在查詢數據的時候 遇到一個小問題 就是在用TP5.0的時候 查詢數據的時候需要用到一個函數 FIND_IN_SET 對於這個函數的用處 就是 首先舉個例子來說: 有個文章表裏面有個ty

三角---深度濾波器

code 顯示 -1 均值 原來 earch oar inline 特征匹配 一.三角化得到空間點的三維信息(深度值) (1)三角化的提出 三角化最早由高斯提出,並應用於測量學中。簡單來講就是:在不同的位置觀測同一個三維點P(x, y, z),已知在不同位置處觀察到的三維點

Linux(Centos )的網絡內參數優化提高服務器並發處理能力【轉】

正在 數量 庫服務器 sdn 正常 般的 優化 trie 字數 簡介 提高服務器性能有很多方法,比如劃分圖片服務器,主從數據庫服務器,和網站服務器在服務器。但是硬件資源額定有限的情況下,最大的壓榨服務器的性能,提高服務器的並發處理能力,是很多運維技術人員思考的問題。要提高

視頻結構相關調研

down flickr 關系 微博 資源分配 雅虎 learning 視頻 migration 視頻結構化是一種視頻內容信息提取的技術,它對視頻內容按照語義關系,采用時空分割、特征提取、對象識別等處理手段,組織成可供計算機和人理解的文本信息的技術。 深度學習為視覺和語言之間