論文翻譯:Multi-view People Tracking via Hierarchical Trajectory Composition
阿新 • • 發佈:2019-01-07
Abstract
本文提出了多視點物件跟蹤的分層組合方法。其關鍵思想是自適應地利用二維和三維的多重線索,例如地面佔有一致性,外觀相似性,運動相干性等,這些線索在追蹤行人軌跡的過程中相互補充。雖然在過去的文獻中已經廣泛地研究了特徵聯機選擇,但是如何有效地排程這些提示以用於追蹤目的仍然不清楚,特別是在遇到各種挑戰時,例如,遮擋,連詞和外觀變化。為此,我們提出了一個層次組合模型,並將多視點多目標跟蹤作為組合結構優化的一個問題。我們設定了一套組合標準,每個標準對應一個特定的提示。通過利用不同的標準來追求層次組合過程,這在圖層節點和其層次結構中的後代之間施加了約束。我們學習使用最大似然估計(MLE)標註資料的構成標準,並通過迭代貪婪追蹤演算法有效地構建分層圖。在實驗中,我們證明了我們的方法在三個公共資料集上的優越效能,其中之一是由我們新建立的,以測試多檢視多目標跟蹤中的各種挑戰。1. Introduction
如圖1所示,假設我們想跟蹤突出顯示的人物並獲得完整的軌跡(e)。 追蹤的最佳策略可能隨空間和時間而變化。 例如,在(a)中,由於人物在特定時間段內共享相同的外觀,因此我們應用基於外觀的跟蹤器來獲得2D軌跡; 在(b)和(c)中,由於可以從兩個不同的視角完全觀察物件,所以我們可以通過測試它們的3D位置的接近度將這兩個邊界框組合成3D軌跡; 在(d)中,由於在這個檢視中被攝體完全被遮擋,所以我們考慮從被背景佔用限制的3D軌跡曲線對其位置進行取樣。
在
每個標準著眼於一個特定的提示上,實際上相當於一個簡單的跟蹤器,例如外觀跟蹤器[29,45],幾何跟蹤器[35],運動跟蹤器[2],將相同檢視或不同檢視的軌跡組合成更大尺寸的軌跡。成分標準是我們的方法的核心:可行的組成可以遞迴地進行,因此標準可以被有效地利用。
為了推斷組成結構,我們放棄了基於MCMC取樣的演算法,因為它們的計算複雜度很高。 我們通過漸進式組合過程來逼近層次結構。 組合排程問題通過迭代貪婪追蹤演算法解決。 在每一步中,我們首先“貪婪”地尋找並應用具有最大概率的構圖,然後重新計算增量部分的引數。
在實驗中,我們在一系列具有挑戰性的資料集上評估所提出的方法,結果證明優於其他最先進方法的效能。 此外,我們設計了一系列比較實驗來系統地分析每個標準的有效性。
本論文的主要貢獻是雙重的。 首先將多視點多目標跟蹤重構為層次結構優化問題,提出了三種基於軌跡的合成準則,共同開發不同型別的線索。 其次,我們建立了一個新的資料集,以解決更多的挑戰,呈現更豐富的視覺資訊,並提供比現有資料集更多的詳細註釋。
本文的其餘部分安排如下。 我們在第二部分回顧了相關工作,在第三部分介紹了我們的方法的公式,並在第四部分討論了學習和推理過程。第五部分介紹了實驗和比較,最後是第六部分的結論。