PoseTrack: Joint Multi-Person Pose Estimation and Tracking

阿新 • • 發佈：2018-12-02

介紹

文章指出現有的方法不能直接解決posetrack問題，因為這個問題包括兩個問題，一個pose估計，一個是track

本文提出一個新穎的方法和一個數據集劍指同時解決這個兩個子問題，方法有幾個關鍵點

用一個時空graph，表達視訊中姿態估計
通過求解一個整數線性規劃問題（integer linear program）去把這個圖分割成子圖，每個子圖僅含有單個人的pose時空軌跡
這個問題還沒有定量的評價資料集，這文章提出一個PoseTrackDataset 資料集，這個資料集包含一個無約束的評價協議（沒有任何的，大小，尺寸，定位或者人數量的先驗假設，都是任意的）

方法

上圖可視化了本文的主要思路（bottom-up）：

第一行是檢測到的候選關節點，使用的是Deepcut(ECCV16 pose估計，後面會去看這文章，看完加連線)
第二行是所建立的圖，圖有兩種邊：一種是同一幀中不同種關節點的聯絡，分割結果是單幀中每個子圖中的節點都屬於同一個人；另外一種是兩幀之間同一種關節點的聯絡，分割結果是一個子圖僅包含視訊中同一個人的同一個關節點
圖分割結果

圖的邊權還有如何分割就不關注了，只能說為了讓邊權反映分割目標，設計非常複雜，填了一些坑（可能是看結果出現的一些分割規律，根據規律調整邊權設計，發現越多，調整的越多，顯得越複雜），下面只關注效果如何

結果比較可以參考PoseTrackDataset 文章中的結果

dataset文章出來時，這文章的結果已經不是state-of-art了，部分工作比它稍好一點點，現在（18年底）的話有微軟的Simple Baselines for Human Pose Estimation and Tracking，還有別的工作，取得的mAP和MOTA都比這個優秀很多

時效性，主要分析這個graph cut，因為圖割是序列程式，無法用gpu加速，測試用3.3GHz CPU：

PoseTrack: Joint Multi-Person Pose Estimation and Tracking

介紹文章指出現有的方法不能直接解決posetrack問題，因為這個問題包括兩個問題，一個pose估計，一個是track 本文提出一個新穎的方法和一個數據集劍指同時解決這個兩個子問題，方法有幾個關鍵點用一個時空graph，表達視訊中姿態估計通過求解一個整數線性規劃問題（i

Multi-Person Pose Estimation for PoseTrack with Enhanced Part Affinity Fields

介紹進階版的PAF，posetrack map 70！關鍵點冗餘的PAF 文中指出，由於PAF使用的聚合方法中，連線N個關節點只用了N-1條邊，要取得完整的聚合需要所有部分都檢測聚合正確，這是很難滿足的，因此設定一些冗餘的連線，可以提高聚合的效果。如

Simple Baselines for Human Pose Estimation and Tracking

介紹微軟神作，pose track 的新base line 比ICCV Pose track 冠軍在mAP上高15個點，在MOTA上高6個點姿態估計一個簡單的ResNet 結構三個卷積層+BN+ReLU 中間一個1*1的卷積層產生pose的h

RMPE：Regional Multi-Person Pose Estimation

摘要多人姿態估計現存方法效果不錯，但定位和識別上的小錯誤是不可避免的，這些錯誤會導致單人姿態估計的失敗。文章提出一種新穎的框架——RMPE：Regional Multi-Person Pose Estimation 這框架包含了三個部分關鍵點： Symme

『演算法學習』CPN：Cascaded Pyramid Network for Multi-Person Pose Estimation

原文L：https://www.cnblogs.com/hellcat/p/10138036.html 論文連線 CVPR2018的文章，用於關鍵點檢測（原話叫“多人姿態估計”）。本算髮聚焦點在於處理多人姿態估計所面臨的挑戰：關鍵點遮擋，關鍵點不可見，複雜背景等——就是優化對於難以檢測的點的

論文筆記（CPN）：Cascaded Pyramid Network for Multi-Person Pose Estimation

該論文發表在2018年CVPR上，用於多人姿態估計的級聯金字塔網路 arxiv論文地址：https://arxiv.org/abs/1711.07319 github程式碼：https://github.com/GengDavid/pytorch-cpn，https://g

《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記

《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記姿

《Cascaded Pyramid Network for Multi-Person Pose Estimation》--曠世2017COCO keypoints冠軍論文解讀

簡介《Cascaded Pyramid Network for Multi-Person Pose Estimation》，這是Face++曠世科技2017年取得COCO Keypoints Challenge冠軍的文章，主要目的是解決 in the wil

JointFlow: Temporal Flow Fields for Multi Person Pose Tracking

摘要多目標姿態跟蹤使用了時間流場(Temporal Flow Fields) 基於相鄰兩幀和時間網路的通用設計，使得其可以和多種人體姿態估計的空間網路搭配，這裡指時間網路主要處理track問題，而空間網路主要針對detect問題使用CNN提取相鄰兩幀的影象f

讀書筆記25：2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning（CVPR2018）

摘要：首先指出背景，即action recognition和human pose estimation是兩個緊密相連的領域，但是總是被分開處理。然後自然地引出本文的模型，本文的模型就針對這個現狀，提出了一個multitask framework，既能從靜態image中進行

CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark

摘要問題：擁擠場景中的pose估計文章提出自己的方法，包含兩個關鍵點： joint-candidate single person pose estimation (SPPE) global maximum joints association 該方法，對每個節點

Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記

ati 技術分享 mar 最大 ali ndt and 兩個 mat Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記這篇論文主要是兩個貢獻

caffe openpose/Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields配置（轉）

art gravity git sid 同學 person 配置 nac 生成 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 是CVPR2017的一篇論文，作者稱是世界上第一個基於深度

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields（翻譯）

poi mpi hal time pos 出了 keypoint 序列貪婪 0 - Abstract 　　我們提出了一種方法去在一張圖片中有效地識別多個人體的2D姿勢。這個方法使用了一個無參數表示法，我們將其叫為Part Affinity Fields（PAFs），其是去

2D多人關鍵點--《Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》

《Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》來源：CMU，OpenPose開源多人姿態模型原始碼：https://github.com/ZheC/Realtime_Multi-Perso

caffe openpose/Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields配置

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 是CVPR2017的一篇論文，作者稱是世界上第一個基於深度學習的實時多人二維姿態估計。優酷演示地址：連結前幾天作者公佈了windows

UPenn - Robotics 5:Robotics: Estimation and Learning - week 2:Bayesian Estimation - Target Tracking

with eve system cred tracking abi fuse true edi

論文閱讀 Multi-Scale Structure-Aware Network for Human Pose Estimation

1、文章在hourglass的網路基礎上做了四點改進 1）多尺度監督來加強語義特徵學習來融合多尺度的特徵 2）多尺度的迴歸網路來優化整體的人體結構 3）structure-aware損失（在多

RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 閱讀記錄

最近發現將閱讀論文的心得體會記錄下來是很有必要的，一方面將自己的想法用文字表達出來，可以鍛鍊論文寫作表達能力，便於後續論文寫作。另一方面，便於回顧自己的工作。本文僅代表我自己的觀點，對論文理解有誤的地方，歡迎大家指正。正如標題說是，本文是利用遷移學習技

6D姿態估計從0單排——看論文的小雞篇——Learning Descriptors for Object Recognition and 3D Pose Estimation

iss dem vol nodes rim ext obj tor triplet 這篇文章和前一篇把神經網絡主要集中於descriptor的對比方面不一樣的是，這一篇中CNN還用來區分不同的物體類別和同類別不同姿態從而確保不同類間距較大同類間距較小（但是足以區分pose）

PoseTrack: Joint Multi-Person Pose Estimation and Tracking

介紹

方法

相關推薦