論文筆記之 SST: Single-Stream Temporal Action Proposals

阿新 • • 發佈：2017-06-11

ron 我們裁剪只需要 lock proposal 數據 function 性能

SST: Single-Stream Temporal Action Proposals

2017-06-11 14:28:00

　　本文提出一種時間維度上的 proposal 方法，進行行為的識別。本文方法具有如下的幾個特點：

　　　　1. 可以處理 long video sequence，只需要一次前向傳播就可以處理完畢整個video；可以處理任意長度的 video，而不需要處理重疊的時間窗口；

　　　　2. 在 proposal generation task 上取得了頂尖的效果；

　　　　3. SST proposals 提供了一個較強的基準，進行 temporal action localization，將該方法結合到現有的分類任務中，可以改善分類的性能。

　　所提出方法的流程圖如下所示：

　　技術分享

　　Technical Approach:

　　我們所要達到的目標是：在一個 long video 上產生 temporal action proposals。

　　網絡的幾個重要的部分：

　　1. Visual Encoder (C3D) 用於編碼 video frame，感知輸入 video ；

　　2. Seq.Encoder (GRU) 的輸入是降維後的 C3D feature，設計該模塊的目的是： accumulate evidence across time as the video sequence progresses. 為了能夠更好的產生 good proposals，該模塊應該能夠收集信息直到確定某個動作已經發生了，與此同時，扔掉不相關的背景信息。

　　技術分享

　　Training:

　　由於行為識別本身就是一個多分類問題，所以這裏用到了交叉熵損失函數來作為最終 loss function。

　　技術分享

　　而總的 loss 就是該 loss 的加和：

　　技術分享

　　數據集提供了裁剪好的 video，所以就是給定 gt 的監督訓練任務，完全可以用反向傳播算法進行訓練。　　

　　Reference:

　　1. Paper: http://vision.stanford.edu/pdf/buch2017cvpr.pdf

　　2. Github: https://github.com/ranjaykrishna/SST

論文筆記之 SST: Single-Stream Temporal Action Proposals

ron 我們裁剪只需要 lock proposal 數據 function 性能 SST: Single-Stream Temporal Action Proposals 2017-06-11 14:28:00 　　本文提出一種時間維度上的 proposal

論文筆記之 SST: Single-Stream Temporal Action Proposals

論文筆記之 SST: Single-Stream Temporal Action Proposals

Deep Learning論文筆記之（二）Sparse Filtering稀疏濾波

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

論文筆記之No-reference blur assessment based on edge modeling

論文筆記之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》

論文筆記之聚類演算法Clustering by propagating probabilities between data points

nodejs筆記之流（stream）

論文筆記之Learning Convolutional Neural Networks for Graphs

論文筆記-Temporal segment network:towards good practices for deep action recognition

論文閱讀筆記之——《Practical Signal-Dependent Noise Parameter Estimation From a Single Noisy Image》

CTC（Connectionist Temporal Classification）論文筆記

論文筆記6：Increasing the Action Gap: New Operators for Reinforcement Learning

Compressed Video Action Recognition論文筆記

Struts2筆記之Action子節點result

論文筆記：語音情感識別（四）語音特徵之聲譜圖，log梅爾譜，MFCC，deltas

論文筆記：語音情感識別（五）語音特徵集之eGeMAPS，ComParE，09IS，BoAW

Java8學習筆記之Stream API

論文筆記 | A Closer Look at Spatiotemporal Convolutions for Action Recognition

SSD: Single Shot MultiBox Detector 深度學習筆記之SSD物體檢測模型

Reinforced Temporal Attention and Split-Rate Transfer for Depth-Based Person Re-Identification 論文筆記

論文筆記之 SST: Single-Stream Temporal Action Proposals

相關推薦