視訊行為識別閱讀[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

阿新 • • 發佈：2018-11-21

[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]（TSN網路）

概括：

為了解決長序列的視訊行為識別問題，將長序列切分成短序列並從中隨機選擇部分，作為雙流網路的輸入，採用多個這樣的雙流網路，最後將各個子網路的得分值進行均值融合得到最終結果。
#####介紹：
(1)對於長序列的學習能力在理解視訊行為上具有重要意義，但是主流的雙流法和C3D通常只是聚焦於表面或者是短時間序列的學習（C3D的輸入是連續的16幀，而雙流法是依靠前後兩幀計算出來的光流）。Long-term temporal convolutions for action recognition.[2016]、Beyond short snippets: Deep networks for video classification.[CVPR2015]、Long-term recurrent convolutional networks for visual recognition and description[CVPR2015]等文章通過預定義的取樣間隔進行稠密時序取樣解決這種問題，但是卻增大了計算量。
(2)卷積神經網路訓練需要大量的資料，否則容易過擬合，公開資料集UCF101和HMDB51在尺寸和多樣性上不足。在影象識別中非常深的網路，例如Very deep convolutional networks for large-scale image recognition. [[ICLR2015]和Batch normalization: Accelerating deep network training by reducing internal covariate shift.[ICMl2015]，在視訊行為識別中可能存在較高的過擬合風險。
(3)連續視訊幀具有高度冗餘性（相鄰動作間的相似性極大）。TSN在長的視訊序列上均勻的抽取短的序列，然後在聚合這些資訊，這樣TSN能夠模擬長的視訊。
(4)為了釋放該網路的潛力，使用了非常深的網路Batch normalization: Accelerating deep network training by reducing internal covariate shift.[ICMl2015]和Very deep convolutional networks for large-scale image recognition. [[ICLR2015]，探索了一些方法去使用少量的樣本就可以進行訓練。例如：資料增強、跨模態預訓練、正則化。
You lead, we exceed: Labor-free video concept learning by jointly exploiting web videos and images. In: CVPR

測試

這裡寫圖片描述
四種訓練模式，第一行：原始雙流網路；第二行，從頭開始；第三行：預訓練空間流；第四行：交叉模式預訓練；第五行：交叉預訓練和部分BN dropout相結合。

視訊行為識別閱讀[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]（TSN網路）

概括：

相關工作：

測試

視訊行為識別閱讀[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

論文筆記-Temporal segment network:towards good practices for deep action recognition

基於temporal segment networks的行為識別

視訊行為識別論文閱讀[4]

視訊行為識別論文閱讀[3]

深度學習在視訊行為識別中應用

視訊行為識別檢測綜述 IDT TSN CNN-LSTM C3D CDC R-C3D

【論文筆記】光流在視訊行為識別中的作用

【人臉識別】A Discriminative Feature Learning Approach for Deep Face Recognition

人臉識別：coco loss-Rethinking Feature Discrimination and Polymerization for Large-scale Recognition

人臉識別（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition

視訊動作識別--Two-Stream Convolutional Networks for Action Recognition in Videos

Temporal Action Detection with Structured Segment Networks

CVPR2018 | R(2+1)D結構：視訊動作識別中的時空卷積深度探究

opencv隨筆記錄:2.anaconda+windows系統下實現視訊目標識別yolov3

行為識別筆記：C3D network-用於視訊特徵提取的3維卷積網路

幾個視訊中行為識別的底層特徵及程式碼

【論文閱讀】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【論文閱讀】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

視訊人員行為識別（Action Recognition）

視訊行為識別閱讀[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]（TSN網路）

概括：

相關工作：

測試

相關推薦