讀Multimodal Motion Prediction with Stacked Transformers

阿新 • • 發佈：2021-07-20

讀Multimodal Motion Prediction with Stacked Transformers

paper | github(尚未更新程式碼)
貢獻 | 模型框架 | 具體實現 | 其他需要注意

貢獻

第一個使用堆疊Transformer
RTS
STOA

模型框架

中間的三塊主幹即堆疊的Transformer，分別用於提取軌跡地圖及互動資訊；最後也是迴歸軌跡和分數。採用新的基於區域的訓練策略來訓練網路。

具體實現

軌跡特徵提取
從目標車輛和臨近車輛的軌跡中，提取特徵。由編碼器和解碼器組成。
地圖特徵提取
接受軌跡特徵和地圖資料（車道中心線的向量表示），輸出經地圖特徵加權後的目標車輛軌跡特徵和臨近車輛軌跡特徵；

互動特徵提取
在目標車輛軌跡特徵與臨近車輛軌跡特徵作輸入，但只解碼目標車輛特徵以提高效率；
軌跡解碼
類似於LaneGCN，兩支：軌跡和分數；
Region-based Training Strategy
[35]告訴我們，直接回歸預測軌跡，將導致模式平均問題，不能體現多模；只使用minFDE的預測軌跡來計算迴歸和分類損失能解決這一問題；多模K越多，會導致模式崩潰問題； RTS即將預測軌跡歸類到按照真實軌跡終點聚類而成的幾個空間區域中，通過模型訓練優化改善每個區域中的預測表現；區域劃分：將車輛旋轉到航向指向y軸正方向，按照終點來聚類，得到7個區域；計算歸於真實軌跡所在區域的每條預測軌跡的分類迴歸損失，而不是最靠近的真實軌跡的那一條軌跡的損失；

Loss Function
用於迴歸損失的Huber損失、用於評分的KL散度、區域分類損失、；
迴歸損失
Huber損失：相比平方誤差損失，Huber損失對於資料中異常值的敏感性要差一些。在值為0時，它也是可微分的。它基本上是絕對值，在誤差很小時會變為平方值。誤差使其平方值的大小如何取決於一個超引數δ，該引數可以調整。當δ~ 0時，Huber損失會趨向於MSE；當δ~ ∞（很大的數字），Huber損失會趨向於MAE。
KL散度

KL散度: 在概率論或資訊理論中，KL散度( Kullback–Leibler divergence)，又稱相對熵（relative entropy)，是描述兩個概率分佈P和Q差異的一種方法。
區域分類損失
鼓勵到預測在正確的區域的軌跡有更高的分數，交叉傷損失函式；

中間層損失
加速訓練過程整個損失函式

其他需要注意

生成預測軌跡的兩種方法：

基於概率生成模型：
基於預定義軌跡的方法：
迴歸軌跡

兩種改善模式平均的機制：

軌跡提議機制
基於區域的訓練策略

讀Multimodal Motion Prediction with Stacked Transformers

讀Multimodal Motion Prediction with Stacked Transformers paper | github(尚未更新程式碼) 貢獻 | 模型框架 | 具體實現 | 其他需要注意

Python開啟檔案、檔案讀寫操作、with方式、檔案常用函式例項分析

本文例項講述了Python開啟檔案、檔案讀寫操作、with方式、檔案常用函式。分享給大家供大家參考，具體如下：

Human motion prediction research 人體運動預測研究

Temporal Attention + MHU 論文：【2018IJCAI】Long-Term Human Motion Prediction by Modeling Motion Context and Enhancing Motion Dynamic 創新點1：MHU 創新點2：gram matrix loss網路總體分為兩部分：

python 讀寫二進位制檔案 with用法

有的時候需要用python處理二進位制資料，比如，存取檔案，socket操作時.這時候，可以使用python的struct模組來完成.可以用 struct來處理c語言中的結構體.

Barquero-2022-BeLFusion Latent Diffusion for Behavior-Driven Human Motion Prediction

# BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction #paper 1. paper-info 1.1 Metadata

讀 Trajectron++: Dynamically-Feasible TrajectoryForecasting With Heterogeneous Data

讀 Trajectron++: Dynamically-Feasible TrajectoryForecasting With Heterogeneous Data paper github 貢獻

論文筆記2：Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

文章連結：https://arxiv.org/abs/2012.15840 1 引言傳統的語義分割模型一般採用全卷積神經網路的設計，使用編解碼結構。受限於CNN感受野過小，無法學習長程依賴資訊，故而使用空洞卷積或者添加註意力模組的方法增

VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text

VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text 2021-07-22 08:54:20

論文筆記3：SegFormer Simple and Efficient Design for Semantic Segmentation with Transformers

論文地址：https://arxiv.org/abs/2105.15203 1 引言文章提出了一種基於transformer的語義分割網路，不同於ViT模型，SegFormer使用一種分層特徵表示的方法，每個transformer層的輸出特徵尺寸逐層遞減，通過這種方式

讀HOME: Heatmap Output for future Motion Estimation

paper 貢獻 | 模型框架 | 具體實現 | 貢獻提出一種用影象輸出解決運動預測問題的方法；

Stream Processing with Apache Flink中文版-- 第8章與外部系統的讀寫互動

資料可以儲存在許多不同的系統中，比如檔案系統、物件儲存、關係資料庫系統、鍵值儲存、搜尋索引、事件日誌、訊息佇列等等。每一類系統都是為特定的訪問模式設計的，並且擅長於服務於特定的目的。因此，今天的資料基

論文閱讀（標定）-Motion-Based Calibration of Multimodal Sensor Arrays

Motion-Based Calibration of Multimodal Sensor Arrays 多模態感測器陣列的基於運動的標定背景：

【ICCV 2021】論文閱讀：3D Human Pose Estimation with Spatial and Temporal Transformers

ICCV2021 的一篇文章，一開始的感覺是在之前CVPR 2019上的VideoPose3D基礎上做的一些工作，主要是把最近兩年很火的vision Transformer加到了上面。

Transformers - 2 - End-to-End Object Detection with Transformers - 1

End-to-End Object Detection with Transformers Abstract: 提出了一種將目標檢測視為直接的集合預測問題的新方法。我們的方法簡化了檢測管道，有效地消除了對許多手工設計元件的需求，比如非最大抑制程式

AOP實現mysql的主從資料庫：讀寫分離

1.問題首先，為什麼會碰到這樣的問題？昨天寫的一個業務上線了，但是在dev環境和test環境都能跑，但是到了線上環境發生資料不能插入的問題。

併發讀寫資料一致性保證（二）-MySQL

業務開發過程，其實就是使用者業務資料的處理過程，因而開發的核心任務就是維護資料一致不出錯。現實場景中，多個使用者會併發讀寫同一份資料（如秒殺），不加控制會翻車、加了控制則降低併發度，影響效能和使用者體

HDFS的讀寫機制

本篇部落格講解了HDFS的讀機制和寫機制，通過一個例項演示了HDFS的檔案儲存過程，非常通俗易懂。

帶你入坑大資料（二） --- HDFS的讀寫流程和一些重要策略

前言前情回顧如果說上一篇是在闡述HDFS最基礎的理論知識，這一篇就是HDFS的主要工作流程，和一些較為有用的策略

MySQL讀寫分離主從複製原理？主從同步時延問題？

面試題你們有沒有做 MySQL 讀寫分離？如何實現 MySQL 的讀寫分離？MySQL 主從複製原理的是啥？如何解決 MySQL 主從同步的延時問題？

淺談go語言中的讀寫鎖和互斥鎖

Hello，各位小夥伴大家好，我是小棧君，近期氣溫有所下降，希望各位小夥伴記得防寒保暖，不要感冒了哦。

讀Multimodal Motion Prediction with Stacked Transformers

讀Multimodal Motion Prediction with Stacked Transformers

貢獻

模型框架

具體實現

其他需要注意

相關推薦