1. 程式人生 > 實用技巧 >irca slam與深度學習結合論文總結

irca slam與深度學習結合論文總結

1 UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning

文件存放名稱:1-UnDeepVO
Abstract總結:本文提出一個新的VO系統,可以實現單目影象的6個自由度的姿態估計,主要亮點:(1)採用無監督的深度學習架構 (2) 可以恢復出絕對的尺度。

疑問:1 如何使用深度學習來構建VO系統,如何訓練,最後的預測結果(6維姿態估計,深度)如何得到?

主要架構:
在這裡插入圖片描述
Introduction總結
基於模型或者幾何的VO分為特徵法和直接法,取得不錯的效果,但是有一些缺點:對相機引數敏感、對複雜環境難以勝任(弱紋理、運動模糊、光照複雜)。資料驅動的VO或者基於深度學習的VO由於魯棒性好具有很大的潛力,如最開始將深度學習應用在重定位,使用rgb影象作為輸入用CNN做6個自由度的姿態估計,給定光流使用基於CNN的端到端VO系統,基於RCNN的VO方法取得和基於模型的方法接近的效能,DeMoN可以同時估計相機運動和影象深度、表面法向量和光流,還有基於深度學習的VIO。

但是上面的方法存在一個問題就是需要相機位姿的真值和深度影象來進行訓練。這個問題可以使用無監督的深度學習VO來解決。無監督深度學習的VO主要用於深度估計,後面有人用左右雙目的光度差損失函式進一步提升了深度估計的效能,進而有人使用單目來估計自身運動和深度但是不能恢復尺度。
UnDeepVO主要貢獻:(1)利用時空關係提出一種無監督學習的單目VO系統(2)估計位姿和影象深度的同時可以恢復尺度(3)系統在KITTI上表現不錯

系統概述