Improving RGB-D SLAM in dynamic environments: A motion removal approach
一、貢獻
(1)提出一種針對RGB-D的新的運動分割算法
(2)運動分割采用矢量量化深度圖像
(3)數據集測試,並建立RGB-D SLAM系統
二、Related work
[1]R.K. Namdev, A. Kundu, K.M. Krishna, C. Jawahar, Motion segmentation of multiple objects from a freely moving monocular camera, in: Robotics and Automation(ICRA), 2012 IEEE International Conference on, IEEE, 2012, pp. 4092–4099.
利用多幾何約束與密集光流分割運動物體,並整合至SLAM系統。
[2]T. Lim, B. Han, J.H. Han, Modeling and segmentation of floating foreground and background in videos, Pattern Recognit. 45 (4) (2012) 1696–1706.
通過檢查具有極線約束的密集光流,從圖像第一幀獲得運動提示,最初的運動分割作為種子向後傳播。將一幀圖像切割成等大的塊,在核密度模型中利用傳播的運動分割結果以塊為單位學習背景和前景外觀。運動分割與傳播模型反復叠代得到當前結果。
[3]K. Moo Yi, K. Yun, S. Wan Kim, H. Jin Chang, J. Young Choi, Detection of moving objects with non-stationary cameras in 5.8 ms: Bringing motion detection to your mobile device, in: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, 2013, pp. 27–34.
速度快,硬件要求低。采用了塊技術,采用雙模單高斯模型對每個塊進行描述,一個單高斯模型作為顯性的模型,另一個作為候選模型。雙模單高斯模型提供了兩個容器來接收數據,從而避免了前景點汙染了真實的背景模型。當一個模型的age大於另一個時,兩個模型作交換。使用從單應性計算的自我運動將塊與傳播混合。
[4]A. Teichman, J.T. Lussier, S. Thrun, Learning to Segment and Track in RGBD, IEEE Trans. Autom. Sci. Engrg. 10 (4) (2013) 841–852.
提出了基於RGB-D數據的運動去除算法,結合大量分割線索來構造條件隨機場(CRF)模型,分割線索包括光流,視覺外觀,顏色,深度的不連續性等。該方法的訓練過程是確定能量函數中每個線索的權重。假設在第一次叠代時給出了初始的手動標記分割。當前幀的CRF分割結果作為下一幀中CRF模型的運動似然。利用傳遞的方式將運動物體從每一幀裏遞增式得分割出來。
[5]D. Giordano, F. Murabito, S. Palazzo, C. Spampinato, Superpixel-based video object segmentation using perceptual organization and location prior, in: The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June
2015.
運動線索是通過檢查超像素在連續幀中變化獲得的,作者發現超分像素的改變一般是在運動的物體上,將超分像素從當前幀傳播到上一幀。使用上一幀中重疊最大部分的超分像素與傳遞的超分像素來計算Jaccard距離。采用自適應閾值以通過計算的Jaccard距離確定傳播的超像素是否屬於移動物體。 使用高斯混合(MOG)技術將超分像素分類以建立前景與背景外觀模型。 使用圖形切割框架進一步優化運動分割。
[6]Y. Wang, S. Huang, Towards dense moving object segmentation based robust dense RGB-D SLAM in dynamic scenarios, in: Control Automation Robotics & Vision (ICARCV), 2014 13th International Conference on, IEEE, 2014.
pp. 1841–1846.
與本文關聯最大。采用了[7]中提出的運動分割方法,並將其集成到RGB-D SLAM系統中,結果是基於TUM數據集。
[7]J. Sturm, N. Engelhard, F. Endres, W. Burgard, D. Cremers, A benchmark for the evaluation of RGB-D SLAM systems, in: 2012 IEEE/RSJ International Conference on Intelligent Robots and Systems, IEEE, 2012, pp. 573–580.
三、方法
1、基於自我運動補償圖像差分粗略地檢測運動物體運動。
2、通過使用粒子濾波器跟蹤運動來增強運動檢測。
3、對矢量量化深度圖像應用最大後驗(MAP)估計,以精確地確定前景。
應該註意的是,該論文方法中跟蹤的是運動補丁但不是移動物體。 我們的方法不同於大多數跟蹤技術,它們構建移動對象的模型並跟蹤構建的模型。
利用RGB通過RANSAC求出兩幀之間H單應矩陣,通過用運動補償的最後RGB幀減去當前RGB幀來粗略地檢測運動對象運動。 不在3D中補償RGB-D點雲幀的原因是當距離增加時,深度測量誤差呈二次方增加。
Improving RGB-D SLAM in dynamic environments: A motion removal approach