視覺SLAM十四講學習筆記——第二講
2.1引子:小蘿蔔的例子
1. 慣性測量單元(Inertial Measurement Unit, IMU)
2. 按照工作方式的不同,相機可以分為單目相機(Monocular)、雙目相機(Stereo)、和深度相機(RGB-D)三大類。
3. RGB-D除了能夠採集到彩色圖片之外,還能夠讀出每個畫素與相機之間的距離。
單目相機
只使用一個攝像頭進行SLAM的做法稱為單目SLAM(Monocular SLAM)。
雙目相機和深度相機
深度相機的最大特點是可以通過紅外結構光或Time-of-Flight(ToF)原理,像鐳射感測器那樣,通過主動向物體發射光並接收返回的光,測出物體與相機之間的距離。
2.2經典視覺SLAM框架
整體視覺SLAM流程圖
整個視覺SLAM流程包括以下步驟。
1. 感測器資訊獲取。相機影象資訊的預處理
2. 視覺里程計(Visual Odometry, VO)。視覺里程計的任務是估算相鄰影象間相機的運動,以及區域性地圖的樣子。VO又稱為前端(Front End)。
3. 後端優化(Optimization)。後端接受不同時刻視覺里程計測量的相機位姿,以及迴環檢測資訊,對它們進行優化,得到全域性一致的軌跡和地圖。
4. 迴環檢測(Loop Closing)。迴環檢測判斷機器人是否到達過先前的位置。
5. 建圖(Mapping)。它會根據估計的軌跡,建立與任務要求對應的地圖。
VO能夠通過相鄰幀間的影象估計相機運動,並恢復場景的空間結構。
在視覺SLAM中,前端和計算機視覺領域更為相關,比如影象的特徵提取與匹配等,後端則主要是濾波與非線性優化演算法。
SLAM問題的本質:對運動主體和周圍環境空間不確定性的估計。
迴環檢測,又稱閉環檢測(Loop Closure Detectioon),主要解決位置估計隨時間漂移的問題。
度量地圖(Metric Map):
度量地圖強調精確地表示地圖中物體的位置關係,通常用稀疏(Sparse)與稠密(Dense)對其分類。
拓撲地圖(Topological Map):
拓撲地圖更加強調地圖元素之間的關係。