1. 程式人生 > >視覺SLAM十四講學習筆記——第二講

視覺SLAM十四講學習筆記——第二講

2.1引子:小蘿蔔的例子

  1. 慣性測量單元(Inertial Measurement Unit, IMU)

  2. 按照工作方式的不同,相機可以分為單目相機(Monocular)、雙目相機(Stereo)、和深度相機(RGB-D)三大類。

  3. RGB-D除了能夠採集到彩色圖片之外,還能夠讀出每個畫素與相機之間的距離。

  單目相機

    只使用一個攝像頭進行SLAM的做法稱為單目SLAM(Monocular SLAM)。

  雙目相機和深度相機

    深度相機的最大特點是可以通過紅外結構光或Time-of-Flight(ToF)原理,像鐳射感測器那樣,通過主動向物體發射光並接收返回的光,測出物體與相機之間的距離。

2.2經典視覺SLAM框架

  

整體視覺SLAM流程圖

  整個視覺SLAM流程包括以下步驟。

  1. 感測器資訊獲取。相機影象資訊的預處理

  2. 視覺里程計(Visual Odometry, VO)。視覺里程計的任務是估算相鄰影象間相機的運動,以及區域性地圖的樣子。VO又稱為前端(Front End)。

  3. 後端優化(Optimization)。後端接受不同時刻視覺里程計測量的相機位姿,以及迴環檢測資訊,對它們進行優化,得到全域性一致的軌跡和地圖。

  4. 迴環檢測(Loop Closing)。迴環檢測判斷機器人是否到達過先前的位置。

  5. 建圖(Mapping)。它會根據估計的軌跡,建立與任務要求對應的地圖。

  VO能夠通過相鄰幀間的影象估計相機運動,並恢復場景的空間結構。

  在視覺SLAM中,前端和計算機視覺領域更為相關,比如影象的特徵提取與匹配等,後端則主要是濾波與非線性優化演算法。

  SLAM問題的本質:對運動主體和周圍環境空間不確定性的估計。

  迴環檢測,又稱閉環檢測(Loop Closure Detectioon),主要解決位置估計隨時間漂移的問題。

  度量地圖(Metric Map):

    度量地圖強調精確地表示地圖中物體的位置關係,通常用稀疏(Sparse)與稠密(Dense)對其分類。

  拓撲地圖(Topological Map):

    拓撲地圖更加強調地圖元素之間的關係。