Mask RcNN論文翻譯
阿新 • • 發佈:2018-11-26
Mask Rcnn英文版論文連結:https://arxiv.org/pdf/1703.06870.pdf
Mask Rcnn專案地址(caffe2):https://github.com/facebookresearch/Detectron
摘要
簡介
掩碼分支是作用於每個RoI的小FCN,以畫素到畫素的方式預測分割掩碼。Mask R-CNN易於實現和訓練,它是基於Faster R-CNN這種靈活的框架的。此外,掩碼分支只增加了很小的計算開銷。
我們的模型可以在GPU上以200毫秒每幀的速度執行,使用一臺有8個GPU的機器,在COCO上訓練需要一到兩天的時間。我們相信,快速的訓練和測試速度,以及框架的靈活性和準確性將促進未來目標分割的研究。
相關工作
Mask R-CNN
掩碼錶示:掩碼錶示輸入目標的空間佈局。因此,與通過全連線(fc)層不可避免地縮成短輸出向量的類標籤或框偏移不同,提取掩碼的空間結構可以通過由卷積提供的畫素到畫素對應自然地被解決。
這種畫素到畫素的行為需要RoI特徵,它們本身就是小特徵圖。為了更好地對齊,以準確地保留顯式的畫素空間對應關係,我們開發出在掩模預測中發揮關鍵作用的以下RoIAlign層。