1. 程式人生 > >mask-RCNN 學習筆記1

mask-RCNN 學習筆記1

摘要:

我們提出了一個概念上簡單,靈活,通用的物件例項分割框架。我們的方法有效地檢測影象中的物件,同時為每個例項生成高質量的分割掩碼。該方法稱為Mask R-CNN,通過增加一個與現有分支並行的用於預測掩碼物件的分支來增強Fast R-CNN的邊界檢測能力。 Mask R-CNN易於訓練,比起Fast R-CNN只增加了一點點開銷,執行速度為5 fps。此外,Mask R-CNN很容易推廣到其他任務,例如,利用同一框架可以預測人體姿勢。我們在COCO挑戰中針對三個方面展示了最佳結果,包括例項分割,boundingbox檢測和人員關鍵點檢測。沒有花哨,Mask R-CNN在每項任務中都優於所有現有的單一模型,包括COCO 2016挑戰賽冠軍。我們希望我們簡單有效的方法將成為一個堅實的基線,並有助於簡化未來在例項級認可方面的研究。程式碼已在以下網址獲得:https://github.com/facebookresearch/Detectron

*************************

筆記:

fps:幀率,每秒幀數

標註工具:

程式碼:

需要學習的參考文獻:

[9] R. Girshick. Fast R-CNN. In ICCV, 2015. 1, 2, 3, 4, 6 
 

[28] S. Ren, K. He, R. Girshick, and J. Sun. Faster R-CNN: To- wards real-time object detection with region proposal net- works. In NIPS, 2015. 1, 2, 3, 4, 7 
 

[23] J. Long, E. Shelhamer, and T. Darrell. Fully convolutional networks for semantic segmentation. In CVPR, 2015. 1, 3, 6 


[16] J. Huang, V. Rathod, C. Sun, M. Zhu, A. Korattikara, A. Fathi, I. Fischer, Z. Wojna, Y. Song, S. Guadarrama, et al. Speed/accuracy trade-offs for modern convolutional object 
detectors. arXiv:1611.10012, 2016. 2, 3, 4, 5, 7 
 

*************************

標註工具以及各式轉換:

COCO安裝、下載:

*************************

程式碼使用(matterport):【2】

1、下載程式碼

2、安裝包

3、在資料夾所在目錄下執行setup

4、程式碼:【5】

5、首先測試demo的使用,該程式碼試一個模型檢測程式碼

開啟demo.ipynb,將程式碼複製貼上到一個demo.py檔案中(自己新建),然後正常執行檔案。【6】

然後就開始運行了

並輸出了一個結果

6、進行自己的訓練:saple/shapes/train_shapes.ipynb

該程式碼當中的資料圖片是直接生成的形狀圖片,沒有匯入額外的資料集,是一個模型的應用

首先同樣將train_shapes.ipynb的程式碼複製到train_shapes.py

然後執行。

7、inspect_data使用

8、inspect_model

*************************

其他參考:

應用的例子:

論文翻譯:

程式碼使用參考:

【7】https://blog.csdn.net/daniaokuye/article/details/78699138