Mask R-CNN官方實現“又”來了!基於PyTorch,訓練速度是原來2倍
曉查 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
來自官方的Mask R-CNN實現終於“又”來了!PyTorch官方Twitter今天公佈了一個名為Mask R-CNN Benchmark的專案。
10個月前Facebook曾釋出過名叫Detecron的專案,也是一款影象分割與識別平臺,其中也包含Mask R-CNN。不過它是基於Caffe 2深度學習框架編寫的。這一次,在Caffe2專案併入PyTorch半年之後,Facebook換上了更受歡迎的PyTorch框架。
除了更改框架,Mask R-CNN Benchmark相比它的“前輩”Detectron,訓練速度提高了一倍。
△ Detecron效果輸出圖
Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成,快速、模組化的Faster R-CNN和Mask R-CNN元件。該專案旨在讓使用者更容易地建立一種模組,實現對圖片中物品的識別與分割。
負責這一專案的Facebook AI工程師Francisco Massa還在個人Twitter發了張自拍照,並使用新工具對圖片中的物品進行了識別,尷尬的是好像有些物件被識別錯誤:
△ Francisco Massa自拍照
第三方專案
在Facebook官方推出Mask R-CNN Benchmark之前,程式設計師們一直希望能用更流行的PyTorch取代Caffe 2實現Mask R-CNN,今年7月GitHub上有一名印度小哥完成任務。
另外,商湯和香港中文大學的多媒體實驗室也開源了一個類似專案:mmdetection。它支援Faster R-CNN、Mask R-CNN、RetinaNet等等,相比Facebook的Detecron有5%到20%的效能提升。這個模型還在2018年的COCO Detection競賽中拿下了冠軍。
那麼今天Facebook釋出的Mask R-CNN Benchmark相比前兩者有哪些優點呢?
亮點
PyTorch 1.0編寫:RPN、Faster R-CNN和Mask R-CNN均可實現,達到甚至超出Detectron的準確度
快速:訓練速度是Detectron的2倍,比mmdetection高30%。
視訊記憶體效率更高:大約比mmdetection少使用500MB視訊記憶體
支援多GPU訓練與推斷
支援以CPU進行推斷
支援影象批處理:可分批分GPU對多圖進行推斷
提供預訓練模型:針對幾乎所有引用Faster RCNN和Mask RCNN的架構
PyTorch官方Twitter轉發了該專案,並希望mmdetection等專案都能使用一下。
安裝小貼士
使用Mask R-CNN Benchmark需要安裝以下元件:
PyTorch 1.0
orchvision
cocoapi
yacs
matplotlib
OpenCV(可選)
R-CNN發展歷史
R-CNN是卷積神經網路(CNN)在影象識別領域的應用,Facebook AI研究團隊在這條到道路上做出了頗多貢獻,其中不得不提一位大神:Ross Girshick。他發明了RCNN,又提出速度更快的Fast R-CNN。
2016年,微軟研究院提出了Faster R-CNN,降低了在邊框搜尋上的運算量,進一步提高了演算法的速度。
2017年,Facebook AI研究團隊又再次提出了Mask R-CNN:通過新增與現有分支並行的物件掩碼(object mask)分支,以增強Faster RCNN在邊框識別上的效能。
傳送門
Mask R-CNN Benchmark專案地址:
https://github.com/facebookresearch/maskrcnn-benchmark
印度小哥的Mask R-CNN專案地址:
https://github.com/wannabeOG/Mask-RCNN
Detecron專案地址:
https://github.com/facebookresearch/Detectron
mmdetection專案地址:
https://github.com/open-mmlab/mmdetection
推薦閱讀