1. 程式人生 > >Mask R-CNN官方實現“又”來了!基於PyTorch,訓練速度是原來2倍

Mask R-CNN官方實現“又”來了!基於PyTorch,訓練速度是原來2倍

曉查 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

640?wx_fmt=png

來自官方的Mask R-CNN實現終於“又”來了!PyTorch官方Twitter今天公佈了一個名為Mask R-CNN Benchmark的專案。

10個月前Facebook曾釋出過名叫Detecron的專案,也是一款影象分割與識別平臺,其中也包含Mask R-CNN。不過它是基於Caffe 2深度學習框架編寫的。這一次,在Caffe2專案併入PyTorch半年之後,Facebook換上了更受歡迎的PyTorch框架。

除了更改框架,Mask R-CNN Benchmark相比它的“前輩”Detectron,訓練速度提高了一倍。

640?wx_fmt=jpeg

△ Detecron效果輸出圖

Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成,快速、模組化的Faster R-CNN和Mask R-CNN元件。該專案旨在讓使用者更容易地建立一種模組,實現對圖片中物品的識別與分割。

負責這一專案的Facebook AI工程師Francisco Massa還在個人Twitter發了張自拍照,並使用新工具對圖片中的物品進行了識別,尷尬的是好像有些物件被識別錯誤:

640?wx_fmt=jpeg

△ Francisco Massa自拍照

第三方專案

在Facebook官方推出Mask R-CNN Benchmark之前,程式設計師們一直希望能用更流行的PyTorch取代Caffe 2實現Mask R-CNN,今年7月GitHub上有一名印度小哥完成任務。

640?wx_fmt=png

另外,商湯和香港中文大學的多媒體實驗室也開源了一個類似專案:mmdetection。它支援Faster R-CNNMask R-CNNRetinaNet等等,相比Facebook的Detecron有5%到20%的效能提升。這個模型還在2018年的COCO Detection競賽中拿下了冠軍。

那麼今天Facebook釋出的Mask R-CNN Benchmark相比前兩者有哪些優點呢?

亮點

  • PyTorch 1.0編寫:RPNFaster R-CNNMask R-CNN均可實現,達到甚至超出Detectron的準確度

  • 快速:訓練速度是Detectron的2倍,比mmdetection高30%

  • 視訊記憶體效率更高:大約比mmdetection少使用500MB視訊記憶體

  • 支援多GPU訓練與推斷

  • 支援以CPU進行推斷

  • 支援影象批處理:可分批分GPU對多圖進行推斷

  • 提供預訓練模型:針對幾乎所有引用Faster RCNN和Mask RCNN的架構

PyTorch官方Twitter轉發了該專案,並希望mmdetection等專案都能使用一下。

安裝小貼士

使用Mask R-CNN Benchmark需要安裝以下元件:

  • PyTorch 1.0

  • orchvision

  • cocoapi

  • yacs

  • matplotlib

  • OpenCV(可選)

R-CNN發展歷史

R-CNN是卷積神經網路(CNN)在影象識別領域的應用,Facebook AI研究團隊在這條到道路上做出了頗多貢獻,其中不得不提一位大神:Ross Girshick。他發明了RCNN,又提出速度更快的Fast R-CNN
2016年,微軟研究院提出了Faster R-CNN,降低了在邊框搜尋上的運算量,進一步提高了演算法的速度。
2017年,Facebook AI研究團隊又再次提出了Mask R-CNN:通過新增與現有分支並行的物件掩碼(object mask)分支,以增強Faster RCNN在邊框識別上的效能。

傳送門

Mask R-CNN Benchmark專案地址:
https://github.com/facebookresearch/maskrcnn-benchmark

印度小哥的Mask R-CNN專案地址:
https://github.com/wannabeOG/Mask-RCNN

Detecron專案地址:
https://github.com/facebookresearch/Detectron

mmdetection專案地址:
https://github.com/open-mmlab/mmdetection

推薦閱讀

640?wx_fmt=png