1. 程式人生 > 其它 >YOLO 論文翻譯及解釋

YOLO 論文翻譯及解釋

你只看一次:統一的實時目標檢測(2016年)

摘要

我們介紹了YOLO,一種新的目標檢測方法。之前關於物件檢測的工作將分類器重新調整為執行檢測。不同的是,我們建立一個目標檢測空間分隔邊界盒及其關聯類概率的迴歸問題。完整的影象直接通過一次單一神經網路評估邊界框和類概率。因為整個檢測管道是一個單一神經網路,它可以端到端進行優化直接作用檢測效能。

注:之前關於物件檢測的工作將分類器重新調整為執行檢測。如Faster-RCNN,將VGG(一種CNN網路)重新調整為執行預測,即通過CNN網路對目標進行分類操作,然後提取建議區作為目標檢測。YOLO第一版便只比VGG+RCNN的mAP低1.3,但是是唯一的實時目標檢測器。YOLOv3時(2018年4月8日),Faster-RCNN w FPN才能勉強超過YOLOv3的精度了。YOLOv4時,YOLOv4不再專注於與RCNN系列比較。
住:統一是指,YOLO的網路並非使用其他網路構建而成的,沒有拆分環節,不存在CNN網路進行分類,然後再提取建議區的two stage方法

我們的統一架構非常快。我們的基礎YOLO模型實時處理45幀的影象。一個較小的網路版本,Fast YOLO,每秒處理令人震驚的155幀,仍然實現了其他實時檢測器的兩倍mAP。

與最先進的(state-of-the-art)檢測系統比,YOLO產生更多的定位錯誤,但更少預測背景上的假陽性的可能。而且,YOLO比DPM、R-CNN等物體檢測系統能夠學到更加抽象的物體的特徵,這使得YOLO可以從真實影象領域遷移到其他領域,如藝術。

Introduction