CVPR 2017、2018 - 目標檢測文章

阿新 • • 發佈：2018-11-10

CVPR 2018
CVPR 2017
參考

國際計算機視覺與模式識別會議（CVPR）是IEEE一年一度的學術性會議，會議的主要內容是計算機視覺與模式識別技術。CVPR是世界頂級的計算機視覺會議（三大頂會之一，另外兩個是ICCV和ECCV），近年來每年有約1500名參加者，收錄的論文數量一般300篇左右。本會議每年都會有固定的研討主題，而每一年都會有公司贊助該會議並獲得在會場展示的機會。

CVPR 2018

Cascade R-CNN: Delving into High Quality Object Detection

arxiv: https://arxiv.org/abs/1712.00726
github(Caffe, official): https://github.com/zhaoweicai/cascade-rcnn
　　在目標檢測中,在判定正負樣本的時候交併比閾值是必需的。較低的物件探測器,訓練有素的借據 0.5閾值,例如,通常會產生噪聲檢測。然而,檢測效能會降低,增加了借據閾值。兩個主要原因:1)過度擬合訓練期間,由於迅速消失的正樣品,2)inference-time不匹配借據的檢測器之間的最優和輸入假設。多級物件檢測體系結構、級聯R-CNN 提出瞭解決這些問題。它由一個序列的探測器順序與借據閾值增加,訓練更多的選擇性接近的假陽性。探測器是逐步訓練, 利用觀察到探測器的輸出是一個很好的分佈培訓下一個更高質量的探測器。逐步的重取樣改進的假設保證所有探測器都積極的同尺寸的例子,減少過度擬合的問題。相同的級聯程式應用於推理,使之間的緊密匹配假設和探測器每個階段的質量。一個簡單的實現顯示了級聯R-CNN超越所有單模物件探測器具有挑戰性的可可資料集。實驗還表明,級聯R-CNN 廣泛適用於探測器的架構,實現一致的收益獨立於基線檢測器的力量。

Domain Adaptive Faster R-CNN for Object Detection in the Wild

arxiv: https://arxiv.org/abs/1803.03243
　　物件檢測通常假定訓練和測試資料是來自然而,一個相同的分佈,在實踐中並不總是持有。這種分佈不匹配會導致顯著的效能下降。在這項工作,我們的目標是提高目標檢測的跨域的魯棒性。我們在兩個層次上解決域轉變:1)映像級別轉變,如形象風格、照明等,2)例項級的轉變,如物件外觀,尺寸等。根據最近我們構建我們的方法先進的快R-CNN模型和設計兩個領域適應氣候變化元件、影象水平和例項級減少域差異。這兩個領域適應基於H-divergence元件理論,通過學習實現域分類器在敵對的培訓的方式。進一步域分類器在不同的水平加強與一致性正則化學習一個域不變建議網路(RPN)快R-CNN模型。我們評估我們的新建議的方法使用多個數據集包括了城市,KITTI,SIM10K, 等。結果顯示我們提出的方法的有效性的物件檢測場景在不同的領域轉變。

Multi-scale Location-aware Kernel Representation for Object Detection

arxiv: https://arxiv.org/abs/1804.00428
github: https://github.com/Hwang64/MLKP
　　雖然快R-CNN及其變體已經顯示出不錯的表現物件檢測,他們只利用簡單的一階表示物件建議最終的分類和迴歸。最近的分類方法表明,高階統計資訊的整合到深卷積神經網路可以達到令人印象深刻的進步,但是他們的模型的目標是整個影象通過丟棄位置資訊不能直接採用物件檢測。在這篇文章中,我們讓一個試圖利用高階統計資訊在目標檢測中,針對為建議提高生成更有識別力的表示探測器的效能。為此,我們提出一種新的多尺度位置感知核心表示(MLKP)來捕獲高階統計深特性的建議。我們MLKP改性可以有效地計算多尺度特徵對映使用一個低維多項式核心近似。此外,不同於現有的無條理的全球基於高階統計資料表示,我們提議MLKP位置保留和敏感,以便它可以靈活地採用物件檢測。通過融入快R-CNN模式,提出MLKP達到非常競爭效能最先進的方法,提高了速度 R-CNN 4.9%(mAP),4.7%(mAP)和5.0%(美聯社借據=[0.5:0.05:0.95])在帕斯卡 2007年VOC,VOC 2012和COCO資料集。

Object Detection using Domain Randomization and Generative Adversarial Refinement of Synthetic Images

arxiv: https://arxiv.org/abs/1805.11778

在這項工作中,我們目前的應用程式域隨機化和生成對抗網路(GAN)訓練接近實時物件探測器,完全在一個模擬的環境。大規模的可用性為真實世界的資料通常是罕見的,很難獲得在許多工業環境。因此,只有幾百未標記的真實影象用於訓練Cyclic-GAN網路相結合各種程度的域隨機化程式。我們證明這使強大的翻譯合成影象真實世界的領域。我們表明,原始的組合合成(模擬)和翻譯圖片,當用於訓練Mask-RCNN物件檢測網路達到大於0.95意味著平均精度檢測和分類工業電氣部分的集合。我們評估效能不同組合的訓練資料。

Relation Networks for Object Detection

intro: CVPR 2018
arxiv: https://arxiv.org/abs/1711.11575
雖然好多年相信建模之間的關係物件將幫助物件識別,沒有證據表明想法是在深工作學習的時代。所有先進的目標檢測系統仍然依靠單獨識別物件例項,沒有學習期間利用他們的關係。這項工作提出了一個物件關係模組。 It過程的一組物件同時通過外表之間的互動功能幾何形狀,從而允許他們關係的建模。它是輕量級的, 就地。它不需要額外的監督很容易嵌入現有的網路。它是有效提高目標識別和顯示重複刪除步驟在現代物件檢測管道。它驗證建模基於物件關係在CNN的功效檢測。它會引起第一個完整的端到端物件探測器。

Beyond Trade-off: Accelerate FCN-based Face Detector with Higher Accuracy

arxiv: https://arxiv.org/abs/1804.05197

完全卷積神經網路(FCN)主導的遊戲的臉檢測任務幾年的先天能力與共享核心sliding-window-searching,歸結所有冗餘計算,最新最先進的方法等 SSD,Faster-RCNN YOLO和紅外系統使用意思FCN作為他們的支柱。這是一個問題:我們能找到一個普遍的策略,進一步加快FCN 精度高,所以可能會加速所有最近FCN-based方法? 來分析這個問題,我們將面對搜尋空間分解成兩個正交的方向,“規模”和“空間”。只有少數的座標空間擴大由兩個基本向量表示前景。如果FCN可以忽略的其他點,搜尋空間和假警報應該顯著歸結。基於這種哲學,一個名為規模估計的新方法和空間注意的建議(S2AP提出了關注一些具體的尺度和有效的位置在影象金字塔。此外,我們採用 masked-convolution操作基於加速FCN關注結果計算。實驗表明,FCN-based方法可以加速項關於4×的幫助下S2APmasked-FCN和在同一時間也可以實現先進的FDDB,AFW MALF人臉檢測嗎基準。

Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks

arxiv: https://arxiv.org/abs/1804.06039
github: https://github.com/Jack-CV/PCN
用任意旋轉不變人臉檢測,即檢測的臉 rotation-in-plane(RIP)角度,廣泛需要於不受限制應用程式但仍然作為一個具有挑戰性的任務,由於大變化的表象。大多數現有的方法與速度或妥協精度處理大變化。為解決這一問題效率,我們建議進步校準網路(PCN)來執行而且方式旋轉不變人臉檢測。 PCN由三個階段,每個不僅區分非人臉的臉, 但也校準每個候選人臉的RIP取向直立逐步。除以校準過程分為幾個進步步驟和只在早期階段,預測粗取向PCN可以實現精確和快速校準。通過執行二進位制分類面臨vs。區別人臉與逐漸減少擷取範圍,PCN可以準確檢測的面孔與全360∘把角度。這種設計導致實時旋轉不變的臉探測器。筆跡FDDB和實驗具有挑戰性的子集包含旋轉面臨的更廣泛的臉在野外顯示我們PCN達到相當有前途的效能。

Seeing Small Faces from Robust Anchor’s Perspective

arxiv: https://arxiv.org/abs/1802.09058
介紹了一種新型錨設計支援anchor-based臉檢測尺度不變的優越效能,尤其是在小臉上。為了達到這個目標,我們明確地解決這一問題,anchor-based探測器用小尺寸,效能大幅下降的臉如小於16 x16 畫素。在本文中,我們調查為什麼會出現這種情況。我們發現當前錨設計不能保證高小小的臉和之間的重疊錨箱,增加培訓的難度。預計新馬克斯重疊(情緒)得分提出可以從理論上解釋了低重疊的問題,激發新的錨設計的一些有效的策略導致更高的臉重疊,包括減少新錨一步網路架構、額外移錨和隨機面臨轉變。全面的實驗表明,我們提出的方法明顯優於基線anchor-based檢測器,而實現最先進的具有挑戰性的人臉檢測結果資料集競爭執行時的速度。

Direction-aware Spatial Context Features for Shadow Detection

陰影檢測是一個基本且富有挑戰性的任務,因為它需要一個全球形象的理解語義和有各種各樣的背景周圍的陰影。介紹了一種新穎的網路陰影的檢測分析影象上下文direction-aware的方式。為了達到這個目標,我們首先制定direction-aware注意力機制在一個空間複發性神經網路(RNN)通過引入關注權重時聚合空間上下文 RNN的特性。通過學習這些重量訓練,我們可以恢復 direction-aware空間上下文(DSC)檢測陰影。這個設計是發展成為CNN的DSC模組和嵌入式學習DSC特性不同的級別。此外,加權交叉熵損失設計培訓更有效。我們僱傭兩個常見的陰影檢測基準資料集和執行各種實驗來評估我們的網路。實驗結果表明,我們的網路優於最先進的方法和實現 97%的準確率和平衡出錯率降低38%。
arxiv: https://arxiv.org/abs/1712.04142

CVPR 2017

A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

arxiv: https://arxiv.org/abs/1704.03414
paper: http://abhinavsh.info/papers/pdfs/adversarial_object_detection.pdf
github(Caffe): https://github.com/xiaolonw/adversarial-frcnn

Speed/accuracy trade-offs for modern convolutional object detectors

arxiv: https://arxiv.org/abs/1611.10012

Discriminative Bimodal Networks for Visual Localization and Detection with Natural Language Queries

arxiv: https://arxiv.org/abs/1704.03944

Accurate Single Stage Detector Using Recurrent Rolling Convolution

keywords: Recurrent Rolling Convolution (RRC)
arxiv: https://arxiv.org/abs/1704.05776
github: https://github.com/xiaohaoChen/rrc_detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection

arxiv: https://arxiv.org/abs/1707.01691
github: https://github.com/taokong/RON

Mimicking Very Efficient Network for Object Detection

intro: CVPR 2017. SenseTime & Beihang University
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Mimicking_Very_Efficient_CVPR_2017_paper.pdf

Learning non-maximum suppression

project page: https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/object-recognition-and-scene-understanding/learning-nms/
arxiv: https://arxiv.org/abs/1705.02950
github: https://github.com/hosang/gossipnet

Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection

intro: CVPR 2017 spotlight paper
arxiv: https://arxiv.org/abs/1703.03054

Detecting Visual Relationships with Deep Relational Networks

intro: CVPR 2017 oral. The Chinese University of Hong Kong
arxiv: https://arxiv.org/abs/1704.03114

Multi-Path Region-Based Convolutional Neural Network for Accurate Detection of Unconstrained “Hard Faces”

intro: CVPR 2017. MP-RCNN, MP-RPN
arxiv: https://arxiv.org/abs/1703.09145

Scale-Aware Face Detection

intro: CVPR 2017. SenseTime & Tsinghua University
arxiv: https://arxiv.org/abs/1706.09876

Detecting Faces Using Inside Cascaded Contextual CNN

intro: CVPR 2017. Tencent AI Lab & SenseTime
paper: http://ai.tencent.com/ailab/media/publications/Detecting_Faces_Using_Inside_Cascaded_Contextual_CNN.pdf

Finding Tiny Faces

intro: CVPR 2017. CMU
project page: http://www.cs.cmu.edu/~peiyunh/tiny/index.html
arxiv: https://arxiv.org/abs/1612.04402
github(official, Matlab): https://github.com/peiyunh/tiny
github(inference-only): https://github.com/chinakook/hr101_mxnet
github: https://github.com/cydonia999/Tiny_Faces_in_Tensorflow

Expecting the Unexpected: Training Detectors for Unusual Pedestrians with Adversarial Imposters

intro: CVPR 2017
project page: http://ml.cs.tsinghua.edu.cn:5000/publications/synunity/
arxiv: https://arxiv.org/abs/1703.06283
github(Tensorflow): https://github.com/huangshiyu13/RPNplus

What Can Help Pedestrian Detection?

intro: CVPR 2017. Tsinghua University & Peking University & Megvii Inc.
keywords: Faster R-CNN, HyperLearner
arxiv: https://arxiv.org/abs/1705.02757
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Mao_What_Can_Help_CVPR_2017_paper.pdf

Evaluating State-of-the-art Object Detector on Challenging Traffic Light Data

intro: CVPR 2017 workshop
paper: http://openaccess.thecvf.com/content_cvpr_2017_workshops/w9/papers/Jensen_Evaluating_State-Of-The-Art_Object_CVPR_2017_paper.pdf

SRN: Side-output Residual Network for Object Symmetry Detection in the Wild

intro: CVPR 2017
arxiv: https://arxiv.org/abs/1703.02243
github: https://github.com/KevinKecc/SRN

Learning Detection with Diverse Proposals

keywords: differentiable Determinantal Point Process (DPP) layer, Learning Detection with Diverse Proposals (LDDP)
arxiv: https://arxiv.org/abs/1704.03533

參考

Object Detection