CVPR 2017、2018 - 目標檢測文章
- CVPR 2018
- Cascade R-CNN: Delving into High Quality Object Detection
- Domain Adaptive Faster R-CNN for Object Detection in the Wild
- Multi-scale Location-aware Kernel Representation for Object Detection
- Object Detection using Domain Randomization and Generative Adversarial Refinement of Synthetic Images
- Relation Networks for Object Detection
- Beyond Trade-off: Accelerate FCN-based Face Detector with Higher Accuracy
- Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
- Seeing Small Faces from Robust Anchor’s Perspective
- Direction-aware Spatial Context Features for Shadow Detection
- CVPR 2017
- A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection
- Speed/accuracy trade-offs for modern convolutional object detectors
- Discriminative Bimodal Networks for Visual Localization and Detection with Natural Language Queries
- Accurate Single Stage Detector Using Recurrent Rolling Convolution
- RON: Reverse Connection with Objectness Prior Networks for Object Detection
- Mimicking Very Efficient Network for Object Detection
- Learning non-maximum suppression
- Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection
- Detecting Visual Relationships with Deep Relational Networks
- Multi-Path Region-Based Convolutional Neural Network for Accurate Detection of Unconstrained “Hard Faces”
- Scale-Aware Face Detection
- Detecting Faces Using Inside Cascaded Contextual CNN
- Finding Tiny Faces
- Expecting the Unexpected: Training Detectors for Unusual Pedestrians with Adversarial Imposters
- What Can Help Pedestrian Detection?
- Evaluating State-of-the-art Object Detector on Challenging Traffic Light Data
- SRN: Side-output Residual Network for Object Symmetry Detection in the Wild
- Learning Detection with Diverse Proposals
- 參考
國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學術性會議,會議的主要內容是計算機視覺與模式識別技術。CVPR是世界頂級的計算機視覺會議(三大頂會之一,另外兩個是ICCV和ECCV),近年來每年有約1500名參加者,收錄的論文數量一般300篇左右。本會議每年都會有固定的研討主題,而每一年都會有公司贊助該會議並獲得在會場展示的機會。
CVPR 2018
Cascade R-CNN: Delving into High Quality Object Detection
arxiv: https://arxiv.org/abs/1712.00726
github(Caffe, official): https://github.com/zhaoweicai/cascade-rcnn
在目標檢測中,在判定正負樣本的時候交併比閾值是必需的。較低的物件探測器,訓練有素的借據 0.5閾值,例如,通常會產生噪聲檢測。 然而,檢測 效能會降低,增加了借據閾值。 兩個主要 原因:1)過度擬合訓練期間,由於 迅速消失的正樣品,2)inference-time不匹配 借據的檢測器之間的最優和輸入 假設。 多級物件檢測體系結構、級聯R-CNN 提出瞭解決這些問題。 它由一個序列的探測器 順序與借據閾值增加,訓練更多的選擇性 接近的假陽性。 探測器是逐步訓練, 利用觀察到探測器的輸出是一個很好的分佈 培訓下一個更高質量的探測器。 逐步的重取樣 改進的假設保證所有探測器都積極的 同尺寸的例子,減少過度擬合的問題。 相同的級聯 程式應用於推理,使之間的緊密匹配 假設和探測器每個階段的質量。 一個簡單的實現 顯示了級聯R-CNN超越所有單模物件探測器 具有挑戰性的可可資料集。 實驗還表明,級聯R-CNN 廣泛適用於探測器的架構,實現一致的收益 獨立於基線檢測器的力量。
Domain Adaptive Faster R-CNN for Object Detection in the Wild
arxiv: https://arxiv.org/abs/1803.03243
物件檢測通常假定訓練和測試資料是來自 然而,一個相同的分佈,在實踐中並不總是持有。 這種分佈不匹配會導致顯著的效能下降。 在 這項工作,我們的目標是提高目標檢測的跨域的魯棒性。 我們在兩個層次上解決域轉變:1)映像級別轉變,如 形象風格、照明等,2)例項級的轉變,如物件 外觀,尺寸等。根據最近我們構建我們的方法 先進的快R-CNN模型和設計兩個領域適應氣候變化 元件、影象水平和例項級減少域 差異。 這兩個領域適應基於H-divergence元件 理論,通過學習實現域分類器在敵對的 培訓的方式。 進一步域分類器在不同的水平 加強與一致性正則化學習一個域不變 建議網路(RPN)快R-CNN模型。 我們評估我們的新 建議的方法使用多個數據集包括了城市,KITTI,SIM10K, 等。結果顯示我們提出的方法的有效性的物件檢測場景在不同的領域轉變。
Multi-scale Location-aware Kernel Representation for Object Detection
arxiv: https://arxiv.org/abs/1804.00428
github: https://github.com/Hwang64/MLKP
雖然快R-CNN及其變體已經顯示出不錯的表現 物件檢測,他們只利用簡單的一階表示物件 建議最終的分類和迴歸。 最近的分類 方法表明,高階統計資訊的整合到深 卷積神經網路可以達到令人印象深刻的進步,但是他們的 模型的目標是整個影象通過丟棄位置資訊 不能直接採用物件檢測。 在這篇文章中,我們讓一個 試圖利用高階統計資訊在目標檢測中,針對 為建議提高生成更有識別力的表示 探測器的效能。 為此,我們提出一種新的多尺度 位置感知核心表示(MLKP)來捕獲高階統計 深特性的建議。 我們MLKP改性可以有效地計算 多尺度特徵對映使用一個低維多項式核心 近似。 此外,不同於現有的無條理的全球 基於高階統計資料表示,我們提議MLKP位置 保留和敏感,以便它可以靈活地採用物件檢測。 通過融入快R-CNN模式,提出MLKP達到非常 競爭效能最先進的方法,提高了速度 R-CNN 4.9%(mAP),4.7%(mAP)和5.0%(美聯社借據=[0.5:0.05:0.95])在帕斯卡 2007年VOC,VOC 2012和COCO資料集。
Object Detection using Domain Randomization and Generative Adversarial Refinement of Synthetic Images
arxiv: https://arxiv.org/abs/1805.11778
在這項工作中,我們目前的應用程式域隨機化和 生成對抗網路(GAN)訓練接近實時物件探測器,完全在一個模擬的環境。 大規模的 可用性為真實世界的資料通常是罕見的,很難 獲得在許多工業環境。 因此,只有幾百 未標記的真實影象用於訓練Cyclic-GAN網路相結合 各種程度的域隨機化程式。 我們證明 這使強大的翻譯合成影象真實世界的領域。 我們表明,原始的組合合成(模擬)和翻譯圖片,當用於訓練Mask-RCNN物件檢測網路 達到大於0.95意味著平均精度檢測和分類 工業電氣部分的集合。 我們評估效能 不同組合的訓練資料。
Relation Networks for Object Detection
intro: CVPR 2018
arxiv: https://arxiv.org/abs/1711.11575
雖然好多年相信建模之間的關係 物件將幫助物件識別,沒有證據表明 想法是在深工作學習的時代。 所有先進的目標檢測 系統仍然依靠單獨識別物件例項,沒有 學習期間利用他們的關係。這項工作提出了一個物件關係模組。 It過程的一組物件 同時通過外表之間的互動功能 幾何形狀,從而允許他們關係的建模。 它是輕量級的, 就地。 它不需要額外的監督很容易嵌入 現有的網路。 它是有效提高目標識別和顯示 重複刪除步驟在現代物件檢測管道。 它驗證 建模基於物件關係在CNN的功效檢測。 它會引起 第一個完整的端到端物件探測器。
Beyond Trade-off: Accelerate FCN-based Face Detector with Higher Accuracy
arxiv: https://arxiv.org/abs/1804.05197
完全卷積神經網路(FCN)主導的遊戲的臉 檢測任務幾年的先天能力 與共享核心sliding-window-searching,歸結所有 冗餘計算,最新最先進的方法等 SSD,Faster-RCNN YOLO和紅外系統使用意思FCN作為他們的支柱。 這是一個 問題:我們能找到一個普遍的策略,進一步加快FCN 精度高,所以可能會加速所有最近FCN-based方法? 來 分析這個問題,我們將面對搜尋空間分解成兩個正交的 方向,“規模”和“空間”。 只有少數的座標空間擴大 由兩個基本向量表示前景。 如果FCN可以忽略的 其他點,搜尋空間和假警報應該顯著 歸結。 基於這種哲學,一個名為規模估計的新方法 和空間注意的建議(S2AP提出了關注一些 具體的尺度和有效的位置在影象金字塔。 此外,我們採用 masked-convolution操作基於加速FCN關注結果 計算。 實驗表明,FCN-based方法可以加速項 關於4×的幫助下S2APmasked-FCN和在同一時間 也可以實現先進的FDDB,AFW MALF人臉檢測嗎 基準。
Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
arxiv: https://arxiv.org/abs/1804.06039
github: https://github.com/Jack-CV/PCN
用任意旋轉不變人臉檢測,即檢測的臉 rotation-in-plane(RIP)角度,廣泛需要於不受限制 應用程式但仍然作為一個具有挑戰性的任務,由於大 變化的表象。 大多數現有的方法與速度或妥協 精度處理大變化。 為解決這一問題 效率,我們建議進步校準網路(PCN)來執行 而且方式旋轉不變人臉檢測。 PCN由 三個階段,每個不僅區分非人臉的臉, 但也校準每個候選人臉的RIP取向直立 逐步。 除以校準過程分為幾個進步 步驟和只在早期階段,預測粗取向PCN可以實現 精確和快速校準。 通過執行二進位制分類面臨vs。 區別人臉與逐漸減少擷取範圍,PCN可以準確檢測的面孔 與全360∘把角度。 這種設計導致實時 旋轉不變的臉探測器。 筆跡FDDB和實驗 具有挑戰性的子集包含旋轉面臨的更廣泛的臉在野外顯示 我們PCN達到相當有前途的效能。
Seeing Small Faces from Robust Anchor’s Perspective
arxiv: https://arxiv.org/abs/1802.09058
介紹了一種新型錨設計支援anchor-based臉 檢測尺度不變的優越效能,尤其是在小臉上。 為了達到這個目標,我們明確地解決這一問題,anchor-based探測器 用小尺寸,效能大幅下降的臉如小於16 x16 畫素。 在本文中,我們調查為什麼會出現這種情況。 我們發現 當前錨設計不能保證高小小的臉和之間的重疊 錨箱,增加培訓的難度。 預計新馬克斯 重疊(情緒)得分提出可以從理論上解釋了低 重疊的問題,激發新的錨設計的一些有效的策略 導致更高的臉重疊,包括減少新錨一步 網路架構、額外移錨和隨機面臨轉變。 全面的實驗表明,我們提出的方法明顯 優於基線anchor-based檢測器,而實現 最先進的具有挑戰性的人臉檢測結果資料集 競爭執行時的速度。
Direction-aware Spatial Context Features for Shadow Detection
陰影檢測是一個基本且富有挑戰性的任務,因為它需要一個 全球形象的理解語義和有各種各樣的背景 周圍的陰影。 介紹了一種新穎的網路陰影的檢測 分析影象上下文direction-aware的方式。 為了達到這個目標,我們首先 制定direction-aware注意力機制在一個空間複發性神經 網路(RNN)通過引入關注權重時聚合空間上下文 RNN的特性。 通過學習這些重量訓練,我們可以恢復 direction-aware空間上下文(DSC)檢測陰影。 這個設計是 發展成為CNN的DSC模組和嵌入式學習DSC特性 不同的級別。 此外,加權交叉熵損失設計 培訓更有效。 我們僱傭兩個常見的陰影檢測基準 資料集和執行各種實驗來評估我們的網路。 實驗 結果表明,我們的網路優於最先進的方法和實現 97%的準確率和平衡出錯率降低38%。
arxiv: https://arxiv.org/abs/1712.04142
CVPR 2017
A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection
arxiv: https://arxiv.org/abs/1704.03414
paper: http://abhinavsh.info/papers/pdfs/adversarial_object_detection.pdf
github(Caffe): https://github.com/xiaolonw/adversarial-frcnn
Speed/accuracy trade-offs for modern convolutional object detectors
arxiv: https://arxiv.org/abs/1611.10012
Discriminative Bimodal Networks for Visual Localization and Detection with Natural Language Queries
arxiv: https://arxiv.org/abs/1704.03944
Accurate Single Stage Detector Using Recurrent Rolling Convolution
keywords: Recurrent Rolling Convolution (RRC)
arxiv: https://arxiv.org/abs/1704.05776
github: https://github.com/xiaohaoChen/rrc_detection
RON: Reverse Connection with Objectness Prior Networks for Object Detection
arxiv: https://arxiv.org/abs/1707.01691
github: https://github.com/taokong/RON
Mimicking Very Efficient Network for Object Detection
intro: CVPR 2017. SenseTime & Beihang University
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Mimicking_Very_Efficient_CVPR_2017_paper.pdf
Learning non-maximum suppression
project page: https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/object-recognition-and-scene-understanding/learning-nms/
arxiv: https://arxiv.org/abs/1705.02950
github: https://github.com/hosang/gossipnet
Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection
intro: CVPR 2017 spotlight paper
arxiv: https://arxiv.org/abs/1703.03054
Detecting Visual Relationships with Deep Relational Networks
intro: CVPR 2017 oral. The Chinese University of Hong Kong
arxiv: https://arxiv.org/abs/1704.03114
Multi-Path Region-Based Convolutional Neural Network for Accurate Detection of Unconstrained “Hard Faces”
intro: CVPR 2017. MP-RCNN, MP-RPN
arxiv: https://arxiv.org/abs/1703.09145
Scale-Aware Face Detection
intro: CVPR 2017. SenseTime & Tsinghua University
arxiv: https://arxiv.org/abs/1706.09876
Detecting Faces Using Inside Cascaded Contextual CNN
intro: CVPR 2017. Tencent AI Lab & SenseTime
paper: http://ai.tencent.com/ailab/media/publications/Detecting_Faces_Using_Inside_Cascaded_Contextual_CNN.pdf
Finding Tiny Faces
intro: CVPR 2017. CMU
project page: http://www.cs.cmu.edu/~peiyunh/tiny/index.html
arxiv: https://arxiv.org/abs/1612.04402
github(official, Matlab): https://github.com/peiyunh/tiny
github(inference-only): https://github.com/chinakook/hr101_mxnet
github: https://github.com/cydonia999/Tiny_Faces_in_Tensorflow
Expecting the Unexpected: Training Detectors for Unusual Pedestrians with Adversarial Imposters
intro: CVPR 2017
project page: http://ml.cs.tsinghua.edu.cn:5000/publications/synunity/
arxiv: https://arxiv.org/abs/1703.06283
github(Tensorflow): https://github.com/huangshiyu13/RPNplus
What Can Help Pedestrian Detection?
intro: CVPR 2017. Tsinghua University & Peking University & Megvii Inc.
keywords: Faster R-CNN, HyperLearner
arxiv: https://arxiv.org/abs/1705.02757
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Mao_What_Can_Help_CVPR_2017_paper.pdf
Evaluating State-of-the-art Object Detector on Challenging Traffic Light Data
intro: CVPR 2017 workshop
paper: http://openaccess.thecvf.com/content_cvpr_2017_workshops/w9/papers/Jensen_Evaluating_State-Of-The-Art_Object_CVPR_2017_paper.pdf
SRN: Side-output Residual Network for Object Symmetry Detection in the Wild
intro: CVPR 2017
arxiv: https://arxiv.org/abs/1703.02243
github: https://github.com/KevinKecc/SRN
Learning Detection with Diverse Proposals
keywords: differentiable Determinantal Point Process (DPP) layer, Learning Detection with Diverse Proposals (LDDP)
arxiv: https://arxiv.org/abs/1704.03533