ECCV2018 | 論文閱讀DetNet: A Backbone network for Object Detection
持續更新~~~
目前大部分的目標檢測網路,包括one-stage和two-stage法,都是直接對用於影象分類的ImageNet預訓練模型進行微調,很少有專門為目標檢測設計的特徵提取器。更重要的是,影象分類和物體檢測之間存在許多差異:
(i)最新的物體探測器如FPN和RetinaNet通常需要影象分類任務以外的部分,來處理目標檢測所關注的物體的尺度問題。
(ii)影象分類只需要識別物體的類別,而目標檢測不僅要對物體進行匪類,還要定位物體的空間位置。 大尺度的降取樣操作增大了感受野,有利於影象分類,但是對於需要定位目標的檢測任務而言就不一定有利,因為降取樣操作會降低影象解析度,丟失了目標的位置資訊,對於大目標的定位和小目標的識別實在不利。
由於分類與檢測任務的各種不同,本文設計了一種專為目標檢測的主幹網路—— DetNet。
由於目標檢測存在物體的尺度問題,DetNetFPN中添加了額外的部分。 與用於ImageNet分類的傳統預訓練模型不同,即使包括額外的部分,我們仍可以保持特徵的空間解析度。為了保持DetNet的效率,我們採用了低複雜度的膨脹瓶頸結構。 通過整合這些改進點,我們的DetNet不僅可以保持高解析度的特徵圖,還可以保留較大的感受野,這兩者對於目標檢測任務都非常重要。
相關推薦
ECCV2018 | 論文閱讀DetNet: A Backbone network for Object Detection
持續更新~~~ 目前大部分的目標檢測網路,包括one-stage和two-stage法,都是直接對用於影象分類的ImageNet預訓練模型進行微調,很少有專門為目標檢測設計的特徵提取器。更重要的是,影象分類和物體檢測之間存在許多差異: (i)最新的物體探測器如FPN和RetinaNet通
RefineDet論文閱讀:Single-Shot Refinement Neural Network for Object Detection
裁剪 部分 損失函數 過程 bject sin 關聯 增加 問題 摘要 RefineDet是CVPR 2018的一篇論文,文中提出了一個新的single-shot檢測器RefineDet,實現了比二階段方法更高的準確率而且具有與一階段方法相當的效率。RefineDet包括兩
Parallel Feature Pyramid Network for Object Detection
Parallel Feature Pyramid Network for Object Detection ECCV2018 總結: 文章借鑑了SPP的思想並通過MSCA(multi-scale context aggregation)模組進行特徵融合從而提出PFPNet(Paralle
論文筆記:Learning Region Features for Object Detection
中心思想 繼Relation Network實現可學習的nms之後,MSRA的大佬們覺得目標檢測器依然不夠fully learnable,這篇文章類似之前的Deformable ROI Pooling,主要在ROI特徵的組織上做文章,文章總結了現有的各種ROI Pooling變體,提出了一個統一的數學表示式
論文筆記:Feature Pyramid Networks for Object Detection
初衷 Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep
【深度學習論文筆記】Deep Neural Networks for Object Detection
論文:<<Deep Neural Networks for Object Detection>> 作者:Christian Szegedy Al
論文解讀之Feature Pyramid Networks for Object Detection
論文名稱:Feature Pyramid Networks for Object Detection 這是一篇CVPR2017的文章,提出一種新型的特徵金字塔網路,作者是何開明等人 首先,文章介
論文閱讀:A Primer on Neural Network Models for Natural Language Processing(1)
選擇 works embed 負責 距離 feature 結構 tran put 前言 2017.10.2博客園的第一篇文章,Mark。 由於實驗室做的是NLP和醫療相關的內容,因此開始啃NLP這個硬骨頭,希望能學有所成。後續將關註知識圖譜,深度強化學習等內
論文閱讀 | CrystalBall: A Visual Analytic System for Future Event Discovery and Analysis from Social Media Data
夏洛特 bstr soci 相同 方式 PE VM src 測量 CrystalBall: A Visual Analytic System for Future Event Discovery and Analysis from Social Media Data 論文地
『 論文閱讀』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
AbstractMULTI-VIEW-DNN聯合了多個域做的豐富特徵,使用multi-view DNN模型構建推薦,包括app、新聞、電影和TV,相比於最好的演算法,老使用者提升49%,新使用者提升110%。並且可以輕鬆的涵蓋大量使用者,解決冷啟動問題。主要做user embedding的過程,通多使用者在多
【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition
【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition 這是一篇facebook的論文,它和一篇google的論文連結地址的研究內容非常相似,而且幾乎是同一時刻的研究,感覺這兩個公司真的冤家路窄,
論文翻譯 DOTA:A Large-scale Dataset for Object Detection in Aerial Images
網絡 操作 邊框 允許 官方 靈活 數量級 image 轉化 簡介:武大遙感國重實驗室-夏桂松和華科電信學院-白翔等合作做的一個航拍圖像數據集 摘要: 目標檢測是計算機視覺領域一個重要且有挑戰性的問題。雖然過去的十幾年中目標檢測在自然場景已經有了較重要的成就
【Network Architecture】Feature Pyramid Networks for Object Detection(FPN)論文解析(轉)
目錄 0. 前言 1. 部落格一 2.。 部落格二 0. 前言 這篇論文提出了一種新的特徵融合方式來解決多尺度問題, 感覺挺有創新性的, 如果需要與其他網路進行拼接,還是需要再回到原文看一下細節。這裡轉了兩篇比較好的部落格作為備忘。 1. 部落格一 這篇論文是CVPR20
論文閱讀 | Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction
Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction (KDD 2018) 1.主要特點: 通常,一個句子應用一次attention,然後學習最終表
【論文閱讀】Siamese Neural Networks for One-shot Image Recognition
關鍵詞: one-short learning : 待解決的問題只有少量的標註資料,先驗知識很匱乏,遷移學習就屬於one-short learning的一種 zero-short learning: 這個種情況下完全沒有
【論文閱讀】Between-class Learning for Image Classification
文章:Between-class Learning for Image Classification 連結:https://arxiv.org/pdf/1711.10284.pdf CVPR2018 作者嘗試了將在音訊上的方法用在影象上的,並提出了一種將影象作為波形處理的混合方法(作者認為圖形波長融
論文閱讀-(CVPR 2017) Kernel Pooling for Convolutional Neural Networks
在這篇論文中,作者提出了一種更加通用的池化框架,以核函式的形式捕捉特徵之間的高階資訊。同時也證明了使用無引數化的緊緻清晰特徵對映,以指定階形式逼近核函式,例如高斯核函式。本文提出的核函式池化可以和CNN網路聯合優化。 Network Structure Overview Kernel Pooling
【論文閱讀】Slot-Gated Modeling for Joint Slot Filling and Intent Prediction
文章目錄 論文部分 Abstract Introduction Proposed Approach 2.1 基於注意力機制的RNN模型 2.2 實驗部
【論文閱讀】A Correlated Topic Model Using Word Embeddings
《A Correlated Topic Model Using Word Embeddings》 Abstract 傳統的主題模型能夠通過用邏輯正態分佈代替先驗的Dirichlet來捕捉潛在主題之間的相關結構。word embeddings 已經被證明能夠捕捉語義規律,因此語義相
【論文閱讀】A Neural Probabilistic Language Model
《A Neural Probabilistic Language Model》 Yoshua Bengio 2003 Abstract 統計語言模型建模(Statistical Language Modeling)目標是學習一種語言中單詞序列的聯合概率函式。維度限制會導致:模