目標檢測之FPN（Feature Pyramid Net）

阿新 • • 發佈：2018-12-19

FPN思想

FPN的思想來源是傳統影象處理中的影象金字塔（image pyramid），例如sift特徵構建中使用的不同尺度的影象金字塔。FPN思想的主要是用來提高模型對不同大小輸入影象以及目標檢測問題中不同大小物體的魯棒性。

模型結構

在這裡插入圖片描述

（a）中的影象金字塔，即將影象resize到不同的大小，然後分別對不同大小的圖片使用模型進行訓練和檢測。這種方法的缺點在於增加了時間成本。有些演算法會在測試時候採用影象金字塔。
SPP net，Fast RCNN，Faster RCNN是採用（b）方式，即僅採用網路最後一層的特徵。
SSD（Single Shot Detector）採用（c）多尺度特徵的方式，沒有上取樣過程，即從網路不同層抽取不同尺度的特徵做預測，這種方式不會增加額外的計算量。作者認為SSD演算法中沒有用到足夠低層的特徵（在SSD中，最低層的特徵是VGG網路的conv4_3），而在作者看來足夠低層的特徵對於檢測小物體是很有幫助的。但是我個人認為，在這裡SSD只是用了一個淺層layer的特徵，進行目標檢測，會缺少全域性語義特徵。只是用一個深層layer的特徵進行目標檢測會缺少區域性特徵細節。這才是SSD在使用多尺度特徵進行目標檢測的時候的主要問題

FPN採用（d）方式，多尺度特徵融合，實現了在目標檢測的時候既考慮全域性特徵同時又考慮區域性特徵。

多尺度特徵融合方式

在這裡插入圖片描述

將上層特徵進行上取樣得到和下層特徵圖同樣大小的特徵圖，然後兩個特徵圖進行融合得到最終的特徵圖，使用該特徵圖作為進一步處理的輸入特徵。

FPN效果

在這裡插入圖片描述

目標檢測之FPN（Feature Pyramid Net）

FPN思想 FPN的思想來源是傳統影象處理中的影象金字塔（image pyramid），例如sift特徵構建中使用的不同尺度的影象金字塔。FPN思想的主要是用來提高模型對不同大小輸入影象以及目標檢測問題中不同大小物體的魯棒性。模型結構（a）中的影象金字塔，即

目標檢測演算法之——FPN（Feature Pyramid Networks）

以往多數的object detection演算法都是只採用頂層特徵做預測，但我們知道低層的特徵語義資訊比較少，但是目標位置準確；高層的特徵語義資訊比較豐富，但是目標位置比較粗略。另外雖然

FPN（feature pyramid networks）特徵金字塔網路演算法講解

轉自：https://blog.csdn.net/u014380165/article/details/72890275/ 這篇論文是CVPR2017年的文章，採用特徵金字塔做目標檢測，有許多亮點，特來分享。論文：feature pyramid networks for object de

FPN（feature pyramid networks）演算法講解

這篇論文是CVPR2017年的文章，採用特徵金字塔做目標檢測，有許多亮點，特來分享。論文：feature pyramid networks for object detection 論文連結：https://arxiv.org/abs/1612.03144 論文概述：

目標檢測之模型篇（4）【EAST】

文章目錄 1. 前言 2. 實現 2.1 Pipeline 2.2 網路設計 2.3 標籤生成 2.4 損失函式 2.5 訓練 2.6 位置感知的NMS 3. 結果 4. 總結 5.

目標檢測之模型篇（3）【DMPNet】

文章目錄 1. 前言 2. 實現 2.1 Roughly recall text with quadrilateral sliding window 2.2 Finely localize text with quadrangle

目標檢測之模型篇（2）【RRPN】

文章目錄 1. 前言 2. 實現 2.1 關鍵idea 2.2 模型結構 2.3 具體細節 1.Rotated Bounding Box Representation-旋轉矩形框的表示 2.Rotati

目標檢測之網路篇（2）【STN-空間變換網路】

1. STN是什麼 STN：Spatial Transformer Networks，即空間變換網路，是Google旗下 DeepMind 公司的研究成果。該論文提出空間變換網路STN，分為引數預測、座標對映、畫素採集三大部分，可以插入到現有的CNN模型中。通

目標檢測之模型篇（1）【CTPN連線文字提議網路】

1. 前言本週開始看模型篇，本週目標：CTPN,RRPN,DMPNet,EAST,衝鴨！! 第一篇，CTPN（Connectionist Text Proposal Network），其實是基於Faster R-CNN改進的，將RPN的體系結構擴充套件到文字

目標檢測之網路篇（3）【Faster R-CNN】

前言 1.有關VGG16結構，參見：VGG16圖形化描述 2.本週目標是看三篇網路類，讀到第三篇Faster R-CNN的時候我發現需要先弄懂R-CNN以及Fast R-CNN。引用@v_JULY_v的文章的總結： R-CNN 1.在影象中確定約1000-200

基於深度學習的目標檢測演算法綜述（二）—Two/One stage演算法改進之R-FCN

基於深度學習的目標檢測演算法綜述（一）：https://blog.csdn.net/weixin_36835368/article/details/82687919 目錄 1、Two stage 1.1 R-FCN：Object Detection via Region-based

目標檢測之四，使用multinet的KittiBox部分進行車輛檢測（demo，train，evalute）

目標檢測之四，使用multinet的KittiBox部分進行車輛檢測（demo，train，evalute）使用KittiBox進行車輛檢測，訓練環境和配置：Ubuntu16.04，python3.5，TensorFlow1.4，i76700K+雙GT

目標檢測之-Caffe-SSD系列（一）資料的處理-PASCAL VOC

目標檢測任務之資料的處理常見的目標檢測資料集之PASCAL VOC 1 . PASCAL VOC資料集介紹資料集名稱訓練集（本地訓）測試集（本地測） PAS

目標檢測之訓練opencv自帶的分類器（opencv_haartraining 或 opencv_traincascade）

最權威的說明，參考官方使用手冊： http://www.OpenCV.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincasca

前端基於react,後端基於.net core2.0的開發之路（番外篇）後端使用T4模板，生成某些類

bsp 。。 bubuko 按鈕 uil out eva 下載地址所有 1.介紹因為開發過程中，有部分類是你加一個模型，就需要去改動的，每次加非常的煩，或者有些類，你只用到了他基類的方法，但是你還必須建一個文件才能調用他基類的方法，也很煩。這個時候，T4就非常有用了。

基於深度學習的目標檢測演算法綜述（一）（截止20180821）

參考：https://zhuanlan.zhihu.com/p/40047760 目標檢測（Object Detection）是計算機視覺領域的基本任務之一，學術界已有將近二十年的研究歷史。近些年隨著深度學習技術的火熱發展，目標檢測演算法也從基於手工特徵的傳統演算法轉向了基於深度神經網路的檢測技

基於深度學習的目標檢測演算法綜述（三）（截止20180821）

參考：https://zhuanlan.zhihu.com/p/40102001 基於深度學習的目標檢測演算法綜述分為三部分： 1. Two/One stage演算法改進。這部分將主要總結在two/one stage經典網路上改進的系列論文，包括Faster R-CNN、YOLO、SSD等經

基於深度學習的目標檢測演算法綜述（二）（截止20180821）

參考：https://zhuanlan.zhihu.com/p/40020809 基於深度學習的目標檢測演算法綜述分為三部分： 1. Two/One stage演算法改進。這部分將主要總結在two/one stage經典網路上改進的系列論文，包括Faster R-CNN、YOLO、SSD等經

目標檢測之RCNN、Fast RCNN 、Faster RCNN技術演進與對比

三者的處理步驟先上三者的處理步驟： RCNN： 1、提取1000-2000個（超引數）的候選框（採用selective search演算法）; 2、將每個候選框中的影象調整到相同的size; 3、將調整size後的影象（數量與候選框個數相同）輸入CNN提取featu

計算機視覺（七）：特徵檢測/提取（feature detection/extraction）

關鍵點檢測和匹配流水線四個階段一、背景知識 1. 影象特徵 2. 數字函式的一階導數和二階導數 3. 導數與影象特徵關係二

目標檢測之FPN（Feature Pyramid Net）

FPN思想

模型結構

多尺度特徵融合方式

FPN效果

相關推薦