Faster RCNN 和SSD的常用trick

阿新 • • 發佈：2018-11-15

近期計劃對Faster RCNN、SSD的一系列trick進行總結。主要分為：框架結構上面的trick、引數設定上的trick、在文字檢測特定領域的trick。

首先，是對Faster RCNN、SSD原始框架上的一些改進。包括：

通過各種方式來增加上下文資訊輔助檢測。例如通過空間RNN來引入上下文資訊[80]，通過放大faster rcnn的候選框來獲得上下文資訊[81][82][83]，用dilation 卷積來獲得上下文[84][85]，用global pooling來獲取上下文資訊[86],對每個候選框都加入全域性的分類結果來獲得上下文資訊[87]。Dssd[88]通過反捲積來利用SSD框架同一位置上高層感受野更大的特徵增強本層的特徵，來加入上下文資訊。

改進分類損失。Sheng Tang等人[85]提出要加入sink類來改善某些背景類容易錯分的情況， Tsung-Yi Lin等人[89]提出了focal loss，來改善單階段框架下，類別數目不匹配的情況。
訓練方式和樣本擴增。OHEM[90]通過線上困難樣本挖掘訓練了更有判別力分類分支網路。A-fast-rcnn[91]採用生成對抗式網路的訓練形式，線上產生訓練困難的有遮擋或形變的樣本。SSD[68]採用了豐富的資料擴增，包括映象、顏色畸變、尺度縮放和縱橫比縮放，極大提高了檢測效能。
增強特徵。Hypernet[92]把從高層到底層的多特徵融合，然後進行ROIpooling，獲得了更高的精度，FPN[93]通過反捲積網路，構建了每層都有相同特徵強度的特徵金字塔，對多尺度的目標都可以很好地處理。Jiannan Li [94]提出用生成對抗式網路式的訓練，將小目標通過ROIpooling得到的特徵逼近大目標ROIPooling提出的特徵。

改進proposal 產生方式。J Hosang [95]通過實驗表明，proposal方法的recall是影響檢測器的效能的決定因素之一。CRAFT[98]通過兩級的模型來回歸出更好的object proposal。
改進迴歸方式，Spyros Gidaris [97]提出視窗微調與多視窗投票。首先利用Fast R-CNN[64]系列框架中對視窗進行迴歸的這個過程，反覆迭代，然後用所有視窗投票，決定最終的目標類別與位置。

轉自：https://www.jianshu.com/p/70711a18f5f7?from=timeline&isappinstalled=0

Faster RCNN 和SSD的常用trick

近期計劃對Faster RCNN、SSD的一系列trick進行總結。主要分為：框架結構上面的trick、引數設定上的trick、在文字檢測特定領域的trick。首先，是對Faster RCNN、SSD原始框架上的一些改進。包括：通過各種方式來增加上下文資訊輔助檢測。例如通過空間RN

R-FCN、SSD、YOLO2、faster-rcnn和labelImg實驗筆記

轉自：https://ask.julyedu.com/question/7490R-FCN paper:https://arxiv.org/abs/1605.06409 作者程式碼：https://github.com/daijifeng001/R-FCN #matlab版本這裡使用python版本的程式

Faster-RCNN和Region Proposal Network

論文閱讀 RPN是一種全卷積網路，同時預測目標的邊界和目標在沒個位置的目標可信度得分。解決了region Proposal的計算瓶頸。傳統的SS（selective search）方法比較耗時，佔據了目標檢測的大部分時間。本文使用一個深度網路計算Propo

深度學習之目標檢測常用演算法原理+實踐精講 YOLO / Faster RCNN / SSD / 文字檢測 / 多工網路

深度學習之目標檢測常用演算法原理+實踐精講 YOLO / Faster RCNN / SSD / 文字檢測 / 多工網路資源獲取連結：點選這裡第1章課程介紹本章節主要介紹課程的主要內容、核心知識點、課程涉及到的應用案例、深度學習演算法設計通用流程、適應人群、學習本門

深度學習之目標檢測常用算法原理+實踐精講 YOLO / Faster RCNN / SSD / 文本檢測 / 多任務網絡

資源測試 -h 轉換條件評價框架檢測方法結果深度學習之目標檢測常用算法原理+實踐精講 YOLO / Faster RCNN / SSD / 文本檢測 / 多任務網絡資源獲取鏈接：點擊這裏第1章課程介紹本章節主要介紹課程的主要內容、核心知識點、課程

Caffe-SSD 和Faster RCNN訓練 Caltech行人資料集

前言：本教程的主要內容： 1，將Caltech行人資料集轉換成Caffe-SSD，Faster RCNN系列能夠訓練的格式（VOC資料集格式）； 2，同理，可以將INRIA，ETH，TUD等資料集轉換成VOC格式。 3，Caltec

CentOS7.5下安裝tensorflow和運行tf-faster-rcnn

sci manager 上傳 orm cpu plt 能夠 new ron 一、升級服務器的python版本 0、通過yum安裝後續可能會依賴的包。註意：如果在後續的安裝過程中，遇到缺少某些系統模塊的錯誤的時候，需要通過yum源進行安裝，然後需要重新編譯python。

學習筆記-目標檢測、定位、識別（RCNN，Fast-RCNN, Faster-RCNN，Mask-RCNN，YOLO，SSD 系列）

0. 前言說到深度學習的目標檢測，就要提到傳統的目標檢測方法。傳統的目標檢測流程： 1）區域選擇（窮舉策略：採用滑動視窗，且設定不同的大小，不同的長寬比對影象進行遍歷，時間複雜度高） 2）特徵提取（SIFT、HOG等；形態多樣性、光照變化多樣性、背景多樣性使得特徵魯棒性差）

Ubuntu16.04+caffe的安裝和Py-faster-rcnn在CPU電腦的安裝-2

本機安裝在/home/whu/HS/caffe https://blog.csdn.net/jx232515/article/details/72384465 第一步：重點宣告：是在cpu安裝，不適用GPU.本教程caffe編譯只是編譯了通用caffe的Python介面（如果還需要編譯

基於faster-rcnn的圖片標註和資料集生成自動化工具（資料集格式同pascal voc）

未完待續。。。 faster-rcnn的模型訓練需要大量資料集，目前使用labelImg工具，需要人工一張一張標註，效率低。本文使用python編寫了自動化圖片標註和資料集生成工具（本文標註目標是人臉，大家可以根據需要訓練其他目標判別模型，比如汽車、自行車等標註需要的圖片資

tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路

0.前言該程式碼執行首先就是呼叫vgg類建立一個網路物件self.net if cfg.FLAGS.network == 'vgg16': self.net = vgg16(batch_size=cfg.FLAGS.ims_per_batch) 該類位於vgg.py中，如下：

SSD、Faster-rcnn Loss

2018年11月11日 18:39:44 jiachen0212 閱讀數：13 標籤：目標檢測

【FPN車輛目標檢測】資料集獲取以及Windows7+TensorFlow+Faster-RCNN+FPN程式碼環境配置和執行過程實測

PS 最近在學目標檢測想用最新的FPN網路，剛好看到這篇部落格https://blog.csdn.net/Angela_qin/article/details/80944604嘗試把它復現，說的小白一點。 1.資料集獲取博主只說是車輛目標檢測沒將資料集在哪裡獲取。我在程式碼中發現E:/st

faster-rcnn配置和訓練小結

論文：http://arxiv.org/abs/1506.01497 1.準備工作類似於fast-rcnn http://blog.csdn.net/u010678153/article/details/46892911 2.安裝（用於demo） 2.1 從github

深度學習目標檢測模型全面綜述：Faster R-CNN、R-FCN和SSD

選自medium 機器之心編輯部 Faster R-CNN、R-FCN 和 SSD 是三種目前最優且應用最廣泛的目標檢測模型，其他流行的模型通常與這三者類似。本文介紹了深度學習目標檢測的三種常見模型：Faster R-CNN、R-FCN 和 SSD。圖為機

目標檢測學習總結之RCNN、SPP-net、Fast RCNN、Faster RCNN、YOLO、SSD的區別

在計算機視覺領域，“目標檢測”主要解決兩個問題：影象上多個目標物在哪裡（位置），是什麼（類別）。圍繞這個問題，人們一般把其發展歷程分為3個階段： 1. 傳統的目標檢測方法 2. 以R-CNN為代表的結合region proposal和CNN分類的目標檢測框架(R-CNN,

faster rcnn中損失函式（一）——softmax，softmax loss和cross entropy的講解

先理清下從全連線層到損失層之間的計算。來看下面這張圖，（非常好的圖）。 T類 N表示前一層特徵層flatten後的數字 fltten後的特徵無限大小的T類從0-1的T類向量

關於學習使用Faster-RCNN做目標檢測和物件捕捉問題

這裡主要是為了做遙感方向的物件捕捉問題而從目標檢測開始入手，首先大體採用的是遷移學習的思路，注主要是對模型遷移，在img做了切割和西工大及北航的資料集上進行一個交叉訓練，這樣使得RPN的網路外面的打分函式有了一個更好的0.7的結果，這個結果主要是通過對reu

Ubuntu上編譯Caffe和拓展應用(faster-rcnn, pvanet)的錯誤及解決方案

Caffe 錯誤：採用make方式編譯時遇到如下錯誤 In file included from /usr/include/boost/python/detail/prefix.hpp:13:0, fr

AWS-G2-Ubuntu16.04下安裝cuda,caffe和py-faster-rcnn

G2的顯示卡（GRID K520）驅動：http://www.nvidia.com/Download/Find.aspx 然後參考這個文章安裝CUDA和caffe：http://blog.csdn.net/sinat_26917383/article/details/56

Faster RCNN 和SSD的常用trick

相關推薦