R-CNN

阿新 • • 發佈：2021-08-17

R-CNN

目標檢測+深度學習開山之作

CVPR'14

paper：Rich feature hierarchies for accurate object detection and semantic segmentation

亮點

使用selection search(region proposal)生成候選框
使用AlexNet提取特徵
使用SVM對CNN提取的特徵進行分類
使用Bounding box迴歸出更加精確的框

網路結構

整個流程

輸入一張圖片（任意大小）
在影象上應用selection search方法得到2000個候選框
對候選框進行裁剪、縮放得到227*227大小的影象塊

使用預訓練好的AlexNet作為特徵提取器
使用訓練好的SVM作為分類器
使用NMS除去重複的框
使用訓練好的bounding box 迴歸修正候選框

Selection search

Selection Search

劃分為小塊，對相鄰的塊計算影象相似度，合併相似的塊，重複這個過程，最後得到候選框。

指標包括顏色、紋理、區域大小和區域的合適度

影象處理

填充後再裁剪

裁剪後再填充

直接縮放到目標尺寸

論文對比發現直接縮放到目標尺寸+在影象周圍填充16個畫素（基於上下文）效果比較好。（也可以根據原始影象的畫素決定填充的畫素數）

特徵提取

使用fine-tune，保留AlexNet前五層。AlexNet在大型的資料集上訓練。

fune-tune

分類器

使用SVM*預測種類數量個分類器。

NMS

非極大抑制

按照得分排序，除去和最大得分框IOU大於閾值的框，不斷篩選。

預測框修正

附錄C

輸入\((G, P)\)， \(G\)是GT bounding box，\(P\)是predict bounding box。

\(P\)除去了那些和任何GT都不沾邊的框，這些框拿來訓練沒意義。

\(t^i_*\)是由\(G\)和\(P\)計算得到的，包括中心點偏移量和長寬的縮放比例。

hard negative mining

主要由樣本量引起。

方法：把難以訓練的樣本放入訓練集中進行訓練。

在文中特徵提取部分和分類器部分使用有點區別，fine-tunning階段是由於CNN對小樣本容易過擬合，需要大量訓練資料，故對IoU限制寬鬆： IoU>0.5的建議框為正樣本，否則為負樣本； SVM這種機制是由於其適用於小樣本訓練，故對樣本IoU限制嚴格：Ground Truth為正樣本，與Ground Truth相交IoU＜0.3的建議框為負樣本。
。

缺點

select search只能在CPU上處理，速度慢

每次輸入2000+個候選框，有大量的重複計算，速度很慢

特徵提取、分類、邊框迴歸是三個部分分別訓練

需要額外的儲存空間

在Pytorch中使用Mask R-CNN進行例項分割操作

在這篇文章中，我們將討論mask R-CNN背後的一些理論，以及如何在PyTorch中使用預訓練的mask R-CNN模型。

Mask R-CNN綜述

本專欄將從論文的角度解讀一下CV方向的一些經典神經網路模型及其貢獻與意義，以期加深自己的印象，後續可以隨時翻看並且學習其中好的tricks。這一期介紹基於 Faster R-CNN 的 Mask R-CNN ，看看其如何改進使

R-CNN論文解讀-將RCNN的多段訓練合併為一段，使用RoI池化層統一尺度-最大優點是訓練與檢測速度快

作者：WXY 日期：2020-9-5 論文期刊：Ross Girshick Microsoft Research Sep 2015 標籤：Fast RCNN

R-CNN系演算法

技術標籤：人工智慧演算法 Part 1理論知識學習：首先我學習了R-CNN系的幾個主要演算法， 1.R-CNN 我在上一週瞭解了目標檢測的兩個主要任務為物體的分類和定位。為了完成這兩個任務，R-CNN的主要思想是利用計算機

Faster R-CNN 自定義Dataset

技術標籤：faster-RCNNpython深度學習 bilibili spilt_data.py files_path = "./VOCdevkit/VOC2012/Annotations"

【目標檢測】一、初始的R-CNN與SVM

1.流程 2.數學概念 SVM（Support Vector Machines），主要想找到分離一批資料的超平面，約定是，找到距離這個超平面最近的點做距離該點最遠的線（/面）。

R-CNN

R-CNN 目標檢測+深度學習開山之作 CVPR\'14 paper：Rich feature hierarchies for accurate object detection and semantic segmentation

【論文筆記】Cascade R-CNN：通過多次迴歸提高檢測質量

Introduction 在論文的開始，作者提出了\"close\" false positive，這些false positive比較接近但不是true positive，使得檢測器難以區分\"close\" false positive和true positive，這是目標檢測的主要難點之一。當

[R-CNN]Rich feature hierarchies for accurate object detection and semantic segmentation

論文周閱讀（14周）論文標題：Rich feature hierarchies for accurate object detection and semantic segmentation Tech report

Faster R-CNN小結

1. 從Fast R-CNN到Fast R-CNN 由圖可見，Faster-RCNN引入了RPN網路（region proposal network）來代替selective-search，

Mask R-CNN原始碼終於來了，還有它背後的物體檢測平臺

夏乙編譯整理量子位出品 | 公眾號 QbitAI “等程式碼吧。” 從Mask R-CNN論文亮相至今的10個月裡，關於它的討論幾乎都會以這句話收尾。

如何使用Faster R-CNN來計算物件個數

準確地在給定的影象或視訊幀中計算物件個數的例項是機器學習中很難解決的問題。儘管許多解決方案已經被開發出來，用來計算人、汽車和其他物體的數量，但是沒有一個是完美的辦法。當然，我們這裡討論的是影象處理，所

Faster R-CNN中的RPN的理解

RPN的作用 rpn是相對於選擇性搜尋策略做出的改進，該區域生成網路的輸入是backbone的一個或多個特徵層，維度不妨設為（B,C,H,W）先通過3x3的卷積將輸入的特徵圖的特徵進行融合，接著利用兩個獨立的1x1卷積輸出object

numpy.array shape (R, 1) and (R,) 的區別

翻譯自：stackoverflow 回答 By Gareth Rees 原問題在 numpy 中，有些運算返回 shape 為 (R,1) 而有些返回 (R,)。由於需要顯式呼叫 reshape，這會讓矩陣乘法變得更加繁瑣。舉例來說，假設有一個矩陣 M，如果我們想執

簡單瞭解python字串前面加r,u的含義

這篇文章主要介紹了簡單瞭解python字串前面加r,u的含義,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python 解決OPEN讀檔案報錯 ,路徑以及r的問題

Python 中 ‘unicodeescape\' codec can\'t decode bytes in position XXX: trun錯誤解決方案背景描述

詳解Python中字串前“b”,“r”,“u”,“f”的作用

1、字串前加 u 例：u\"我是含有中文字元組成的字串。\" 作用：後面字串以 Unicode 格式進行編碼，一般用在中文字串前面，防止因為原始碼儲存格式問題，導致再次使用時出現亂碼。

簡單瞭解python中的f.b.u.r函式

這篇文章主要介紹了簡單瞭解python中的f.b.u.r函式,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python+Tensorflow+CNN實現車牌識別的示例程式碼

一、專案概述本次專案目標是實現對自動生成的帶有各種噪聲的車牌識別。在噪聲干擾情況下，車牌字元分割較困難，此次車牌識別是將車牌7個字元同時訓練，字元包括31個省份簡稱、10個阿拉伯數字、24個英文字母（\'O\'和

pytorch實現用CNN和LSTM對文字進行分類方式

model.py： #!/usr/bin/python # -*- coding: utf-8 -*- import torch from torch import nn import numpy as np

R-CNN

R-CNN

亮點

網路結構

整個流程

Selection search

影象處理

特徵提取

分類器

NMS

預測框修正

hard negative mining

缺點

相關推薦