影象框檢測演算法的演變

阿新 • • 發佈：2018-12-17

mAP

mean Average Precision:在每個類上的平均準確率

NMS

非極大值抑制

針對每個類的候選框，根據得分從大到小排序
取最大得分的候選框，依次和後面的候選框進行IoU計算，若大於閾值，則刪除得分低的。否則認為影象中存在多個同類物體。
依次在得分較低的候選框上計算2，得到最終候選框。

這裡有說可以在最後一步結果上刪除候選框得分小於閾值的。但是完全可以在開始就做這一步呀。

selective search

選擇性搜尋

簡單演算法將影象劃分成一個個小區域集合R
R中每個相鄰區域相似度組成集合s
取s中最相近的兩個區域，合併後新增入R

刪除s中和3相關子集
計算新的相似度
迴圈到3，直至s為空

EdgeBoxes

Anchor Box

DPM

hard negative mining

難分樣本挖掘

將分類錯誤的負樣本劃分為負樣本繼續訓練。

代表演算法：OHEM

image-centric sampling

FPN

特徵金字塔網路；在每個尺度層面進行預測。用於RPN

RPN

proposal :大概位置

區域建議網路：

每個點有9個錨點，將9個錨點中的物件進行檢測後迴歸，再進行非極大值抑制來得到最終需要的待檢測框。

SVD

ROI Align

相對於ROI 池化的取整損失精度，採用了保留浮點數的方式，讓結果更準確。

RoI Warping Layer

R-CNN

使用selective search選擇約2000個候選框
對影象padding16後，將影象變形為227*227以適應AlexNet的輸入
對每個候選框減去影象均值（預處理）後輸入AlexNet產生2000*4096的特徵矩陣
使用svm將每個候選矩陣分類，20個分類器這裡，因為是svm是2分類
使用NMS進行篩選
使用迴歸器進行迴歸以修正結果

存在問題：慢，複雜。。

SPPnet

Fast-RCNN

對整幅圖卷積，得到特徵圖
對原圖進行selective search得到候選框
從2的候選框在特徵圖中取到特徵框
通過池化得到相同大小特徵框（ROI池化）就是每個max pooling的範圍大小不固定。

將相同大小特徵框輸入全連線層得到固定大小特徵向量
將5所得特徵向量並行經過兩個全連線層，分別得到softmax的類別輸出和bounding-box的視窗迴歸。
對每個類非極大值抑制後，得到的特徵框迴歸修正。

相對改進：

對整個影象進行一次卷積後，selective search的結果，選取特徵區域。

取消了SVM，節約了儲存空間

採用了SVD，優化全連線速度。

Faster-RCNN

對整幅圖進行卷積，卷積的前半部分共享，產生的特徵一部分用於繼續後面的Fast-RCNN使用，一部分輸入RPN網路
通過RPN網路得到候選框，其他同上Fast-RCNN

RPN訓練時產生2000個，測試時300個。

MASK_RCNN

修改ROI pooling 為ROI Align的Faster-RCNN

FCIS

YOLO

同樣也是對整幅圖卷積，不過不再使用預測框+分類的方式，而是直接對結果迴歸。也有多個版本的變遷。

SSD

MobileNet

感覺這個網路就是一種速度和記憶體的優化吧。用於移動端

影象框檢測演算法的演變

mAP mean Average Precision:在每個類上的平均準確率 NMS 非極大值抑制針對每個類的候選框，根據得分從大到小排序取最大得分的候選框，依次和後面的候選框進行IoU計算，若大於閾值，則刪除得分低的。否則認為影象中存在多個同類物體。依次在

opencv學習--opencv內的6種影象邊緣檢測演算法的實現

如上篇部落格所述，影象邊緣檢測演算法主要有Sobel, Scarry, Canny, Laplacian，Prewitt， Marr-Hildresh，現在進行總結 1.Sobel運算元 Sobel運算元是主要用於邊緣檢測的離散微分運算元，它

Win8 Metro(C#)數字影象處理--2.35影象膚色檢測演算法

[函式名稱] 膚色檢測函式SkinDetectProcess(WriteableBitmap src) [演算法說明] 這個演算法是一篇學術論文演算法的實現，論文名字為“基於韌臉檢測和顏色分析的紅眼自動消除”(作者金秋明，王朔中)，主要是採集並統計膚色畫素，得到膚

異常檢測演算法演變及學習筆記

【說在前面】本人部落格新手一枚，象牙塔的老白，職業場的小白。以下內容僅為個人見解，歡迎批評指正，不喜勿噴！[認真看圖][認真看圖] 【補充說明】異常檢測，又稱離群點檢測，有著廣泛應用。例如金融反欺詐、工業損毀檢測、電網竊電行為等！一、基於時間序列分析關於時間序列分析的介紹，歡迎瀏覽我的另一篇部

opencv影象處理-------邊緣檢測演算法

利用Canny邊緣檢測運算元進行邊緣檢測的原理及OpenCV程式碼實現 Canny運算元是John Canny在1986年發表的論文中首次提出的邊緣檢測運算元，該運算元檢測效能比較好，應用廣泛。 Canny運算元進行邊緣檢測的原理和步驟如下： ⑴消除噪聲。邊緣檢測的演算

目標檢測演算法中檢測框合併策略技術綜述

物體檢測（Object Detection）的任務是找出影象或視訊中的感興趣目標，同時實現輸出檢測目標的位置和類別，是機器視覺領域的核心問題之一，學術界已有將近二十年的研究歷史。隨著深度學習技術的火熱發展，目標檢測演算法也從基於手工特徵的傳統演算法轉向了基於深度神經網路的檢測技術。從最初 2013

數字影象處理筆記（十一）：邊緣檢測演算法

1 - 引言在影象識別中，如果可以將影象感興趣的物體或區別分割出來，無疑可以增加我們影象識別的準確率，傳統的數字影象處理中的分割方法多數基於灰度值的兩個基本性質不連續性、以灰度突變為基礎分割一副影象，比如影象的邊緣相似性根據一組預定義的準則將一副影象分割為相似

邊緣檢測演算法——影象處理

1.Sobel邊緣檢測演算法 sobel邊緣運算元認不同為鄰域的畫素對當前畫素產生的影響不是等價的，所以距離不同的畫素具有不同的權值，對運算元結果產生的影響也不同。一般來說，距離越大，產生的影響越小。這兩個卷積因子分別對垂直邊緣和水平邊緣影響最大，兩個卷積的最大值做為該點的輸出位。

影象區域性特徵點檢測演算法綜述

研究影象特徵檢測已經有一段時間了，影象特徵檢測的方法很多，又加上各種演算法的變形，所以難以在短時間內全面的瞭解，只是對主流的特徵檢測演算法的原理進行了學習。總體來說，影象特徵可以包括顏色特徵、紋理特等、形狀特徵以及區域性特徵點等。其中區域性特點具有很好的穩定性，不容易受外界環境的干擾，本篇文章也是對這方面知識