影象處理之IOU, NMS原理及C++實現

阿新 • • 發佈：2020-10-29

1. IOU

交併比（Intersection-over-Union，IoU），目標檢測中使用的一個概念，是產生的候選框（candidate bound）與原標記框（ground truth bound）的交疊率，即它們的交集與並集的比值。最理想情況是完全重疊，即比值為1。

計算公式：

C++程式碼：

struct bbox
{
	int m_left;
	int m_top;
	int m_width;
	int m_height;
 
	bbox() {}
	bbox(int left, int top, int width, int height) 
	{
		m_left = left;
		m_top = top;
		m_width = width;
		m_height = height;
	}
};

float IOU_compute(const bbox b1, const bbox b2)
{
    w = max(min((b1.m_left + b1.m_width), (b2.m_left + b2.m_width)) - max(b1.m_left, b2.m_left), 0);
    h = max(min((b1.m_top + b1.m_height), (b2.m_top + b2.m_height)) - max(b1.m_top, b2.m_top), 0);

    return w*h / (b1.m_width*b1.m_height + b2.m_width*b2.m_height - w*h);
}

2. NMS

NMS（non maximum suppression），中文名非極大值抑制，在很多計算機視覺任務中都有廣泛應用，如：邊緣檢測、目標檢測等。

在物體檢測中NMS（Non-maximum suppression）非極大抑制應用十分廣泛，其目的是為了消除多餘的框，找到最佳的物體檢測的位置。

在RCNN系列演算法中，會從一張圖片中找出很多個候選框（可能包含物體的矩形邊框），然後為每個矩形框為做類別分類概率。

就像上面的圖片一樣，定位一個車輛，最後演算法就找出了一堆的方框，我們需要判別哪些矩形框是沒用的。

非極大值抑制：先假設有6個候選框，根據分類器類別分類概率做排序，從小到大分別屬於車輛的概率分別為A、B、C、D、E、F。

從最大概率矩形框（即面積最大的框）F開始，分別判斷A~E與F的重疊度IOU是否大於某個設定的閾值;
假設B、D與F的重疊度超過閾值，那麼就扔掉B、D（因為超過閾值，說明D與F或者B與F，已經有很大部分是重疊的，那我們保留面積最大的F即可，其餘小面積的B，D就是多餘的，用F完全可以表示一個物體了，所以保留F丟掉B,D）；並標記第一個矩形框F，是我們保留下來的。
從剩下的矩形框A、C、E中，選擇概率最大的E，然後判斷E與A、C的重疊度，重疊度大於一定的閾值，那麼就扔掉；並標記E是我們保留下來的第二個矩形框。
一直重複這個過程，找到所有曾經被保留下來的矩形框。

C++程式碼：

//升序排列
bool cmpScore(Bbox lsh, Bbox rsh) {
	if (lsh.score < rsh.score)
		return true;
	else
		return false;
}

void nms(vector<Bbox> &boundingBox_, const float overlap_threshold, string modelname = "Union"){
 
    if(boundingBox_.empty()){
        return;
    }
    //對各個候選框根據score的大小進行升序排列
    sort(boundingBox_.begin(), boundingBox_.end(), cmpScore);
    float IOU = 0;
    float maxX = 0;
    float maxY = 0;
    float minX = 0;
    float minY = 0;
    vector<int> vPick;
    int nPick = 0;
    multimap<float, int> vScores;   //存放升序排列後的score和對應的序號
    const int num_boxes = boundingBox_.size();
	vPick.resize(num_boxes);
	for (int i = 0; i < num_boxes; ++i){
		vScores.insert(pair<float, int>(boundingBox_[i].score, i));
	}
    while(vScores.size() > 0){
        int last = vScores.rbegin()->second;  //反向迭代器，獲得vScores序列的最後那個序列號
        vPick[nPick] = last;
        nPick += 1;
        for (multimap<float, int>::iterator it = vScores.begin(); it != vScores.end();){
            int it_idx = it->second;
            maxX = max(boundingBox_.at(it_idx).x1, boundingBox_.at(last).x1);
            maxY = max(boundingBox_.at(it_idx).y1, boundingBox_.at(last).y1);
            minX = min(boundingBox_.at(it_idx).x2, boundingBox_.at(last).x2);
            minY = min(boundingBox_.at(it_idx).y2, boundingBox_.at(last).y2);
            //轉換成了兩個邊界框相交區域的邊長
            maxX = ((minX-maxX+1)>0)? (minX-maxX+1) : 0;
            maxY = ((minY-maxY+1)>0)? (minY-maxY+1) : 0;
            //求交併比IOU
            
            IOU = (maxX * maxY)/(boundingBox_.at(it_idx).area + boundingBox_.at(last).area - IOU);
            if(IOU > overlap_threshold){
                it = vScores.erase(it);    //刪除交併比大於閾值的候選框,erase返回刪除元素的下一個元素
            }else{
                it++;
            }
        }
    }
    
    vPick.resize(nPick);
    vector<Bbox> tmp_;
    tmp_.resize(nPick);
    for(int i = 0; i < nPick; i++){
        tmp_[i] = boundingBox_[vPick[i]];
    }
    boundingBox_ = tmp_;
}

影象處理之IOU, NMS原理及C++實現

1. IOU

2. NMS

影象處理之IOU, NMS原理及C++實現

影象處理之卷積模式及C++實現

Kubernetes網路分析之Flannel工作原理及原始碼實現

跳錶原理及C++實現

迴圈佇列FIFO原理及C實現

影象處理之直方圖均衡化及C++實現

OpenCV C++ 影象處理之自動色階

Redis處理高併發機制原理及例項解析

執行緒池原理及C語言實現執行緒池

深入理解JavaScript之 new 原理及模擬實現

影象處理之卷積核

（opencv）影象處理之開閉運算

Python OpenCV 影象處理之影象直方圖，取經之旅第 23 天

數字影象處理之影象取樣理論+實驗

影象處理之濾鏡、圖文排版的開發詳解，從入門到起飛

delphi影象處理之灰度處理

（原創）[C#] 一步一步自定義拖拽（Drag&Drop）時的滑鼠效果：（一）基本原理及基本實現

堆原理及C語言實現

永恆之藍漏洞原理及復現

感知器基礎原理及python實現過程詳解

影象處理之IOU, NMS原理及C++實現

1. IOU

2. NMS

相關推薦