1. 程式人生 > >NMS 非極大值抑制

NMS 非極大值抑制

非極大值抑制(non maximum suppression,NMS),顧名思義就是抑制不是極大值的元素,搜尋區域性的極大值。

定位一個車輛時,演算法可能會找出一堆候選框,為了從中找出最佳候選框,非極大值抑制的方法是:先假設有6個矩形框,根據分類器的類別分類概率做排序,假設從小到大屬於車輛的概率 分別為A、B、C、D、E、F:

  1. 從最大概率矩形框F開始,分別判斷A~E與F的重疊度IOU是否大於某個設定的閾值;

  2. 假設B、D與F的重疊度超過閾值,那麼就扔掉B、D;並標記第一個矩形框F,是我們保留下來的。

  3. 從剩下的矩形框A、C、E中,選擇概率最大的E,然後判斷E與A、C的重疊度,重疊度大於一定的閾值,那麼就扔掉;並標記E是我們保留下來的第二個矩形框。

就這樣一直重複,找到所有被保留下來的矩形框。

計算方法:

def nms(dets, thresh):
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    order = scores.argsort()[::-1]

    keep = []
    while order.size > 0:
        i = order[
0] keep.append(i) xx2 = np.minimum(x2[i], x2[order[1:]]) xx1 = np.maximum(x1[i], x1[order[1:]]) yy2 = np.minimum(y2[i], y2[order[1:]]) yy1 = np.maximum(y1[i], y1[order[1:]]) w = np.maximum(0.0, xx2 - xx1 + 1) h = np.maximum(0.0, yy2 - yy1 +
1) inter = w * h ovr = inter / (areas[i] + areas[order[1:]] - inter) inds = np.where(ovr <= thresh)[0] order = order[inds + 1] return keep