一分鐘速學 | NMS, IOU 與 SoftMax

阿新 • • 發佈：2020-07-25

非極大抑制

NMS的英文是Non-maximum suppression的縮寫。

簡單的說，就是模型給出了多個重疊在一起的候選框，我們只需要保留一個就可以了。其他的重疊的候選框就刪掉了，效果可見下圖：

交併比

IoU的英文全稱Intersection over Union，就是兩個候選框區域的交集面積比上並集的面積，用下圖可以理解：

hard-NMS

hard-nms其實就是經典版本的NMS的方法。就是根據模型給出每個box的置信度從大到小進行排序，然後保留最大的，刪除所以與這個最大置信度的候選框的IoU大於閾值的其他候選框。

舉個例子吧，現在有4個候選框：
(box1,0.8),(box2,0.9),
(box3,0.7),(box4,0.5)

我們把這四個候選框按照置信度從大到小排序：
box2>box1>box3>box4

現在我們保留置信度最大的候選框box2,然後計算剩下三個box與box2之間的IoU，如果IoU大於一個事先設定的閾值，那麼就刪除這個box。假設,閾值是0.5:
IoU(box1,box2)=0.1<0.5，保留；IoU(box3,box2)=0.7<0.5，刪除；IoU(box4,box2)=0.2<0.5，保留；

現在還有box1和box4，然後再重複上面的過程，排序，然後刪除。

下面是python實現的hard-NMS：

def hard_nms(box_scores, iou_threshold, top_k=-1, candidate_size=200):
    """
    Args:
        box_scores (N, 5): box的集合，N為框的數量，5即4(位置資訊)+1(可能為物體的概率)
        iou_threshold: 我們用IOU標準去除多餘檢測框的閾值
        top_k: 保留多少個計算後留下來的候選框，如果為-1則全保留
        candidate_size: 參與計算的boxes數量
    Returns:
         picked: 經過nms計算後保留下來的box
    """
    scores = box_scores[:, -1]                # 首先我們取出box中的最後一個元素也就是當前box檢測到物體的概率
    boxes = box_scores[:, :-1]                # 取出box中的四個座標(左上、右下)
    picked = []  
    _, indexes = scores.sort(descending=True) # 按照降序排列所有的物體的概率，得到排序後在原陣列中的索引資訊 indexes
    indexes = indexes[:candidate_size]        # 只保留前 candidate_size 個 boxes 其餘的不考慮了
    while len(indexes) > 0:
        current = indexes[0]                  # 每次取出當前在 indexes 中 檢測到物體概率最大的一個 
        picked.append(current.item())         # 將這個最大的存在結果中
        if 0 < top_k == len(picked) or len(indexes) == 1:
            break
        current_box = boxes[current, :]       # 當前第一個也就是最高概率的box
        indexes = indexes[1:]                
        rest_boxes = boxes[indexes, :]        # 剩下其餘的box
        iou = iou_of(                         # 將當前的box與剩下其餘的boxes用IOU標準進行篩選
            rest_boxes,
            current_box.unsqueeze(0),
        )
        indexes = indexes[iou <= iou_threshold]# 保留與當前box的IOU小於一定閾值的boxes，

    return box_scores[picked, :]

如何計算iou的面積呢？實現方法在下面：

def area_of(left_top, right_bottom) -> torch.Tensor:
    """Compute the areas of rectangles given two corners.

    Args:
        left_top (N, 2): left top corner.
        right_bottom (N, 2): right bottom corner.

    Returns:
        area (N): return the area.
    """
    hw = torch.clamp(right_bottom - left_top, min=0.0)
    return hw[..., 0] * hw[..., 1]


def iou_of(boxes0, boxes1, eps=1e-5):
    """Return intersection-over-union (Jaccard index) of boxes.

    Args:
        boxes0 (N, 4): ground truth boxes.
        boxes1 (N or 1, 4): predicted boxes.
        eps: a small number to avoid 0 as denominator.
    Returns:
        iou (N): IoU values.
    """
    overlap_left_top = torch.max(boxes0[..., :2], boxes1[..., :2])
    overlap_right_bottom = torch.min(boxes0[..., 2:], boxes1[..., 2:])

    overlap_area = area_of(overlap_left_top, overlap_right_bottom)
    area0 = area_of(boxes0[..., :2], boxes0[..., 2:])
    area1 = area_of(boxes1[..., :2], boxes1[..., 2:])
    return overlap_area / (area0 + area1 - overlap_area + eps)

soft-NMS

在密集目標檢測任務中，hard-NMS會有一些問題，看下面的例子：

兩個物體重疊起來了，但是根據hard-NMS綠色的框會被掉。

Soft-NMS就改動了一個地方。 在判斷最高的置信度的box和其他box的IoU的時候增加了一個係數，可以更好的選擇哪些才是多餘的box。

對於hard-NMS來說，\(iou(M,b_i)<N_t\)的時候，保留，大於等於的時候刪除，\(s\)表示置信度：

對於soft-NMS來說，\(iou(M,b_i)<N_t\)的時候，保留，大於的時候削減：

可以看出來，hard-NMS對於IoU大於閾值的候選框，直接把其置信度變成0，這樣就相當於刪除了這個box；但是soft-NMS的會根據IoU的大小，去適當的削減置信度，從而留下一些餘地。

【如何削減】
這裡有兩種方法來降低重疊候選框的置信度：

\(s=s(1-iou(M,b))\)簡單的線性衰減；
\(s = se^{-\frac{iou(M,b)^2}{\sigma}}\)指數衰減。其中sigma是常數，一般是0.5.

第二種方法更為常見。

下面是python來實現的soft-NMS，其實跟hard-NMS相比，就多了一行程式碼罷了：

def soft_nms(box_scores, score_threshold, sigma=0.5, top_k=-1):
    """Soft NMS implementation.

    References:
        https://arxiv.org/abs/1704.04503
        https://github.com/facebookresearch/Detectron/blob/master/detectron/utils/cython_nms.pyx

    Args:
        box_scores (N, 5): boxes in corner-form and probabilities.
        score_threshold: boxes with scores less than value are not considered.
        sigma: the parameter in score re-computation.
            scores[i] = scores[i] * exp(-(iou_i)^2 / simga)
        top_k: keep top_k results. If k <= 0, keep all the results.
    Returns:
         picked_box_scores (K, 5): results of NMS.
    """
    picked_box_scores = []
    while box_scores.size(0) > 0:
        max_score_index = torch.argmax(box_scores[:, 4])
        cur_box_prob = torch.tensor(box_scores[max_score_index, :])
        picked_box_scores.append(cur_box_prob)
        if len(picked_box_scores) == top_k > 0 or box_scores.size(0) == 1:
            break
        cur_box = cur_box_prob[:-1]
        box_scores[max_score_index, :] = box_scores[-1, :]
        box_scores = box_scores[:-1, :]
        ious = iou_of(cur_box.unsqueeze(0), box_scores[:, :-1])

        # 以下這句是新加的，如果沒有這句就是Hard-NMS了
        box_scores[:, -1] = box_scores[:, -1] * torch.exp(-(ious * ious) / sigma) 

        box_scores = box_scores[box_scores[:, -1] > score_threshold, :]
    if len(picked_box_scores) > 0:
        return torch.stack(picked_box_scores)
    else:
        return torch.tensor([])

一分鐘速學 | NMS, IOU 與 SoftMax

非極大抑制 NMS的英文是Non-maximum suppression的縮寫。簡單的說，就是模型給出了多個重疊在一起的候選框，我們只需要保留一個就可以了。其他的重疊的候選框就刪掉了，效果可見下圖：

一分鐘瞭解Java中List集合與set集合的多種遍歷方式

List集合與set集合的多種遍歷方式方法有： 1. for迴圈遍歷 2. foreach增強迴圈遍歷

一分鐘學一個 Python 標準庫之 Pathlib

相對於 os.path 來說，Pathlib 極大地簡化了路徑相關的操作。舉個例子來說：獲取當前檔案路徑下的 default.yaml 檔案

資料結構與演演算法（十一）：圖的儲存與遍歷

圖的定義圖（Graph）是由非空的頂點集合和一個描述頂點之間的關係——邊（或者弧）的集合組成的，其形式化定義為：

十分鐘搞懂Lombok使用與原理

1 簡介 Lombok是一款好用順手的工具，就像Google Guava一樣，在此予以強烈推薦，每一個Java工程師都應該使用它。Lombok是一種Java™實用工具，可用來幫助開發人員消除Java的冗長程式碼，尤其是對於簡單的Java物件（P

【Python雜貨鋪】速學python基礎

“人生苦短，我學python”是程式設計屆的名言。用python寫小指令碼的便捷性，讓很多其他語言的學習者把python當作輔助語言。擁有了某一個語言的功底，再來學習另外一種語言應該是十分快速的。程式設計理念都十分相似

通過一分鐘快速瞭解索引技巧

花1分鐘時間，瞭解聚集索引，非聚集索引，聯合索引，索引覆蓋。舉例，業務場景，使用者表，表結構為：

python實現的Iou與Giou程式碼

最近看了網上很多博主寫的iou實現方法，但Giou的程式碼似乎比較少，於是便自己寫了一個，新手上路，如有錯誤請指正，話不多說，上程式碼：

Python 日期時間datetime 加一天，減一天，加減一小時一分鐘,加減一年

計算年、月、日需要安裝元件包 pip install python-dateutil 當前日期時間 import datetime

學前端,css與javascript重難點淺析

JavaScript是一種屬於網路的指令碼語言,已經被廣泛用於Web應用開發,常用來為網頁新增各式各樣的動態功能,為使用者提供更流暢美觀的瀏覽效果。通常JavaScript指令碼是通過嵌入在HTML中來實現自身的功能的。

一分鐘開始持續整合之旅系列之：Java + GWT

作者：CODING - 朱增輝前言 Google Web Toolkit（GWT）是一個開源、免費的 Web 開發框架，通過該框架，您可以使用 Java 構建複雜、高效能的 JavaScript 應用程式。

一分鐘開始持續整合之旅系列之：C 語言 + Makefile

作者：CODING - 朱增輝前言 make 工具非常強大，配合 makefile 檔案可以實現軟體的自動化構建，但是執行 make 命令依然需要經歷手動輸入執行、等待編譯完成、將目標檔案轉移到合適位置等過程，我們真正關心的是最終

win10電腦開機速度慢長達一分鐘怎麼辦

Win10電腦開機慢確實是一件很糟心的事情，相信大家都遇到過開機慢,動不動就要等上一分鐘的情況，影響上網心情。造成開機速度慢的原因很多，比如電腦配置、系統設定等等，該怎麼設定才能儘量加快開機時間？為此，這裡

華為交換機如何配置SSH遠端登入，一分鐘秒學會

從事網路運維工作的小夥伴們都知道，在交換機正式上線時，必須完成配置SSH遠端登入，這樣做目的是為了日後，維護方便，不需要每次登入裝置都要跑到機房，這樣既不現實，又費事。

一文解決django 2.2與mysql相容性問題

Django是一個開放原始碼的Web應用框架，由Python寫成。採用了MTV的框架模式，即模型M，檢視V和模版T。它最初是被開發來用於管理勞倫斯出版集團旗下的一些以新聞內容為主的網站的，即是CMS（內容管理系統）軟體。並於

2020年7月最新|一分鐘永久啟用Win10系統超簡單教程|更多神奇功能

2020年7月最新|一分鐘永久啟用Win10系統超簡單教程|更多神奇功能北緯37度的大飛2020-07-13 12:54:09

一分鐘玩轉 Spring IoC！

前言「上一篇文章」我們對 Spring 有了初步的認識，而 Spring 全家桶中幾乎所有元件都是依賴於 IoC 的。

用Python一分鐘選出底部放量跳空上揚的強勢股，你也可是巴菲特

前言最近A股市場行情火爆，對股民們來說，選到一隻強勢股是夢寐以求的事情，因為只有強勢股才能讓自己的收益跑贏大盤，不然只能眼巴巴看著指數不斷上漲，而手上的股票卻不動聲色，懊惱不已！

優化國際網站從一分鐘到4~6秒

前言　　前幾天開會的時候，被老闆質問為何開啟網址等了8、9秒？當時我既然語塞，因為安卓和IOS開啟也很慢，但不會像PC網頁這麼慢到接近10秒才打開。而且更要命的是伺服器在新加坡，老闆就是在新加坡開啟這麼慢，我

Scrapy分散式爬蟲，分散式佇列和布隆過濾器，一分鐘搞定？

使用Scrapy開發一個分散式爬蟲？你知道最快的方法是什麼嗎？一分鐘真的能開發好或者修改出一個分散式爬蟲嗎？

一分鐘速學 | NMS, IOU 與 SoftMax

非極大抑制

交併比

hard-NMS

soft-NMS

相關推薦