1. 程式人生 > 其它 >特徵點檢測、目標檢測

特徵點檢測、目標檢測

1 特徵點檢測(Landmark detection

假設你正在構建一個人臉識別應用,出於某種原因,你希望演算法可以給出眼角的具體位置。眼角座標為(x, y),你可以讓神經網路的最後一層多輸出兩個數字lxly,作為眼角的座標值。如果你想知道兩隻眼睛的四個眼角的具體位置,那麼從左到右,依次用四個特徵點來表示這四個眼角。對神經網路稍做些修改,輸出第一個特徵點(l1xl1y),第二個特徵點(l2xl2y),依此類推,這四個臉部特徵點的位置就可以通過神經網路輸出了。也可以有更多的特徵點,用來提取臉部輪廓或下頜輪廓。

2 目標檢測(Object detection

通過卷積網路進行物件檢測,採用的是基於滑動視窗的目標檢測演算法。假設這是一張測試圖片,首先選定一個特定大小的視窗,比如圖片下方這個視窗,將這個紅色小方塊輸入卷積神經網路,卷積網路開始進行預測,即判斷紅色方框內有沒有汽車。滑動視窗目標檢測演算法接下來會繼續處理第二個影象,即紅色方框稍向右滑動之後的區域,並輸入給卷積網路,因此輸入給卷積網路的只有紅色方框內的區域,再次運行卷積網路,然後處理第三個影象,依次重複操作,直到這個視窗滑過影象的每一個角落。為了滑動的更快,可以選用比較大的步幅。

滑動視窗目標檢測演算法也有很明顯的缺點,就是計算成本,因為你在圖片中剪切出太多小方塊,卷積網路要一個個地處理。如果你選用的步幅很大,顯然會減少輸入卷積網路的視窗個數,但是粗糙間隔尺寸可能會影響效能。反之,如果採用小粒度或小步幅,傳遞給卷積網路的小視窗會特別多,這意味著超高的計算成本。

本文來自部落格園,作者:zhang-X,轉載請註明原文連結:https://www.cnblogs.com/YY-zhang/p/15077141.html