1. 程式人生 > >HOG特徵-梯度方向直方圖

HOG特徵-梯度方向直方圖

簡介

  • HOG特徵主要是用於目標檢測等影象任務中,它能夠提取影象中有意義的部分,進而用於分類等任務。

主要流程

  • 給定一張影象,我們可以將其轉換為特定大小的影象(不轉換也可以,這裡假設得到的影象尺寸都是一樣的,方便後續的說明),假設尺寸為WH3
  • 設定cell(大小為CxCy),求每個cell的x與y方向的梯度,進而可以得到這個cell的梯度及其方向,可以使用sobel運算元進行梯度計算
  • 根據每個cell中的梯度大小及方向,計算其梯度的直方圖,梯度越大,對應梯度方向所在的直方圖區域的權值就越大,一般可以設定直方圖大小為9X1.
  • 得到每個cell的梯度資訊之後,我們希望梯度資訊最後不受其光照資訊等因素的影響,因此對其進行normalization的操作,但是更好的方法是設定將不同的cell組成一個block,在這其中對其進行normalization,我們假設一個block包含
    bxby
    個cell,因此該區域的直方圖就是一個9bxbyX1的向量,對每個block按照一個1cell的step進行滑動,我們最終可以得到(W/Cxbx+1)(H/Cyby+1)個直方圖向量,將所有的直方圖reshape為1維向量,就能得到最終的HOG特徵向量。

參考連結