1. 程式人生 > 程式設計 >opencv3/C++ HOG特徵提取方式

opencv3/C++ HOG特徵提取方式

HOG特徵

HOG(Histograms of Oriented Gradients)梯度方向直方圖

通過利用梯度資訊能反映影象目標的邊緣資訊並通過區域性梯度的大小將影象區域性的外觀和形狀特徵化.在論文Histograms of Oriented Gradients for Human Detection中被提出.

HOG特徵的提取過程為:

Gamma歸一化;

計算梯度;

劃分cell

組合成block,統計block直方圖;

梯度直方圖歸一化;

收集HOG特徵。

Gamma歸一化:

對影象顏色進行Gamma歸一化處理,降低區域性陰影及背景因素的影響.

計算梯度:

通過差分計算出影象在水平方向上及垂直方向上的梯度:

然後得到各個畫素點的梯度的幅值及方向:

劃分cell

將整個視窗劃分成大小相同互不重疊的細胞單元cell(如8×8畫素),計算出每個cell的梯度大小及方向.然後將每畫素的梯度方向在0−180o0−180o 區間內(無向:0-180,有向:0-360)平均分為9個bins,每個cell內的畫素用幅值來表示權值,為其所在的梯度直方圖進行加權投票.

9bins:

如圖,不同數量的bins下的錯誤率:

組合成block,統計block直方圖

將2×2個相鄰的cell組成大小為16×16的畫素塊即block.依次將block大小的滑動視窗從左到右從上到下滑動,求其梯度方向直方圖向量.

如圖,不同大小的cell與不同大小的block作用下的效果對比:

梯度直方圖歸一化

作者對比了L2-norm、L1-norm、L1-sqrt等歸一化方法,發現都比非標準資料有顯著的改善.其中L2-norm和L1-sqrt效果最好,而L1-norm檢測效果要比L2-norm和L1-sqrt低5%.

如圖,不同的歸一化方法效果對比:

這樣通過歸一化能夠進一步地對光照、陰影和邊緣進行壓縮.

收集HOG特徵

由於每個cell內的梯度方向分成了9個bins,這樣每個細胞單元的HOG特徵向量長度是9.

這樣,對於大小為128×64大小的影象,採用8*8畫素的sell,2×2個cell組成的16×16畫素的block,採用8畫素的block移動步長,這樣檢測視窗block的數量有((128-16)/8+1)×((64-16)/8+1)=15×7.則HOG特徵描述符的維數為15×7×4×9.

HOG的缺點:

速度慢,實時性差;難以處理遮擋問題。

OpenCV應用

利用HOG進行行人檢測時有兩種用法:

1、採用HOG特徵+SVM分類器進行行人檢測;

2、利用HOG+SVM訓練自己的XML檔案。

採用第一種方法,使用HOG特徵結合SVM分類器進行行人檢測,簡單示例:

#include <opencv2/opencv.hpp>
#include <opencv2/objdetect.hpp>
using namespace std;
using namespace cv;

int main()
{
 Mat src,dst;
 src = imread("E:/image/image/passerby.jpg",1);
 if (src.empty())
 {
 printf("can not load the image...\n");
 return -1;
 }
 dst = src.clone();
 vector<Rect> findrects,findrect;
 HOGDescriptor HOG;
 //SVM分類器
 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
 //多尺度檢測
 HOG.detectMultiScale(src,findrects,Size(4,4),Size(0,0),1.05,2);
 //若rects有巢狀,則取最外面的矩形存入rect
 for(int i=0; i < findrects.size(); i++)
 {
 Rect rect = findrects[i];
 int j=0;
 for(; j < findrects.size(); j++)
  if(j != i && (rect & findrects[j]) == rect)
  break;
 if( j == findrects.size())
  findrect.push_back(rect);
 }
 //框選出檢測結果
 for(int i=0; i<findrect.size(); i++)
 {
 RNG rng(i);
 Scalar color = Scalar(rng.uniform(0,255),rng.uniform(0,255));
 rectangle(dst,findrect[i].tl(),findrect[i].br(),color,2);
 }

 imshow("src",src);
 imshow("dst",dst);
 waitKey();
 return 0;
}

以上這篇opencv3/C++ HOG特徵提取方式就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。