1. 程式人生 > >影象特徵提取之HOG特徵

影象特徵提取之HOG特徵

  方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣泛應用於影象識別中,尤其在行人檢測中獲得了極大的成功。

演算法思想

  HOG特徵的核心思想是在一幅影象中,區域性目標的表象和形狀(appearance and shape)能夠被梯度和邊緣的方向密度(梯度的統計資訊,而梯度主要存在於邊緣地方)很好地描述。通過將整幅影象分為多個小的連通區域(cells),並計算每個cell的梯度或邊緣方向直方圖,這些直方圖的組合可用於構成特徵描述子,為了提高準確率,可以將區域性直方圖在影象更大範圍內(稱為block)進行對比度歸一化(constrast-normalized)。所採用的方法是:先計算各直方圖在對應的block中的密度,然後根據這個密度對block中的所有cell做歸一化(normalize)。歸一化操作對光照變化和陰影具有更好的魯棒性。

演算法特點

  • HOG特徵是在影象的區域性操作,對影象幾何和光學的變化有較好的穩健性,這兩種變化只會出現在更大的空域上。
  • 在粗粒度的空域抽樣、細粒度的方向抽樣,以及較強的區域性光學歸一化條件下,只要行人大體保持直立的姿勢,可以容許行人有一些細微的肢體動作,而不影響檢測效果。

演算法實現

HOG特徵提取的流程如下:

影象預處理

  • 灰度化:HOG提取的是紋理特徵,顏色資訊不起作用,所以將彩色圖轉化為灰度圖。
  • Gamma校正(歸一化):對影象進行Gamma校正,完成對整個影象的標準化(歸一化),可以調節影象的對比度,降低區域性光照不均勻或者陰影的影響,同時也可以在一定程度上降低噪聲的干擾,提高特徵描述器對光照等干擾因素的魯棒性。校正公式如下:
    I
    (x,y)=I(x,y)γ,γ=12

計算影象梯度

  分別求取影象水平方向和垂直方向的梯度,然後計算每個畫素點的梯度幅值和方向,微分求影象梯度不僅可以捕獲影象邊緣和紋理資訊,而且可以弱化光照不均勻的影響。

Gx(x,y)=I(x+1,y)I(x1,y)
Gy(x,y)=I(x,y+1)I(x,y1)
G(x,y)=Gx(x,y)2+Gy(x,y)2
theta(x,y)=arctan(Gy(x,y)/Gx(x,y))
一般採用梯度運算元對影象進行卷積運算求取影象梯度,例如用[1,0,1]梯度運算元對影象進行卷積操作得到水平方向的梯度分量,用[
1,0,1]T
梯度運算元進行卷積操作得到豎直方向的梯度分量,然後求取影象的梯度幅值和方向。

在cell中計算梯度方向直方圖(Orientation binning)

  將影象劃分為若干個連通區域(cell),例如每個cell為8×8個畫素,相鄰cell之間不重疊,將所有梯度方向劃分為9個方向塊(bin),然後在每個cell內統計梯度方向直方圖。在計算梯度方向時,可把方向的角度範圍定位(0,180)或者(0,360)。最後每個cell都對應一個9維的特徵向量。此外,還可以考慮梯度幅值作為bin的統計權重。
  在行人檢測中,通過給區域性影象區域進行編碼,可以保持對目標物件的姿勢和外觀的弱敏感性,更好地捕獲影象的輪廓和紋理資訊。

在block中歸一化梯度方向直方圖(Block Normalization)

  將多個cell組合成更大連通塊(block),將block內所有cell的特徵向量串聯起來便得到該block的HOG特徵描述子,不同block之間可能相互重疊,可以有效地利用區域性鄰域資訊。類比在卷積神經網路(CNN)中,掩碼(Kernel)和步長(stride)的選擇。在跟大範圍內(block)統計梯度直方圖,並做歸一化處理,能夠更好地適應光照和對比度的變化。常用的歸一化方法有以下幾種:
- L2-norm

v=v|v22+ε2
- L1-norm
v=v|v1+ε
- L1-sqrt
v=v|v1+ε
還有一種L2-Hys,即先做一次L2-norm,然後把大於特定值(0.2)的分量幅值為0.2再做一次L2-norm,一般在檢測中採用L2-norm效果更好。在一個block中,如果cell的數量為2×2,那block的特徵數為2×2×9=36維特徵。

統計整幅影象(檢測視窗)的HOG特徵

  在實際應用中,通常是選取固定大小的滑動視窗來提取HOG特徵,對於一個64×128的影象視窗(window),每8×8個畫素組成一個cell,每2×2個cell組成一個block,一共有(81)×(161)=105個block,因此該影象的視窗特徵維數為105×36=3780。當然也可以將整幅影象作為一個視窗來提取HOG特徵。

HOG特徵 + SVM分類器進行行人檢測

  訓練過程中正樣本為圖片中包含有目標區域(行人)的boundingbox,尺寸統一為檢測視窗的大小即64×128,負樣本不需要統一尺寸,只需比檢測視窗大,且圖片中不包含檢測目標,可任意擷取圖片中64×128大小的區域提取HOG特徵作為負樣本的特徵向量,並與正樣本圖片中boundingbox區域提取出的HOG特徵向量一起訓練,得到SVM的分類模型。
  檢測過程中採用滑動視窗法,檢測視窗尺寸固定不變,對待檢測圖片進行尺度縮放,在每一層的影象上,用固定大小的滑動視窗提取HOG特徵,並根據訓練好的分類模型判斷檢測視窗是否為目標(行人)。因此HOG + SVM進行行人檢測的過程實際上就是對影象的檢測視窗提取HOG特徵進行分類判決的過程。

reference

相關推薦

影象特徵提取HOG特徵

  方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣泛應用於影

影象處理特徵提取HOG特徵簡單梳理

HOG 方向梯度直方圖,這裡分解為方向梯度與直方圖。 一、方向梯度 梯度:在向量微積分中,標量場的梯度是一個向量場。標量場中某一點上的梯度指向標量場增長最快的方向,梯度的長度是這個最大的變化率。更嚴格的說,從歐幾里得空間Rn到R的函式的梯度是在Rn某一點最佳的線性近

影象特徵提取HOG特徵

方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是用於影象檢測的特徵描述子。它通過計算和統計區域性區域的梯度方向直方圖來構成特徵。特徵地,HOG在行人檢測方向取得巨大成功。 演算法實現過程: (1)標準化gamma空間和顏色空間

python進階目標檢測的影象特徵提取Haar特徵

目標檢測的影象特徵提取之(三)Haar特徵 1、Haar-like特徵        Haar-like特徵最早是由Papageorgiou等應用於人臉表示,Viola和Jones在此基礎上,使用3種類型4種形式的特徵。 Haar特徵分為三類:邊緣特徵、線性特徵、

影象處理特徵提取(一)HOG特徵 特徵數的計算

對於64128的影象而言,每88的畫素組成一個cell,每22個cell組成一個塊,也就是說,64128的圖片,總共有36715=3780個特徵。 單個cell的9個特徵,每個block(掃描視窗)包含22個cell也就是229=36個特徵,一個64128大小的

影象處理特徵提取(一)HOG特徵簡單梳理

  上圖是一張行人圖的四種表示方式,原三色圖,灰度圖,邊緣圖,梯度圖,人腦根據前期學習與先驗知識很容易理解到影象中包含著一個行人,並可以根據一定情況將其從影象中摳選出來,但計算機是怎麼思考的呢?怎樣讓計算機理解以上影象中包含的是一個行人呢?前三個影象現在情況不適用,所以選取梯度圖,現在的梯度圖同樣也是人腦處理

影象特徵提取(一)HOG特徵

1、HOG特徵:        方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已

影象特徵提取(三) --- HOG特徵

1.hog特徵提取流程 2.伽瑪校正 在計算機系統中,由於顯示卡或者顯示器的原因會出現實際輸出的影象在亮度上有偏差,而Gamma曲線矯正就是通過一定的方法來矯正影象的這種偏差的方法。一般情況下,當用於Gamma矯正的值大於1時,影象的高光部分被壓

影象處理影象特徵提取(一)HOG特徵

1、HOG特徵:        方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計

影象處理特徵提取(二):Haar特徵

1,Haar特徵: Haar特徵分為:邊緣特徵,線性特徵,中心特徵,對角線特徵。特徵模板內有白色和黑色兩種矩形,並定義該模板的特徵值為白色矩形畫素減去黑色矩形畫素和。Haar特徵值反映了影象的灰度變化情況。例如:臉部的一些特徵能有矩形特徵簡單的描述,如眼睛要比臉頰顏色深,鼻

目標檢測的影象特徵提取(四)OpenCV中BLOB特徵提取與幾何形狀分類

OpenCV中BLOB特徵提取與幾何形狀分類一:方法二值影象幾何形狀提取與分離,是機器視覺中重點之一,在CT影象分析與機器人視覺感知等領域應用廣泛,OpenCV中提供了一個對二值影象幾何特徵描述與分析最有效的工具 - SimpleBlobDetector類,使用它可以實現對二

目標檢測的影象特徵提取(三)Haar特徵+積分圖+盒式濾波器Box Filter

原文http://blog.csdn.net/zouxy09/article/details/7929570 (Haar-like特徵值無非就是兩個矩陣畫素和的差,同樣可以在常數時間內完成。所以矩形特徵的特徵值計算,只與此特徵矩形的端點的積分圖有關,所以不管

文字分類特徵提取Word2Vec

分類問題是人類所面臨的一個非常重要且具有普遍意義的問題,我們生活中的很多問題歸根到底都是分類問題。 文字分類就是根據文字內容將其分到合適的類別,它是自然語言處理的一個十分重要的問題。文字分類主要應用於資訊檢索,機器翻譯,自動文摘,資訊過濾,郵件分類等任務。 文字分類技

影象特徵提取1—LBP特徵

  最近研究了一下LBP,就先從最基本的LBP說起。LBP(Local Binary Pattern,區域性二值模式)是一種用來描述影象區域性紋理特徵的運算元;它具有旋轉不變性和灰度不變性等顯著的優點。它是首先由T. Ojala, M.Pietikäinen,

人臉表情識別筆記(二)特徵提取LBP(區域性二值模式)原理及MATLAB程式碼

一:原理部分 LBP(Local Binary Pattern,區域性二值模式)是一種用來描述影象區域性紋理特徵的運算元;它具有旋轉不變性和灰度不變性等顯著的優點。它是首先由T. Ojala, M.Pietikäinen, 和D. Harwood 在1994年提出,用

目標檢測演算法-特徵提取(一)Haar特徵

1、Haar-like特徵 Haar特徵最先由Paul Viola等人提出,後經過Rainer Lienhart等擴充套件引入45°傾斜特徵。Haar特徵分為三類:邊緣特徵、線性特徵、中心特徵和對角線特徵,組合成特徵模板。OpenCV(2.4

目標檢測HOG特徵

       方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣泛應用於影象識別中,尤其在行人檢測中獲得了極大的

OpencvHOG特徵與SVM相結合的人體檢測(增加自舉法)

Hello~洛基在上一篇關於人體檢測的文章末尾提到了自舉法,這裡科普一下,所謂自舉法,即在一個容量為n的原始樣本中重複抽取一系列容量也是n的隨機樣本,並保證每次抽樣中每一樣本觀察值被抽取的概率都為1/n。好像不是很通俗易懂,說人話就是——應用於行人檢測中的自舉方法是,對於訓

DNA特徵提取序列組裝K-mer演算法

基因就像一本天書,裡面的字都是有A,T,C,G組成的。我們測序出來的大於幾百bp的小的序列,我們叫做reads。我們測序的結果中有上百萬條的reads,而這些reads的位置我們又不知道,我們只能根據他們重疊的部分來儘量還原他的原型。 k-mer是指將reads分成包含

特徵工程類別特徵 處理方法介紹

當類別特徵仍保持原始形式時,其取值來自所有可能取值構成的集合而不是一個數字,故不能作為輸入。 當各個取值之間是沒有順序關係的並列關係,這樣的類別特徵稱為 名義(nominal)變數。相反,那些