影象的全域性特徵--HOG特徵、DPM特徵

阿新 • • 發佈：2019-02-15

HOG特徵：方向梯度直方圖（Histogram of Oriented Gradient,）特徵是一種全域性影象特徵描述子。

它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣泛應用於影象識別中，尤其在行人檢測中獲得了極大的成功。需要提醒的是，HOG+SVM進行行人檢測的方法是法國研究人員Dalal在2005的CVPR上提出的，而如今雖然有很多行人檢測演算法不斷提出，但基本都是以HOG+SVM的思路為主。

RGB的DPM檢測特徵和其級聯方法是最後一個有效的傳統的目標檢測方法，翻譯見DPM原理詳解，此後，如有疑義，請拜訪原文，作者的主頁面：

http://www.rossgirshick.info/。

See also, CACM Research Highlight: Visual Object Detection with Deformable Part Models
P. Felzenszwalb, R. Girshick, D. McAllester, D. Ramanan Communications of the ACM, no. 9 (2013): 97-105

一、HOG+SVM模型

1、HOG描述子的計算過程

輸入影象image：

1）灰度化（將影象看做一個x,y,z（灰度）的三維影象）；

2）採用Gamma校正法對輸入影象進行顏色空間的標準化（歸一化）；目的是調節影象的對比度，降低影象區域性的陰影和光照變化所造成的影響，同時可以抑制噪音的干擾；

3）計算影象每個畫素的梯度（包括大小和方向）；主要是為了捕獲輪廓資訊，同時進一步弱化光照的干擾。

4）將影象劃分成小cells（例如6*6畫素/cell）；

5）統計每個cell的梯度直方圖（不同梯度的個數），即可形成每個cell的descriptor；原始HOG特徵劃分為9個直方圖區間。

意義：計算梯度直方圖，可以降低光線明暗變化帶來的影響，保持良好的光照不變性和特定的旋轉不變性。

6）將每幾個cell組成一個block（例如3*3個cell/block），一個block內所有cell的特徵descriptor串聯起來便得到該block的HOG特徵descriptor。（此處cell和block，每個block可以多個cell，相鄰cell之間產生特定畫素的重疊，可以有效的抵擋偏移影響

。行人檢測的最佳引數設定是：3×3細胞/區間、6×6畫素/細胞、9個直方圖通道。則一塊的特徵數為：3*3*9）
意義：覆蓋劃分區域用於降低影象塊偏移帶來的影響；並同時保持特定區域相關性。

7）將影象image內的所有block的HOG特徵descriptor串聯起來就可以得到該image（你要檢測的目標）的HOG特徵descriptor了。這個就是最終的可供分類使用的特徵向量了。

以220X310大小影象為例，經過縮放處理後為216x304，但並不直接提取整個影象的HOG特徵，而是用一個固定大小的視窗在影象上滑動，滑動的間隔為8個畫素，opencv中預設的視窗大小為128x64（高128，寬64），即有(128÷8)x(64÷8)=16x8個cell，也即有15x7個block，這樣一來一幅影象就可以取到(27-16)x(38-8)=11x30=330個視窗。現在提取每個視窗的HOG特徵，則可得到 105x36=3780 維HOG特徵向量。
2、HOG特徵的全域性性質

HOG特徵並非固定長度約束的特徵描述子。向量的維數和影象大小和Cell大小有關。每一個Cell裡面統計梯度直方圖，形成每個Cell的梯度特徵。其中每個Cell裡面提取的特徵可以使用其他塊特徵取代。

2.1. HOG優點：

與其他的特徵描述方法相比，HOG有很多優點。首先，由於HOG是在影象的區域性方格單元上操作，所以它對影象幾何的和光學的形變都能保持很好的不變性，這兩種形變只會出現在更大的空間領域上。其次，在粗的空域抽樣、精細的方向抽樣以及較強的區域性光學歸一化等條件下，只要行人大體上能夠保持直立的姿勢，可以容許行人有一些細微的肢體動作，這些細微的動作可以被忽略而不影響檢測效果。因此HOG特徵是特別適合於做影象中的人體檢測的。

全域性變形性，區域性不變形，在區分行人特徵和左右眼特徵時具有天然的優勢。當然，HOG思想是一個演算法族，Cell和Block思想是主要思想，重疊度直方圖分割槽塊大小可以根據實際情況進行調參，在一定的資料集上，力求達到最佳效果。

3、使用OpenCV進行HOG特徵計算

OpenCV的ObjectDetect模組包含了HOG計算的原始碼，使用例程如下

bool CEyeClassify::GetHogFeature(const cv::Mat& imggray, std::vector<float>& vecFeature)
{
	const int cnSizeW = CEyeClassify::m_PatchWidth;
	const int cnSizeH = CEyeClassify::m_PatchHeight;
	{
		cv::Mat imggray1;
		resize(imggray, imggray1, cv::Size(cnSizeW, cnSizeH), 0, 0, CV_INTER_LINEAR);

		cv::HOGDescriptor hog(imggray1.size(), cv::Size(16, 16), cv::Size(8, 8), cv::Size(8, 8), 9); // 48x32  540
		hog.compute(imggray1, vecFeature);
	}

	return true;
}

二、DPM+LatentSVM模型

DPM（Deformable Part Model），正如其名稱所述，可變形的元件模型，是一種基於元件的檢測演算法，其所見即其意。該模型由大神Felzenszwalb在2008年提出，並發表了一系列的cvpr，NIPS。並且還拿下了2010年，PASCAL VOC的“終身成就獎”。

1、DPM描述子的計算過程

輸入影象image

2、DPM描述子的檢測過程

輸入影象image

3、Latent SVM模型

輸入影象image

參考資料：

影象的全域性特徵--HOG特徵、DPM特徵

HOG特徵：方向梯度直方圖（Histogram of Oriented Gradient,）特徵是一種全域性影象特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣泛應用於影象識別中，尤其在行人檢

特徵層次分析、視覺特徵語義探索（微調+預訓練）

1. 關於卷積運算、密集連線層、池化與小樣本密集連線層與卷積層的根本區別在於，密集連線層從輸入特徵中學到的是全域性模式，在計算機視覺領域對應著的是高階語義特徵（全域性模式就是涉及所有畫素的模式，如狗，耳朵，向日葵等）。卷積層學到的是區域性模式，學到的就是輸入影象二維影象小視窗中發現的模式

行人檢測全域性特徵中的HOG、LBP、Haar特徵整理

原文地址：http://dataunion.org/20584.html （一）HOG特徵 1、HOG特徵：方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通

影象特徵提取三大法寶：HOG特徵、LBP特徵、Haar-like特徵

轉自：https://blog.csdn.net/q123456789098/article/details/52748918（一）HOG特徵1、HOG特徵：方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處

影象特徵檢測描述(一):SIFT、SURF、ORB、HOG、LBP特徵的原理概述及OpenCV程式碼實現

什麼叫特徵檢測？就是檢測影象中目標的特徵唄，所謂特徵，不管你怎麼旋轉目標，離目標遠近，它的特徵都應不變才對，這兩個特性稱為叫旋轉不變性和尺度不變性。當然還有其它特徵，如光照不一樣，也不應該變化嘛，只是旋轉不變性和尺度不變性是最基本的兩個要求。對特徵的描述有很多種方法和運算

計算機視覺（八）：提取Cifar-10資料集的HOG、HSV特徵並使用神經網路進行分類

1 - 引言之前我們都是將整張圖片輸入進行分類，要想進一步提升準確率，我們就必須提取出圖片更容易區分的特徵，再將這些特徵當做特徵向量進行分類。在之前我們學了一些常用的影象特徵，在這次實驗中，我們使用了兩種特徵梯度方向直方圖（HOG）顏色直方圖（HSV）

HOG特徵、LBP特徵、Harr特徵

（一）HOG特徵 1、HOG特徵：方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM

影象特徵— —HOG特徵

概念方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。它通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。HOG特徵結合SVM分類器已經被廣泛應用於影

卷積神經網路及影象處理中共享權重、特徵對映等理解

一，前言卷積神經網路（Constitutional Neural Networks, CNN）是在多層神經網路的基礎上發展起來的針對影象分類和識別而特別設計的一種深度學習方法。先回顧一下多層神經網路: 多層神經網路包括一個輸入層和一個輸出層，中間有多個隱藏層。每一層有若干個神

Hog特徵、Haar特徵

HOG： http://blog.csdn.net/abcjennifer/article/details/7365651（轉載） HOG即histogram of oriented gradient, 是用於目標檢測的特徵描述子，該技術將影象區域性出現的方向梯度次數進行計

JavaScript6裡出現了哪些新語法、新特徵？

ES5是2009年就出來的，目前來說在我寫這篇文章的時候基本上ES6在瀏覽器上面還沒有普及，不過Google瀏覽器是支援ES6語法的，誰讓Google是美國生產的呢。。。 ES6現在使用的地方其實還是很多的，前端腳手架工具基本上都是支援ES6語法的，他們內部都有一套解析ES6的引擎。如vue、angular

形象理解線性代數（三）——列空間、零空間（核）、值域、特徵值（特徵向量）、矩陣與空間變換、矩陣的秩

這裡，我們還是要以形象理解線性代數（一）——什麼是線性變換？為基礎。矩陣對向量的作用，可以理解為線性變換，同時也可以理解為空間的變換，即（m*n）的矩陣會把一個向量從m維空間變換到n維空間。一、矩陣的列空間與矩陣的秩以及值域的關係矩陣的列空間，其實就是矩陣的列所組成的空間。比如我們考慮

無偏估計、特徵值/特徵向量、無偏估計、卷積、行列式

為馬同學網站點贊，直觀、通俗易懂：https://www.matongxue.com/ 1、如何理解矩陣特徵值和特徵向量？馬同學高等數學如何理解矩陣特徵值和特徵向量？ 2、如何理解無偏估計量？馬同學高等數學如何理解無偏估計量？ 3、如何通俗地理解卷積

物聯網核心技術M2M的構成、基本特徵和應用類別

　　現階段，許多公司都在引進新的面向客戶的相關產品和服務以改善現有的產品，增加收益並且創造新的收益機會。根據跨國通訊公司沃達豐的M2M晴雨表資料，在已經應用 M2M 技術的企業中，有66%聲稱他們的戰略側重於外部利益相關者，M2M 的趨勢已經顯而易見。全球已經有超過四分之一的企業在應用 M

吳恩達機器學習（二）多元線性迴歸（假設、代價、梯度、特徵縮放、多項式）

目錄 0. 前言學習完吳恩達老師機器學習課程的多變數線性迴歸，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。 0. 前言多元線性迴歸（Multivari

Java的基礎特徵，抽象、封裝、繼承、多型

前言概述在《java程式設計思想》中提到在java的世界中一切皆是物件的概念，物件就是對現實世界事物的抽象結果，它集成了事物的屬性和行為，抽象程度越高越具有普適性，例如：生物---->動物(植物)---->哺

Sift運算元特徵點提取、描述及匹配全流程解析

Sift之前的江湖在Sift橫空出世之前，特徵點檢測與匹配江湖上佔據霸主地位的是角點檢測家族。先來探究一下角點家族不為人知的恩怨情仇。角點家族的族長是Moravec在1977年提出的Moravec角點檢測運算元，它是一種基於灰度方差的角點檢測方法，該運算元計算影象中某

以哲學的角度解釋面向物件的三大特徵（封裝、繼承、多型）

<在此特向我的好哥們兒—小明哥，表示由衷的感謝，讓我對Java的理解更深入了一層。還是那句話，小明哥，等我去你那找你玩的時候請你吃大餐，哦，不對，是你請我吃大餐~啊，言歸正傳… 萬物皆物件首先說一下類和物件的理解：什麼是類，類就是一個類別，是一種抽象，是在概念這一

SSE影象演算法優化系列二十五:二值影象的Euclidean distance map（EDM)特徵圖計算及其優化。 SSE影象演算法優化系列九：靈活運用SIMD指令16倍提升Sobel邊緣檢測的速度（4000*3000的24點陣圖像時間由480ms降低到30ms）

　　Euclidean distance map（EDM)這個概念可能聽過的人也很少，其主要是用在二值影象中，作為一個很有效的中間處理手段存在。一般的處理都是將灰度圖處理成二值圖或者一個二值圖處理成另外一個二值圖，而EDM演算法確是由一幅二值圖生成一幅灰度圖。其核心定義如下：　　The definitio

python - 面向物件的三大特徵：封裝、繼承、多型

面向物件三大特性 1.封裝：根據職責將屬性和方法封裝到一個抽象的類中 2.繼承：實現程式碼的重用，相同的程式碼不需要重複的寫 -3.多型單繼承：子類擁有父類的所有方法和屬性(子類只需封裝自己特有的方法) 舉例： class Animal: #

影象的全域性特徵--HOG特徵、DPM特徵

相關推薦