1. 程式人生 > >影象特徵提取(六)——尺度空間理論

影象特徵提取(六)——尺度空間理論

轉自:http://www.cnblogs.com/ronny/p/3886013.html

1. 特徵的不變性

何謂特徵?

每個物體,我們總可以用一些詞語或部件來描述它,比如人臉的特徵:兩個眼睛、一個鼻子和一個嘴巴。對於影象而言,我們需要計算機去理解影象,描述影象就需要計算機去取得影象的特徵,對影象比較全面的描述即一個二維矩陣,矩陣內的每個值代表影象的亮度。有時候我們需要讓計算機更簡化的來描述一個影象,抓住一些顯著特徵,這些特徵要具有一些良好的性質,比如區域性不變性。區域性不變性一般包括兩個方面:尺度不變性與旋轉不變性。

- 尺度不變性:人類在識別一個物體時,不管這個物體或遠或近,都能對它進行正確的辨認,這就是所謂的尺度不變性。尺度空間理論經常與生物視覺關聯,有人也稱影象區域性不變性特徵為基於生物視覺的不變性方法。

- 旋轉不變性:當這個物體發生旋轉時,我們照樣可以正確地辨認它,這就是所謂的旋轉不變性。

2. 區域性不變特徵

全域性特徵:從整個影象中抽取的特徵。較多的運用在影象檢索領域,如影象顏色直方圖。

區域性特徵:從影象的區域性區域中抽取的特徵(這個區域性區域往往是影象中的一個畫素及它周圍的鄰域)。

一種好的區域性特徵應該具有下面的特性:

  1. 可重複性:同一個物體在不同時間,不同角度拍到影象中,檢測到的特徵對應的越多越好。
  2. 獨特性:特徵在該物體上表現為獨特性,能與場景下其他物體區分。
  3. 區域性性:特徵往往是物體某個區域性的特點,這樣才可以避免遮擋時不能匹配的問題。
  4. 數量性:檢測到的特徵數目一定要多,密集度最好能在一定程度上反映影象的內容。
  5. 準確性:得到的特徵應該能被精確定位,能夠精確到畫素。
  6. 高效性:特徵檢測演算法運算要快。

為了研究影象的尺度不變特徵,我們需要先從影象的尺度空間理論開始。

3. 影象尺度空間理論

當用一個機器視覺系統分析未知場景時,計算機沒有辦法預先知識影象中物體尺度,因此,我們需要同時考慮影象在多尺度下的描述,獲知感興趣物體的最佳尺度。

所以在很多時候,我們會在將影象構建為一系列不同尺度的影象集,在不同的尺度中去檢測我們感興趣的特徵。比如:在Harr特徵檢測人臉的時候,因為我們並不知道影象中人臉的尺寸,所以需要生成一個不同大小的影象組成的金字塔,掃描其中每一幅影象來尋找可能的人臉。

3.1 金字塔解析度

影象金字塔化的一般步驟:首先,影象經過一個低通濾波器進行平滑(這個步驟會使影象變模糊,好像模仿人的視覺中遠處的物體沒有近處的清晰的原理),然後,對這個平滑後的影象進行抽樣(一般抽樣比例在水平和豎直方向上都為1/2),從而得到一系列的縮小的影象。

   

假設高斯金字塔的第 l 層影象為Gl,則有:

Gl(i,j)=m=22n=22ω(m,n)Gl1(2i+m,2j+n)(1lN,0iRl,0jCl)

式中,N為高斯金字塔頂層 撥動號;RlGl分別為高斯金字塔第l層的行數和列數;ω(m,n)是一個二維可分離的5×5視窗函式,表示式為:

ω=12561464141624164624362464162416414641=116[14641]×11614641

寫成上面的形式是為了說明,二維視窗的卷積運算元,可以寫成兩個方向上的1維卷積核(二項核)的乘積。上面卷積形式的公式實際上完成了2個步驟:1)高斯模糊;2)降維。

按上述步驟生成的G0,G1,,GN就構成了影象的高斯金字塔,其中G0為金字塔的底層(與原影象相同),GN為金字塔的頂層。可見高斯金字塔的當前層影象是對其前一層影象先進行高斯低通濾波,然後做隔行和隔列的降取樣(去除偶數行與偶數列)而生成的。當前層影象的大小依次為前一層影象大小的1/4。即左邊的金字塔。


下面是用OpenCV中的影象金字塔相關函式寫的一個生成影象金字塔的示例程式。程式中,不但生成了影象金字塔,而且生成了影象的拉普拉斯金字塔(接下來的內容)。

enum pyrType { PYR_GUASS, PYR_LAPLACE };
void genPyr(const Mat& imgSrc, vector<Mat>& outPutArray, int TYPE, int level)
{
    outPutArray.assign(level + 1, Mat());
    outPutArray[0] = imgSrc.clone(); // the 0 level is the image. 
    for (int i = 0; i != level; i++)
    {
        pyrDown(outPutArray[i], outPutArray[i + 1]);
    }
    if (PYR_GUASS == TYPE)
    {
        return;
    }
    for (int i = 0; i != level; i++)
    {
        Mat UpSampleImg;
        pyrUp(outPutArray[i + 1], UpSampleImg, outPutArray[i].size());
        outPutArray[i] -= UpSampleImg;
    }
}

3.2 影象的拉普拉斯金字塔

GlGl進行內插(這裡內插用的不是雙線性而是用的與降維時相同的濾波核)得到放大影象Gl,使Gl

的尺寸與Gl1的尺寸相同,表示為:

Gl(i,

相關推薦

影象特徵提取——尺度空間理論

轉自:http://www.cnblogs.com/ronny/p/3886013.html1. 特徵的不變性何謂特徵?每個物體,我們總可以用一些詞語或部件來描述它,比如人臉的特徵:兩個眼睛、一個鼻子和一個嘴巴。對於影象而言,我們需要計算機去理解影象,描述影象就需要計算機去取

數字影象處理筆記空間濾波基礎

1 - 引言 空間濾波是影象處理領域應用廣泛的主要工具之一。這裡我們主要討論怎樣使用空間濾波來增強影象。 2 - 平滑空間濾波器 平滑濾波器用於模糊處理和降低噪聲。模糊處理經常用於預處理任務中,例如在目標提取之前去除影象中的一些瑣碎細節。 2.1 - 平滑線性濾波器 平滑

Opencv2.4學習::特徵分析尺度空間

尺度空間 尺度空間就是試圖在影象領域中模擬人眼觀察物體的概念與方法。 這是由於通過計算機視覺系統,我們無法直接獲取所關注物體、物件的大小,這時候就需要一個尺度空間來描述 一、區域性不變性     對於目標物體,我們希望通過一些特徵來描述它。比如車

影象特徵提取——ORB特徵原理

        ORB演算法的論文來自"ORB: an efficient alternative to SIFT or SURF",作者是OpenCV維護和開發的公司willowgarage的,論文名字起的很牛氣,摘要裡說,ORB演算法比sift演算法效率高

影象處理之特徵提取之HOG特徵 特徵數的計算

對於64128的影象而言,每88的畫素組成一個cell,每22個cell組成一個塊,也就是說,64128的圖片,總共有36715=3780個特徵。 單個cell的9個特徵,每個block(掃描視窗)包含22個cell也就是229=36個特徵,一個64128大小的

影象處理之特徵提取:HOG特徵

HOG方向梯度直方圖: (1)具體在HOG中方向梯度的實現:首先用[-1,0,1]梯度運算元對原影象做卷積運算,得到x方向(水平方向,以向右為正方向)的梯度分量gradscalx,然後用[1,0,-1]T梯度運算元對原影象做卷積運算,得到y方向(豎直方向,以向上為正方向)的

影象處理之特徵提取之HOG特徵簡單梳理

  上圖是一張行人圖的四種表示方式,原三色圖,灰度圖,邊緣圖,梯度圖,人腦根據前期學習與先驗知識很容易理解到影象中包含著一個行人,並可以根據一定情況將其從影象中摳選出來,但計算機是怎麼思考的呢?怎樣讓計算機理解以上影象中包含的是一個行人呢?前三個影象現在情況不適用,所以選取梯度圖,現在的梯度圖同樣也是人腦處理

影象金字塔pyramid與 SIFT 影象特徵提取feature extractor

0. 影象金字塔變換(matlab) matlab 對影象金字塔變換介面的支援(impyramid),十分簡單好用。 其支援在reduce和expand兩種方式的變換,分別是成比例的縮小和放大。

影象特徵提取顏色,紋理,形狀

1.顏色特徵提取      計算機視覺的特徵提取演算法研究至關重要。在一些演算法中,一個高複雜度特徵的提取可能能夠解決問題(進行目標檢測等目的),但這將以處理更多資料,需要更高的處理效果為代價。而顏色特徵無需進行大量計算。只需將數字影象中的畫素值進行相應轉換,表現為

影象特徵提取類似於綜述

        空間關係特徵的使用可加強對影象內容的描述區分能力,但空間關係特徵常對影象或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間資訊往往是不夠的,不能有效準確地表達場景資訊。為了檢索,除使用空間關係特徵外,還需要其它特徵來配合。 (二)常用的特徵提取與匹配方法         提

lol人物模型提取

努力學習 是我 人物 應該 活動 努力奮鬥 奮鬥 讓我 耐心 ??模型昨天就已經做出來了,不過到上色這一塊貌似又遇到了一些問題。由於模型的眼睛比較小,沒法做出亮光效果,上不了UV,只能做啞光效果的。 ??亮光效果: ??啞光效果: ??很顯然亮光效果更加好看一點對吧!不

影象處理與影象識別筆記影象增強3

上一章節中我們講解了空域濾波的影象增強方法,包括影象的平滑和銳化,本文中,我們首先帶來頻域濾波的影象增強方法,指在頻域中對影象進行變換,需要的基礎知識是前述過的影象傅立葉變換,請檢視學習。 一、頻域濾波處理 頻域濾波處理的一般方法如下圖所示,先將影象經過傅立葉變換為頻域形式,然後乘以

【蜂口 | AI人工智慧】人臉年齡——龍鵬 深度學習與人臉影象應用連載

[所有文章皆首發於蜂口知道公眾號,內容來源於蜂口小程式~請多關注瞭解] hi,大家好,我是龍鵬。 這次接著上一篇繼續給大家分享人臉影象相關的應用。本次的分享是人臉年齡這個問題。 本次的分享將包含三個方面的內容。 首先,對人臉年齡這個問題做一個通用的介紹。人臉年齡

目標特徵提取:全域性特徵

        全域性特徵是基於灰度畫素值的描述,可以分為直方圖特徵、顏色特徵和輪廓特徵。 1、直方圖特徵 直方圖特徵用數學統計方法提取目標的外觀特徵。舉例說明提取過程:對於一幅灰度影象,將灰度值從0

Caffe matlab之基於Alex network的特徵提取轉載

R-CNN是第一篇成功得將CNN用於object detection並取得優異效果的文章,是學習CNN for object detection的必讀文章。R-CNN中提到Alex network可以用作一個“黑匣子”來提取特徵,CV中的很多問題都需要尋找特徵,如果直接試試利用Alex network去做

C++和C語言的區別——名稱空間

名稱空間用關鍵字namespace 來定義。名稱空間是C++的一種機制,用來把單個識別符號下的大量有邏輯聯絡的程式實體組合到一起。 C++標準程式庫中的所有識別符號都被定義於一個名為std的namespace中。所以使用標準識別符號都有以下三種方式。 (1)直接指定識別符號 (2)

語音識別 特徵提取

一.語音的產生簡介 1.1   發音器官     人體的語音是由人體的發音器官在大腦的控制下做生理運動產生的。人體發音器官由三部分組成:肺和氣管、喉、聲道。 肺是語音產生的能源所在。氣管連線著肺和喉,是肺與聲道的聯絡通道。喉是由一個軟骨和肌肉組成的複雜系統,其中包含著

人臉識別特徵提取LBP及其opencv實現

        LBP是一種簡單,有效的紋理分類的特徵提取演算法。LBP運算元是由Ojala等人於1996年提出的,主要的論文是"Multiresolution gray-scale and rotation invariant texture classification

SparkML之特徵提取主成分分析(PCA)

主成分分析(Principal Component Analysis,PCA), 將多個變數通過線性變換以選出較少個數重要變數的一種多 元統計分析方法. --------------------------------------------目錄--------------

文字特徵特徵提取

為了使用機器學習方法處理文字資料,需要找到適合的文字表示形式,對於傳統機器學習方法而言,常用的一種表示方法是將文件轉換為文件-詞項矩陣(document term matrix)。具體就是將多篇文件轉換為資料幀(dataframe),其中: 每個行標籤代表