1. 程式人生 > >影象處理(影象學習)的基礎必備知識

影象處理(影象學習)的基礎必備知識

基礎儲備知識列表(影象必備基礎)

1.     影象會表示成一個2D實數矩陣f(x,y),也稱為是影象在那個畫素的灰度或者是亮度,對於double型別的是0.0黑      1.0白,對於unit8型別是0黑,255是白

2.     影象常見的數字形式編碼:點陣圖(柵格)和向量

3.     影象表示

        二值化影象,1位元影象(一個畫素是1位元)0 1
       灰度影象,8位元影象(1個畫素是8位元)0-255
       彩色影象24位元(RGB各佔8位元),同時也會有第四通道,提供對每個畫素透明性的測度

      索引影象 24位元,其中每個畫素給出的索引和索引所指示的彩色調色盤中的元素R G B的值

4.     基本術語

     影象拓撲:常用於二值影象並藉助形態學

     領域:圍繞一個給定畫素的周圍構成它的領域,4領域 8領域

     鄰接;通路;連線性;組元

5.     影象處理分為3個層次

     底層:基本操作(噪聲消除,對比度增強),其中輸入和輸出都是影象

     中層:從影象中提取屬性(如邊緣,輪廓,區域)

     高層:對一個場景的內容進行分析和解釋

6.     影象的處理分為:空間域和頻域

     空間域:

     全域性(點)操作

     面向領域的操作,卷積

     結合多幅影象的操作

             頻域:

7.     影象的採集需要光,光可用電磁波或者粒子秒速,一個光子是一個微小的電磁振動能量包,可以用波長和頻率來刻畫,波長乘以頻率等於波傳播的速度,人類的視覺系統(HVS)對波長在400-700nm,1nm=10-9m

8.     彩色編碼和表達

      彩色可使用3個數值分量和恰當的增加權函式來編碼。最簡單的編碼方式就是畫素的RGB

9.     人對光的感知以及對顏色的感知常用3個引數來描述:

      輝度:對於發光強度的主觀感受

     色調:一個視感覺的屬性,對應區域是否類似於一個感知的彩色,紅綠藍或者是組合

     飽和度:對一個區域用與其亮度成比例來判斷的彩色行,對光源白色性的描述

     注:亮度可以用紅綠藍的加權和來計算

10.   數字影象處理的硬體:採集裝置,負責捕獲數字化影象或視訊序列camera link。當相機產生模擬視訊輸出時,需要使用一個影象數字化器(影象採集卡)將其轉化成數字格式;

      處理裝置,計算機;顯示和硬拷貝裝置;儲存裝置,光碟。

      數學影象處理的軟體,matlab c++

11.   影象感測器:將電磁輻射能量轉換為可以處理、顯示和解釋成影象的電訊號。主要是基於CCD(電荷耦合裝置)和CMOS(互補型金氧半導體器件)工藝。

      相機長常用的是CCD感測器,他們不受幾何失真的影響並對入射光有線性的響應,一個CCD感測器由一組光敏單元構成,用矽製造,每個能產生正比於落在上面光密度的電壓。一個感光單元具有一個約10^6能量載體的有限能力,這限制了被成像物體的明度上限,一個飽和的感光單元會溢位,從而影響它相鄰單元並導致成為滲色的缺陷

     一個CCD相機有時候插入一個計算機板子,稱為幀快取,它包括對相機採集的影象快速訪問的記憶體(典型的是每幅影象0.1ms),影象在被採集和臨時儲存在幀快取後,將被處理貨複製到長時儲存裝置中。

    在單CCD的相機中,使用具有對每種光基色(紅藍綠)不同感光單元的三色成像儀,其中感光單元排列成貝葉斯模式,這樣,每個畫素實際上僅僅記錄了三個基色之一。

     COMS感測器是分層感測器堆疊,在網格的每個位置都有分層的對所有三種基色都敏感的光電感測器,在每個畫素只有一個僅對一種基色敏感的光電感測器。

相機的鏡頭有2個重要的引數是它的放大倍數和光收集能力

12.   影象數字化:(時間或者空間)取樣、(幅度上)量化

     取樣就是去離散的值,有采樣率,取樣率要大於訊號中最高頻率分量的2倍(乃奎斯特准則),取樣模式

     量化是將一個連續變化函式用一個離散集合的量化級替換的過程。影象的量化級是灰度級,量化理解為對映,就是把一個範圍的灰度值隱射到單個點,例如0-255可以均勻量化為4,1代表0-64 2代表65-128 3代表129-1924代表193-255

     空間分解析度;描述衣服影象中畫素密度,空間解析度高,將有越多的畫素用來顯示一副固定尺寸的影象,每英寸點數dpi表示,空間解析度降低的時候,質量變化不是很明顯,但是畫素化,鋸齒化 細節的損失,甚至會出現莫爾模式

     灰度解析度是HVS能辨別的亮度級的最小變化,對於單色影象每個畫素8位元是在主觀質量和實際實現(每個畫素值對應一個位元組對應)中較好的平衡