影象處理與分析(數字影象處理岡薩雷斯第二版)學習筆記2
第二章,數字影象基礎
1,人眼視覺原理?
眼球適當聚焦,眼睛外部的光在視網膜上成像。視網膜表面的光接收器:錐狀體和桿狀體。每隻眼睛的錐狀體數目在600萬到700萬之間,主要位於視網膜中間部分,被稱為中央凹(大概1.5mm凹坑相當於1.5*1.5的方形感測器陣列),對顏色敏感度很高,可以充分分辨影象細節。錐狀視覺叫做白晝視覺或亮光視覺。桿狀體數目更多,約有7500萬到15000個桿狀體分佈在視網膜表面。由於分佈面積較大,減少了接收器感知細節的數量。他們沒有彩色感覺,在低照明度下對影象敏感,桿狀視覺被稱為夜視覺或叫暗視覺。
人眼視覺存在馬赫帶毛邊視覺現象以及視覺同時對比現象,以及視覺錯覺。
2,感測器影象感知和獲取?
單個成像感測器,線性感測器和感測器陣列,通過將輸入電功率和對特殊型別檢測能源敏感的感測器材料結合,把輸入能源轉換為電壓。輸出電壓波形是感測器的響應,將每個感測器響應數字量化。
3,影象灰度級?
單色影象中任意一點(x,y)的幅值f(x,y)的強度為影象在該點的灰度級l=f(x,y),其中l∈[Lmin,Lmax],該區間被稱為灰度級,通常令該區間等於[0,L-1],l=0為黑,l=L-1為白。影象灰度級指影象中的色度分量亮度的最大值與最小值之差的級別。
4,影象取樣和量化?
一幅影象的x和y座標及幅值都可能是連續的,為把它轉換為數字形式,必須在座標和幅度上都做取樣操作。數字化座標值稱為取樣,數字化幅度值稱為量化。
5,數字影象表示?
一幅影象f(x,y)取樣和量化後結果是一個實際矩陣,產生的數字影象有M行N列,變為離散值。f(0,0)為矩陣第一個行第一列的元素即原點,影象第一行的下一個座標值為f(0,1)。第一列的下一個座標為f(1,0)。最後一個元素為f(M-1,N-1)。
6,影象儲存表示?
數字化過程中對於M,N和每個畫素允許的離散灰度級L需要一個判定,M,N需要為整數。出於處理,儲存和取樣硬體的考慮,典型灰度級取值是2的整數次冪。L=2^k。離散灰度級區間為[0,L-1]內整數,有時灰度級取值範圍稱為影象的動態範圍。把佔有灰度級全部有效段的影象稱為高動態範圍影象。
數字b是儲存數字影象需要的位元數,b=M*N*k,當M=N時,b=N^2*k。當一幅影象由L=2^k個灰度級時,通常稱該影象時k位元影象。例如,一幅影象有256個可能的灰度級,則稱其為8位元影象。
7,相鄰畫素表示形式?
位於座標(x,y)的一個畫素p有4個水平和垂直的相鄰畫素,其座標由下式給出:
(x+1,y),(x-1,y),(x,y+1),(x,y-1)稱為p的4鄰域,用表示,每個畫素距離p為一個單位距離。若p位於影象邊界,則p的某一鄰域畫素位於數字影象外部。
對角相鄰畫素:(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)用表示,和4個鄰域點一起稱為p的8鄰域。
8,基於畫素的影象操作?
線性和非線性操作:令H是一種運算元,其輸入和輸出都是影象。如果對於任何兩幅影象f和g及任何兩個標量a和b有如下關係:
H(af+bg)=aH(f)+bH(g),則稱H為線性運算元。
換句話說,對兩幅影象(用所示的常數去乘)的和應用線性運算元等同於分別對影象應用該運算元,並與各自適當的常數相乘,然後結果相加。
對K幅影象求和的運算元是一個線性運算元,計算兩幅影象的差分絕對值的運算元就不是線性運算元。不能通過上面公式檢驗的運算元就定義為非線性運算元。
參考書籍:
《數字影象處理第二版(岡薩雷斯)》