影象處理（影象學習）的基礎必備知識

阿新 • • 發佈：2019-01-26

基礎儲備知識列表（影象必備基礎）

1. 影象會表示成一個2D實數矩陣f(x,y)，也稱為是影象在那個畫素的灰度或者是亮度，對於double型別的是0.0黑 1.0白，對於unit8型別是0黑，255是白

2. 影象常見的數字形式編碼：點陣圖（柵格）和向量

3. 影象表示

二值化影象，1位元影象（一個畫素是1位元）0 1
灰度影象，8位元影象（1個畫素是8位元）0-255
彩色影象24位元（RGB各佔8位元），同時也會有第四通道，提供對每個畫素透明性的測度
索引影象 24位元，其中每個畫素給出的索引和索引所指示的彩色調色盤中的元素R G B的值

4. 基本術語

影象拓撲：常用於二值影象並藉助形態學

領域：圍繞一個給定畫素的周圍構成它的領域，4領域 8領域

鄰接；通路；連線性；組元

5. 影象處理分為3個層次

底層：基本操作（噪聲消除，對比度增強），其中輸入和輸出都是影象

中層：從影象中提取屬性（如邊緣，輪廓，區域）

高層：對一個場景的內容進行分析和解釋

6. 影象的處理分為:空間域和頻域

空間域：

全域性（點）操作

面向領域的操作，卷積

結合多幅影象的操作

頻域：

7.     影象的採集需要光，光可用電磁波或者粒子秒速，一個光子是一個微小的電磁振動能量包，可以用波長和頻率來刻畫，波長乘以頻率等於波傳播的速度，人類的視覺系統（HVS）對波長在400-700nm,1nm=10-9m

8.     彩色編碼和表達

彩色可使用3個數值分量和恰當的增加權函式來編碼。最簡單的編碼方式就是畫素的RGB

9.     人對光的感知以及對顏色的感知常用3個引數來描述：

輝度：對於發光強度的主觀感受

色調：一個視感覺的屬性，對應區域是否類似於一個感知的彩色，紅綠藍或者是組合

飽和度：對一個區域用與其亮度成比例來判斷的彩色行，對光源白色性的描述

注：亮度可以用紅綠藍的加權和來計算

10.   數字影象處理的硬體：採集裝置,負責捕獲數字化影象或視訊序列camera link。當相機產生模擬視訊輸出時，需要使用一個影象數字化器（影象採集卡）將其轉化成數字格式；

處理裝置，計算機；顯示和硬拷貝裝置；儲存裝置，光碟。

數學影象處理的軟體，matlab c++

11.   影象感測器：將電磁輻射能量轉換為可以處理、顯示和解釋成影象的電訊號。主要是基於CCD（電荷耦合裝置）和CMOS（互補型金氧半導體器件）工藝。

相機長常用的是CCD感測器，他們不受幾何失真的影響並對入射光有線性的響應，一個CCD感測器由一組光敏單元構成，用矽製造，每個能產生正比於落在上面光密度的電壓。一個感光單元具有一個約10^6能量載體的有限能力，這限制了被成像物體的明度上限，一個飽和的感光單元會溢位，從而影響它相鄰單元並導致成為滲色的缺陷

一個CCD相機有時候插入一個計算機板子，稱為幀快取，它包括對相機採集的影象快速訪問的記憶體（典型的是每幅影象0.1ms），影象在被採集和臨時儲存在幀快取後，將被處理貨複製到長時儲存裝置中。

在單CCD的相機中，使用具有對每種光基色（紅藍綠）不同感光單元的三色成像儀，其中感光單元排列成貝葉斯模式，這樣，每個畫素實際上僅僅記錄了三個基色之一。

COMS感測器是分層感測器堆疊，在網格的每個位置都有分層的對所有三種基色都敏感的光電感測器，在每個畫素只有一個僅對一種基色敏感的光電感測器。

相機的鏡頭有2個重要的引數是它的放大倍數和光收集能力

12.   影象數字化：（時間或者空間）取樣、（幅度上）量化

取樣就是去離散的值，有采樣率，取樣率要大於訊號中最高頻率分量的2倍（乃奎斯特准則），取樣模式

量化是將一個連續變化函式用一個離散集合的量化級替換的過程。影象的量化級是灰度級，量化理解為對映，就是把一個範圍的灰度值隱射到單個點，例如0-255可以均勻量化為4，1代表0-64 2代表65-128 3代表129-1924代表193-255

空間分解析度;描述衣服影象中畫素密度，空間解析度高，將有越多的畫素用來顯示一副固定尺寸的影象，每英寸點數dpi表示，空間解析度降低的時候，質量變化不是很明顯，但是畫素化，鋸齒化細節的損失，甚至會出現莫爾模式

灰度解析度是HVS能辨別的亮度級的最小變化，對於單色影象每個畫素8位元是在主觀質量和實際實現（每個畫素值對應一個位元組對應）中較好的平衡

影象處理（影象學習）的基礎必備知識

基礎儲備知識列表（影象必備基礎） 1. 影象會表示成一個2D實數矩陣f(x,y)，也稱為是影象在那個畫素的灰度或者是亮度，對於double型別的是0.0黑 1.0白，對於un

影象處理（十一）影象分割(3)泛函能量LevelSet、snake分割

一、level set相關理論基於水平集的影象分割演算法是一種進化版的Snake演算法，也是需要給定初始的輪廓曲線，然後根據泛函能量最小化，進行曲線演化。水平集的方法，用的是一種隱式函式的方法，這個演算法比較難理解，我一年前開始搞這個演算法的時候，雖然知道程式碼怎麼寫，但是它的原理推

python+OpenCV影象處理（十二）車牌定位中對影象的形態學組合操作處理

車牌定位中對影象的形態學組合操作處理所謂的車牌定位，其中最關鍵的部分就是對圖片的處理，引數的設定，並使之擁有泛化能力。首先傳入圖片，在進行大規模的圖片處理時，因為無法確定圖片的尺寸，所以需要將原始圖片進行等比例的縮放。 orgimg = cv2.imread('ch

Python3+OpenCV3影象處理（十一）—— 影象金字塔

簡介：影象金字塔是影象中多尺度表達的一種，最主要用於影象的分割，是一種以多解析度來解釋影象的有效但概念簡單的結構。簡單來說，影象金字塔就是用來進行影象縮放的。進行影象縮放可以用影象金字塔，也可以使用resize函式進行縮放，後者效果更好。這裡只是對影象金字塔做一些簡單瞭解

經典數字影象處理（matlab 實現）

Multi-Scale EPLL Linearized Kernel Dictionary Learning Trainlets: Dictionary Learning in High Dim

數字影象處理（MATLAB版）岡薩雷斯中文高清版pdf:

下載地址：網盤下載數字影象處理（MATLAB版）岡薩雷斯+中文高清版。包含MATLAB程式碼實現《數字影象處理(MATLAB版)》是把影象處理基礎理論論述與軟體實踐方法相結合的第一本書，它集成了岡薩雷斯和伍茲所著的《數字影象處理》一書中的重要內容和MathWorks公司的影象處理工具箱。本書的特色在於它重點強

視訊、圖形影象處理之Opencv技術記錄（五）、Opencv教程之影象處理（imgproc模組）之平滑影象

目標在本教程中，您將學習如何使用OpenCV函式應用各種線性濾鏡來平滑影象，例如：理論注意下面的解釋屬於Richard Szeliski和LearningOpenCV的計算機視覺：演算法和應用一書平滑，也稱為模糊，是一種簡單且經常使用的影象處理操作。

（轉載）影象處理（卷積）

卷積公式　　解釋　　卷積公式是用來求隨機變數和的密度函式(pdf)的計算公式。　　定義式：　　z(t)=x(t)*y(t)= ∫x(m)y(t-m)dm. 　　已知x,y的pdf,x(t),y(t).現在要求z=x+y的pdf. 我們作變數替顯，令　　z=x+y,m=x. 雅可比行列式=1.那麼,z，m聯合密

影象處理（十二）影象融合(1)Seamless cloning泊松克隆-Siggraph 2004

Seamless cloning泊松克隆作者：hjimce 本篇博文主要講解2004年Siggraph的經典paper：《Poisson Image Editing》，在影象融合領域，融合效果最牛逼的paper。講這個演算法，我沒打算講太多理論的公式，理論的東西，對於大

ES6系列_13之Proxy進行預處理（簡單學習）

預處理當我 con bubuko 上下文對象 prope {} ons ive 1.理解什麽是預處理？當我們在操作一個對象或者方法時會有幾種動作，比如：在運行函數前初始化一些數據，在改變對象值後做一些善後處理。這些都算鉤子函數，Proxy的存在就可以讓我們給函數加上這樣

增強學習（強化學習）基礎之蒙特卡洛方法

https://blog.csdn.net/coffee_cream/article/details/66972281https://zhuanlan.zhihu.com/p/25743759https://zhuanlan.zhihu.com/p/28107168這三篇文章

岡薩雷斯：數字影象處理（二）：第二章數字圖形基礎（下）——數學工具

陣列操作與矩陣操作的區別：也就是說，除非特別說明，否則以後所提到的矩陣之間的操作都是元畫素與對應畫素之間的操作。線性運算與非線性運算（和純數學裡面的定義相同）：例如，求和是線性運算，取最大值是非線性運算灰度影象的集合與邏輯運算：在灰度影象領域，集合的

岡薩雷斯：數字影象處理（二）：第二章數字圖形基礎（上）——影象內插，相鄰畫素，鄰接性，距離度量

1.影象內插：從根本上看，內插是用已知資料來估計未知位置的數值的處理。例如，假設一幅大小為500500畫素的影象要放大1.5倍到75075畫素，一種簡單的放大方法是建立一個假想的750750網格，它與原始影象有相同的間隔，然後將其收縮，使它準確的與原影象匹配。顯然，收縮後的750750網格

影象處理與計算機視覺：基礎，經典以及最近發展（4）影象處理與分析

Last update: 2012-6-3 本章主要討論影象處理與分析。雖然後面計算機視覺部分的有些內容比如特徵提取等也可以歸結到影象分析中來，但鑑於它們與計算機視覺的緊密聯絡，以及它們的出處，沒有把它們納入到影象處理與分析中來。同樣，這裡面也有一些也可以劃歸到計算機視覺中

影象處理與計算機視覺：基礎，經典以及最近發展（5）計算機視覺

Last update: 2012-6-7 這一章是計算機視覺部分，主要側重在底層特徵提取，視訊分析，跟蹤，目標檢測和識別方面等方面。對於自己不太熟悉的領域比如攝像機標定和立體視覺，僅僅列出上google上引用次數比較多的文獻。有一些剛剛出版的文章，個人非常喜歡，也列出來

數字影象處理（MATLAB）（第二版）岡薩雷斯學習筆記

數字影象處理（MATLAB）（第二版）岡薩雷斯主要用來記錄自己的學習過程，相關實驗內容，便於日後查詢相關知識點及複習所用第二章灰度變換和空間濾波本章重點討論兩類空間域處理方法：亮度（或灰度）變換與空間濾波。空間濾波有時又稱為鄰域處理或空間卷積。

影象處理與計算機視覺：基礎，經典以及最近發展（1）序

1. 為什麼要寫這篇文章從2002年到現在，接觸影象快十年了。雖然沒有做出什麼很出色的工作，不過在這個領域摸爬滾打了十年之後，發現自己對影象處理和計算機視覺的感情越來越深厚。下班之後看看相關的書籍和文獻是一件很愜意的事情。平常的一大業餘愛好就是收集一些相關的文章，尤其

深度學習影象處理（分類or檢測）中結果的評價方法-mAP簡介

多標籤影象分類（Multi-label Image Classification）任務中圖片的標籤不止一個，因此評價不能用普通單標籤影象分類的標準，即mean accuracy，該任務採用的是和資訊檢索中類似的方法—mAP（mean Average

影象處理與影象識別筆記（六）影象增強3

上一章節中我們講解了空域濾波的影象增強方法，包括影象的平滑和銳化，本文中，我們首先帶來頻域濾波的影象增強方法，指在頻域中對影象進行變換，需要的基礎知識是前述過的影象傅立葉變換，請檢視學習。一、頻域濾波處理頻域濾波處理的一般方法如下圖所示，先將影象經過傅立葉變換為頻域形式，然後乘以

影象處理與影象識別筆記（五）影象增強2

上一節中我們講解了灰度變換的原理以及實現方法，本節我們講解空域濾波增強，與灰度變換相同，空域濾波增強是一種空域處理的方法，不過空域濾波不是一種對點做處理的方法，而是利用相鄰畫素間的關係進行增強。空域濾波可以按照增強效果的不同分為平滑與銳化兩類，又都可分為線性與非線性方法，線性濾波利用空域卷積

影象處理（影象學習）的基礎必備知識

基礎儲備知識列表（影象必備基礎）

相關推薦