Opencv學習（三）——影象變換

阿新 • • 發佈：2018-12-11

一、邊緣檢測

邊緣檢測的一般步驟：

濾波——消除噪聲
增強——使邊界輪廓更加明顯
檢測——選出邊緣點

1.1、canny運算元

void Canny(

inputArray,

outputArray,

double threshold1,

double threshold2,

int apertureSize=3,

bool L2gradient=false

) ;

第一個引數，輸入影象，且需為單通道8點陣圖像。
第二個引數，輸出的邊緣圖。
第三個引數，第一個滯後性閾值。用於邊緣連線。
第四個引數，第二個滯後性閾值。用於控制強邊緣的初始段，高低閾值比在2:1到3:1之間。
第五個引數，表明應用sobel運算元的孔徑大小，預設值為3。

第六個引數，bool型別L2gradient，一個計算影象梯度幅值的標識，預設值false。

1.2、sobel運算元

void Sobel(

inputArray,

outputArray,

int ddepth,

int dx,

int dy,

int ksize=3,

double scale=1,

double delta=0,

int borderType=BORDER_DEFAULT

) ;

第一個引數，輸入影象。
第二個引數，輸出影象。
第三個引數，輸出影象深度。
第四個引數，x方向上的差分階數。
第五個引數，y方向上的差分階數。
第六個引數，Sobel核的大小，預設值為3，必須為1、3、5、7。當為1時，往往使用3x1、1x3的核心，這種情況下，沒有進行高斯平滑操作。

第七個引數，計算導數值時可選的縮放因子，預設值1，表示預設情況下沒用應用縮放。
第八個引數，表示在結果存入輸出影象之前可選的delta值，預設值0。
第九個引數，邊界模式。

1.3、Laplacian運算元

void Laplacian(

inputArray,

outputArray,

int ddepth,

int ksize=1,

double scale=1,

double delta=0,

int borderType=BORDER_DEFAULT

) ;

第一個引數，輸入影象，且需為單通道8點陣圖像。
第二個引數，輸出的邊緣圖。
第三個引數，輸出影象的影象深度。
第四個引數，用於計算二階導數的濾波器的孔徑尺寸大小，大小必須為正奇數，預設值為1。

第五個引數，計算拉普拉斯值的時候可選的比例因子，預設值為1。
第六個引數，表示在結果存入目標圖之前可選的delta值，預設值為0。
第七個引數，邊界模式。

1.4、scharr濾波器

void Scharr(

inputArray,

outputArray,

int ddepth,

int dx,

int dy,

double scale=1,

double delta=0,

int borderType=BORDER_DEFAULT

) ;

第一個引數，輸入影象。
第二個引數，輸出影象。
第三個引數，輸出影象深度。
第四個引數，x方向上的差分階數。
第五個引數，y方向上的差分階數。
第六個引數，計算導數值時可選的縮放因子，預設值1，表示預設情況下沒用應用縮放。
第七個引數，表示在結果存入輸出影象之前可選的delta值，預設值0。
第八個引數，邊界模式

二、霍夫變換

霍夫線變換是一種用來尋找直線的方法. 在使用霍夫線變換之前, 首先要對影象進行邊緣檢測的處理，也即霍夫線變換的直接輸入只能是邊緣二值影象。由HoughLines函式呼叫。

多尺度霍夫變換為經典霍夫變換在多尺度下的一個變種。由HoughLines函式呼叫。

累計概率霍夫變換演算法是標準霍夫變換演算法的一個改進，它在一定的範圍內進行霍夫變換，計算單獨線段的方向以及範圍，從而減少計算量，縮短計算時間。由HoughLinesP函式呼叫。

void HoughLines(

InputArray image,

OutputArray lines,

double rho,

double theta,

int threshold,

double srn=0,

double stn=0

) ;

第一個引數，InputArray型別的image，輸入影象，即源影象，需為8位的單通道二進位制影象，可以將任意的源圖載入進來後由函式修改成此格式後，再填在這裡。
第二個引數，InputArray型別的lines，經過呼叫HoughLines函式後儲存了霍夫線變換檢測到線條的輸出向量。每一條線由具有兩個元素的矢量表示，其中，是離座標原點((0,0)（也就是影象的左上角）的距離。是弧度線條旋轉角度（0_{垂直線，π/2}水平線）。
第三個引數，double型別的rho，以畫素為單位的距離精度。另一種形容方式是直線搜尋時的進步尺寸的單位半徑。PS:Latex中/rho就表示。
第四個引數，double型別的theta，以弧度為單位的角度精度。另一種形容方式是直線搜尋時的進步尺寸的單位角度。
第五個引數，int型別的threshold，累加平面的閾值引數，即識別某部分為圖中的一條直線時它在累加平面中必須達到的值。大於閾值threshold的線段才可以被檢測通過並返回到結果中。
第六個引數，double型別的srn，有預設值0。對於多尺度的霍夫變換，這是第三個引數進步尺寸rho的除數距離。粗略的累加器進步尺寸直接是第三個引數rho，而精確的累加器進步尺寸為rho/srn。
第七個引數，double型別的stn，有預設值0，對於多尺度霍夫變換，srn表示第四個引數進步尺寸的單位角度theta的除數距離。且如果srn和stn同時為0，就表示使用經典的霍夫變換。否則，這兩個引數應該都為正數。

void HoughLinesP(

InputArray image,

OutputArray lines,

double rho,

double theta,

int threshold,

double minLineLength=0,

double maxLineGap=0

) ;

第一個引數，InputArray型別的image，輸入影象，即源影象，需為8位的單通道二進位制影象，可以將任意的源圖載入進來後由函式修改成此格式後，再填在這裡。
第二個引數，InputArray型別的lines，經過呼叫HoughLinesP函式後後儲存了檢測到的線條的輸出向量，每一條線由具有四個元素的向量(x_1,y_1, x_2, y_2）表示，其中，(x_1, y_1)和(x_2, y_2) 是是每個檢測到的線段的結束點。
第三個引數，double型別的rho，以畫素為單位的距離精度。另一種形容方式是直線搜尋時的進步尺寸的單位半徑。
第四個引數，double型別的theta，以弧度為單位的角度精度。另一種形容方式是直線搜尋時的進步尺寸的單位角度。
第五個引數，int型別的threshold，累加平面的閾值引數，即識別某部分為圖中的一條直線時它在累加平面中必須達到的值。大於閾值threshold的線段才可以被檢測通過並返回到結果中。
第六個引數，double型別的minLineLength，有預設值0，表示最低線段的長度，比這個設定引數短的線段就不能被顯現出來。
第七個引數，double型別的maxLineGap，有預設值0，允許將同一行點與點之間連線起來的最大的距離。

三、重對映

把一個影象中一個位置的畫素放置到另一個圖片指定位置的過程。

簡單的說就是改變圖片的位置（左，右，上，下，顛倒）

void remap(

InputArray src,

OutputArraydst,

InputArray map1,

InputArray map2,

int interpolation,

intborderMode=BORDER_CONSTANT,

const Scalar& borderValue=Scalar()

);

第一個引數，InputArray型別的src，輸入影象，即源影象，填Mat類的物件即可，且需為單通道8位或者浮點型影象。
第二個引數，OutputArray型別的dst，函式呼叫後的運算結果存在這裡，即這個引數用於存放函式呼叫後的輸出結果，需和源圖片有一樣的尺寸和型別。
第三個引數，InputArray型別的map1，它有兩種可能的表示物件
第四個引數，InputArray型別的map2，同樣，它也有兩種可能的表示物件，根據map1來確定表示哪種物件。
第五個引數，int型別的interpolation,插值方式，之前的resize( )函式中有講到，需要注意，resize( )函式中提到的INTER_AREA插值方式在這裡是不支援的，所以可選的插值方式如下：

INTER_NEAREST - 最近鄰插值 INTER_LINEAR – 雙線性插值（預設值） INTER_CUBIC – 雙三次樣條插值（逾4×4畫素鄰域內的雙三次插值） INTER_LANCZOS4 -Lanczos插值（逾8×8畫素鄰域的Lanczos插值）

第六個引數，int型別的borderMode，邊界模式，有預設值BORDER_CONSTANT，表示目標影象中“離群點（outliers）”的畫素值不會被此函式修改。
第七個引數，const Scalar&型別的borderValue，當有常數邊界時使用的值，其有預設值Scalar( )，即預設值為0

四、仿射變換

仿射變換（Affine Transformation）是空間直角座標系的變換，從一個二維座標變換到另一個二維座標，仿射變換是一個線性變換，他保持了影象的“平行性”和“平直性”，即影象中原來的直線和平行線，變換後仍然保持原來的直線和平行線，仿射變換比較常用的特殊變換有平移(Translation)、縮放（Scale）、翻轉（Flip）、旋轉（Rotation）和剪下(Shear)。

void warpAffine(

InputArray src,

OutputArray dst,

InputArray M,

Size dsize,

int flags=INTER_LINEAR,

intborderMode=BORDER_CONSTANT,

const Scalar& borderValue=Scalar()

) ;

第一個引數，InputArray型別的src，輸入影象，即源影象，填Mat類的物件即可。
第二個引數，OutputArray型別的dst，函式呼叫後的運算結果存在這裡，需和源圖片有一樣的尺寸和型別。
第三個引數，InputArray型別的M，2×3的變換矩陣。
第四個引數，Size型別的dsize，表示輸出影象的尺寸。
第五個引數，int型別的flags，插值方法的識別符號。此引數有預設值INTER_LINEAR(線性插值)，可選的插值方式如下：

INTER_NEAREST - 最近鄰插值 INTER_LINEAR - 線性插值（預設值） INTER_AREA - 區域插值 INTER_CUBIC –三次樣條插值 INTER_LANCZOS4 -Lanczos插值 CV_WARP_FILL_OUTLIERS - 填充所有輸出影象的象素。如果部分象素落在輸入影象的邊界外，那麼它們的值設定為 fillval. CV_WARP_INVERSE_MAP –表示M為輸出影象到輸入影象的反變換，即。因此可以直接用來做象素插值。否則, warpAffine函式從M矩陣得到反變換。

第六個引數，int型別的borderMode，邊界畫素模式，預設值為BORDER_CONSTANT。
第七個引數，const Scalar&型別的borderValue，在恆定的邊界情況下取的值，預設值為Scalar()，即0。

五、直方圖均衡化

直方圖均衡化是通過調整影象的灰階分佈，使得在0~255灰階上的分佈更加均衡，提高了影象的對比度，達到改善影象主觀視覺效果的目的。對比度較低的影象適合使用直方圖均衡化方法來增強影象細節。

void equalizeHist(

InputArray src,

OutputArray dst

);

第一個引數：Mat即可，需要8位單通道的影象
第二個引數：需要與原圖片相同尺寸

Opencv學習（三）——影象變換

一、邊緣檢測邊緣檢測的一般步驟：濾波——消除噪聲增強——使邊界輪廓更加明顯檢測——選出邊緣點 1.1、canny運算元 void Canny( inputArray, outputArray, double threshold1, double t

【Opencv學習（三）】獲取Mat影象的ROI區域

在影象處理中，有時需要分塊處理，或者只處理影象中的某一部分。因此設定影象的Region of interest 是非常重要的，可以提高效率。 ROI 區域的兩種定義方法： 1. 使用cv::Rect. cv::Rect 表示一個矩形區域，常用的建構函式如下：Rect_ (

OpenCV計算機視覺學習（10）——影象變換（傅立葉變換，高通濾波，低通濾波）

如果需要處理的原圖及程式碼，請移步小編的GitHub地址　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/ComputerVisionPractice 　　在數字影象處理中，有兩個經典的變換被廣泛應用——傅立葉變換和霍夫變化。其中，傅立葉變換主要是將時間域

Python+OpenCV學習（2）---影象的合併與拆分

利用python學習OpenCV，個人感覺比較方便。函式的形式與C++基本相同，所以切換過來還是比較好的，對於像我這種對python不太熟練的人，使用python的整合開發環境PyCharm進行學習，

QT和opencv學習（三）Qt訊號槽

所謂訊號槽，簡單來說，就像是插銷一樣：一個插頭和一個插座。怎麼說呢？當某種事件發生之後，比如，點選了一下滑鼠，或者按了某個按鍵，這時，這個元件就會發出一個訊號。就像是廣播一樣，如果有了事件，它就漫天發聲。這時，如果有一個槽，正好對應上這個訊號，那麼，這個槽的函式就會執行，也就

Python+OpenCV學習（4）---影象梯度及邊緣檢測

OpenCV計算機視覺學習（3）——影象灰度線性變換與非線性變換（對數變換，伽馬變換）

如果需要處理的原圖及程式碼，請移步小編的GitHub地址　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/ComputerVisionPractice 　　下面主要學習影象灰度化的知識，結合OpenCV呼叫 cv2.cvtColor()函式實現影象灰度化，

OpenCV計算機視覺學習（11）——影象空間幾何變換（影象縮放，影象旋轉，影象翻轉，影象平移，仿射變換，映象變換）

如果需要處理的原圖及程式碼，請移步小編的GitHub地址　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/ComputerVisionPractice 　　影象的幾何變換是在不改變影象內容的前提下對影象畫素進行空間幾何變換，主要包括了影象的平移變換，縮放，

opencv學習（十三）：影象直方圖

一、安裝matplotlib 在cmd環境下，按照自己安裝的python位置進入Scripts目錄下，輸入命令：pip install matplotlib 二、繪出圖片的直方圖程式碼如下： #匯入cv模組 import cv2 as cv import nump

opencv學習（九）：利用卷積對影象模糊處理

在影象上個人覺得卷積就是：對於某一位置的畫素，通過演算法來把它附近的所有畫素點的值聯合起來，重新設定這個畫素的大小。（大概就是這樣）這個演算法類似有：均值，中值，就是取周圍所有畫素的均值、中值來設定這個畫素的大小。（關於邊界問題：有幾種填充方法：補零、邊界複製、塊複製、映象複製等方法）&

OpenCV(C++) 基礎（五）-- 影象變換（重對映/仿射/直方圖均衡化）

1.重對映：翻轉 void remap(src, dst, map1, map2, interpolation, mode=BORDER_CONSTANT, Scalar&borderVal=Scalar()); // map1 / map2: x / y 方向的對

【python學習筆記】openCV包（1）影象操作

碎碎念 python中影象操作的包有很多，之前看過一個教識別的大佬的視訊用了openCV，所以今天也就選擇openCV進行學習啦。另外，感覺openCV可以在很多語言環境下使用啊，C，C++，PHP啥的。這裡只是openCV包中的檔案操作的一些方法，不要小看這

opencv學習（一）總結最近學習的影象處理函式以及waitkey()函式

常用函式圖片讀寫 cv.imread()函式 Mat cv::imread ( const String & filename, int flags = IMREAD_COLOR ) Python: retval = cv.imread(

樹莓派學習（三）基於OpenCv的人臉識別

博主的課程設計選題，開始在網上參考了諸多教程踩了很多坑最終得以實現，所以寫下心得總結，以便後人乘涼~https://blog.csdn.net/kyokozan/article/details/79192646https://blog.csdn.net/LC_1994/art

opencv學習（五）之畫素遍歷三種方式耗時分析

前面用兩篇介紹了畫素的顏色空間縮減、查詢表、遍歷畫素的三種方式、程式計時等，也說了一下每種方法的優缺點，現在用一個綜合型的程式進行對比。方式是用三種方式對lena影象（220x220）進行處理，使其顏色種類從256中變成64種。在顏色空間縮減方法中講過這種方式，

Python+OpenCV學習（6）---傅立葉變換

利用python學習OpenCV，個人感覺比較方便。函式的形式與C++基本相同，所以切換過來還是比較好的，對於像我這種對python不太熟練的人，使用python的整合開發環境PyCharm進行學習，可以設定斷點除錯，有助於我這類初學者理解掌握。下面是學習傅立葉變換的

matlab學習筆記（三）---影象的代數運算

1、絕對值差函式imabstiff I=imread('cameraman.tif'); J=uint8(filter2(fspecial('gaussian'),I)); K=imabsdiff(I,J); imshow(I); imsho

VS2017開發C++學習（三）OpenCV的配置方法

我們文件路徑源碼 stack bug 不同版本整合 imread evc 作為萌新最初聽說到opencv，以為是一個集成開發環境IDE。後來因為畢設原因不得不去使用opencv，才了解到OpenCV是一個廣受歡迎的開源計算機視覺庫，它提供了很多函數，實現很多計算機視

QT和opencv學習（二）opencv的載入、顯示、修改、儲存影象

載入影象（用cv::imread） imread功能是載入影象檔案成為一個Mat物件，其中第一個引數表示影象檔名稱第二個引數，表示載入的影象是什麼型別，支援常見的三個引數值 IMREAD_UNCHANGED (<0) 表示載入原圖，不做任何改變

學習opencv之（六）-影象切割，使用ROI

一.ROI介紹在OpenCV中我們能夠非常方便地獲取指定ROI區域的子影象。如果你對影象設定了ROI，那麼，Opencv的大多數函式只在該ROI區域內運算（只處理該ROI區域），如果沒設ROI的話，就會出來整幅影象。ROI非常有用，例如我們想把影象中的人臉扣出來，進行人臉識別

Opencv學習（三）——影象變換

一、邊緣檢測

1.1、canny運算元

1.2、sobel運算元

1.3、Laplacian運算元

1.4、scharr濾波器

二、霍夫變換

三、重對映

四、仿射變換

五、直方圖均衡化

相關推薦