Opencv媒體與GUI---OpenCV的視訊輸入和相似度測量

阿新 • • 發佈：2018-12-16

程式碼

#include <iostream> // for standard I/O
#include <string>   // for strings
#include <iomanip>  // for controlling float print precision
#include <sstream>  // string to number conversion

#include <opencv2/imgproc/imgproc.hpp>  // Gaussian Blur
#include <opencv2/core/core.hpp>        // Basic OpenCV structures (cv::Mat, Scalar)
#include <opencv2/highgui/highgui.hpp>  // OpenCV window I/O

using namespace std;
using namespace cv;

double getPSNR ( const Mat& I1, const Mat& I2);
Scalar getMSSIM( const Mat& I1, const Mat& I2);
int main(int argc, char *argv[], char *window_name)
{
    if (argc != 5)
    {
        cout << "Not enough parameters" << endl;
        return -1;
    }
    stringstream conv;

    const string sourceReference = argv[1],sourceCompareWith = argv[2];
    int psnrTriggerValue, delay;
    conv << argv[3] << endl << argv[4];       // put in the strings
    conv >> psnrTriggerValue >> delay;// take out the numbers

    char c;
    int frameNum = -1;          // Frame counter

    VideoCapture captRefrnc(sourceReference),
        captUndTst(sourceCompareWith);

    if ( !captRefrnc.isOpened())
    {
        cout  << "Could not open reference " << sourceReference << endl;
        return -1;
    }

    if( !captUndTst.isOpened())
    {
        cout  << "Could not open case test " << sourceCompareWith << endl;
        return -1;
    }

    Size refS = Size((int) captRefrnc.get(CV_CAP_PROP_FRAME_WIDTH),
        (int) captRefrnc.get(CV_CAP_PROP_FRAME_HEIGHT)),
        uTSi = Size((int) captUndTst.get(CV_CAP_PROP_FRAME_WIDTH),
        (int) captUndTst.get(CV_CAP_PROP_FRAME_HEIGHT));

    if (refS != uTSi)
    {
        cout << "Inputs have different size!!! Closing." << endl;
        return -1;
    }

    const char* WIN_UT = "Under Test";
    const char* WIN_RF = "Reference";

    // Windows
    namedWindow(WIN_RF, CV_WINDOW_AUTOSIZE );
    namedWindow(WIN_UT, CV_WINDOW_AUTOSIZE );
    cvMoveWindow(WIN_RF, 400       ,            0);      //750,  2 (bernat =0)
    cvMoveWindow(WIN_UT, refS.width,            0);      //1500, 2

    cout << "Reference frame resolution: Width=" << refS.width << "  Height=" << refS.height
        << " of nr#: " << captRefrnc.get(CV_CAP_PROP_FRAME_COUNT) << endl;

    cout << "PSNR trigger value " <<
        setiosflags(ios::fixed) << setprecision(3) << psnrTriggerValue << endl;

    Mat frameReference, frameUnderTest;
    double psnrV;
    Scalar mssimV;

    while( true) //Show the image captured in the window and repeat
    {
        captRefrnc >> frameReference;
        captUndTst >> frameUnderTest;

        if( frameReference.empty()  || frameUnderTest.empty())
        {
            cout << " < < <  Game over!  > > > ";
            break;
        }

        ++frameNum;
        cout <<"Frame:" << frameNum <<"# ";

        ///////////////////////////////// PSNR ////////////////////////////////////////////////////
        psnrV = getPSNR(frameReference,frameUnderTest);                 //get PSNR
        cout << setiosflags(ios::fixed) << setprecision(3) << psnrV << "dB";

        //////////////////////////////////// MSSIM /////////////////////////////////////////////////
        if (psnrV < psnrTriggerValue && psnrV)
        {
            mssimV = getMSSIM(frameReference,frameUnderTest);

            cout << " MSSIM: "
                << " R " << setiosflags(ios::fixed) << setprecision(2) << mssimV.val[2] * 100 << "%"
                << " G " << setiosflags(ios::fixed) << setprecision(2) << mssimV.val[1] * 100 << "%"
                << " B " << setiosflags(ios::fixed) << setprecision(2) << mssimV.val[0] * 100 << "%";
        }

        cout << endl;

        ////////////////////////////////// Show Image /////////////////////////////////////////////
        imshow( WIN_RF, frameReference);
        imshow( WIN_UT, frameUnderTest);

        c = cvWaitKey(delay);
        if (c == 27) break;
    }

    return 0;
}

double getPSNR(const Mat& I1, const Mat& I2)
{
    Mat s1;
    absdiff(I1, I2, s1);       // |I1 - I2|
    s1.convertTo(s1, CV_32F);  // cannot make a square on 8 bits
    s1 = s1.mul(s1);           // |I1 - I2|^2

    Scalar s = sum(s1);         // sum elements per channel

    double sse = s.val[0] + s.val[1] + s.val[2]; // sum channels

    if( sse <= 1e-10) // for small values return zero
        return 0;
    else
    {
        double  mse =sse /(double)(I1.channels() * I1.total());
        double psnr = 10.0*log10((255*255)/mse);
        return psnr;
    }
}

Scalar getMSSIM( const Mat& i1, const Mat& i2)
{
    const double C1 = 6.5025, C2 = 58.5225;
    /***************************** INITS **********************************/
    int d     = CV_32F;

    Mat I1, I2;
    i1.convertTo(I1, d);           // cannot calculate on one byte large values
    i2.convertTo(I2, d);

    Mat I2_2   = I2.mul(I2);        // I2^2
    Mat I1_2   = I1.mul(I1);        // I1^2
    Mat I1_I2  = I1.mul(I2);        // I1 * I2

    /*************************** END INITS **********************************/

    Mat mu1, mu2;   // PRELIMINARY COMPUTING
    GaussianBlur(I1, mu1, Size(11, 11), 1.5);
    GaussianBlur(I2, mu2, Size(11, 11), 1.5);

    Mat mu1_2   =   mu1.mul(mu1);
    Mat mu2_2   =   mu2.mul(mu2);
    Mat mu1_mu2 =   mu1.mul(mu2);

    Mat sigma1_2, sigma2_2, sigma12;

    GaussianBlur(I1_2, sigma1_2, Size(11, 11), 1.5);
    sigma1_2 -= mu1_2;

    GaussianBlur(I2_2, sigma2_2, Size(11, 11), 1.5);
    sigma2_2 -= mu2_2;

    GaussianBlur(I1_I2, sigma12, Size(11, 11), 1.5);
    sigma12 -= mu1_mu2;

    ///////////////////////////////// FORMULA ////////////////////////////////
    Mat t1, t2, t3;

    t1 = 2 * mu1_mu2 + C1;
    t2 = 2 * sigma12 + C2;
    t3 = t1.mul(t2);              // t3 = ((2*mu1_mu2 + C1).*(2*sigma12 + C2))

    t1 = mu1_2 + mu2_2 + C1;
    t2 = sigma1_2 + sigma2_2 + C2;
    t1 = t1.mul(t2);               // t1 =((mu1_2 + mu2_2 + C1).*(sigma1_2 + sigma2_2 + C2))

    Mat ssim_map;
    divide(t3, t1, ssim_map);      // ssim_map =  t3./t1;

    Scalar mssim = mean( ssim_map ); // mssim = average of ssim map
    return mssim;
}

解釋

你需要先定義一個 VideoCapture 類的物件來開啟和讀取視訊流。具體可以通過 constructor 或者通過 open 函式來完成。如果使用整型數當引數的話，就可以將這個物件繫結到一個攝像機，將系統指派的ID號當作引數傳入即可。例如你可以傳入0來開啟第一個攝像機，傳入1開啟第二個攝像機，以此類推。如果使用字串當引數，就會開啟一個由這個字串（檔名）指定的視訊檔案。例如在上面的例子裡傳入如下引數:：
前兩個引數傳入了兩個檔名，分別代表原始參考視訊和測試視訊。這裡使用了相對地址，這也代表著系統會從軟體的工作目錄下的video子目錄裡尋找檔案。然後程式將針對這些引數開始進行相似性檢查
你可以用 isOpened 函式來檢查視訊是否成功開啟與否:
當解構函式呼叫時，會自動關閉視訊。如果你希望提前關閉的話，你可以呼叫 release 函式. 視訊的每一幀都是一幅普通的影象。因為我們僅僅需要從 VideoCapture 物件裡釋放出每一幀影象並儲存成 Mat 格式。因為視訊流是連續的，所以你需要在每次呼叫 read 函式後及時儲存影象或者直接使用過載的>>操作符。
如果視訊幀無法捕獲（例如當視訊關閉或者完結的時候），上面的操作就會返回一個空的 Mat 物件。我們可以用下面的程式碼檢查是否返回了空的影象：
讀取視訊幀的時候也會自動進行解碼操作。你可以通過呼叫

grab 和 retrieve 函式來顯示地進行這兩項操作。
視訊通常擁有很多除了視訊幀影象以外的資訊，像是幀數之類，有些時候資料較短，有些時候用4個位元組的字串來表示。所以 get 函式返回一個double（8個位元組）型別的資料來表示這些屬性。然後你可以使用位操作符來操作這個返回值從而得到想要的整型資料等。這個函式有一個引數，代表著試圖查詢的屬性ID。在下面的例子裡我們會先獲得視訊的尺寸和幀數。
當你需要設定這些值的時候你可以呼叫 set 函式。函式的第一個引數是需要設定的屬性ID，第二個引數是需要設定的值，如果返回true的話就表示成功設定，否則就是false。接下來的這個例子很好地展示瞭如何設定視訊的時間位置或者幀數：
當我們想檢查壓縮視訊帶來的細微差異的時候，就需要構建一個能夠逐幀比較差視訊差異的系統。最常用的比較演算法是PSNR( Peak signal-to-noise ratio)。這是個使用“區域性均值誤差”來判斷差異的最簡單的方法，假設有這兩幅影象：I1和I2，它們的行列數分別是i，j，有c個通道。
PSNR公式如下:
每個畫素的每個通道的值佔用一個位元組，值域[0,255]。這裡每個畫素會有 $MAX_I^2$ 個有效的最大值注意當兩幅影象的相同的話，MSE的值會變成0。這樣會導致PSNR的公式會除以0而變得沒有意義。所以我們需要單獨的處理這樣的特殊情況。此外由於畫素的動態範圍很廣，在處理時會使用對數變換來縮小範圍。這些變換的C++程式碼如下:
在考察壓縮後的視訊時，這個值大約在30到50之間，數字越大則表明壓縮質量越好。如果影象差異很明顯，就可能會得到15甚至更低的值。PSNR演算法簡單，檢查的速度也很快。但是其呈現的差異值有時候和人的主觀感受不成比例。所以有另外一種稱作 結構相似性 的演算法做出了這方面的改進。

Scalar getMSSIM( const Mat& i1, const Mat& i2)
{
 const double C1 = 6.5025, C2 = 58.5225;
 /***************************** INITS **********************************/
 int d     = CV_32F;

 Mat I1, I2;
 i1.convertTo(I1, d);           // 不能在單位元組畫素上進行計算，範圍不夠。
 i2.convertTo(I2, d);

 Mat I2_2   = I2.mul(I2);        // I2^2
 Mat I1_2   = I1.mul(I1);        // I1^2
 Mat I1_I2  = I1.mul(I2);        // I1 * I2

 /***********************初步計算 ******************************/

 Mat mu1, mu2;   //
 GaussianBlur(I1, mu1, Size(11, 11), 1.5);
 GaussianBlur(I2, mu2, Size(11, 11), 1.5);

 Mat mu1_2   =   mu1.mul(mu1);
 Mat mu2_2   =   mu2.mul(mu2);
 Mat mu1_mu2 =   mu1.mul(mu2);

 Mat sigma1_2, sigma2_2, sigma12;

 GaussianBlur(I1_2, sigma1_2, Size(11, 11), 1.5);
 sigma1_2 -= mu1_2;

 GaussianBlur(I2_2, sigma2_2, Size(11, 11), 1.5);
 sigma2_2 -= mu2_2;

 GaussianBlur(I1_I2, sigma12, Size(11, 11), 1.5);
 sigma12 -= mu1_mu2;

 ///////////////////////////////// 公式 ////////////////////////////////
 Mat t1, t2, t3;

 t1 = 2 * mu1_mu2 + C1;
 t2 = 2 * sigma12 + C2;
 t3 = t1.mul(t2);              // t3 = ((2*mu1_mu2 + C1).*(2*sigma12 + C2))

 t1 = mu1_2 + mu2_2 + C1;
 t2 = sigma1_2 + sigma2_2 + C2;
 t1 = t1.mul(t2);               // t1 =((mu1_2 + mu2_2 + C1).*(sigma1_2 + sigma2_2 + C2))

 Mat ssim_map;
 divide(t3, t1, ssim_map);      // ssim_map =  t3./t1;

 Scalar mssim = mean( ssim_map ); // mssim = ssim_map的平均值
 return mssim;
}

正是這個原因，最開始的原始碼裡，我們用PSNR演算法去計算每一幀影象，而僅當PSNR演算法計算出的結果低於輸入值的時候，用SSIM演算法去驗證。為了展示資料，我們在例程裡用兩個視窗顯示了原影象和測試影象並且在控制檯上輸出了PSNR和SSIM資料。

結果

Opencv媒體與GUI---OpenCV的視訊輸入和相似度測量

程式碼 #include <iostream> // for standard I/O #include <string> // for strings #include <iomanip> // for controlling f

Opencv媒體與GUI---為應用程式新增滑塊

程式碼 #include <cv.h> #include <highgui.h> using namespace cv; /// 全域性變數的宣告與初始化 const int alpha_slider_max = 100; int alpha_s

Opencv媒體與GUI---使用GDAL讀取地理空間柵格檔案

程式碼 /* * gdal_image.cpp -- Load GIS data into OpenCV Containers using the Geospatial Data Abstraction Library */ // OpenCV Headers #incl

距離和相似度度量

com 聚類算法匯總 pearson 求和選擇方式獲得分享在數據分析和數據挖掘的過程中，我們經常需要知道個體間差異的大小，進而評價個體的相似性和類別。最常見的是數據分析中的相關分析，數據挖掘中的分類和聚類算法，如K最近鄰（KNN）和K均值（K-Means）。當然

演算法之常用的距離和相似度度量

在資料分析和資料探勘的過程中，我們經常需要知道個體間差異的大小，進而評價個體的相似性和類別。最常見的是資料分析中的相關分析，資料探勘中的分類和聚類演算法，如K最近鄰（KNN）和K均值（K-Means）。當然衡量個體差異的方法有很多，這裡整理羅列下。　　為了方便下面的解釋和舉例，先設定我們要

常用距離和相似度度量

在資料分析和資料探勘的過程中，我們經常需要知道個體間差異的大小，進而評價個體的相似性和類別。最常見的是資料分析中的相關分析，資料探勘中的分類和聚類演算法，如K最近鄰（KNN）和K均值（K-Means）。當然衡量個體差異的方法有很多，最近查閱了相關的資料，這裡整理羅列下。

資料探勘和機器學習中距離和相似度公式

距離：閔可夫斯基距離公式，也叫 Lp 範數：當p=1時，變為曼哈頓距離公式，也即 L1範數：當p=2時，變為歐式距離公式，也即 L2範數：衡量空間中點的絕對距離，對絕對數值敏感。相似性：餘弦相似：皮爾遜相關係數，即相關分析中的相關係數，對兩個個體的向

影象相似度測量與模板匹配總結

摘要本文主要總結了進行目標跟蹤、檢測中經常使用到的影象相似度測量和模板匹配方法，並給出了具體的基於OpenCV的程式碼實現。引言模板匹配是一種在源影象中尋找與影象patch最相似的技術，常常用來

【轉載】機器學習計算距離和相似度的方法

3. 向量內積向量內積是線性代數裡最為常見的計算，實際上它還是一種有效並且直觀的相似性測量手段。向量內積的定義如下：直觀的解釋是：如果 x 高的地方 y 也比較高， x 低的地方 y 也比較低，那麼整體的內積是偏大的，也就是說 x 和 y 是相似的。舉個例子，在一段長的序列訊號 A 中尋找哪一段與短序

OpenCV|圖片與視訊的相互轉換(C++&Python)

前言在學習opencv的過程中，終會遇到需要把視訊轉換成圖片處理，或者把處理後的圖片儲存為視訊格式的時候。這篇文章中就來看一下如何進行圖片和視訊之間的相互轉換。視訊轉圖片對於這種情況大家應該很熟悉了。因為學習opencv的時候肯定開啟過攝像頭，比如開啟攝像頭檢測個

OpenCV 處理視訊輸入輸出 Python

OpenCV 處理視訊輸入輸出 Python 簡介視訊的處理和圖片的處理類似，只不過視訊處理需

基於標記的AR的OpenCV實現:動態視訊輸入

我的上篇部落格《基於標記的AR的OpenCV實現》實現的是單幅圖片的標記檢測和增強現實，稍微改動了程式實現了攝像頭視訊流影象的動態檢測和實時增強，經測試，實時性不錯，在標記不被遮擋的情況下，繪製的虛擬模型和實時與檢測標記結合，但標記只要有被遮擋一少部分，標記就檢測失敗。

opencv（c++）檔案輸入和輸出使用XML和YAML檔案

你會找到以下問題的答案：如何使用YAML或XML檔案列印和讀取文字和OpenCV檔案？如何為OpenCV資料結構做同樣的事情？如何為你的資料結構做到這一點？使用OpenCV資料結構，如cv :: FileStorage，cv :: F

【OpenCV開發】OpenCV：使用VideoCapture類進行視訊讀取和顯示

註釋比較詳盡，相信大家都能看得懂，這裡再做幾點補充： 1.由於原視訊是網路攝像頭採集的，所以有很多雪花點，在這裡進行了簡單的均值濾波處理。 2.雖然VideoCapture類中有grab（捕獲下一幀）和retrieve（對該幀進行解碼）操作，但是直接用read比較簡單。 3.get函式的功能很強大，

opencv︱圖片與視訊的讀入、顯示、寫出、放縮與基本繪圖函式介紹

本文來自於段力輝譯《OpenCV-Python 中文教程》一、圖片 + 讀入、顯示、寫出 opencv中讀入、顯示、寫出圖片：cv2.imread()， cv2.imshow()， cv2.imwrite() 1、cv2.imread(

opencv人臉檢測程式碼應用與分析（PC端和Android端）

（1）OpenCV人臉檢測C++程式流程： OpenCV的人臉檢測程式採用了Viola & Jones人臉檢測方法，主要是呼叫訓練好的瀑布級聯分類器cascade來進行模式匹配。 cvHaarDetectObjects先將影象灰度化，根據傳入引數判斷是否進行can

opencv中videocapture用法開啟視訊和開啟攝像頭

#include <opencv2/opencv.hpp> #include <iostream> using namespace std; using namespace cv; int main(int argc, char **argv) {

OpenCV實踐之路——Python的安裝和使用

imread ipp 多少變量 target 好的文件記錄 span 本文由@星沈閣冰不語出品，轉載請註明作者和出處。文章鏈接：http://blog.csdn.net/xingchenbingbuyu/article/details/

DM8168 OpenCV嘗試與評估（編譯ARM版OpenCV）

gnu ner arm sdn ack all finish tools 再次交叉編譯opencv2.3.1，並在DM8168 cortex A8中執行圖像處理。開發環境： PC：ubuntu12.04LTS。Intel

OpenCV中的霍夫線變換和霍夫圓變換

word 得到統計不同效率兩種做的 ndis pan 一、霍夫線變換霍夫線變換是OpenCv中一種尋找直線的方法，輸入圖像為邊緣二值圖。原理：一條直線在圖像二維空間可由兩個變量表示，例如: 1、在笛卡爾坐標系: 可由參數: (m,b) 斜率和截距表示。

Opencv媒體與GUI---OpenCV的視訊輸入和相似度測量

程式碼

解釋

結果

相關推薦