OpenCV之影象處理(三十四) 基於距離變換與分水嶺的影象分割

阿新 • • 發佈：2019-02-06

影象分割(Image Segmentation)是影象處理最重要的處理手段之一
    影象分割的目標是將影象中畫素根據一定的規則分為若干(N)個cluster集合，每個集合包含一類畫素。
    根據演算法分為監督學習方法和無監督學習方法，影象分割的演算法多數都是無監督學習方法 - KMeans

距離變換常見演算法有兩種
    - 不斷膨脹/ 腐蝕得到
    - 基於倒角距離

分水嶺變換常見的演算法
    - 基於浸泡理論實現，假設顏色資料為一個個山頭，在山底不停加水，直到各大山頭之間形成了明顯的分水線

distanceTransform ( // 距離變換
    InputArray src, // 同下
    OutputArray dst, // 同下
    int distanceType, // 同下
    int maskSize, // 同下
    int dstType=CV_32F // 表示輸出影象的深度，輸出影象的通道數與輸入圖形一致
)

distanceTransform ( // 距離變換
    InputArray  src, // 輸入的影象，一般為二值影象
    OutputArray dst, // 輸出8位或者32位的浮點數，單一通道，大小與輸入影象一致
    OutputArray  labels, // 輸出 2D 的標籤(離散Voronoi(維諾)圖)，型別為 CV_32SC1 ，相同距離的算做同一個 label ，算出總共由多少個 labels
    int  distanceType, // 所用的求解距離的型別   
                                CV_DIST_L1      distance = |x1-x2| + |y1-y2| 
                                CV_DIST_L2      distance = sqrt((x1-x2)^2 + (y1-y2)^2)  歐幾里得距離
                                CV_DIST_C       distance = max(|x1-x2|, |y1-y2|)
    int maskSize, // 最新的支援5x5，推薦3x3
    int labelType=DIST_LABEL_CCOMP // Type of the label array to build, see cv::DistanceTransformLabelTypes
)

watershed ( // 分水嶺變換
    InputArray image, 
    InputOutputArray  markers
)

處理流程：
    1. 將白色背景變成黑色-目的是為後面的變換做準備
    2. 使用filter2D與拉普拉斯運算元實現影象對比度提高，sharp
    3. 轉為二值影象通過threshold
    4. 距離變換
    5. 對距離變換結果進行歸一化到[0~1]之間
    6. 使用閾值，再次二值化，得到標記(山頭)
    7. 腐蝕得到每個Peak - erode
    8. 發現輪廓 – findContours
    9. 繪製輪廓- drawContours
    10. 分水嶺變換 watershed
    11. 對每個分割區域著色輸出結果

程式碼

    #include "../common/common.hpp"

    void main(int argc, char** argv)
    {
        Mat src = imread(getCVImagesPath("images/cards.png"), IMREAD_COLOR);
        imshow("src34", src);

        for (int row = 0; row < src.rows; row++) 
        {
            for (int col = 0; col < src.cols; col++) 
            {
                if (src.at<Vec3b>(row, col) == Vec3b(255, 255, 255))  // 白色變為黑色，改變背景色
                {
                    src.at<Vec3b>(row, col)[0] = 0;
                    src.at<Vec3b>(row, col)[1] = 0;
                    src.at<Vec3b>(row, col)[2] = 0;
                }
            }
        }
        imshow("src back", src);

        // 銳化 sharpen
        Mat kernel = (Mat_<float>(3, 3) << 1, 1, 1, 1, -8, 1, 1, 1, 1);// 類似於拉普拉斯運算元
        Mat imgLaplance;
        Mat sharpenImg = src; // 拷貝建構函式
        printf("%d,%d,%d,%d\n", src.depth(), CV_32F, src.type(), CV_8UC3);// 0,5,16,16
        // 這裡計算的顏色資料有可能是負值，所以深度傳 CV_32F， 不要傳 -1，原圖的深度是 CV_8U，不能儲存負值
        filter2D(src, imgLaplance, CV_32F, kernel, Point(-1, -1), 0, BORDER_DEFAULT);
        // 1 depth=5, type=21, channels=3  即 depth=CV_32F  type=CV_32FC3
        printf("1 depth=%d, type=%d, channels=%d\n", imgLaplance.depth(), imgLaplance.type(), imgLaplance.channels());
        imshow("laplance34", imgLaplance);
        src.convertTo(sharpenImg, CV_32F); // mat.type 由 CV_8UC3 轉換為 CV_32FC3 ，為了下面的減法計算
        Mat resultImg = sharpenImg - imgLaplance;
        // mat.type 由 CV_32FC3 轉換為 CV_8UC3， 如果不轉換的話，影象感覺像失真了，同時 做閾值二值化的時候會報錯
        resultImg.convertTo(resultImg, CV_8UC3);
        imgLaplance.convertTo(imgLaplance, CV_8UC3);
        // 2 depth = 0, type = 16, channels = 3  即 depth=CV_8U  type=CV_8UC3
        printf("2 depth=%d, type=%d, channels=%d\n", imgLaplance.depth(), imgLaplance.type(), imgLaplance.channels());
        imshow("sharpen image", resultImg);

        // 轉換為灰度圖，並閾值二值化
        Mat binaryImg;
        //cvtColor(src, resultImg, CV_BGR2GRAY); // 如果以這種方式，並且腐蝕的Mat的size為13*13，發現輪廓的size為14
        //Mat k1 = Mat::ones(13, 13, CV_8UC1); // 不過相比於這種方式，把contours[][].size<=2過濾掉，影象分割會更好些
        cvtColor(resultImg, resultImg, CV_BGR2GRAY);
        imshow("resultImg gray", resultImg);
        Mat k1 = Mat::ones(3, 3, CV_8UC1); // 做腐蝕或膨脹的Mat的元素的值為1最適合? 取哪個值都不影響影象分割的結果
        threshold(resultImg, binaryImg, 40, 255, THRESH_BINARY | THRESH_OTSU);//閾值二值化，通過THRESH_OTSU產生閾值
        imshow("binary image", binaryImg); // 黑白圖

        // 距離變換
        Mat distImg; // = binaryImg;
        // 解開上句註釋，然後不做距離變換，也能得出一種影象分割的結果，誤差也不大，contours.size=17
        // 距離變換生成的輸出影象與原圖差距不大，還是隻是這裡是特例? 如果不做距離變換，後面的再次二值化也沒必要
        // 因為這裡的距離變換，讓原先的二值圖，輸出的不再是二值
        // 對於各個物件內部的畫素點會根據其離邊緣的距離不同生成顏色值，距離越遠(物件的中心點)顏色值越大
        // 這是最重要的一步，為了後面的再次二值化能夠準確尋找到山頭(也就是各物件的中心區域)
        distanceTransform(binaryImg, distImg, DIST_L1, 3, CV_32F); // CV_32F表示輸出影象的深度，通道數與輸入圖形一致
        imshow("distanceTransform34", distImg); // 與 binaryImg 影象感官上沒差別
        normalize(distImg, distImg, 0, 1, NORM_MINMAX); // 歸一化，為了下面的再次二值化，顯現影象的輪廓
        imshow("distance result", distImg);// 由於距離變化的原因，這裡影象的顏色資料，不是二值了

        // 將歸一化後的mat再次二值化，(即顏色值達到0.4的地方，表示輪廓的邊界，為發現輪廓做準備)
        threshold(distImg, distImg, 0.4, 1, THRESH_BINARY); 
        Mat cop1, cop2;
        distImg.copyTo(cop1);
        distImg.copyTo(cop2);
        // 腐蝕的size達到9，發現輪廓的數目就只有13， 9之前的輪廓數目與原圖的撲克數一致，為15
        erode(distImg, distImg, k1, Point(-1, -1)); // 腐蝕一些白點，k1元素的值為0的話，相比與1，腐蝕的部分會少一些
        imshow("distance binary erode image", distImg); // 二值圖

        // 發現輪廓
        Mat dist_8u;
        // distImg depth=5, type=5  即 CV_32F 與 CV_32FC1
        printf("distImg depth=%d, type=%d\n", distImg.depth(), distImg.type());
        distImg.convertTo(dist_8u, CV_8UC1); // 將 CV_32FC1 轉換到 CV_8UC1   因為findContours的輸入影象是8-bit
        imshow("dist_8u * 100", dist_8u * 100); // 元素值放大100倍，以便肉眼觀看
        vector<vector<Point>> contours;
        findContours(dist_8u, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE, Point(0, 0));
        printf("contours.size=%d\n", contours.size()); // contours.size=15

        // 繪製輪廓，建立標記
        RNG rng(12345);
        Mat show_contours;
        src.copyTo(show_contours);
        // 因為 dist_8u 是單通道的，所以這裡也是單通道，如果使用 CV_8UC1 ，watershed 函式會報錯
        Mat markers = Mat::zeros(src.size(), CV_32SC1); 
        for (size_t i = 0; i < contours.size(); i++) {
            if (contours[i].size() <= 2) continue; // 過濾排除點數不夠的輪廓，最終的影象分割效果更好了

            // 因為顏色傳的是 Scalar::all(i + 1) 所以 各撲克牌間灰度還是有一定差距的，但是不明顯
            // 這裡傳 Scalar::all(i + 1), -1) 最主要的是用顏色給各輪廓做一個下標
            drawContours(markers, contours, i, Scalar::all(i + 1), -1); // thickness傳 -1 表示填充輪廓

            printf("contours[%d].size=%d\n", i, contours[i].size());
            if (i == 1) // 腐蝕的Mat尺寸為3*3時，下標1的輪廓只有兩個點，在上面已排除
            {
                printf("contours[1][0].x=%d, contours[1][0].y=%d, contours[1][1].x=%d,contours[1][1].y=%d\n",
                    contours[1][0].x, contours[1][0].y, contours[1][1].x, contours[1][1].y);
                circle(show_contours, contours[1][0], 5, Scalar(0, 0, 255), -1);
                circle(show_contours, contours[1][1], 5, Scalar(0, 0, 0), -1);
            }
            Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
            drawContours(show_contours, contours, i, color, -1); // 繪製輪廓
        }
        // 建立標記，標記的位置如果在要分割的影象塊上會影響分割的結果，如果不建立，分水嶺變換會無效
        circle(markers, Point(5, 5), 3, Scalar(255, 255, 255), -1); 
        imshow("markers * 1000", markers * 1000); // 元素值放大1000倍，以便肉眼觀看
        imshow("show_contours", show_contours);

        // 分水嶺變換，將繪製的輪廓區域的顏色資料蔓延到各輪廓所在的分水嶺，這樣，影象分割已完成，後續不同著色顯示即可
        watershed(src, markers);
        // markers depth=4, type=4  即 CV_32S 與 CV_32SC1
        printf("markers depth=%d, type=%d\n", markers.depth(), markers.type());
        imshow("watershed image", markers * 1000);
        Mat mark = Mat::zeros(markers.size(), CV_8UC1); // 為了做顏色反差，所以將 CV_32SC1 轉到 CV_8UC1
        markers.convertTo(mark, CV_8UC1);
        bitwise_not(mark, mark, Mat()); // 顏色反差
        imshow("bitwise_not watershed image", mark); // 各撲克牌間灰度還是有一定差距的，但是不明顯

        // 為每個輪廓生成隨機顏色
        vector<Vec3b> colors;
        for (size_t i = 0; i < contours.size(); i++) {
            int r = theRNG().uniform(0, 255);
            int g = theRNG().uniform(0, 255);
            int b = theRNG().uniform(0, 255);
            colors.push_back(Vec3b((uchar)b, (uchar)g, (uchar)r));
        }

        // fill with color and display final result
        Mat dst = Mat::zeros(markers.size(), CV_8UC3);
        for (int row = 0; row < markers.rows; row++) {
            for (int col = 0; col < markers.cols; col++) {
                int index = markers.at<int>(row, col); // 對應上面傳的 Scalar::all(i + 1), -1)
                if (index > 0 && index <= static_cast<int>(contours.size())) { // 給各輪廓上不同色
                    dst.at<Vec3b>(row, col) = colors[index - 1]; // 因為上面傳的是 Scalar::all(i + 1), -1) 所以要減1
                }
                else {
                    dst.at<Vec3b>(row, col) = Vec3b(0, 0, 0); // 輪廓之外全部黑色
                }
            }
        }
        imshow("Final Result", dst);

        waitKey(0);
    }

效果圖

這裡寫圖片描述

OpenCV之影象處理(三十四) 基於距離變換與分水嶺的影象分割

影象分割(Image Segmentation)是影象處理最重要的處理手段之一影象分割的目標是將影象中畫素根據一定的規則分為若干(N)個cluster集合，每個集合包含一類畫素。根據演算法分為監督學習方法和無監督學習方法，影象分割的演算法多數

OpenCV影象處理教程C++（二十二）基於距離變換與分水嶺的影象分割

影象分割是影象處理最重要的處理手段之一影象分割的目標是將影象中畫素根據一定的規則分為若干個cluster集合每個集合包括一類畫素根據演算法分為監督學習和無監督學習，影象分割的演算法多數都是無監督學習-KMenas 距離變換常見演算法有兩種 - 不斷膨

OpenCv-C++-基於距離變換與分水嶺的影象分割

在這裡，先感謝賈志剛老師的教學，我今天學習了影象分水嶺分割，什麼是影象分割呢？借用賈志剛老師的課件，如下圖所示：其實大致就是將下面圖1變成圖2的樣子：圖1：圖2：或：具體操作有什麼步驟？看下圖：下面附上程式碼（具體解釋程式碼已註釋）： #include

（31）基於距離變換與分水嶺的影象分割

/* *基於距離變換與分水嶺的影象分割 *什麼是影象分割(Image Segmentation) 1：影象分割(Image Segmentation)是影象處理最重要的處理手段之一 2：影象分割的目標是將影象中畫素根據一定的規則分為若干(N)個cluster集合，

Python+OpenCV圖像處理（十四）—— 直線檢測

gap mat rgb2gray inf 單位 imshow width 結果 pre 簡介： 1.霍夫變換(Hough Transform) 霍夫變換是圖像處理中從圖像中識別幾何形狀的基本方法之一，應用很廣泛，也有很多改進算法。主要用來從圖像中分離出具有某種相同特征的幾何

Python之路(第三十四篇) 網路程式設計：驗證客戶端合法性

一、驗證客戶端合法性如果你想在分散式系統中實現一個簡單的客戶端連結認證功能，又不像SSL那麼複雜，那麼利用hmac+加鹽的方式來實現。　客戶端驗證的總的思路是將服務端隨機產生的指定位數的位元組傳送到客戶端，兩邊同時用hmac進行加密，然後對生成的密文進行比較，相同就是合法的客戶端，不相同就是不合法

opencv學習筆記三十二：Haar特徵與積分影象

一、 Haar特徵定義 Haar特徵是基於“塊”的特徵，也被稱為矩形特徵。Haar特徵（模板）分為三類：邊緣特徵、線性特徵、中心特徵和對角線特徵。特徵模板內有白色和黑色兩種矩形，並定義該模板的特徵值為白色矩形畫素和減去黑色矩形畫素和。Haar特徵值反映了影象

python+OpenCV影象處理（十二）車牌定位中對影象的形態學組合操作處理

車牌定位中對影象的形態學組合操作處理所謂的車牌定位，其中最關鍵的部分就是對圖片的處理，引數的設定，並使之擁有泛化能力。首先傳入圖片，在進行大規模的圖片處理時，因為無法確定圖片的尺寸，所以需要將原始圖片進行等比例的縮放。 orgimg = cv2.imread('ch

Python學習之旅（三十四）

Python基礎知識（33）：網路程式設計（Ⅱ） UDP程式設計相對TCP，UDP則是面向無連線的協議使用UDP協議時，不需要建立連線，只需要知道對方的IP地址和埠號，就可以直接發資料包雖然用UDP傳輸資料不可靠，但它的優點是和TCP比，速度快，對於不要求可靠到達的資料，就可以使用UDP協議

Opencv影象處理---基於距離變換和分水嶺演算法的影象分割

程式碼 #include <opencv2/opencv.hpp> #include <iostream> using namespace std; using namespace cv; int main(int, char** argv) {

python+OpenCV影象處理（十）霍夫變換簡單圖形檢測

霍夫變換霍夫變換（Hough Transform）是影象處理中從影象中識別幾何形狀的基本方法之一，應用很廣泛，也有很多改進演算法。主要用來從影象中分離出具有某種相同特徵的幾何形狀（如：直線、圓等）。最基本的霍夫變換是從黑白影象中檢測直線。霍夫變換是經典的檢測直線的演算

三十四、Linux 程序與訊號——訊號特點、訊號集和訊號遮蔽函式

34.1 訊號特點訊號的發生是隨機的，但訊號在何種條件下發生是可預測的程序槓開始啟動時，所有訊號的處理方式要麼預設，要麼忽略；忽略是 SIGUSR1 和 SIGUSR2 兩個訊號，其他都採取預設方式（大多數是終止程序）。程序在呼叫 exec 函式後，原有訊號的捕捉函式失效子程序的誕

【OpenCV學習筆記】三十七、特徵檢測與匹配(二)——SIFT特徵點匹配

特徵檢測與匹配(二)——SIFT特徵點匹配 1.SIFT特徵點提取 2.繪製特徵點 3.特徵點描述符(特徵向量)提取 4.使用暴力匹配器進行暴力匹配 5.對匹配結果進行篩選（依據DMatch結構體中的float型別變數distance進行篩選） 6.繪製匹配結果先上ppt

《數字影象處理》第4講——線性運算與空間影象增強

雖然寫這個部落格主要目的是為了給我自己做一個思路記憶錄，但是如果你恰好點了進來，那麼先對你說一聲歡迎。我並不是什麼大觸，只是一個菜菜的學生，如果您發現了什麼錯誤或者您對於某些地方有更好的意見，非常歡迎您的斧正！目錄 4.1線性系統 ❶性質 ❷線性移不變系統（時不變系統） 4.2

OpenCV探索之路（二十四）影象拼接和影象融合技術

影象拼接在實際的應用場景很廣，比如無人機航拍，遙感影象等等，影象拼接是進一步做影象理解基礎步驟，拼接效果的好壞直接影響接下來的工作，所以一個好的影象拼接演算法非常重要。再舉一個身邊的例子吧，你用你的手機對某一場景拍照，但是你沒有辦法一次將所有你要拍的景物全部拍下來，所以你

opencv學習(三十四)之重對映remap

重對映就是把一個影象中一個為之的畫素放置到另一個圖片指定位置過程。為了完成重對映過程有必要獲得一些插值作為非整數畫素座標，因為原影象與目標影象的畫素座標不是一一對應的。我們通過重對映來表達每個畫素的位置(x, y): g(x, y)=f(h(x,y)) 這裡

走入計算機的第三十四天（基於tcp和udp的套接字）

recv 設置內存 tcp list dup lis 不知道狀態一 TCP套接字 1 low版TCP套接字服務器端　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　客戶端　　　　　　2、改進版tcp套接字　　　　　　　　　　服務端　　　

javaweb(三十四)——使用JDBC處理MySQL大數據

solid 項目 class tez writer manager drive lvf lzo 一、基本概念　　大數據也稱之為LOB(Large Objects)，LOB又分為：clob和blob，clob用於存儲大文本，blob用於存儲二進制數據，例如圖像、聲音、二進

【三十四】thinkphp之curd操作

傳遞 nfa ace meta png 設置顯示 logs 對象 1.數據創建（create）接受提交過來的數據，比如表單提交的 POST（默認）數據。接受到數據後，還可以對數據進行有效的驗證、完成、生成等工作 // 這裏 create()方法就是數據創建，

易寶典文章——玩轉O365中的EXO服務之三十四實現就地保留

雲計算 Office 365 微軟郵件服務就地保留在企業商務或社會交往中，往往會遇到一些需要提供電子證據的時候。比如，涉及訴訟或法律問題時，需要企業提供相關的郵件證據等。為了確保相關敏感郵件或在商務/事務中的郵件完整，就需要事先將相關郵件完整保存號。通常，如訴訟一類的事情會在一個突然

OpenCV之影象處理(三十四) 基於距離變換與分水嶺的影象分割

程式碼

效果圖

相關推薦