直播被禁、視訊被刪是何人所為?python與OpenCV對視訊實時監測!
這篇博文的目的是應用計算機視覺和影象處理技術,展示一個條形碼檢測的基本實現。我所實現的演算法本質上基於StackOverflow 上的這個問題,瀏覽程式碼之後,我提供了一些對原始演算法的更新和改進。
學習Python中有不明白推薦加入交流群
號:960410445
群裡有志同道合的小夥伴,互幫互助,
群裡有不錯的視訊學習教程和PDF!
首先需要留意的是,這個演算法並不是對所有條形碼有效,但會給你基本的關於應用什麼型別的技術的直覺。
假設我們要檢測下圖中的條形碼:
圖1:包含條形碼的示例圖片
現在讓我們開始寫點程式碼,新建一個檔案,命名為detect_barcode.py,開啟並編碼:
Python
1 # import the necessary packages 2 import numpy as np 3 import argparse 4 import cv2 5 6 # construct the argument parse and parse the arguments 7 ap = argparse.ArgumentParser() 8 ap.add_argument("-i", "--image", required = True, help = "path to the image file") 9 args = vars(ap.parse_args())
我們首先做的是匯入所需的軟體包,我們將使用NumPy做數值計算,argparse用來解析命令列引數,cv2是OpenCV的繫結。
然後我們設定命令列引數,我們這裡需要一個簡單的選擇,–image是指包含條形碼的待檢測影象檔案的路徑。
現在開始真正的影象處理:
Python
11 # load the image and convert it to grayscale 12 image = cv2.imread(args["image"]) 13 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 14 15 # compute the Scharr gradient magnitude representation of the images 16 # in both the x and y direction 17 gradX = cv2.Sobel(gray, ddepth = cv2.cv.CV_32F, dx = 1, dy = 0, ksize = -1) 18 gradY = cv2.Sobel(gray, ddepth = cv2.cv.CV_32F, dx = 0, dy = 1, ksize = -1) 19 20 # subtract the y-gradient from the x-gradient 21 gradient = cv2.subtract(gradX, gradY) 22 gradient = cv2.convertScaleAbs(gradient) 12~13行:從磁碟載入影象並轉換為灰度圖。 17~18行:使用Scharr操作(指定使用ksize = -1)構造灰度圖在水平和豎直方向上的梯度幅值表示。 21~22行:Scharr操作之後,我們從x-gradient中減去y-gradient,通過這一步減法操作,最終得到包含高水平梯度和低豎直梯度的影象區域。
上面的gradient表示的原始影象看起來是這樣的:
圖:2:條形碼影象的梯度表示
注意條形碼區域是怎樣通過梯度操作檢測出來的。下一步將通過去噪僅關注條形碼區域。
Python
24 # blur and threshold the image 25 blurred = cv2.blur(gradient, (9, 9)) 26 (_, thresh) = cv2.threshold(blurred, 225, 255, cv2.THRESH_BINARY) 25行:我們要做的第一件事是使用9*9的核心對梯度圖進行平均模糊,這將有助於平滑梯度表徵的圖形中的高頻噪聲。 26行:然後我們將模糊化後的圖形進行二值化,梯度圖中任何小於等於255的畫素設為0(黑色),其餘設為255(白色)。
模糊並二值化後的輸出看起來是這個樣子:
圖3:二值化梯度圖以此獲得長方形條形碼區域的粗略近似
然而,如你所見,在上面的二值化影象中,條形碼的豎槓之間存在縫隙,為了消除這些縫隙,並使我們的演算法更容易檢測到條形碼中的“斑點”狀區域,我們需要進行一些基本的形態學操作:
Python
28 # construct a closing kernel and apply it to the thresholded image 29 kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (21, 7)) 30 closed = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel)
29行:我們首先使用cv2.getStructuringElement構造一個長方形核心。這個核心的寬度大於長度,因此我們可以消除條形碼中垂直條之間的縫隙。
30行:這裡進行形態學操作,將上一步得到的核心應用到我們的二值圖中,以此來消除豎槓間的縫隙。
現在,你可以看到這些縫隙相比上面的二值化影象基本已經消除:
圖4:使用形態學中的閉運算消除條形碼豎條之間的縫隙
當然,現在影象中還有一些小斑點,不屬於真正條形碼的一部分,但是可能影響我們的輪廓檢測。
讓我們來消除這些小斑點:
Python
32 # perform a series of erosions and dilations 33 closed = cv2.erode(closed, None, iterations = 4) 34 closed = cv2.dilate(closed, None, iterations = 4)
我們這裡所做的是首先進行4次腐蝕(erosion),然後進行4次膨脹(dilation)。腐蝕操作將會腐蝕影象中白色畫素,以此來消除小斑點,而膨脹操作將使剩餘的白色畫素擴張並重新增長回去。
如果小斑點在腐蝕操作中被移除,那麼在膨脹操作中就不會再出現。
經過我們這一系列的腐蝕和膨脹操作,可以看到我們已經成功地移除小斑點並得到條形碼區域。
圖5:應用一系列的腐蝕和膨脹來移除不相關的小斑點
最後,讓我們找到影象中條形碼的輪廓:
Python
36 # find the contours in the thresholded image, then sort the contours 37 # by their area, keeping only the largest one 38 (cnts, _) = cv2.findContours(closed.copy(), cv2.RETR_EXTERNAL, 39 cv2.CHAIN_APPROX_SIMPLE) 40 c = sorted(cnts, key = cv2.contourArea, reverse = True)[0] 41 42 # compute the rotated bounding box of the largest contour 43 rect = cv2.minAreaRect(c) 44 box = np.int0(cv2.cv.BoxPoints(rect)) 45 46 # draw a bounding box arounded the detected barcode and display the 47 # image 48 cv2.drawContours(image, [box], -1, (0, 255, 0), 3) 49 cv2.imshow("Image", image) 50 cv2.waitKey(0)
38~40行:幸運的是這一部分比較容易,我們簡單地找到影象中的最大輪廓,如果我們正確完成了影象處理步驟,這裡應該對應於條形碼區域。
43~44行:然後我們為最大輪廓確定最小邊框
48~50行:最後顯示檢測到的條形碼
正如你在下面的圖片中所見,我們已經成功檢測到了條形碼:
圖6:成功檢測到示例影象中的條形碼
下一部分,我們將嘗試更多影象。
成功的條形碼檢測
要跟隨這些結果,請使用文章下面的表單去下載本文的原始碼以及隨帶的圖片。
一旦有了程式碼和影象,開啟一個終端來執行下面的命令:
Python
$ python detect_barcode.py --image images/barcode_02.jpg
圖7:使用OpenCV檢測影象中的一個條形碼
檢測椰油瓶子上的條形碼沒有問題。
讓我們試下另外一張圖片:
$ python detect_barcode.py --image images/barcode_03.jpg
圖8:使用計算機視覺檢測影象中的一個條形碼
我們同樣能夠在上面的圖片中找到條形碼。
關於食品的條形碼檢測已經足夠了,書本上的條形碼怎麼樣呢:
Python
$ python detect_barcode.py --image images/barcode_04.jpg
圖9:使用Python和OpenCV檢測書本上的條形碼
沒問題,再次通過。
那包裹上的跟蹤碼呢?
Python
$ python detect_barcode.py --image images/barcode_05.jpg
圖10:使用計算機視覺和影象處理檢測包裹上的條形碼
我們的演算法再次成功檢測到條形碼。
最後,我們再嘗試一張圖片,這個是我最愛的義大利麵醬—饒氏自制伏特加醬(Rao’s Homemade Vodka Sauce):
Python
$ python detect_barcode.py --image images/barcode_06.jpg
圖11:使用Python和Opencv很容易檢測條形碼
我們的演算法又一次檢測到條形碼!
總結
這篇博文中,我們回顧了使用計算機視覺技術檢測影象中條形碼的必要步驟,使用Python程式語言和OpenCV庫實現了我們的演算法。
演算法概要如下:
- 計算x方向和y方向上的Scharr梯度幅值表示
- 將x-gradient減去y-gradient來顯示條形碼區域
- 模糊並二值化影象
- 對二值化影象應用閉運算核心
- 進行系列的腐蝕、膨脹
- 找到影象中的最大輪廓,大概便是條形碼
需要注意的是,該方法做了關於影象梯度表示的假設,因此只對水平條形碼有效。
如果你想實現一個更加魯棒的條形碼檢測演算法,你需要考慮影象的方向,或者更好的,應用機器學習技術如Haar級聯或者HOG + Linear SVM去掃描影象條形碼區域。
原始碼下載:http://pan.baidu.com/s/1jGMfcBs