[python-opencv]模板匹配
模板匹配最適用於工業場合(在一張圖片中識別特定的工件圖)
模板匹配是一種最原始、最基本的模式識別方法,研究某一特定物件物的圖案位於影象(target)的什麼地方,進而識別物件物,這就是一個匹配問題。
它是影象處理中最基本、最常用的匹配方法。模板匹配具有自身的侷限性,主要表現在它只能進行平行移動,若原影象中的匹配目標發生旋轉或大小變化,該演算法無效。
簡單來說,模板匹配就是在整個影象區域發現與給定子影象匹配的小塊區域。
工作原理:在帶檢測影象上,從左到右,從上向下計算模板影象與重疊子影象的匹配度,匹配程度越大,兩者相同的可能性越大。
1 importcv2 as cv 2 import numpy as np 3 4 5 def matchTemplate_demo(): 6 tpl = cv.imread('1_tpl.jpg') 7 target = cv.imread('1.jpg') 8 # cv.namedWindow('matchTemplate_demo', cv.WINDOW_AUTOSIZE) 9 # cv.imshow('matchTemplate_demo',tpl) 10 # cv.namedWindow('matchTemplate_demo', cv.WINDOW_AUTOSIZE)11 cv.imshow('matchTemplate_demo', target) 12 #定義3中標準匹配方法 13 methods = [cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED] 14 tpl_h , tpl_w = tpl.shape[:2] #取模板圖片的高 寬 15 for method in methods: 16 result = cv.matchTemplate(target,tpl,method) 17 #返回的 minVal, maxVal (模板與目標圖片畫素匹配的最小值 最大值), minLoc, maxLoc(最小和最大位置)18 #打印出minVal, maxVal, minLoc, maxLoc: 0.0004309755750000477 1.0 (466, 185) (395, 327) 19 minVal, maxVal, minLoc, maxLoc = cv.minMaxLoc(result) 20 print(minVal, maxVal, minLoc, maxLoc) 21 if method == cv.TM_SQDIFF_NORMED: 22 tl = minLoc 23 else: 24 tl = maxLoc 25 # 當時用第一種cv.TM_SQDIFF_NORMED匹配方法時:br是矩形左上角的座標 26 # 當時用第二種cv.TM_CCORR_NORMED第三種cv.TM_CCOEFF_NORMED匹配方法時:br是矩形左上角的座標 27 print(tl) 28 br = (tl[0]+tpl_w,tl[1]+tpl_h) 29 #在target圖片上繪製tl+br矩形,紅色,線寬2 30 cv.rectangle(target,tl,br,(0,0,255),2) 31 cv.namedWindow('match-'+np.str(method),cv.WINDOW_NORMAL) 32 cv.imshow('match-'+np.str(method),target) 33 34 35 matchTemplate_demo() 36 37 cv.waitKey(0) 38 cv.destroyAllWindows()
知識點:
1.幾種常見的模板匹配演算法:
其中,
①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是標準平方差匹配。利用平方差來進行匹配,最好匹配為0,匹配越差,匹配值越大。
②TM_CCORR是相關性匹配;TM_CCORR_NORMED是標準相關性匹配。採用模板和影象間的乘法操作,數越大表示匹配程度較高, 0表示最壞的匹配效果。
③TM_CCOEFF是相關性係數匹配;TM_CCOEFF_NORMED是標準相關性係數匹配。將模版對其均值的相對值與影象對其均值的相關值進行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示沒有任何相關性(隨機序列)。
總結:隨著從簡單的測量(平方差)到更復雜的測量(相關係數),我們可獲得越來越準確的匹配(同時也意味著越來越大的計算代價)。
參考:
https://blog.csdn.net/guduruyu/article/details/69231259
注意:
參考的第一篇部落格的關於模板匹配演算法的原理模板影象應該是左上角開始,而不是從中心點開始。在左上角那個點開始計算匹配度,最後得出的最匹配的座標點是模板影象左上角的位置。
2.opencv的目標匹配函式為matchTemplate,函式原型為:matchTemplate(image, templ, method[, result[, mask]]) -> result
image引數表示待搜尋源影象(目標),必須是8位整數或32位浮點。
templ引數表示模板影象,必須不大於源影象並具有相同的資料型別。
method引數表示計算匹配程度的方法。
result引數表示匹配結果影象,必須是單通道32位浮點。如果image的尺寸為W x H,templ的尺寸為w x h,則result的尺寸為(W-w+1)x(H-h+1)。
3.opencv的函式minMaxLoc:在給定的矩陣中尋找最大和最小值,並給出它們的位置。 該功能不適用於多通道陣列。 如果您需要在所有通道中查詢最小或最大元素,要先將陣列重新解釋為單通道。
函式minMaxLoc原型為:minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
src引數 表示輸入單通道影象。
mask引數 表示用於選擇子陣列的可選掩碼。
minVal引數 表示返回的最小值,如果不需要,則使用NULL。
maxVal引數 表示返回的最大值,如果不需要,則使用NULL。
minLoc引數 表示返回的最小位置的指標(在2D情況下); 如果不需要,則使用NULL。
maxLoc引數 表示返回的最大位置的指標(在2D情況下); 如果不需要,則使用NULL。
參考:https://blog.csdn.net/liuqz2009/article/details/60869427
4.opencv的函式rectangle用於繪製矩形。函式原型為: rectangle(img, pt1, pt2, color[, thickness[, lineType[, shift]]]) -> img
img引數 表示源影象。
pt1引數 表示矩形的一個頂點。
pt2引數 表示與pt1相對的對角線上的另一個頂點 。
color引數 表示矩形線條顏色 (RGB) 或亮度(灰度影象 )。
thickness引數 表示組成矩形的線條的粗細程度。取負值時(如 CV_FILLED)函式繪製填充了色彩的矩形。
lineType引數 表示線條的型別。
shift引數 表示座標點的小數點位數。