OpenCV模板匹配matchTemplate的實現
作用有侷限性,必須在指定的環境下,才能匹配成功,是受到很多因素的影響,所以有一定的適應性
模板匹配是一種最原始、最基本的模式識別方法,研究某一特定物件物的圖案位於影象的什麼地方,進而識別物件物,這就是一個匹配問題。
它是影象處理中最基本、最常用的匹配方法。
模板匹配具有自身的侷限性,主要表現在它只能進行平行移動,若原影象中的匹配目標發生旋轉或大小變化,該演算法無效。
模板匹配就是在整個影象區域發現與給定子影象匹配的小塊區域[/code]
工作原理:在待檢測影象上,從左到右,從上向下計算模板影象與重疊子影象的匹配度,匹配程度越大,兩者相同的可能性越大。
程式碼實現:
import cv2 as cv import numpy as np def template_demo(): tpl = cv.imread("./temp.png") target = cv.imread("./1.png") cv.imshow("template image",tpl) cv.imshow("target image",target) methods = [cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED] #各種匹配演算法 th,tw = tpl.shape[:2] #獲取模板影象的高寬 for md in methods: result = cv.matchTemplate(target,tpl,md) # result是我們各種演算法下匹配後的影象 # cv.imshow("%s"%md,result) #獲取的是每種公式中計算出來的值,每個畫素點都對應一個值 min_val,max_val,min_loc,max_loc = cv.minMaxLoc(result) if md == cv.TM_SQDIFF_NORMED: tl = min_loc #tl是左上角點 else: tl = max_loc br = (tl[0]+tw,tl[1]+th) #右下點 cv.rectangle(target,tl,br,(0,255),2) #畫矩形 cv.imshow("match-%s"%md,target) src = cv.imread("./1.png") #讀取圖片 cv.namedWindow("input image",cv.WINDOW_AUTOSIZE) #建立GUI視窗,形式為自適應 cv.imshow("input image",src) #通過名字將影象和視窗聯絡 template_demo() cv.waitKey(0) #等待使用者操作,裡面等待引數是毫秒,我們填寫0,代表是永遠,等待使用者操作 cv.destroyAllWindows() #銷燬所有視窗
補充:
1.幾種常見的模板匹配演算法
①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是標準平方差匹配。利用平方差來進行匹配,最好匹配為0.匹配越差,匹配值越大。
②TM_CCORR是相關性匹配;TM_CCORR_NORMED是標準相關性匹配。採用模板和影象間的乘法操作,數越大表示匹配程度較高,0表示最壞的匹配效果。
③TM_CCOEFF是相關性係數匹配;TM_CCOEFF_NORMED是標準相關性係數匹配。將模版對其均值的相對值與影象對其均值的相關值進行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示沒有任何相關性(隨機序列)。
總結:隨著從簡單的測量(平方差)到更復雜的測量(相關係數),我們可獲得越來越準確的匹配(同時也意味著越來越大的計算代價)。
相關性是越接近1越大越好
平方差是越小越好
所以TM_SQDIFF在使用時和其他的是有所區別的
2.result = cv.matchTemplate(target,md)
opencv的目標匹配函式為matchTemplate,函式原型為:matchTemplate(image,templ,method[,result[,mask]]) -> result
image引數表示待搜尋源影象,必須是8位整數或32位浮點。
templ引數表示模板影象,必須不大於源影象並具有相同的資料型別。
method引數表示計算匹配程度的方法。
result引數表示匹配結果影象,必須是單通道32位浮點。如果image的尺寸為W x H,templ的尺寸為w x h,則result的尺寸為(W-w+1)x(H-h+1)。
其中result是模板影象去匹配的區域位置影象[/code]
3.min_val,max_loc = cv.minMaxLoc(result)
opencv的函式minMaxLoc:在給定的矩陣中尋找最大和最小值,並給出它們的位置。 該功能不適用於多通道陣列。 如果您需要在所有通道中查詢最小或最大元素,要先將陣列重新解釋為單通道。
函式minMaxLoc原型為:minMaxLoc(src[,mask]) -> minVal,maxVal,minLoc,maxLoc
src引數表示輸入單通道影象。
mask引數表示用於選擇子陣列的可選掩碼。
minVal引數表示返回的最小值,如果不需要,則使用NULL。
maxVal引數表示返回的最大值,如果不需要,則使用NULL。
minLoc引數表示返回的最小位置的指標(在2D情況下); 如果不需要,則使用NULL。
maxLoc引數表示返回的最大位置的指標(在2D情況下); 如果不需要,則使用NULL。
結合每種匹配演算法,我們看看獲取的數值
result = cv.matchTemplate(target,md) #獲取的是每種公式中計算出來的值,每個畫素點都對應一個值 min_val,max_loc = cv.minMaxLoc(result) print("--------------%s--------------"%md) print("min_val",min_val) print("max_val",max_val) print("min_loc",min_loc) print("max_loc",max_loc) print("--------------%s--------------" % md)
--------------1-------------- #TM_SQDIFF_NORMED標準平方差匹配 min_val 0.0 #標準差是越小為0代表匹配上了 max_val 0.22279763221740723 min_loc (108,248) max_loc (3,480) --------------1-------------- --------------3-------------- #TM_CCORR_NORMED標準相關性匹配 min_val 0.9228140115737915 max_val 1.0 #相關性是越接近1代表匹配上了 min_loc (9,378) max_loc (108,248) --------------3-------------- --------------5-------------- #TM_CCOEFF_NORMED標準相關性係數匹配 min_val -0.10706906020641327 max_val 1.0 #相關性越接近1越好 min_loc (186,248) max_loc (108,248) --------------5--------------
檢視min_loc和max_loc關係
cv.line(target,max_loc,255,2)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。