opencv3/Python 稠密光流calcOpticalFlowFarneback詳解
光流是由物體或相機的運動引起的影象物件在兩個連續幀之間的視在運動模式.光流方法計算在t和 t+Δtt+Δt時刻拍攝的兩個影象幀之間的每個畫素的運動位置。這些方法被稱為差分,因為它們基於影象訊號的區域性泰勒級數近似; 也就是說,它們使用關於空間和時間座標的偏導數。
和稀疏光流相比,稠密光流不僅僅是選取影象中的某些特徵點(一般用角點)進行計算;而是對影象進行逐點匹配,計算所有點的偏移量,得到光流場,從而進行配準.因此其計算量會顯著大於稀疏光流,但效果一般優於稀疏光流.
函式:
def calcOpticalFlowFarneback(prev,next,flow,pyr_scale,levels,winsize,iterations,poly_n,poly_sigma,flags):
使用Gunnar Farneback演算法計算密集光流。
相關引數:
prev 輸入前一幀影象(8位單通道);
next 輸入後一幀影象(與prev大小和型別相同);
flow 計算的流量影象具有與prev相同的大小併為CV_32FC2型別;
pyr_scale 指定影象比例(\ <1)為每個影象構建金字塔; pyr_scale = 0.5意味著一個古典金字塔,其中每個下一層比前一層小兩倍。
levels 金字塔層數包括初始影象; levels = 1意味著不會建立額外的圖層,只會使用原始影象。
winsize 平均視窗大小;較大的值會增加演算法對影象噪聲的魯棒性,並可以檢測更快速的運動,但會產生更模糊的運動場。
iterations 每個金字塔等級上執行迭代演算法的迭代次數。用於在每個畫素中查詢多項式展開的畫素鄰域;
poly_n大小;較大的值意味著影象將近似於更光滑的表面,產生更穩健的演算法和更模糊的運動場,一般取poly_n = 5或7。
poly_sigma用於平滑導數的高斯的標準偏差,用作多項式展開的基礎;對於poly_n = 5,可以設定poly_sigma = 1.1,對於poly_n = 7,可以設定poly_sigma = 1.5;
flags 操作標誌,可取計算方法有:
OPTFLOW_USE_INITIAL_FLOW 使用輸入流作為初始流近似。
OPTFLOW_FARNEBACK_GAUSSIAN 使用Gaussian winsize×winsizewinsize×winsize過濾器代替光流估計的相同大小的盒子過濾器;通常情況下,這個選項可以比使用箱式過濾器提供更精確的流量,代價是速度更低;通常,應將高斯視窗的勝利設定為更大的值以實現相同的穩健性水平。
示例:
#!/usr/bin/python # coding:utf8 import numpy as np import cv2 step=10 if __name__ == '__main__': cam = cv2.VideoCapture(0) ret,prev = cam.read() prevgray = cv2.cvtColor(prev,cv2.COLOR_BGR2GRAY) while True: ret,img = cam.read() gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) # 使用Gunnar Farneback演算法計算密集光流 flow = cv2.calcOpticalFlowFarneback(prevgray,gray,None,0.5,3,15,5,1.2,0) prevgray = gray # 繪製線 h,w = gray.shape[:2] y,x = np.mgrid[step / 2:h:step,step / 2:w:step].reshape(2,-1).astype(int) fx,fy = flow[y,x].T lines = np.vstack([x,y,x + fx,y + fy]).T.reshape(-1,2,2) lines = np.int32(lines) line = [] for l in lines: if l[0][0]-l[1][0]>3 or l[0][1]-l[1][1]>3: line.append(l) cv2.polylines(img,line,(0,255,255)) cv2.imshow('flow',img) ch = cv2.waitKey(5) if ch == 27: break cv2.destroyAllWindows()
以上這篇opencv3/Python 稠密光流calcOpticalFlowFarneback詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。