opencv python 光流法
光流法
光流是由对象或相机的移动引起的两个连续帧之间的图像对象的明显运动的模式.它是2D矢量场,其中每个矢量是位移矢量,表示从第一帧到第二帧的点的移动.
上图表示的是一个球在连续的5帧图像中的运动,箭头显示其位移矢量.
光流法原理的基础:
- 目标像素强度在连续帧之间不变
- 相邻像素具有相似的运动
第一帧的像素I(x,y,t),在dt时间之后的下一帧中移动距离(dx,dy),因为这些像素是相同的,而且亮度不变,所以:
$$I(x,y,t) = I(x+dx, y+dy, t+dt)$$
然后采用右侧的泰勒级数展开,删除常用项并除以dt得到:
$$I(x,y,t) = I(x+dx, y+dy, t+dt)$$
在这里:
$$f_x = \frac{\partial f}{\partial x} \; ; \; f_y = \frac{\partial f}{\partial y}$$
$$u = \frac{dx}{dt} \; ; \; v = \frac{dy}{dt}$$
上述方程称为光流方程.在其中,我们可以找到fx和fy,它们是图像渐变. 类似地,ft是沿时间的梯度,(u,v) 未知,我们无法用两个未知变量来解决这个方程.因此提供了几种方法来解决这个问题,其中一种方法是Lucas-Kanade.
Lucas-Kanade
我们之前已经看到一个假设,即所有相邻像素将具有相似的运动.Lucas-Kanade方法需要窗口大小,所有9个点都有相同的动作,我们可以找到这9个点的(f x,f y,f t). 所以现在我们的问题变成解决了9个方程式,其中两个未知变量是过度确定的.解的个数大于未知数的个数,这是个超定方程,使用最小二乘的方法来求解最优值.
$$\begin{bmatrix} u \\ v \end{bmatrix} = \begin{bmatrix} \sum_{i}{f_{x_i}}^2 & \sum_{i}{f_{x_i} f_{y_i} } \\ \sum_{i}{f_{x_i} f_{y_i}} & \sum_{i}{f_{y_i}}^2 \end{bmatrix}^{-1} \begin{bmatrix} - \sum_{i}{f_{x_i} f_{t_i}} \\ - \sum_{i}{f_{y_i} f_{t_i}} \end{bmatrix}$$
所以从用户的角度来看,想法很简单,给出一些跟踪点,从而那些点的光流向量,但是到现在为止,我们只处理了小动议,所以当有大的运动时它会失败.
使用的解决办法是利用图像金字塔,在金字塔顶端的小尺寸图片当中,大幅度的运动就变成了小幅度的运动, 因此,在那里应用Lucas-Kanade,可以得到尺度空间上的光流.
Lucas-Kanade Optical Flow in OpenCV
import numpy as np import cv2 import matplotlib.pyplot as plt cap = cv2.VideoCapture('test.mp4') # params for ShiTomasi corner detection feature_params = dict( maxCorners = 100, qualityLevel = 0.3, minDistance = 7, blockSize = 7 ) # Parameters for lucas kanade optical flow lk_params = dict( winSize = (15,15), maxLevel = 2, criteria = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03)) # Create some random colors color = np.random.randint(0,255,(100,3)) # Take first frame and find corners in it ret, old_frame = cap.read() old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY) p0 = cv2.goodFeaturesToTrack(old_gray, mask = None, **feature_params) # Create a mask image for drawing purposes mask = np.zeros_like(old_frame) while(1): ret,frame = cap.read() frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # calculate optical flow p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params) # Select good points good_new = p1[st==1] good_old = p0[st==1] # draw the tracks for i,(new,old) in enumerate(zip(good_new,good_old)): a,b = new.ravel() c,d = old.ravel() mask = cv2.line(mask, (a,b),(c,d), color[i].tolist(), 2) frame = cv2.circle(frame,(a,b),5,color[i].tolist(),-1) img = cv2.add(frame,mask) cv2.imshow('frame',img) k = cv2.waitKey(30) & 0xff if k == 27: break # Now update the previous frame and previous points old_gray = frame_gray.copy() p0 = good_new.reshape(-1,1,2) cv2.destroyAllWindows() cap.release()
Dense Optical Flow in OpenCV
Lucas-Kanade方法计算稀疏特征集的光流(在我们的例子中,使用Shi-Tomasi算法检测到的角)。 OpenCV提供了另一种算法来查找密集的光流。 它计算帧中所有点的光流。 它基于Gunner Farneback的算法,该算法在Gunner Farneback于2003年的“Two-Frame Motion Estimation Based on Polynomial Expansion”中进行了解释.
import numpy as np import cv2 import matplotlib.pyplot as plt cap = cv2.VideoCapture('test.mp4') ret, frame1 = cap.read() prvs = cv2.cvtColor(frame1,cv2.COLOR_BGR2GRAY) hsv = np.zeros_like(frame1) hsv[...,1] = 255 while(1): ret, frame2 = cap.read() next = cv2.cvtColor(frame2,cv2.COLOR_BGR2GRAY) flow = cv2.calcOpticalFlowFarneback(prvs,next, None, 0.5, 3, 15, 3, 5, 1.2, 0) mag, ang = cv2.cartToPolar(flow[...,0], flow[...,1]) hsv[...,0] = ang*180/np.pi/2 hsv[...,2] = cv2.normalize(mag,None,0,255,cv2.NORM_MINMAX) bgr = cv2.cvtColor(hsv,cv2.COLOR_HSV2BGR) cv2.imshow('frame2',bgr) k = cv2.waitKey(30) & 0xff if k == 27: break elif k == ord('s'): cv2.imwrite('opticalfb.png',frame2) cv2.imwrite('opticalhsv.png',bgr) prvs = next cap.release() cv2.destroyAllWindows()