时书政 火箭军工程大学士官学院
视频跟踪技术现状研究
时书政 火箭军工程大学士官学院
视频跟踪技术研究是计算机视觉、图像处理和模式识别领域里非常活跃的课题。视频跟踪的目的就是通过对摄像头获得的图像序列进行分析,计算出目标在每一帧图像上的二维位置坐标,并根据不同的特征值,将图像序列中不同帧内同一运动目标关联起来,得到各个运动目标完整的运动轨迹,也即在连续的视频序列中建立运动目标的对应关系,本文分析了常见的视频跟踪方法及其特点。目标跟踪技术的研究进行了多年,目前已经提出了许多算法。这些算法有的是针对刚性目标的跟踪、有的是针对非刚体目标的跟踪、有的是针对提高跟踪匹配的准确性而提出的,这类算法的主要特点是通过选取好的跟踪特征来提高目标的搜索匹配速度和匹配的正确程度;有的算法是针对缩小目标搜索范围提出的,这类算法主要特点是通过某种方法预测目标下一时刻可能出现的位置,通过缩小目标的搜索范围来缩短目标搜索时间。
视频 跟踪
基于模型的跟踪允许使用特定目标的外形等先验知识来构造目标初始模型,通过将运动区域和目标模型的匹配来完成目标跟踪任务。基于模型的跟踪可分为基于模型的刚体跟踪方法和基于模型的非刚体跟踪方法,在跟踪过程中两者有较大不同。对于刚性目标,由于其运动主要是平移、旋转等刚性运动,其形状保持不变,因此利用模型跟踪方法很容易实现目标的跟踪;而对于非刚体目标,由于其形状是变化的,需要不断地更新其模型,如基于模型的人体跟踪一般包括三步:第一步,模型预测,根据先验知识和历史跟踪记录,由当前帧人体模型来预测下一帧的人体模型状态;第二步,模型匹配,将预测模型投影到二维图像平面上,并与图像中的运动区域进行匹配,找出图像中与模型最相似的运动区域;第三步,模型更新,根据不同的搜索策略,找到匹配的人体状态,进而进行模型更新。
基于模型的跟踪相比其他跟踪方法具有以下三个方面的优点:1)因为有先验知识的支持,该方法具有较强的鲁棒性,能够在有干扰和遮挡的情况下得到较好的跟踪结果;2)在用于人体跟踪时,能够将人体结构、人的运动约束及其他先验知识融合使用;3)在用于三维跟踪时,只要设置好二维图像坐标与三维真实世界坐标的对应关系,校正好相机,就可以获得跟踪目标的三维状态。但是,由于基于模型的跟踪方法计算量大,运算速度慢,模型的更新较为复杂,因此该方法跟踪的实时性较差,另外,该方法还要求在跟踪前必须有相应目标的模型结构。
基于区域的跟踪方法是根据与运动目标相关的图像区域发生的变化来进行跟踪。主要根据灰度、颜色、纹理及运动等图像特征,采用运动估计技术或区域分割技术进行目标跟踪。对于非刚体目标的跟踪,一般是把非刚体目标划分为几个刚体子目标,然后分别对这些子目标进行跟踪,最后利用非刚体形成的若干准则进行将运动刚体子目标合并。基于区域的跟踪方法的优点是当目标未被遮挡时,跟踪精度非常高、跟踪也非常稳定。其缺点是:1)算法非常耗时,当搜索区域较大时情况尤为严重;2)算法要求目标变形不严重,且不能有太大遮挡,否则跟踪精度下降,甚至会造成目标的丢失;3)基于区域的跟踪方法无法适应复杂背景情形的跟踪以及多目标的跟踪。
活动轮廓(或snake模型)是一种能量最小的参数化曲线,基于活动轮廓的跟踪方法实质上就是用活动轮廓逼近物体的边缘,外部能量(外力)使活动轮廓向物体边缘运动,内部能量(内力)保持活动轮廓的光滑性和连续性,当能量最小时,活动轮廓收敛到所要跟踪的物体边缘。
由于同时考虑了几何约束条件与图像数据、轮廓形状有关的能量最小等约束条件,这种方法能减小噪声影响及边界的不规则性,所以能得到令人满意的跟踪效果,尤其是在有干扰或存在部分遮挡的情况下仍然能有效地跟踪目标。然而这种方法也存在一些不足之处,一方面由于该方法是基于梯度寻找边缘,在一定程度上受噪声的影响;另一方面跟踪结果与活动轮廓的初始位置有关,只有当活动轮廓的初始化位置比较接近运动目标时,才能够在尽可能短的时间里准确地进行目标跟踪,反之可能会导致目标的丢失。
基于特征的跟踪方法是利用目标的图像特征进行跟踪。从特征的全局性和局部性角度,基于特征的跟踪方法可分为基于全局(Global Feature-Based)特征的方法、基于局部特征(Local Feature-Based)的方法和基于独立图形(Dependence-Graph-Based)的方法;根据特征的类型来分,常见的基于特征的跟踪方法有:基于二值化图像目标的跟踪、基于边缘特征或角点特征的跟踪、基于目标灰度特征的跟踪、基于目标颜色特征的跟踪、基于目标纹理特征的跟踪、基于目标形状特征的跟踪等等。基于特征的跟踪方法的优点是:当目标未被遮挡时,跟踪精度非常高;另外利用目标的运动信息还可以跟踪存在部分遮挡的目标。其缺点是对于噪声等比较敏感;不能有效的处理全遮挡、重叠以及干扰等情况。
近年来,均值迁移(MeanShift)方法在解决计算机视觉底层过程中表现出了良好的鲁棒性和较高的处理速度,因而在计算机视觉领域得到了高度关注。尤其在目标跟踪方面,均值迁移方法的发展为同时解决目标跟踪的稳定性和实时性提供了一个有力的工具。均值迁移方法具有很高的稳定性,能够适应目标的形状、大小的连续变化,而且计算速度很快,抗干扰能力强,能够保证系统的实时和稳定性。目前已有众多关于均值迁移的文献被发表。但是任何一种方法都不是完美的,均值迁移方法的主要缺点是对初始预测位置的要求较高,如果给定的初始值不够精确,该方法将无法准确跟踪目标,甚至丢失目标。将MeanShift算法扩展到连续图像序列,就形成了CamShift算法。CamShift算法是基于连续图像颜色动态变化的概率分布的一种跟踪算法,具有鲁棒性强和实时性好等优点。