运动图像关键帧快速跟踪系统的优化设计

2021-02-02 00:59聂上伟
现代电子技术 2021年3期
关键词:关键帧交叉聚类

聂上伟

(成都中医药大学,四川 成都 611137)

0 引 言

伴随着信息技术的发展,视频数据的发布及传输普及,使视频数据的有效管理、识别变得困难,而传统的人工运动图像检索方式既费时又耗力[1]。关键帧跟踪技术可通过特定方式提取到一帧或多帧图像来体现整个运动图像的核心内容,去除运动图像冗余信息的同时,留存运动图像关键部分,运动图像关键帧的精准跟踪可极大程度地缩减运动目标运动行为分析的计算量,对后续运动图像进一步应用奠定基础[2-4]。

为此本文优化设计一种运动图像关键帧快速跟踪系统,并通过实验验证其设计的有效性。

1 运动图像关键帧快速跟踪系统

1.1 系统原理

优化设计的运动图像关键帧快速跟踪系统主要由执行模块、检测模块、控制模块以及摄像机等部分构成,如图1 所示。

图1 系统原理图

系统利用安装于执行模块的摄像机采集运动目标视频图像,通过检测模块对所获取运动视频图像实施分析、处理,得到运动图像特征,构建运动目标的图像模板,采用基于自适应无监督聚类融合交叉熵的运动图像关键帧跟踪算法,获取运动视频中后续运动图像关键帧,定位运动目标[5-6],同时将跟踪控制指令反馈到执行模块,通过跟踪运动图像关键帧实现运动目标自动跟踪识别。

1.1.1 检测模块设计

系统检测模块用于实现运动目标图像的检测工作,增强运动图像关键帧跟踪能力。该模块主要包括摄像机和PC 机,摄像机通过USB 将采集到的运动目标图像传输至PC 机,经由PC 机中的基于自适应无监督聚类融合交叉熵的运动图像关键帧跟踪算法,跟踪运动图像关键帧,实现运动目标位置实时获取[7]。

系统检测模块的PC 机选用Celeron CPU 1.75 GHz的PC 机,内存大小为256 MB。PC 机中的视频采集模块利用CCD 摄像机采集模拟视频信号,经视频同轴电缆传输至PC 机视频采集卡上,再经由高速A/D 将模拟视频信号转换成数字视频序列,将数字视频序列提供给基于自适应无监督聚类融合交叉熵的运动图像关键帧跟踪算法,实现运动目标跟踪检测。视频采集卡工作示意图如图2 所示。

图2 视频采集卡工作示意图

1.1.2 控制模块设计

控制模块是系统的核心模块,由下位机控制电路和PC 机组成,其中PC 机将所得运动目标图像数据经控制算法处理完成后,采用RS 236 串行接口输送至下位机控制电路展开控制,以保证单片机可以根据所获控制信号,控制直流电动机实施横纵方向的运动[8]。控制模块下位机中的单片机,遵循安装于控制信号管理通道模拟开关中大小适应的电阻,调控降压稳压器输出的电压,有效整改直流电动机转速。其中单片机型号为AT89C2051,是系统控制电路核心部分,可总体协调控制系统其他模块,单片机设计电路如图3 所示。若单片机电路中的两个限位保护开关处于高电平状态下,单片机会与所对应的直流电动机继电器断开,停止电动机运转,反之,电动机正常运转。

图3 单片机设计电路

1.2 基于自适应无监督聚类融合交叉熵的运动图像关键帧跟踪算法

自适应无监督聚类算法可以弥补传统K-均值聚类算法仅可获取固定目标关键帧以及人为设定聚类中心和数目的缺点,依据不同复杂程度视频得到符合各自所需数量的运动图像关键帧[9]。在此基础上,引入交叉熵,便可更加精准地反映运动图像在视觉上所展现的内容。为此,该算法可以跟踪到场景各异目标图像的对应数量关键帧,清晰、准确反映视频中运动目标图像。算法流程图如图4 所示。

1.2.1 运动目标检测

分离运动图像中的序列变更区域是完成运动目标检测的最终目标[10]。采用背景差分法获取实时图像与背景估计图像,对比插值和阈值,评判运动像素点所属运动区域,生成对应二值图像:

式中T 表示阈值。

若HG(x,y)=1,表示该像素点为运动状态;若HG(x,y)=0,则表示该像素点为背景像素点。系统可以依照检测到的视频场景中背景像素点的改变情况,实时、自动对背景进行更新处理。

如果HG(x,y)=1,即有:

如果HG(x,y)=0,即有:

式中:ρ 表示学习率,可以判断实时图像对背景图像的干扰情况,存在ρ+µ=1。这种选择性更新方法可以在有效确保背景尽快适应视频场景变化的基础上,防止运动像素污染背景。

图4 运动图像关键帧跟踪算法流程图

1.2.2 无监督聚类算法

运动目标检测完成后,按照相似距离进行聚类。无监督聚类算法是凭借元素间内在属性相似程度展开聚类,无需预先构建模型分类,也不必依托特性分类体系,便可进行未知类划分[11-12]。因此,为实现新视频帧到簇的划分,采用欧氏距离计算帧与簇中心的相似度,若相似度大于阈值T,表明该帧与该簇相似程度低,无法划分到该簇中。无监督聚类算法计算流程如下:

1)初始化。将取得的第一帧r1当成φ1的聚类中心并划分到簇φ1中,簇数量Nc为1;

2)继续取得下一帧ri,如果不存在下一帧,跳转步骤6);

3)计 算 ri和 簇 φk(k=1,2,…,Nc) 间 欧 氏 距离Dis(ri,φk);

4)通过Mindis=min Dis(ri,φk)(k=1,2,…,Nc)评判与帧ri最相似的簇。若Mindis >T,表明帧ri与所有簇均不相似,此时跳转步骤5);反之,划分帧ri到含Mindis值的簇中;

5)依据Nc=Nc+1 组成全新簇,并将帧ri划分到φNc中;

由于聚类算法是通过阈值T 控制聚类数目,阈值T越小,聚类数目越多,会导致所跟踪到的运动图像关键帧过多;若阈值过大,跟踪到的关键帧便不可作为运动图像的主要内容,而不同类型视频的运动图像关键帧跟踪所需阈值也有所差异[13-14]。因此阈值T 的设定对运动图像关键帧跟踪十分重要。通过自动阈值计算确定聚类算法阈值,计算公式如下:

式中:N 表示视频总帧数;常数C =0.1。阈值自动选取可解决视频运动量较少,图像关键帧跟踪时产生的冗余现象。

1.2.3 融合交叉熵的关键帧跟踪

利用自适应无监督聚类算法完成聚类后,由相似运动图像形成的视频子镜头中跟踪关键帧便可有效识别运动目标[15]。交叉熵可表达概率分布的区别,针对A={a1,a2,…,aN}和B={b1,b2,…,bN}间概率分布差异,定义交叉熵如下:

式(5)显示,交叉熵值恒大于0。为解决ai=0,bi=0时交叉熵难以计算的现象,重新定义式(5):

其中:

式中前两项用于保证交叉熵中所有项不小于0。帧间运动图像的交叉熵差异度序列D={d1,d2,…,dk-1}可通过交叉熵计算实现,其中,di为处于第i 帧和i+1 帧间的交叉熵,k 表示运动图像的帧数目。交叉熵用于体现帧间运动图像差异度,图像帧间交叉熵越大越能展现视频运动图像核心部分,因此将序列的第j 帧及j+1 帧选作待选关键帧,j=arg maix {di},依据式(8)计算待选关键帧所对应图像熵:

式中yk用于描述运动图像r中k 个灰度值的概率分布。

依照图像熵值,选取熵值最大的图像为系统最后跟踪到的运动图像关键帧。

2 实验结果与分析

实验环境配置为IntelⓇCoreTMi5-4780 处理器CPU@3.5 GHz,内存大小为8 GB。选取超过300 个视频片段展开大量关键帧跟踪,其中视频类型广泛,包含新闻、动漫、电影、广告、体育等多个种类。选用SVM、镜头属性的关键帧提取系统为对比系统,以动漫电影《哪吒之魔童降世》视频片段为例,实施运动图像关键帧快速跟踪,对比系统跟踪性能。三种系统对视频片段的关键帧跟踪结果如图5 所示。

对比图5 可知:SVM 系统所跟踪到的关键帧效果较差,不能准确描述视频片段关键信息;镜头属性的系统尽管提取跟踪到的信息可良好描述视频,但每个镜头只能跟踪到一个关键帧,造成部分有代表性关键帧的丢失,难以全面表征视频片段内容;而本文系统不仅跟踪到的关键帧数量较多且帧间图像差异较大,可以充分展现视频片段信息。因此本文系统的运动图像关键帧跟踪更具有代表性,且全面性高,系统关键帧跟踪效果最好。

为进一步验证本文系统跟踪性能,选用具有代表性的car1-1、单人boxing、电视剧三种类型运动图像为实验对象。其中,car1-1 运动图像可以展现出运动图像在摄像机内发生缓慢变化时的跟踪性能;单人boxing 运动图像反映运动图像产生重复运动时的跟踪性能;电视剧用户展现系统自适应选择关键帧数量的能力。通过引入运动图像关键帧跟踪的漏选数、冗余数以及错选数,外加准确率和查全率为运动图像关键帧跟踪衡量标准。其中,漏选数用于描述运动图像关键帧跟踪过程中,未被跟踪到的具有代表性的关键帧;冗余数用于描述跟踪结果中多余的类似关键帧;错选帧用于描述跟踪结果中错误选择了表示运动图像核心内容的帧。准确率和查全率计算公式为:

式中:Zc,Zf,Zm分别代表正确跟踪关键帧数目、错选数目、漏选数目。

三种系统跟踪到的运动图像关键帧对比结果如表1 所示。分析表1 数据可知,本文系统的关键帧跟踪冗余度以及关键帧跟踪准确率、查全率均高于另外两种系统。实验结果表明,本文系统可以有效跟踪变化缓慢运动图像和做重复运动的图像,且具备自适应选择关键帧跟踪数量的能力,准确率、查全率高,冗余度低。

表1 三种系统跟踪到的运动图像关键帧对比

3 结 论

本文设计的运动图像关键帧快速跟踪系统通过有效协调系统中摄像机、检测模块、控制模块以及执行模块之间的相互配合,结合基于自适应无监督聚类融合交叉熵的运动图像关键帧跟踪算法,实现运动目标运动行为获取。通过实验验证本文系统运动图像关键帧跟踪方面的优势,为后期运动图像应用处理提供强有力的数据支撑。

猜你喜欢
关键帧交叉聚类
“六法”巧解分式方程
基于DBSACN聚类算法的XML文档聚类
基于改进关键帧选择的RGB-D SLAM算法
基于高斯混合聚类的阵列干涉SAR三维成像
连一连
基于相关系数的道路监控视频关键帧提取算法
基于聚散熵及运动目标检测的监控视频关键帧提取
基于Fast-ICA的Wigner-Ville分布交叉项消除方法
一种层次初始的聚类个数自适应的聚类方法研究
双线性时频分布交叉项提取及损伤识别应用