蒋志良,赵 攀
(1.重庆邮电大学通信新技术应用研究所,重庆 400065;2.重庆信科设计有限公司,重庆 400065)
随着人工智能和计算机技术的发展,智能监控技术研究取得了长足的进步。目前,嵌入式监控系统完成的运动检测、识别、跟踪广泛地应用于国防建设、航空航海、医药卫生、安全监控等国民经济的各个领域。笔者设计了以DM6467为主处理器,结合目标跟踪法算法和网络传输的远程智能监控系统。本系统和其他视频处理系统相比,具有体积小、功耗低、运行稳定、便于扩展等技术优势,有着广泛的应用前景。
智能监控系统的总体结构如图1所示,由视频采集模块、视频处理模块、视频压缩传输模块、终端控制播放等模块组成。视频采集模块利用摄像头对现场进行实时采集,并把视频信号传送到视频处理器。视频处理器基于达芬奇(DaVinci)双核处理器和Linux嵌人式系统对目标进行检测和跟踪,并将其结果进行视频编解码压缩,通过以太网接口进行远程传输,并通过硬盘将其存储,同时主处理器还负责将客户控制端发来的信息转化成外设控制。客户控制端则负责视频解码及播放,同时把用户的操作转换成相应的控制信号发送到视频处理中心,如缩放、抓拍、摄像头调度等[1-2]。
图1 系统总体设计框图
软件系统一般分为应用层、信号处理层和I/O层三部分,达芬奇软件框架也是基于这样的结构,如图2所示。DaVinci用户在应用层ARM端进行Linux应用程序的开发,包括I/O操作与Linux API函数的调用(主要负责外围设备的控制)并使用由Codec Engine提供的VISA API接口,实现对视频、图像、语音以及音频信号的处理,此外DaVinci用户还可以添加和发挥自己的特色。信号处理层通常都运行在DSP一侧,负责信号处理,包括音视频编解码算法、Codec Engine、DSP的实时操作系统DSP/BIOS以及处理器间通信模块。ARM端与DSP端的通信则是通过Codec Engine,使用DSP/BIOS Link及xDM接口协议,与DSP端的Remote Server进行通信,并通过共享存储空间的方式实现的。
图2 系统软件设计框图
本系统采用TI公司的最新一代视频处理芯片DM6467为硬件核心处理器,硬件设计框图见图3。它的视频输入模块采用8路视频接口,并采用2组TVP5158作为数模转化器,内置2组独立HDVICP协处理器单元,极大地提高了编码效率,提供了更多智能处理能力。中央处理器包括ARM+DSP双核处理器,其中ARM主要负责系统的控制,而DSP主要负责音视频算法的实现。存储模块除了用于视频信息的存储硬盘外,还包括用于初始化的NOR闪存。外围设备,以太网接口、USB接口等,为网络传输提供了多种路径。
图3 系统硬件设计框图
目标跟踪算法实质上就是基于区域、特征、模型的图像匹配问题,考虑到区域匹配和特征匹配的精确性问题,本文采用基于动态轮廓Snake模型的跟踪算法,它不仅适用于复杂的环境,而且具有良好的稳健性[3-6]。
动态轮廓Snake模型就是一条可变形的参数曲线及相应的能量函数,以最小化能量函数为目标,控制参数曲线变形,从而提出目标轮廓曲线实现其跟踪。Snake的初始化轮廓曲线定义为 X(s,t)=(x(s,t),y(s,t)),s∈[0,1]。曲线的能量函数为Ε =)+ Εext(X(s,t))}ds,由此可知曲线的收敛取决于基于模板特性的内能函数Εint和基于图像特性的外能函数Εext。内部能量函数为Εint(X(s,t))=(α(s)+β(s)),其中α为曲线的连续性控制参数,β为曲线的光滑性控制参数,Xs和Xss分别为X(s,t)对s的一阶导数和二阶导数。
外部能量函数Eext=γEimage(X(s,t))由图像的灰度、边缘等特征获得。对于I(x,y)一般采用以下图像能量函数(X(s,t))= ±[Gσ(x,y)*I(x,y)],(X(s,t))=±I(x,y),其中Gσ(x,y)为标准差为σ的二维高斯函数,为梯度算法。为了使能量函数最小,Snake必须满足欧拉方程即 αX″(s,t)- βX‴(s,t)-Eext=0,能量平衡方程可视为驱动力的平衡方程Fint+Fext=0。其中,Fint= αX″(s,t)- βX‴(s,t),控制着曲线的特性。Fext= -Eext,将活动轮廓吸引到目标轮廓,Snake 在内力Fint的吸引驱动下向目标轮廓移动,而外力Fext在保持Snake拓扑性的同时随着Snake的移动变化,最终达到内外力之和等于零,这时,Snake就停留在目标轮廓上。
算法主要由ARM端和DSP端协同工作实现的,如图4所示。首先进行系统初始化,ARM端通过TVP5158进行视频图像采集并进行模/数转化,Codec engine一方面通过VISA API函数调用视频数据,放入共享内存,另一方面通过 DSP link与 DSP端 Codec server进行通信,DSP端则通过Codec server调用符合xDM标准的目标跟踪算法进行视频图像处理,并将结果放入共享内存,然后继续调用符合xDM标准的H.264算法进行视频压缩,应用程序再通过共享内存,将其压缩后的数据通过以太网接口发送到终端进行播放。
如图5为系统的实验结果,可以看出当有人员经过监控区域时,目标跟踪系统就会自动进行目标检测与跟踪,并自动显示跟踪结果。
本文采用了最先进的达芬奇嵌入式技术与目标跟踪算法相结合的设计方案,实现了监控系统的智能化,从实验结果可知该系统具有来良好的稳定性和稳健性,并具有广泛的应用前景。
图4 系统算法实现
图5 系统算法实现
[1]HARITAOGLU I,HARWOOD D,DAVIS L S.W4:Realtime surveillance of people and their activities[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2000,22(8):809-830.
[2]WREN C R,AZARBAYEJANI A.Pfinder:real-time tracking of the human body[J].IEEE Tran.Pattern Analysis and Machine Intelligence,1997,19(7):780-785.
[3]王平,陈素华,董福洲.运动目标检测技术在智能监控系统中的应用[J].电视技术,2007,31(7):81-83.
[4]侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006,32(4):603-614.
[5]陈锋强.复杂场景下运动物体检测与跟踪算法的研究[D].上海:上海交通大学,2008.
[6]邵文坤,黄爱民,韦庆.动态场景下运动目标跟踪方法研究[J].计算机仿真,2006(5):17-20.