张 亚,周孟然,陈君兰,赵苍荣
(安徽理工大学 电气与信息工程学院,安徽 淮南 232001)
近年来,全程数字化、网络化的视频监控系统优势愈发明显,其高度的开发性、集成性和灵活性,为整个安全防护产业的发展提供了更加广阔的发展空间。智能化、数字化、网络化是视频监控发展的必然趋势,智能视频监控的出现正是这一趋势的直接体现[1]。采用智能视频监控系统可以极大地提高视频监控系统的能力,并使视频资源能够发挥更大的作用。
目前国内外的视频监控可大致分为静态监控和动态监控,静态监控的监控范围是固定的,比如利用摄像头对某一场景进行拍摄;动态监控花样繁多,如跟踪某特定目标等,但是主要以图像检测为主。随着安防系统的要求越来越高,单一的视频监控已不能完全满足监控的需要,比如对可疑物的报警判决通常只是根据对监控画面的分析来做出的,而监控画面往往存在盲区,无法覆盖整个监控现场;在被障碍物挡住的地方由于无法采集图像而使视频监控系统不能发挥作用。针对这一问题,笔者将音频监控技术加入到现有的视频监控系统中,设计了一套应用声光联合定位技术的智能视频监控系统。系统借助于声源定位和摄像头动态采集对可疑物进行联合判决报警,可以实现对监控区域的有效覆盖,降低漏报和误报的几率,提高无人值守环境下视频监控系统的有效性和安全性。
系统整体设计方案如图1所示。系统采用ADI公司的Blackfin系列处理器ADSP-BF533[2](简称BF533)作为系统的处理核心,完成各接口电路的控制和算法处理。音频通道由4个麦克风组成的麦克风阵列和音频编解码器AD1836组成,麦克风阵列首先采集空间音频信息,传送到AD1836转换成数字信号,再通过DSP的SPORT口以DMA方式传送到SDRAM,DSP读取SDRAM中的数据并进行声源定位算法处理,确定声源位置;模拟摄像头SCC-C6475与RS-485串口相连,由声源位置决定摄像头转动角度,通过RS-485串口发出信号,控制摄像头转动;视频通道由摄像头和视频编码器SAA7111组成,SAA7111将摄像头传来的声源位置的视频信号转化为YUV数字图像,通过DSP的PPI口以DMA方式传送到SDRAM,DSP调用视频数据并进行图像检测算法分析,发现异常情况自动报警。以太网控制器DM9000负责将采集到的视频数据传输到远端主机进行显示。系统还包括相应的电源电路,复位电路和时钟电路。
图1 系统整体设计框图
系统的处理核心BF533是专为满足嵌入式音频、视频和通信应用的计算要求和低功耗条件而设计的新型16位嵌入式处理器。它基于由ADI和Intel公司联合开发的微信号架构(Micro Signal Architecture,MSA),将信号处理功能与通用型微控制器所具有的易用性组合在了一起[3]。BF533外部I/O供电电压为3.3 V,内核供电电压为1.2 V,系统选用TPS73HD301作为BF533的电源芯片,其典型输入电压为5 V,输出为3.3 V和1.2 V,每个输出最大可提供750 mA电流。BF533的时钟电路采用内部振荡电路外接晶振的方式,晶振频率为27 MHz。BF533的复位电路采用专用复位芯片IMP811。
音频信号采集电路由麦克风阵列和音频编解码器AD1836组成。AD1836是ADI公司的高性能模数转换器,适用于数字音频系统。AD1836内部集成了3路立体的D/A和2路立体的A/D,数据采样率为48/96 kHz,采样位数为16/18/20/24位,参考电压为2.25 V。为了降低信号的干扰,模拟信号的输入输出均采用差分的形式,输入输出模拟信号的最大峰峰值为5.6 V。AD1836具有一个SPI控制端口,允许处理器可以通过SPI端口对内部功能寄存器进行配置,从而实现时钟、工作模式、采样率、采样位数、工作A/D和D/A的路数等参数的选择。
AD1836与BF533之间的音频信息传送通过BF533处理器的SPORT口[4]来完成。同步串行端口SPORT是一个全双工的通信端口,可同时发送和接收数据,而数据单向传输时只需要数据、数据时钟和帧同步3根信号线[5]。SPORT同步串口可以在片内存储器和串口之间建立一个DMA通道,数据帧的传送很方便。音频信号采集电路的框图如图2所示,BF533使用SPORT端口接收音频数据,SPI端口进行AD1836工作参数的设置,由于要同时采集4路信号,SPORT端口工作在TDM多通道模式下。
图2 音频信号采集电路
视频信号采集电路由摄像头和视频解码器SAA7111组成。摄像头采用的是SAMSUNG公司的网络监控摄像头SCC-C6475,能提供PAL制的模拟视频信号,通过RS-485接口可对其进行远程控制,其水平方向移动范围为 0°~360°, 垂直方向移动范围为 0°~180°。SAA7111 是PHILIPS公司的一款视频处理芯片,它能将输入的模拟视频信号解码成标准的“VPO”数字信号,相当于一种“A/D”器件[6]。SAA7111兼容各种视频标准,在应用时可以根据视频标准来配置其内部的寄存器,寄存器的读写通过I2C总线来完成。
SAA7111与BF533之间的视频信息传送通过BF533处理器的PPI口来完成。并行外部接口PPI是数据高速传输专用的半双工双向通道,为视频数据的采集提供了极大的方便。PPI端口包括1个16 bit数据信号(数据宽度可灵活设定),3个帧同步信号和1个时钟信号,可以通过DMA通道完成数据传输。视频信号采集电路的框图如图3所示,由于BF533处理器没有内置I2C接口,系统使用通用输入输出引脚PF1和PF2软件模拟I2C总线,来对SAA7111芯片内部的寄存器进行配置。
系统存储器包括数据存储器和程序存储器。因系统采集的音视频数据量很大,而BF533内部存储器的容量有限,故本系统外部扩展SDRAM作为音视频数据的缓冲器。SDRAM选用MICRON公司的MT48LC16M16A芯片,它是一款高速的同步动态存储器,组成结构为4 Banks×4 M×16 bit。整个SDRAM由2片MT48LC16M16A,容量为32 M×16 bit。系统程序存储在Flash中,Flash选用的是AMD公司的AM29LV800D芯片,它是8 Mbit,单3.3 V电源供电的闪存,可配置成512 k×16 bit的结构,本系统使用2片AM29LV800D,容量为1 M×16 bit。
图3 视频信号采集电路
存储器与BF533的数据交换通过EBIU接口来完成。外部总线接口单元EBIU包括1个16 bit的数据总线、1个地址总线和1个控制总线,既提供与同步存储器的接口,也提供与异步存储器的接口。BF533与SDRAM的连接如图4所示,与Flash的连接如图5所示。
图4 BF533与SDRAM的连接
图5 BF533与Flash的连接
以太网接口电路负责将采集到的视频数据传输到远端主机进行显示。本系统采用的DAVICOM公司的DM9000是带有通用处理器接口的单片快速以太网控制处理器,实现以太网媒体介质访问层(MAC)和物理层(PHY)的功能,支持 8/16 bit数据总线,10/100 Mbit/s自适应,内置16 kbyte的SRAM用于收发缓冲,支持3.3~5 V的容差。BF533与DM9000的连接通过EBIU接口来完成,如图6所示。93C46为E2PROM,用于保存IP地址、网卡物理地址和其他参数。
图6 BF533与DM9000的连接
从软件结构上,系统的程序分为主控程序、音频采集程序、视频采集程序、声源定位算法程序、图像检测程序、网络接口程序、摄像头控制程序等,核心部分为声源定位算法程序的实现。
声源定位是利用麦克风阵列拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。目前关于声源定位的技术和方法很多,考虑到系统实现的实时性,本系统采用的是基于时延估计的声源定位技术[7]。由于声源信号是一个非平稳信号,易受到噪声和混响的干扰,在时延估计算法中,采用了具有一定抗噪声和混响能力的广义互相关函数(Generalized Cross Correlation,GCC)方法[8]。该方法通过求两个信号之间的互功率谱,并在频域内给予一定的加权,来抑制噪声和混响的影响,再反变换到时域,得到两信号之间的互相关函数,其峰值位置即两信号之间的相对时延。在选取加权函数时,采用了互功率谱相位加权的方法(Phase Transform-Generalized Cross Correlation,PHAT-GCC),该方法通过对信号功率谱的归一化,去除了信号的幅度信息,只保留了信号的相位特性,对于噪声和混响都有较好的抑制效果。应用PHAT-GCC算法实现时延估计的算法流程图如图7所示。
图7 PHAT-GCC算法实现时延估计的算法流程图
系统上电后,主控程序读取启动参数,完成各个模块的初始化,顺序启动视频采集、音频采集和网络传输,同时控制视频采集和音频采集的交替运行。同时主控程序按一定时间间隔调用声源定位算法程序进行声源定位,如果有声源存在,则主控程序控制摄像头转动到声源位置采集视频,同时调用图像检测程序,如果有活动物体或异常情况,系统报警。系统软件流程图如图8所示。
图8 系统软件流程图
随着安防系统的要求不断提高,如何提高重点监控区域的全方位覆盖和目标跟踪成为了一个新的课题。笔者将声源定位技术加入到现有的视频监控系统中,提出了声源定位技术和摄像头视频采集联合监控方案,设计了一种应用声光联合定位技术的智能视频监控系统,给出了系统的软硬件的设计流程。该系统的应用可以改善传统监控系统监控范围的局限性,最大程度消除监控死角,进一步降低漏报和误报的几率,特别是对无人值守环境下视频监控提供了一个借鉴。
[1]郑世宝.智能视频监控技术与应用[J].电视技术,2009,33(1):94-96.
[2]王庆辉,杨晶婧,逄玉俊.基于Blackfin533的H.264整数变换的优化实现[J].电视技术,2009,33(S1):62-64.
[3]颜允圣,郭森楙,冯小平,等.基于微信号结构的嵌入式信号处理[M].北京:电子工业出版社,2008.
[4]陈峰.Blackfin系列DSP原理与系统设计[M].北京:电子工业出版社,2004.
[5]王莹,李学生,顶多云,等.基于ADSP-BF533的音频处理系统设计[J].电声技术,2006,30(8):32-35.
[6]刘红喜,李长江,孙俊喜.基于DSP的图像采集及处理系统的设计与实现[J].电子技术应用,2009(2):22-26.
[7]王振涛,郝忠孝,贺洪江.基于传声器阵列的声源定位系统的研究[J].华北电力大学学报,2009,36(5):103-106.
[8]CHEN J D,BENESTY J,HUANG Y T.Performance of GCC and AMDF-basedtimedelayestimation in pratical reverberant environments[J].EURASIP Journal on Applied Signal Processing,2005(1):25-36.