H.264标准在视频监控系统中的应用

2010-07-09 01:40邢春玉

长春工业大学学报 2010年1期

宋宇, 邢春玉

(长春工业大学计算机科学与工程学院,吉林长春 130012)

0 引言

随着计算机网络技术、多媒体技术的飞速发展,桌面视频会议系统、可视电话、高清晰度数字电视、视频点播、数字存储媒体等领域的发展,人们迫切需要将庞大的视频数据进行压缩,以减少磁盘空间的浪费及提高视频在网络上的传输速度。视频压缩编码就这样在近20年里得到了飞速发展。而如今的网络视频监控系统,其核心是以数字视频的压缩、传输、存储和播放为核心,对基于IP网络的视音频信息提供一个综合、完善的处理平台。新一代数字视频监控系统对编码码率、图形质量、智能监控领域提出了更高的要求[1],新一代的视频压缩标准H.264是面向无线网络和因特网的图像编码与传输技术。

1 H.264的编码技术

1.1 H.264的视频压缩系统

H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元[2]。NAL则用于为VCL提供一个与网络无关的统一接口,它负责按照网络所要求的方式对视频数据进行封装打包和传送,它采用统一的数据格式,包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。包头中包含存储标志和类型标志。存储标志用于指示当前数据不属于被参考的帧。类型标志用于指示图像数据的类型[3]。VCL可以传输按当前的网络情况调整的编码参数,如图1所示。

图1 H.264的视频压缩系统

1.2 H.264的编码原理

H.264采用了很多新的编码技术,如帧内预测、多参考帧预测、残差图像的整数变换编码、抗块效应滤波器等[4]。编码原理框图如图2所示。

图2 编码原理框图

1.3 H.264对视频编解码的改进

H.264对传统的帧内预测、帧间预测、变换编码和熵编码等算法的改进,使编码速率和图像质量比以往的压缩标准有了很大的提高。这些编码技术的改进主要体现在两个方面。

1.3.1 图像压缩方法的改进

(1)灵活的分块机制。

(2)更精细的预测精度,亮度信号运动补偿和预测的精度是1/4像素。

(3)多参考帧运动估计。H.264支持多参考帧预测,即可以有多于一个(最多5个)的在当前帧之前解码的帧可以作为参考帧产生对当前帧的预测[5]。

(4)运动补偿循环内的消除块效应滤波器,消除经反变化和反量化映入的块效应。

1.3.2 网络的适应性和纠错能力的改进

H.264把编码核心和输出分成两个部分,即VCL和NAL,NAL把VCL压缩输出的数据打包成NAL单元。NAL单元可以很自由地更改成符合各种网络传输协议的结构,几乎适合所有的网络接口。灵活的宏块排序FMO通过设置宏块次序映射表来任意地指配宏块到不同的片组,解码时当某个宏块的数据发生错误时,可以用插值替换的方法从其它片组里面获取,这种模式增强了H.264的抗误码性能[6]。

2 H.264标准在视频监控中的应用

2.1 在视频监控中的应用

H.264视频标准的突出特点特别有利于对视频信源的高比率压缩、信道的高效利用和对视频传输瓶颈的缓解,并能够产生不同等级的视频质量分别满足不同的应用需要[7]。H.264的这些优点使其在数字视频监控等热门领域得到广泛的应用。

基于H.264优化编解码器技术可以构建数字视频监控系统。从摄像机输出的模拟信号通过采集器被编码器直接编码成数字化H.264码流并打包成网络包发送出去,解码器接收到网络包可以解码还原出视频信号。基于H.264优化编解码器技术构建的数字视频监控系统直接支持网络视频传输和网络管理,使得监控范围达到前所未有的广度。

2.2 针对视频监控改进的编码算法

H.264算法提出了一种实现高压缩比的理论方法,但在具体产品的应用上,高质量对应的就是高复杂度,H.264出色的压缩性能是以其高复杂度为代价的,因此,其编解码的实时性难以保证,通常只能实现对中低分辩率视频的实时编码。在512 Kbps及以下低带宽下,压缩比提高之后视频质量没有太大影响,然而在高带宽下,图像质量并没有保证,因此,压缩编码算法还需要进一步改进。

2.2.1 对多种宏块划分模式估计的优化

在H.264视频编码标准中编码部分最耗时间的是帧间运动估计,约占编码时间的70%,因此,改进帧间预测的算法是提高H.264编码速率的一种有效方法。针对视频监控的特点,采用一些快速估计算法提高编码速度[8]。

宏块中的子块划分的越细,对残差值进行编码的比特数就越少,而用于表示运动矢量的比特数就越多。因此在具体编码时,根据运动估计后的残差值大小和需要的运动矢量编码代价,优化选择子块的编码模式,即使用率失真优化模型RD0来做选择,利用RD0计算编码代价,选择编码代价最小的模式作为帧间编码模式,能够有效节省编码时间。

2.2.2 针对多帧运动估计的优化

由于视频序列相邻帧间存在很强的时域相关性,一般情况下,最优的匹配通常位于与当前编码帧紧密相邻的参考帧,采用REF(0)表示这一参考帧,其余的参考帧被选中的概率远远小于第一个参考帧REF(0)。合理地减少参考帧中的运动计算量,最优的运动矢量一般位于搜索中心的小范围里,利用螺旋搜索顺序,只需搜索这一小部分区域。在重要的参考帧中,搜索范围较大,以保证取得较高的预测精度,在其余不是很重要的参考帧中,选择较小的搜索范围,同时利用前一帧中已得到的运动信息预测下一帧的搜索中心,只需对搜索中心周围的很小一部分候选点进行匹配运算。

利用运动矢量的空域相关性来预测第一个参考帧REF(0)的搜索中心,即利用当前宏块周围的3个空域相邻块的中值运动矢量来预测REF(0)的搜索中心;利用运动矢量的时域相关性,即利用前一帧REF(i-1)所得到的运动信息对下一个参考帧REF(i)的搜索中心进行修正。由于相邻帧间存在很高的时域相关性,下一帧的最优运动矢量很可能就位于修正后的搜索中心附近,只需对搜索中心周围的很少一部分候选点进行匹配运算,这样就省略了很大一部分运算量。

2.2.3 实验模拟和分析

实验采用软件模型JM86,实验参数设置如下:2个典型视频测试序列(foreman,container)、5参考帧、图像格式为CIF、运动矢量搜索范围为16(帧)、量化系数为32、采用Hadamard transform、GOP结构为IPPP。

对改进后的编码算法和改进前的编码结果比较,见表1。

表1 结果比较

从表中可以看出,改进后的算法比改进之前平均节省30%的编码时间,而PSNR下降可忽略,比特率变化很小,图像的主观质量几乎看不出变化。

3 结语

作为一种新的国际标准,H.264标志着在视频编码技术上的不断进步,它在编码效率、图像质量、网络适应性和抗误码方面都取得了成功。但随着终端和网络的快速发展,对视频编解码的新要求在不断出现,H.264也仍在继续完善和发展[9]。目前,对H.264的研究主要集中在如何进一步优化算法结构、降低处理时延、提高实时性和进一步提高图像质量上。随着H.264自身的不断完善和视频通信的不断普及,相信H.264的应用将越来越广泛。

[1] 张剑.基于混合编码框架H.264/AVC核心新技术[J].长春工业大学学报:自然科学版,2006,27(1):8-11.

[2] 干宗良,李晓蕾.H.264的变换编码和量化过程分析[J].电视技术,2003,12:6-9.

[3] 陈文洪,严正楷.H.264视频编码在数码监控系统中的应用研究[J].安防科技,2007(6):351-355.

[4] 李鹏,郭宝龙.H.264视频编码的嵌入式系统实现[J].电子科技,2006(4):11-13.

[5] 毕厚杰.新一代视频压缩编码标准H.264/AVC[M].北京:人民邮电出版社,2005.

[6] 郑世林.主编数码压缩技术及应用[M].北京:机械工业出版社,2000.

[7] 余兆明.图像编码标准H.264技术[M].北京:人民邮电出版社,2006.

[8] 齐淋淋,向健勇.H.264视频压缩关键技术及其应用前景[J].电子科技,2005(10):13-16.

[9] 孙景琪,孙京.数字视频技术及应用[M].北京:北京工业大学出版社,2006.