王 刚,陈贺新,陈绵书,刘媛媛,3,桑爱军
(1.吉林大学通信工程学院,长春130022;2.白城师范学院机械工程学院,吉林白城137000;3.吉林农业大学信息技术学院,长春130118)
在混合视频编码技术中,编码器的核心算法是帧间预测。利用帧间预测可去除视频序列中时间域的冗余信息。它包括整像素运动估计和分像素运动估计。在运动估计中,利用像素间的相关性进行分像素值的内插可提高运动矢量估计的准确性,从而使运动补偿过程产生较小的残差数据。目前,视频编码国际标准H.264/AVC[1-3]引入了1/4像素精度运动估计技术提高运动补偿的精度,通过6阶滤波系数为(1,-5,20,20,-5,1)/32维纳滤波器实现参考图像的二分之一像素插值。四分之一像素插值采用了线性滤波器。实验证明,高精度的运动补偿能够提高视频编码的压缩效率,在提高了运动预测性能的同时,也带来了运算量大和存储操作频繁等问题[1,3]。滤波器的阶数决定了参考数据的读入量,如何在保证预测准确性的前提下,降低插值的空间复杂度是目前要研究的问题。针对此问题,本文提出了一种新的低复杂度、高效率分像素插值方法-4阶滤波系数可变的整数化滤波方法。
H.264/AVC定义了系数为(1,-5,20,20,-5,1)6阶滤波器。图1为6×6像素块,‘M’到‘U’是整像素。
①整像素的水平、垂直插值滤波。
1/2像素b、aa、ss、ee、kk、dd、s、vv;h、cc、tt、bb、m、ff、pp和uu的样点值通过对临近的整像素位置样点进行水平、垂直方向6阶滤波插值计算得到。b和h计算过程如下:
②1/2像素的水平、垂直插值滤波。
1/2像素j、ii、hh、jj、gg、mm、nn、qq、rr的样点值通过对临近的1/2像素进行水平或垂直方向(二者得到的结果相等)6阶滤波插值计算得到。j计算过程如下:
当1/2像素得到后,1/4像素位置样本值使用双线性滤波插值得到。
①整像素、1/2像素的水平、垂直和对角线插值滤波。
1/4像素位置a、c,d、n,e、g、p和r上的值可通过在垂直、水平和对角线方向两个最近的整像素和1/2像素使用线性插值得到。a、d和e计算过程如下:
②1/2像素水平、垂直插值滤波
1/4像素位置f、i、k和q上的值应该通过在垂直、水平方向计算两个最近1/2像素的平均值得到。f和i计算过程如下:
对于1/2像素插值算法的改进,采用系数为(c0,c1,c2,c3)/8的双线性滤波器,并满足条件: c0,c1,c2,c3均为整数;c0+c1+c2+c3=8。
①整像素的水平、垂直插值滤波。
图1中,aa、b、s、dd、ee、kk,bb、h、m、cc、ff和pp处的1/2像素可通过对最近的水平、垂直方向整像素应用4阶滤波器计算得到。b和h计算过程:
②1/2像素水平、垂直插值滤波。
1/2像素ii、hh、jj、gg、j、mm、nn、qq和rr的样点值通过对临近的1/2像素进行水平或垂直方向(二者得到的结果相等)4阶滤波器计算得到。例如j计算过程:
对于1/4像素插值算法的改进,本文采用两个4阶系数为(a0,a1,a2,a3)/2n和(b0,b1,b2,b3)/2m的整数化滤波器F1和F2,满足以下条件: a0,a1,a2,a3及b0,b1,b2,b3均为整数;a0+a1+a2+a3=2n,b0+b1+b2+b3=2m,m=n≥4;a0=b3,a1=b2,a2=b1,a3=b0。
①整像素、1/2像素的水平、垂直和对角线插值滤波。
当1/2像素得到后,图1中,1/4像素位置a、c,d、n,e、g、p和r上的值可以通过对水平、垂直和对角线方向上两个最接近的整像素和1/2像素位置使用滤波器F1和F2插值得到。整个计算过程如下:
②1/2像素水平、垂直插值滤波。
图1中,1/4像素位置i、k,f、q上的值可以通过对水平、垂直方向上四个最接近的1/2像素位置使用滤波器F1和F2插值得到。计算过程如下:
本文给出了m=n=(4、5、6)时,滤波系数(a0,a1,a2,a3)和(b0,b1,b2,b3)的值,而对滤波系数(c0,c1,c2,c3)采用AVS标准中给出的值,具体值如下:
文中从空间和计算复杂度角度对一个4×4的数据块进行插值比较,表1列出了改进算法与H.264插值方法的复杂度比较。从表1可知,使用H.264标准中6阶滤波器需要9×9的参考数据量,而使用本文提出的4阶滤波器需要7×7的参考数据量。H.264需要66/8行参考帧数据,而改进算法需要54/8行参考帧数据,改进算法可降低18%的空间复杂度。两者的计算复杂度接近。
表1 改进算法与H.264插值方法的复杂度比较Table 1 The compare in complexity between the improved algorithm and interpolation method of H.264
把新算法嵌入到H.264的标准参考软件JM12.1[5-7]进行仿真比较。采用了4个视频序列Container、Foreman、News和Tenis。其中每个序列由30个CIF帧组成,各编码100帧,运动估计采用全搜索,搜索半径为16,选用5个参考帧,熵编码采用CABAC,编码结构为IBBPBBPBBP。量化参数QP分别取16、24、32和40。
改进算法与H.264标准中算法的图像质量比较如表2所示。通过调整量化参数 QP对Container、Foreman、News和Tenis序列编码进行测试(帧频为30 Hz)得到算法改进前后码率-信噪比的比较关系如图2所示。其中PSNR(dB)表示每个序列亮度信号峰值信噪比,△PSNR为峰值信噪比的增加;Bit-rate(kbit/s)表示编码码率,△Bit-rate为平均码率的增加。从表2和图2可知,相对于H.264标准中分像素插值算法,改进后的插值算法峰值噪声比(PSNR)明显增加,同时比特率(Bit-rate)明显减少。
表2 改进算法与H.264标准中算法的图像质量比较Table 2 The com pare in im age quality between the im proved algorithm and algorithm in H.264 standards
图2 算法改进前后的码率-信噪比关系曲线Fig.2 The relation of the bit-rate—PSNR-Y before and after im proved algorithm
本文首先给出H.264/AVC分像素插值滤波算法原理,在此基础之上提出了一种滤波系数可变、系数和不变的分像素插值算法。从目前国际视频编码标准H.264/AVC中6阶滤波器简化到4阶滤波器,并给出了m=n=(4、5、6)的滤波系数值。仿真结果显示,该算法与视频编码标准H. 264相比,计算复杂度相当,同时降低18%的空间复杂度,并减小存储面积,提高了编码性能。
[1]Wilegand T,Sullivab G J,Bjointegaard G,et al.Overview of the H.264 video coding standard[J].IEEE Tansactions on Circuits and Systems for Video Technology,2003,13(7):560-576.
[2]毕厚杰.新一代视频压缩编码标准(H.264/AVC)[M].北京:人民邮电出版社,2005.
[3]张凯.像素插值滤波方法及装置,解码方法及系统[P].中国:CN101902632A,2010.
[4]LIU Guo-jun,TANG Xiang-long,HUANG Jian-hua,et al.An image contrast enhancement approach based on fuzzy wavelet[J].ACTA Electronica Sinica,2005,33 (4):643-646.
[5]Fang Yan-long,Zhou Jun.Fast algorithm for H.264 Interpolation[J].Computer Engineering,2006,32(1): 218-223.
[6]Hu Li,Wang Feng,Zhen Shi-bao,et al.A hardware architecture for quarter-pixel interpolation in H.264[J]. Digital Television and Video,2005(10):14-17.
[7]Horowitz M,Joch A,Kossentini F,et al.JVT/H.26L decoder complexity analysis[S].ISO/IEC JTC1/SC29/ WG11 and ITU-TSG16 Q.6,2002.