基于RDO和SSIM的AVS帧内模式选择算法

2013-01-31 05:23杨俊斌武淑红
电视技术 2013年17期
关键词:亮度编码预测

杨俊斌,武淑红

(太原理工大学计算机科学与技术学院,山西太原030024)

AVS是我国具备自主知识产权的第二代信源编码标准,又称为数字音视频编解码技术。它以H.264标准为参考,在编码效率与H.264基本相同的基础上,明显降低了编码复杂度[1]。在AVS的帧内模式选择中,通常采用SAD或RDO来计算失真代价,同时利用PSNR衡量视频图像编码质量。利用RDO和PSNR对原始图像和预测图像进行纯数学计算,这种方法易于理解,但缺点是没有考虑人眼视觉系统的主观性。SSIM作为一种新的图像质量评价方法,计算简单,能更好地反应人眼视觉感知[2-3]。本文提出一种基于RDO和SSIM的AVS帧内模式选择算法,将RDO和SSIM组合共同作为代价函数用于AVS帧内模式选择。

1 原AVS帧内模式选择算法

1.1 AVS的帧内亮度预测模式

在AVS帧内编码器中,每帧图像被均匀划分为若干个非重叠的16×16的宏块(MB)。AVS帧内预测与H.264/AVC的帧内预测类似,对亮度、色度分量分别进行预测;区别在于AVS帧内预测以8×8宏块为基本单位进行编码,而且在AVS帧内亮度编码过程中共有5种预测模式[4]。AVS帧内亮度的5种预测模式如表1所示。

表1 AVS帧内亮度的5种预测模式

1.2 原AVS帧内模式选择算法

率失真优化技术RDO是AVS引入的一种非标准技术。RDO的值是经过模式预测、运动估计与补偿、变换、量化、反量化、反变换、熵编码等步骤以后得到的,故可以大幅度地提高压缩效率和编码性能。在帧内模式选择中,先用RDO代价函数算出每种可用预测模式的代价值(rd_cost),从得到的rd_cost中选出最小的一个作为当前编码块的最优预测模式(rd_cost值相同时选预测模式编号较小的作为最优预测模式)。RDO计算如下

式中:SSD(误差平方和)为当前块与重建块的差值;λ是拉格朗日因子;rate为当前预测模式下的残差块编码比特数,由熵编码给出。

2 结构相似度(SSIM)

结构相似度SSIM是近些年来被提出的一种新的图像质量评价标准,包括亮度、对比度和结构信息3个方面的计算,故SSIM较符合人的视觉主观评价标准[5]。SSIM定义如下

式中:l(x,y)是亮度比较函数,函数中用到原图像和评估图像的均值μx和μy;c(x,y)是对比度比较函数,函数中用到原图像和评估图像的方差σx和σy;s(x,y)是结构信息比较函数,函数中用到原图像和评估图像的协方差σxy。这3个函数分别定义为

式中:参数C1,C2和C3是为避免分母为0而加上的小常数,分别定义为C1=(K1L)2,C2=(K2L)2,C3=C2/2;L是图像中像素灰度的变化范围(如灰度值为8 bit,L取255);K1和K2是很小的数(本实验取K1=0.01,K2=0.03)。从以上计算公式可知SSIM值域为[0,1],且SSIM越大,评估图像和原始图像越相似[6]。

3 基于RDO和SSIM的AVS帧内模式选择算法

率失真方法对每一种预测模式都要进行预测、变换、量化和变长编码,并进行反量化和反变换,再比较各预测模式的编码码率和重建图像质量,代价最小的一种模式被选择作为最优的预测模式[7]。RDO方法可以得到更高的编码性能和更好的编码效率,但是它并没有考虑到人眼视觉系统的主观性。文献[8]提到误差平方和SSD能够很好地衡量平坦区域的图像质量,而SSIM能更好地评价图像的边缘纹理区域[8]。因此将SSIM和RDO结合在一起作为模式选择的代价函数,同时兼顾数学方法科学性和人视觉系统的主观性。改进的代价函数为

式中:rd_cost是原RDO算法求出来的率失真代价值,见式(1);SSIM为当前块与重建块的结构相似度值。因为RDO值与SSIM值不在一个数量级上且评价方向不一致,故增加一个因子k来进行平衡,用1-SSIM来使二者评价方向相同。经过大量的实验数据发现k值在不同QP下有所不同,其取值如表2所示。

表2 不同QP下k的取值

新的帧内预测模式选择流程图如图1所示。

图1 基于RDO和SSIM的帧内预测模式选择流程

4 实验结果分析

实验测试了3个具有代表性的YUV(4∶2∶0)序列(news_cif,foreman_cif和flower_cif),量化参数QP,分别取28,36和42。实验结果如表3所示,其中Δbr是用改进算法与原RDO算法在不同QP下码率变化的百分比;ΔPSNR是平均亮度的信噪比变化量,单位为dB;ΔMSSIM是整个视频序列的平均结构相似度值变化量。数值上带“-”号的表示减少量,不带“-”号的表示增加量。

表3 不同序列、不同QP下的测试结果

从实验数据可以明显的得到:在不同QP、不同序列条件下,采用本文的AVS帧内模式选择算法的亮度信噪比(PSNR)、平均结构相似度(MSSIM)都有不同程度的提高(得了更好的编码质量);同时码率都有不同程度的降低(更高的视频序列压缩比)。也就是说在算法复杂度增加不多的情况下,SSIM算法的引入使AVS视频编码器的性能有了一定的提高。为了观看效果选取6帧图像(见图2~图7),其中图2和图5是原始YUV视频序列的一帧,图3和图6是使用原AVS帧内模式选择算法的编解码视频序列的一帧,图4和图7是使用新AVS帧内模式选择算法的编解码视频序列的一帧。foreman_cif序列(图3和图4)编码时取QP=28,flower_cif序列(图6和图7)编码时取QP=42。

图7 使用新算法(第100帧)

由图可知:图4比图3更接近图2,图7比图6更接近图5。也就是说使用了新的模式选择算法得到的重建图像质量更好。

5 小结

本文在原来率失真优化算法(RDO)的基础上引入了结构相似度算法(SSIM),提出了一种基于RDO和SSIM的AVS帧内模式选择优化算法。新的算法在保留RDO算法的优异性能的同时兼顾了人的主观感受。大量实验数据表明,新的算法取得了更好的编码质量和更高的视频序列压缩比。

[1]邵娟,张卫宁,魏磊,等.AVS中帧内预测模式的快速选择策略[J].计算机工程与应用,2009,45(25):163-165.

[2]杨春玲,肖冬琴.基于SSE和SSIM的H.264帧内预测模式选择改进算法[J].电子与信息学报,2011,33(2):289-294.

[3]WANG Z,BOVIK A C,SHEIKH H R,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Trans.Image Processing,2004,13(4):600-612.

[4]游娜,彭玉华,刘微,等.基于AVS的帧内预测模式快速选择算法[J].计算机工程与应用,2009,45(14):185-187.

[5]崔子冠,朱秀昌.基于结构相似的H.264主观失真性能改进机制[J].电子与信息学报,2012,34(2):433-439.

[6]陈云善,高慧斌,苏宛新,等.结构相似度在AVS帧间模式选择中的应用[J].光电子·激光,2011,22(3):435-439.

[7]马宏兴,张伶.H.264/AVC率失真优化技术综述[J].电视技术,2010,34(6):19-22.

[8]YANG C L,LEUNG R K,PO L M,et al.An SSIM-optimal H.264/AVC inter frame encoder[C]//Proc.IEEE International Conference on Intelligent Computing and Intelligent Systems.Shanghai,China:IEEE Press,2009:291-295.

猜你喜欢
亮度编码预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
亮度调色多面手
Genome and healthcare
亮度一样吗?
不必预测未来,只需把握现在