一种HEVC快速帧内模式判断算法

2015-03-21 08:31肖秀秀张新晨
关键词:代价复杂度编码

肖秀秀, 张新晨

(华中师范大学 物理科学与技术学院, 武汉 430079)



一种HEVC快速帧内模式判断算法

肖秀秀*, 张新晨

(华中师范大学 物理科学与技术学院, 武汉 430079)

针对HEVC帧内预测模式较为复杂的过程,提出一种适合HEVC帧内预测的快速算法.本文提出的算法充分利用了相邻PU块之间的结构相似性(SSIM),以及在候选模式中,MPM、PLANAR模式和DC模式最终被选为最佳预测模式的概率的规律,以达到减少帧内模式数量,降低计算复杂度的目的.实验结果表明,与参考编码算法相比,该算法可以稳定减少HM12.1编码时间35.6%,相应平均码率减少2.29%,PSNR-Y平均增加0.5058 dB,本算法具有实用价值.

视频编码; 高效率视频编码HEVC; 帧内预测; 模式选择

HEVC 是继 H.264/AVC 之后的新一代视频编码标准,由 ITU-T 的 VCEG 和ISO/IEC 的 MPEG 组织组成的联合协作视频编码组(JCT-VC)[1]制定,其目的是为了获得更高的视频压缩效率和更好地适应各种不同的网络环境,并能够支持多核并行编解码.但是,HEVC 视频编码的更高的性能是以更高的计算复杂度为代价的,在帧内编码过程中[2],采用了四叉树递归编码单元结构以及采用枚举法遍历35种帧内预测模式找出最佳模式,其计算的复杂度成倍的增加,导致HEVC不能有效地应用于实时通信应用.因此,在保持HEVC视频主客观质量的前提下,如何降低 HEVC 视频编码的算法复杂度,加快编码速度,满足实际应用,成为 HEVC视频编码研究的重要课题.文献[3] 提出了一种利用编码单元CU、预测单元PU和变换单元TU等级结构关系的帧内快速算法[3].文献[4] 提出了一种新的帧内角度预测方法,使用了传统二抽头滤波器和4抽头的基于离散余弦变换的插值滤波器[4](DCT-based Interpolation Filter, DIF).文献[5]提出使用当前帧相邻块和前一帧的同一位置的相邻块的方向信息来加快帧内方向预测[5].以上几种快速算法,都是在已有的HM框架上,增加额外的编码信息来降低编码复杂度,但是它们并未考虑到HM自身的规律,本文在分析HM规律的基础上,提出了一种帧内快速算法,利用图像相关性的特点,同时依据平面PLANAR模式、DC直流模式和最有可能模式MPM最终被选为最佳预测模式高概率的规律,可进一步降低预测模式选择的计算复杂度,实验结果表明本文提出的帧内模式判断快速算法在较小代价下,可降低模式预测判断的复杂度,更适应实际应用情况.

1 HEVC帧内编码关键技术

1.1 HEVC帧内预测模式

与H.264/AVC相似,HEVC帧内预测分为亮度和色度预测,并为亮度分量和色度分量分别规定了35种和6种预测模式[6].在选取最佳、模式方面,HEVC也是借助率失真代价RDCost来选取的.但是,HEVC和H.264/AVC相比,在帧内编码方面最大的优点就是大大丰富了帧内预测模式的数量,从原来H.264/AVC中的最多9种模式,增加到现在的35种[7].除此之外,HEVC比H.264/AVC多出了一种非方向性的预测模式—平面Planar模式[8],对纹理平滑且有一定渐变趋势的区域处理效果很好.而且HEVC是以PU作为预测单元,其形状及大小种类比H.264/AVC更为丰富,使其能更好地跟纹理相匹配,进而得到更好的预测结果.

1.2 帧内预测模式判断过程

根据目前的HEVC标准测试软件HM12.1,HEVC帧内模式判断的流程大致分为3个阶段:

第一阶段:使用基于 SATD(预测图像与原图像残差的hadamard变换的绝对值之和)的代价函数进行粗略的模式选择,对所有34或17种角度的预测模式进行粗选(Rough Mode Decision,RMD),计算其率失真代价(Rate-Distortion Cost,RDCost)[9]并将其按照代价递增顺序排列,将代价最小的前N种模式作为候选模式,其中,N的值取决于PU块的大小,对于4×4和8×8块,N等于8;对于其它块,N等于3.候选模式集中的候选模式的数量如表1所示.

表1 候选模式集中的候选模式的数量

第二阶段:验证最有可能模式MPM[10]是否已包含在候选模式中,若不包含,则将其加入其末端.

第三阶段:使用率失真优化(Rate-Distortion Optimization,RDO)代价函数进行最后模式选择[11].通过对这些候选模式进行率失真代价的计算,选择最小代价的预测模式作为最佳的预测模式.

2 帧内预测的优化算法

帧内预测模式计算,计算量巨大.帧内模式快速选择算法的研究一直以来都是提高编码效率的研究重点之一.通过上述对HEVC中较为耗时模块的分析,降低帧内预测算法复杂度的可以从以下3个方面进行研究:

第一方面:釆用某种策略减少候选预测模式的数量;

第二方面:对算法本身进行优化;

第三方面:对软硬件算法结构上的优化.

2.1 结构相似度(SSIM)

图像像素之间的相关性暗示着图像的结构信息.在观察图像时,人眼对场景中结构信息的变化比对单个像素取值的变化更敏感[12].在此基础上,文献[13]提出了图像结构相似度(SSIM)的质量评价方法,把对图像结构信息的度量近似为图像感知质量,并利用此特点将当前PU块x和相邻PU块y的SSIM建模为亮度l(x,y)、对比度c(x,y)和结构信息s(x,y)三分量的组合[13]:

SSIM(x,y)=l(x,y)c(x,y)s

(1)

其中, 亮度、对比度和结构信息是与x和y的均值ux、uy,标准差、或协方差σxy有关的量,其表达式

(2)

(3)

(4)

式中,c1,c2和是为了避免分母为零而添加的小常数,c1=(k1L)2,c2=(k2L)2,c3=c2/2 ,其中,L是像素值的动态范围,一般,k1=0.01,k2=0.03,L=255.

2.2 精简候选模式

在候选模式集合中,候选模式按代价值由小到大排列,本文统计了各个候选模式在最终被选择为最佳候选模式时,分别所占的百分比,图1用直方图反映了D类视频序列RaceHorses.yuv中各个候选模式所占百分比.

图1 各个候选模式所占百分比Fig.1 The percentage of each candidate mode

从直方图1可以看出,在候选模式集合中,排在前面的候选模式,即代价小的模式,被选为最佳预测模式的概率更高.

为了减少算法复杂度,同时保证视频预测的质量,则在候选模式中,对于大于8×8的PU块,选取前几种预测候选模式的概率之和达到80%以上的模式,对于小于等于8×8的PU块,由于块的信息更精细,则首先在候选模式中,选取前几种预测候选模式的概率之和达到65%以上的模式,然后,加入两种在HEVC帧内预测时使用率较高的两种模式—PLANAR模式和DC模式,从而缩减RDO决策模式的数量.通过统计分析得到各个块所要保留的粗选择模式数量如表2所示:

表2 缩减RDO决策模式数量

2.3 算法描述

本文提出算法流程如下:

1)在进行粗选模式之前,计算当前PU块与相邻左边块、上边块、左上边块及右上边块四个PU的SSIM,当其中某个SSIM>0.000001时,则将此PU的预测模式作为当前PU的预测模式.

2)若某个SSIM≤0.000001时,则验证当前PU的MPM的SATD是否最小,若其SATD最小,则将此PU的预测模式作为当前PU的预测模式.

3)若MPM的SATD并非最小,则在精简候选模式中,选出最小的RD(Rate-Distortion率失真)代价的模式作为最佳预测模式.

3 实验结果与分析

实验环境是主频为2.6 GHz的Pentium(R)Dual-Core CPU、2 Gbyte 内存的 Windows 7 系统,实验平台采用由VS2010编译的HM12.1,配置文件选用配置encoder_intra_main.cfg,QP=27,测试过程中I帧的周期设置为1,所有编码帧均为帧内编码,每个序列测试100帧.测试结果如表3所示.

表3 模式选择快速算法的实验性能比较

表3的实验结果表明,本文算法在帧内预测编码平均节省35.6%的编码时间,在峰值信噪比PSNR有所增加的同时编码码率的减少了2.29%,这个性能损失值是可以接受的.在不同的分辨率或者序列特征下,可以实现降低几乎相同的复杂度,表明本文所提出的算法在实时HEVC编码应用的潜力.

为了更直观地表示编码器性能的损失,分别给出了在QP为22、27、32、37下,BQTerrace序列、BQMall序列、BlowingBubbles序列和vidyo1序列在文中算法与HEVC中现有算法的RD曲线比较.从图2中可以看出,两条曲线离得较近,说明本文提出的快速算法性能较好.

为了更好的比较本文算法的主观质量效果,图3给出了BasketballDrive序列的主观质量比较,从图可知,文中算法的主观质量与HEVC的算法相比,也没有明显下降.

图2 文中算法与RD算法的RD曲线Fig.2 RD curve of algorithm in this paper and the RD algorithm

图3 文中算法与RD算法的主观质量对比Fig.3 Subjective quality comparison of algorithm in this paper and the RD algorithm

4 结束语

本文在分析了HEVC中帧内预测算法和现有快速算法的基础上,提出了一种利用图形像素之间的结构相似度(SSIM)的快速处理方法,再通过统计MPM、PLANAR模式和DC模式最终被选为最佳预测模式的概率数据,来精简帧内预测候选模式,快速判决PU的预测模式.最后,本文将提出的算法与HM12.1的标准算法进行了比较,结论表明本文提出的快速帧内模式判断算法在不降低编码质量的情况下编码时间上减少了35.6%,而且对应的码率有轻微的减少,PSNR有一定的增加.总体来说,本文提出的HEVC快速帧内模式判决算法具有显著的实用价值和研究意义.

[1] Bross B, McCann K, Han W, et al. HEVC draft and test model editing[C]//ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting, 2013(1):3-58.

[2] Bross B, Han W, Ohm J, et al. WD5: Working draft 5 of high-efficiency video coding[C]//ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting, 2011:31-158.

[3] Kim J, Yang J, Lee H, et al. Fast intra mode decision of HEVC based on hierarchical structure[C]//Information, Communications and Signal Processing (ICICS) 2011 8th International Conference on IEEE, 2011:1-4.

[4] Matsuo S, Takamura S, Jozawa H. Improved intra angular prediction by DCT-based interpolation filter[C]//Signal Processing Conference (EUSIPCO), 2012 Proceedings of the 20th European. IEEE, 2012:1568-1572.

[5] Motra A S, Gupta A, Shukla M, et al. Fast intra mode decision for HEVC video encoder[C]//Software, Telecommunications and Computer Networks (SoftCOM), 2012 20th International Conference on IEEE, 2012:1-5.

[6] Sugimoto K, Itani Y, Isu Y, et al. Description of video coding technology proposal by Mitsubishi Electric[J]. JCTVC, A107, 2010: 29-59.

[7] Wiegand T, Ohm J, Sullivan G J, et al. Special section on the joint call for proposals on high efficiency video coding (HEVC) standardization[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012(3): 1661-1666.

[8] McCann K, Bross B, Kim I, et al. HM5: High efficiency video coding (HEVC) Test Model 5 Encoder Description[C]//ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting, Geneva, 2011: 89-147.

[9] Corrêa G, Assuncao P, da Silva Cruz L A, et al. Adaptive coding tree for complexity control of high efficiency video encoders[C]//Picture Coding Symposium (PCS), IEEE, 2012: 425-428.

[10] Zhao L, Zhang L, Ma S, et al. Fast mode decision algorithm for intra prediction in HEVC[C]//Visual Communications and Image Processing (VCIP), IEEE, 2011:1-4.

[11] Bross B, Han W, Ohm J, et al. WD5: Working draft 5 of high-efficiency video coding[C]//ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting,2011: 401-438.

[12] Yang Chun-ling, Xiao Dong-1in. Improvements for H.264 intra mode selection based on SSE and SSIM [J]. Journal of Electronics & Information Technology, 2011, 33(2):1-6.

[13] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity[J]. Image Processing, IEEE Transactions, 2004, 13(4): 600-612.

A fast intra prediction algorithm for HEVC

XIAO Xiuxiu, ZHANG Xinchen

(Physics Science and Technology School, Central China Normal University, Wuhan 430079)

A fast algorithm for intra mode decision in High Efficiency Video Coding (HEVC) is presented in this paper. In order to reduce the number of intra prediction mode and cut down the computational complexity, this algorithm takes full use of the structural similarity (SSIM) of the adjacent PU block and the regularity of selection probability of MPM、PLANAR model and DC model-in the candidate pattern. The experimental results show that time reduction from HM12.1 is averagely 35.6% and stable for various sequences. The corresponding bit rate decreases by 1.34% and PSNR-Y increases by 0.5058 dB.

video coding; HEVC; intra prediction; mode decision

2014-12-25.

教育部-中国移动科研基金研发项目(MCM20122041);湖北省自然科学基金项目(2014CFB656); 华中师范大学中央高校基本科研业务费项目(CCNU14A05044).

1000-1190(2015)05-0687-05

TN919.81

A

*E-mail: xiaoxx620@163.com.

猜你喜欢
代价复杂度编码
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
一种低复杂度的惯性/GNSS矢量深组合方法
Genome and healthcare
爱的代价
求图上广探树的时间复杂度
代价
某雷达导51 头中心控制软件圈复杂度分析与改进
成熟的代价