DCT域HEVC帧内预测模式映射算法研究

2015-10-20 09:13李俊娟
电视技术 2015年3期
关键词:样点编码器纹理

李俊娟,刘 昱

(天津大学电子信息工程学院,天津300072)

高效视频编码(HEVC)标准由国际电信联盟通信标准部门(ITU-T)的视频编码专家组(VCEG)和国际标准化组织/国际电工委员会(ISO/IEC)的运动图像专家组(MPEG)组成的联合协作视频编码组(JCT-VC)制定,标准号为ITU-T Rec.H.265或ISO/IEC 23008-2。继H.264/AVC之后,该标准面向比高清晰度电视(HDTV)更高级别的图像格式,编码效率大幅提升。

1 HEVC简介

HEVC与自H.261以来的视频编码标准一样,也沿用了混合视频编码技术,包括帧内/帧间预测、变换编码和熵编码等。与此同时,与H.264/AVC相比,HEVC还采用了许多新的视频编码技术,如编码四叉树结构、变换四叉树结构、编码单元、预测单元、变换单元等。这些新的编码技术使得在同等视频质量下,采用HEVC对高分辨率的视频编码可节省约50%比特率[1]。

在获更高压缩效率的同时,HEVC编码计算复杂度也显著增加。在帧内预测处理中,HEVC支持35种帧内预测模式,如图1所示。其中,包括33种方向相关的预测模式(角度预测模式),和2种非方向相关的帧内预测模式(直流和平面预测模式)。实际上,每个角度预测模式都对应一个特定的预测方向[2-3]。例如,当帧内预测模式为34,待预测块的尺寸为4×4时(见图2),待预测块中的所有像素点由右上角的对角线至参考像素所在行或列投影,然后将待预测块中的像素点按其投影到的参考点的像素值赋值。

HEVC编码中,需遍历所有帧内编码模式,得相应的预测数据值并计算预测误差。为了降低帧内预测复杂度,应避免计算所有35种预测模式的预测数据和预测误差。显然,如果待预测块的纹理信息可提前获取,那么预测方向就变为已知,而只需选取该预测方向对应的1种角度预测模式和与其相邻的帧内预测模式作为疑似最优预测模式,于是无须遍历所有33种角度预测模式。

文献[4-6]采用基于DCT系数的思想实现了H.264/AVC帧内预测模块的加速。由于HEVC 支持的帧内预测模式更多,且支持从4×4到64×64尺寸的待预测块,因此要想用基于DCT系数的方案加速HEVC帧内预测,需研究DCT变换系数与33种HEVC帧内预测模式的对应关系。

图1 HEVC支持的35种帧内预测模式

图2 用相应参考像素生成预测块的示例

2 图像DCT数据与HEVC帧内预测模式的映射关系

2.1 HEVC的帧内预测数据生成

在HEVC帧内预测中,待预测块的样点值是根据重建好的参考样点值通过外推法得到。为了简化,参考样点均取自待预测块的相邻的参考行或列。当角度帧内预测模式取值为2~17时,参考样点取自待预测块左侧参考列;当角度帧内预测模式取值为18~34时,参考样点取自待预测块上方参考行。

获取待预测块中每一样点值的具体方法是:将该待预测样点位置沿给定角度帧内预测模式代表的方向向参考行或列做投影;当投影所得位置为整数时,直接将该位置处的参考样点值赋值给该待预测样点,当投影所得位置不是整数时,将距该位置最近的两参考样点值加权平均,得待预测样点值

式中:wy代表投影位置到两个最近参考样点位置距离的权重;“>>”代表按位右移操作。距离投影位置最近的两个参考样点的位置坐标为(i,0),(i+10),及权重wy计算方法如下

式中:d为与角度帧内预测模式相关的参数,取值范围-32~+32,如表1第2、第4列所示;&代表按位与运算。可以看出,cy和wy只依赖于待预测样点位置坐标y与角度帧内预测模式相关的参数d。因此,在特定角度帧内预测模式下,待预测块内同一行的待预测样点对应的和均相等,即只需计算一次。

表1 角度预测模式与纹理方向映射表

式(1)和式(2)给出了在帧内预测模式为18~34情况下,待预测块内样点值的计算方法,此时利用待预测块上方参考行完成。当角度帧内预测模式为2~17时,预测由待预测块左侧参考列完成。

在某些情况下,投影所得像素位置可能为负值。此时,需对参考行或参考列扩展。参考行需向左扩展时,用参考列沿给定预测方向为参考行左侧样点值赋值;参考列需向上扩展时,用参考行沿给定预测方向为参考列上方样点值赋值。

2.2 图像DCT数据与角度帧内预测模式的关系

DCT变换是一种为去除空间域相关性而广泛使用的方法。其计算式为

式中:ACu,v代表位于第i行第j列的DCT系数。事实上,每个DCT系数代表一个有特定纹理方向的基图像,如图3所示。此外,每个DCT系数的绝对值反映了原始待预测块的纹理特征与该基图像纹理特征的相似程度。显然,第1行DCT系数的基图像具有垂直的纹理特性,类似地,第1列的DCT系数的基图像具有水平纹理特性。此处用Energyv,Energyh分别表示原始待预测块具有垂直或水平纹理特征的可能性。因此这两个量的计算方法如

图3 DCT系数和相应的基图像

基于上述对DCT系数特性的分析,本文建议采用如下方法计算待预测块的纹理方向

式中:变量θ表示原始待预测块的纹理方向与水平轴正向间的角度值。

由于每个角度预测模式分别代表一个特定预测方向,因此33种角度预测模式与预测方向角度间的映射关系如表1第5列所示。以角度预测模式33为例(见图1),其预测方向角记为 α1,根据平行线定理,角度 α1与 α2相等,而 α2=arctan(32)=50.91°,因此 α= α=50.91°。2612

此外,如图1所示,角度预测模式19的预测方向角度为b1,其补角为 c1,c1的平行角为 c2。对于等腰三角形,c2=α2,于是b1与α1互补,因此本文将角度预测模式19和33称为对称模式对,这样表1可简化为第3列所示。

考虑到式(7)计算的纹理方向角度连续,其取值区间为(0°,90°),因此需对其离散化,来匹配离散的33种角度预测模式。以角度预测模式13为例,通过查表1的第5列可知,其预测方向角度为15.71°,其相邻的角度预测模式12和14的预测方向角度分别为 8.88°和 22.11°。

假设这三种角度预测模式被选为最优预测模式的可能性相等,本文采用如下方法计算角度预测模式13对应的纹理方向角度区间

类似地,其他角度预测模式的纹理方向角度区间也可计算得到,如表1的第6列所示。

建立了纹理方向区间和角度预测模式间的映射关系后,用式(7)对原始待预测块的纹理方向角度进行估计,再根据该纹理方向角度位于表1第6列的哪一个区间中来将相应的角度预测模式(记为纹理模式)确定为备选帧内预测模式。选择第1列还是第3列的角度预测模式作为纹理模式取决于AC0,1和 AC1,0符号是否同号,同号时选第 3 列,否则选第 1 列。

3 实验及结果

本文基于HEVC编码器HM12.0[7],采用C语言实现了本文提出的DCT系数与帧内预测模式之间的映射处理,并对标准的HEVC编码器进行改进,改进后称为基于DCT系数的HEVC编码器。

为了提高编码器的预测精度,本文在计算得到纹理方向角度后,以该纹理方向角度为中心,左右各取相同的角度偏移,构成一个预测角度范围,来弥补本文计算纹理方向角度的方法存在的误差,并允许预测方向角度位于该预测角度范围内的所有角度预测模式进入帧内预测模块。

本实验做出如下两个假定:

假定一,基于DCT系数的HEVC编码器与原始HEVC编码器相比,比特率差异小于0.5%,且编码质量PSNR差异小于0.01 dB时,认为本实验得到的最优预测模式与原始HEVC编码器一致,误差近似为0。

假定二,33种角度预测模式均匀分布于180°的范围中。该假定是为方便统计左右角度偏移量和预测角度范围。

实验采用全Ⅰ帧高效率配置条件,进行全Ⅰ帧编码,实验序列为 PeopleOnStreet(2 560×1 600 Class A)、Kimono(1 920×1 080 Class B)、RaceHorses(832 × 480 Class C)、BlowingBubbles(416×240 Class D)、Vidyo4(1 280×720 Class E),实验素材为分别从上述5个测试序列中随机抽取出的50帧视频画面。量化系数设置为22,27,32和37。考虑到不同预测块尺寸下的纹理方向误差的差异性,本实验对不同尺寸的预测块采用了不同的预测角度范围,所得实验结果如表2所示。

表2 粗略纹理方向与实际最优预测模式方向的偏差

以PeopleOnStreet序列为例,为保证基于 DCT系数的HEVC编码器的编码质量,对于尺寸为64×64的预测块,需在计算出纹理方向后,以该纹理方向为中心,向左右各偏移5.625,形成11.25的预测角度范围即可覆盖最优预测模式所在位置,所得粗略纹理方向与实际最优预测模式方向的偏差在5.625以内。

由实验结果可知,所得粗略纹理方向与最优预测模式的预测方向很接近:最小偏差为0,即计算出的纹理方向与最优预测模式基本一致;最大偏差为28.125,即最优预测模式存在于以粗略纹理方向为中心形成的56.25的角度范围内。为避免出现最大偏差,本文采用下文所述按不同块尺寸设定帧内预测模式备选数量的措施。

由表2数据可知,对64×64尺寸的数据块,预测精度最高,平均约15,而4×4数据块的预测精度较低,平均约31。据此,应相应确定备选的帧内预测模式数量,例如64×64数据块的备选模式数量为4,而4×4数据块为12。这表明,本文基于DCT系数预测HEVC帧内角度的方法,可大幅降低HEVC帧内预测计算的复杂度。

4 小结

本文建立了基于DCT系数的纹理方向与33种HEVC帧内角度预测模式间的映射关系,提出了一种根据DCT系数的分布特征来快速锁定疑似最优帧内预测模式的方法。该方法先将原始待预测块进行DCT变换,利用DCT系数粗略提取出原始待预测块的纹理信息,根据与角度预测模式之间的映射关系,锁定疑似最优帧内预测模式。该种映射关系将最优帧内预测模式的搜索范围从180°降低为最高56.25°,从而避免了遍历35种帧内预测模式造成的高计算量和高编码时间。

[1] SULLIVAN GJ,OHM JR,HAN WJ,et al.Overview of the high efficiency video coding(HEVC)standard[J].IEEE Trans.Circuits And Systems for Video Technology,2012,22(12):1648-1667.

[2] LEE SW,KIM Y M,CHOI SW.Fast scene change detection using direct feature extraction from MPEG compressed videos[J].IEEE Trans.Multimedia,2000,2(4):240-254.

[3] EOM M,CHOE Y.Fast extraction of edge histogram in DCT domain based on MPEG7[J].IEEE Trans.Engineering Computing and Technology,2005(9):209-212.

[4] LA B,EOM M,CHOE Y.Fast mode decision for intra prediction in H.264/AVC encoder[C]//Proc.IEEE International Conference on Image Processing.San Antonio,TX:IEEE Press,2007:321-324.

[5] LIU X,YOO K Y,KIM SW.Low complexity intra prediction algorithm for MPEG-2 to H.264/AVC transcoder[J].IEEE Trans.Consumer Electronics,2010,56(2):987-994.

[6] HAN Xiaojun,WANG Yongsheng,DU Xianyan.Optimization and realization of texture-based H.264 video coding algorithm[C]//Proc.IEEE International Conference on Control,Automation and Systems Engineering.Singapore:IEEE Press,2011:1-3.

[7] JCT-VC.HEVC reference software hm 12.0[EB/OL].[2014-08-08].https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-12.0/.

猜你喜欢
样点编码器纹理
小麦条锈病田间为害损失的初步分析
基于空间模拟退火算法的最优土壤采样尺度选择研究①
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
基于FPGA的同步机轴角编码器
基于分融策略的土壤采样设计方法*
TEXTURE ON TEXTURE质地上的纹理
应用旋转磁场编码器实现角度测量
养猪发酵床垫料微生物类群结构特性分析
消除凹凸纹理有妙招!