基于运动特征的HEVC帧间模式快速判决算法

2016-06-23 06:02金智鹏代绍庆王利华

电视技术 2016年1期

关键词：二阶编码深度

金智鹏，代绍庆，王利华

(1.嘉兴职业技术学院　信息技术分院，浙江嘉兴 314036；2.浙江(嘉兴)微软技术研究中心，浙江嘉兴 314000)

基于运动特征的HEVC帧间模式快速判决算法

金智鹏1，代绍庆1，王利华2

(1.嘉兴职业技术学院信息技术分院，浙江嘉兴 314036；2.浙江(嘉兴)微软技术研究中心，浙江嘉兴 314000)

摘要:为降低HEVC帧间预测编码过程的计算复杂度，提出了一种新的基于运动特征的编码单元(CodingUnits，CU)及预测单元(PredictionUnits，PU)快速判决算法。首先，通过二阶帧差法检测运动剧烈程度，并分析运动特征对CU及PU时域相关性的影响。然后，利用前帧相同位置CU及PU的最优模式预测当前CU的深度范围，并根据运动剧烈程度优化预测范围。最后，根据预测范围跳过和终止部分不必要的CU深度和PU模式，从而加快帧间编码速度。在HM12.0平台上的实验测试表明，该算法在BDPSNR仅降低0.068dB、BDBR只增加1.530%的情况下，提高了48.389%的编码速度。

关键词:HEVC；帧间预测；编码单元(CU)；预测单元(PU)；前帧相同位置；CU深度范围

新一代高性能视频编码国际标准(HighEfficiencyVideoCoding，HEVC)主要面向高清晰度、高帧率、高压缩率的应用需求[1]。相比H.264，HEVC采用了四叉树结构的编码单元(CodingUnits，CU)、预测单元(PredictionUnits，PU)和变换单元(TransformUnits，TU)等众多新技术[2]，将压缩效率提高了一倍。

HEVC将每帧图像按最大编码单元(LargestCodingUnits，LCU)进行划分，每个LCU又可分为一个或多个不同深度(depth)的CU，包括64×64(depth=0)、32×32(depth=1)、16×16(depth=2)、8×8(depth=3)等4种CU模式。每一深度的CU又可按2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N等8种PU模式进行预测编码[3]。在编码过程中，HEVC采用遍历方式比较上述各种CU及其PU模式的率失真代价，并根据率失真代价确定LCU的最优四叉树结构以及各深度CU的最优PU预测模式，这使得编码器的计算量非常巨大。

为了降低编码复杂度，HEVC采纳了早期编码单元设置(EarlyCodingUnit，ECU)[4]、快速合并模式(FastDecisionforMerge，FDM)[5]、编码标志快速终止(CodedBlockFlag，CBF)[6]、自适应CU深度遍历(AdaptiveCUDepthRange，ACUDR)[7]等一些快速编码算法，以减少编码时间。

为进一步提高HEVC的编码速度，Kim等人[8]通过分析运动矢量差和CBF，提前检测当前PU是否满足Skip模式，并终止后续PU预测模式的遍历计算。Lee等人[9]等利用时域相关性来预测当前CU的深度范围，跳过部分可能性较低的CU模式。Shen等人[10]利用时空相关性以及CU层间相关性来预测当前CU的深度范围，并通过检查运动矢量和率失真代价，提前终止PU模式的计算，以降低编码复杂度。

近来，蒋等人[11]提出了一种基于贝叶斯决策的CU快速判决算法，通过相邻LCU的四叉树结构来预测当前LCU的深度范围，并依据率失真代价和阈值的比较进行CU提前终止判决。晏等人[12]提出了一种CU分级判决快速算法，采用自适应权值量化分析时空相邻CU之间的相关性，并预测当前CU的深度范围，跳过和提前终止不必要的深度计算。

上述快速算法在很大程度上减少了CU遍历范围，但若能结合CU运动特征分类进行CU深度预测，可进一步提高编码速度。本研究将基于CU的运动特征，分类进行CU及PU模式的快速判决，加快HEVC帧间编码速度。

1HEVC帧间模式快速判决算法

1.1CU运动特征检测

在帧间编码过程中，背景和纹理平滑区往往采用大尺寸CU进行编码，以降低编码码率；运动剧烈区域往往采用小尺寸CU进行编码，以提高编码质量。因此，预判CU的运动特征是提高编码速度的关键。

帧间差分法是比较常用且有效的运动对象检测法[13]，即利用前后两帧相同位置处像素的亮度绝对差来衡量运动变化程度。本文采用LCU中4个32×32子CU的二阶亮度绝对差来检测运动对象并衡量其运动幅度。32×32子CU的一阶帧差(FirstDifferenceofCU，FD)计算如下

(1)

式中：FD(cur)表示当前32×32子CU的一阶帧差；fcur(x,y)表示当前32×32子CU的亮度像素值；gcol(x,y)表示前一帧相同位置处32×32子CU的亮度像素值。

但是由于摄像机抖动、镜头运动、光照等影响，一阶帧差的运动对象检测效果并不理想。鉴于由摄像机抖动所产生的帧间差是持续的、大小相近的，因此本文通过计算二阶帧差，滤除由摄像机抖动等因素所带来的扰动和噪声。32×32子CU的二阶帧差(Second Order Difference of CU，SOD)的定义如下

(2)

式中：SOD(cur)表示当前32×32子CU的二阶帧差；FD(col)表示前一帧相同位置处子CU的一阶帧差。

基于上述分析，本文根据二阶帧差SOD来衡量CU的运动特征，并将当前CU分为3种类型：背景平滑区、运动平缓区和运动剧烈区。具体分类如下

(3)

根据编码经验，设置T1=128，T2=3×T1，能取得较佳的编码效果。

1.2运动特征对CU及PU时域相关性的影响

为了掌握相邻两帧之间CU及PU最优模式的相关性概率，分析CU运动特征对CU及PU模式划分的影响，本文采用ClassA～E的15个不同分辨率和运动特性的视频序列进行编码统计。测试平台为HEVC参考软件HM12.0[14]，统计结果如图1和表1所示。

表1中，PCU表示相邻两帧相同位置CU其模式相同的概率，即CU模式相同的面积/图像总面积；PPU表示相同位置PU模式相同的概率。据表1的数据统计可知，运动剧烈区，其相邻两帧之间的PCU平均仅为50.4%；说明其时域相关性较弱，前帧相同位置的最优CU模式不具有参考意义。而对于背景平滑区，其相邻两帧之间的CU及PU模式有着高度的相似性，其PCU平均为82.6%，其PPU平均达89.2%，分别比运动剧烈区高出32.2%和27.7%。因此，对于背景平滑区，可以使用前帧相同位置的最优CU及PU模式来预测当前CU及PU的模式范围；其预测准确性高，且对不同类型的序列都比较稳定。

表1相邻两帧之间CU及PU最优模式的相关性概率 %

从图1可见，各种PU预测模式中，2N×2N模式的使用概率高达84.6%，远高于其他预测模式的使用率。结合表1的统计数据，若当前CU被判为背景平滑区，则当前CU的PU模式更有可能为前帧对应位置的最优PU模式和2N×2N模式；因此，根据一定的判断条件跳过其他冗余PU模式是合理的。

1.3CU划分模式快速判决

步骤1)第1个P帧图像，根据LCU的一阶帧差结果进行运动区和背景区的判断。如果当前LCU的一阶帧差FD>1 920，则判为运动区；否则判为背景区。对运动区遍历计算深度depth=1～3的CU模式，并根据率失真代价选择最优的CU四叉树结构；对背景区，则直接确定depth=0为最佳CU模式。

步骤2)后续P帧图像，先进行二阶帧差计算，判断当前CU的运动特征，并根据CU特征选取相应的编码策略。如果当前LCU中某个32×32子CU的二阶帧差SOD>T2，则判定当前LCU处于运动区，转入步骤3)；否则，判定当前LCU处于背景区，转入步骤4)。

步骤3)运动区。如果当前32×32子CU的二阶帧差SOD>T2，属于运动剧烈区，则设置当前CU的深度遍历范围为depth=1～3。非运动剧烈区，首先获取前帧相同位置处CU的最小深度MinDepth和最大深度MaxDepth，作为当前CU划分的预测范围。然后进一步优化，如果当前32×32子CU的二阶帧差SOD>T1，属于运动平缓区，则修正CU预测范围MinDepth--、MaxDepth++。转入步骤5)。

步骤4)背景区。首先获取前帧相同位置处CU的最小深度MinDepth和最大深度MaxDepth，作为当前CU的预测范围。进一步优化，如果当前32×32子CU的二阶帧差SOD>T1，属于运动平缓区，则MaxDepth++；如果当前32×32子CU的二阶帧差SOD≤T1，属于背景平滑区，则MinDepth--。

步骤5)跳过和终止不必要的CU深度，进行编码计算。根据对当前CU的预测范围，跳过深度depth

步骤6)对LCU中的每个子CU，递归进行步骤2)～5)的判决过程。

1.4 PU预测模式快速判决算法

步骤1)第1个P帧图像，采用PU预测模式全遍历计算，根据率失真代价选择最优的PU预测模式。

步骤2)后续P帧图像，依据二阶帧差计算结果，分运动区、平缓区、背景区等3种情况设置PU模式候选范围。

步骤3)运动区，采用所有PU预测模式全遍历计算。

步骤4)平缓区，采用2N×2N、2N×N、N×2N、和前帧对应位置的最优PU模式组成候选集。

步骤5)背景区，采用2N×2N、前帧对应位置的最优PU模式组成候选集。

步骤6)根据PU模式候选集，计算最优PU模式。如果在2N×2N模式下，残差经量化后的所有系数为0，且运动矢量差值也为0，则认定2N×2N模式为当前CU的最优PU模式，提前终止PU模式候选集的计算。

本文算法CU及PU模式判决过程如图2所示。

2实验结果及数据分析

为测试与分析快速算法的性能，在HM12.0软件平台上按通用测试条件[15]进行测试分析。编码器采用低复杂度配置、低延时编码方案，具体测试参数为：

IPPP，MaxPartitionDepth=4，MotionSearchRange=64；采用快速合并模式判决算法(FastDecisionforMerge，FDM)、快速运动估计搜索算法(EnhancedPredictiveZonalSearch，EPZS)和运动搜索加速算法(FastEncoderDecision，FEN)；编码QP设置为22、27、32和37。

算法性能采用BDBR和BDPSNR[16]指标进行评价，分别表示同样PSNR下码率的损失和相同码率下PSNR的损失情况。采用平均节省时间(AverageSavingTime，AST)表示编码复杂度，其定义如下

(4)

式中：AST表示本文算法相比HM12.0节省的编码时间；Timeproposed和TimeHM12.0分别表示本文算法和HM12.0的总体编码时间。

由表2可见，与HM12.0编码器相比，本文算法的BDBR平均增加1.530%，BDPSNR平均损失0.068dB，编码时间AST平均节省48.389%。这一结果说明，本文提出的HEVC帧间模式快速判决算法具有良好的率失真性能，能大幅降低编码时间。特别是对于背景静止、运动复杂度较低的序列，本文算法可以跳过大量不必要的CU深度和PU模式计算，加速效果尤为显著。

表2本文快速算法测试结果与HM12.0的比较

图3和图4分别为HM12.0和本文快速算法对“BasketballPass”(416×240)序列进行编码的最优CU划分示意图。根据图3和图4的对比可见，仅有5处地方CU划分结构不同，且CU划分深度差都仅为1(如图4中圆圈标识的区域)。这说明本文快速算法的CU划分准确性较高。

为进一步评估本文快速算法的性能，笔者将文献[11]中编码单元裁剪与快速选择算法、文献[12]中时空相关的CU分级判决算法和本文基于运动特征的快速算法进行比较。从表3各种快速算法的率失真和编码时间对比数据可知，与文献[11]提出的算法相比，本文算法的BDBR降低0.65%，编码时间能多节省6%；与文献[12]提出的算法相比，本文算法的编码时间能节省3%，BDPSNR提高0.02dB，BDBR降低0.98%。因此，本文快速算法的综合性能要优于这两种快速算法。其主要原因是本文算法通过二阶帧差法提取运动对象，提高了对不同运动特征的CU及PU的预测针对性和准确性，特别是有效减少了背景平滑区的CU及PU遍历范围。

3小结

根据运动特征对CU及PU时域相关性的影响分析，本文提出了一种新的基于运动特征的CU及PU模式快速判决算法。该算法首先采用二阶帧差法提取运动对象并判定运动剧烈程度，然后根据运动特征采用不同的编码策略。对运动剧烈区，仍以大范围遍历计算为主；对背景平滑区，则主要以前帧相同位置CU及PU的最优模式来预测当前CU的深度范围，从而有效减少了CU及PU的遍历范围。实验结果显示，本文算法提高了48.389%的编码速度，能促进HEVC面向高清视频监控、视频会议以及低复杂度实时编码等领域的应用。

参考文献：

[1]沈燕飞，李锦涛，朱珍民，等. 高效视频编码[J]. 计算机学报，2013，36(11)：2340-2355.

[2]CORREAG，ASSUNCAOP，AGOSTINIL，etal.Performanceandcomputationalcomplexityassessmentofhigh-efficiencyvideodecoders[J].IEEEtransactionsoncircuitsandsystemsforvideotechnology，2012，22(12)：1899-1909.

[3]刘昱，胡晓爽，段继忠. 新一代视频编码技术HEVC算法分析及比较[J]. 电视技术，2012，36(20)：45-49.

[4]CHOIK，PARKSH，JANGES.CodingtreepruningbasedCUearlytermination[C]//Proc.JCT-VC6thMeeting.Torino：JCT-VC， 2011：14-22.

[5]LAROCHEG，POIRIERT，ONNOP.Encoderspeed-upforthemotionvectorpredictorcostestimation[C]//Proc.JCT-VC8thmeeting.SanJose，CA，USA：JCT-VC，2012：121-128.

[6]GWEONRH，LEEYL，LIMJ.EarlyterminationofCUencodingtoreduceHEVCcomplexity[C]//Proc.JCT-VC6thmeeting.Torino：JCT-VC，2011：1-5.

[7]LIX，ANJC，GUOX，etal.AdaptiveCUdepthrange[C]//Proc.JCT-VC5thMeeting.Geneva：JCT-VC，2011.

[8]KIMJ，YANGJ，WONK，etal.EarlydeterminationofmodedecisionforHEVC[C]//Proc.PictureCodingSymposium(PCS).Kraków，Poland：PCS2012：449-452.

[9]LEEHS，KIMKY，KIMTR，etal.Fastencodingalgorithmbasedondepthofcoding-unitforhighefficiencyvideocoding[J].Opticalengineering，2012，51(6)：56-61.

[10]SHENLiquan，LIUZhi，ZHANGXinpeng，etal.AneffectiveCUsizedecisionmethodforHEVCencoders[J].IEEEtransactionsonmultimedia，2013，15(2)：465-470.

[11]蒋刚毅，杨小祥，彭宗举，等. 高效视频编码的快速编码单元深度遍历选择和早期编码单元裁剪[J]. 光学精密工程，2014，22(5)：1322-1330.

[12]晏轲，滕国伟，胡锦雯，等. 一种基于时空相关性的编码单元深度快速分级判决算法[J]. 光电子·激光，2014，25(1)：156-162.

[13]姚春莲，郭克友. 一种利用帧差信息的实时运动对象检测算法[J]. 计算机工程与应用，2011，47(8S)：390-393.

[14]JCT-VC．HEVCReferenceSoftwareHM-12.0 [EB/OL][2014-09-01].https//hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-12.0.

[15]BOSSENF.JCTVC-L1100,Commontestconditionsandsoftwarereferenceconfigurations[S].2013.

[16]PATEUXS，JUNGJ.Anexceladd-inforcomputingbjontegaardmetricanditsevolution[S].2007.

金智鹏(1982— )，硕士，副教授，主要研究方向为低复杂度视频编码与传输、图像质量评价等；

代绍庆(1972— )，硕士，副教授，主要研究图像压缩、图像处理与模式识别；

王利华(1977— )，高级工程师，主要研究网络视频测试与传输技术。

责任编辑：时雯

FastintermodedecisionalgorithmforHEVCbasedonmotionfeatures

JINZhipeng1，DAIShaoqing1，WANGLihua2

(1.Information Technology Branch Institute，Jiaxing Vocational Technical College，Zhejiang Jiaxing 314036，China；2. Zhejiang(Jiaxing) Microsoft's Technology Research Center，Zhejiang Jiaxing 314000，China)

Keywords:HEVC；interprediction；codingunits(CU)；predictionunits(PU)；co-locatedposition；CUdepthrange

Abstract:ToreducethecomplexityofHEVCinterpredictioncoding，anovelfastCU(CodingUnits)andPU(PredictionUnits)modedecisionalgorithmbasedonmotionfeaturesisproposed.Firstly，todetectmovementintensitythroughsecondorderdifferencemethod，andtoanalyzetheimpactofmotionfeaturestoCUandPUtemporalcorrelation.Secondly，topredictthecurrentCUdepthrangeandPUmodeusingthebestCUandPUmodeoftheco-locatedpositioninthepreviousframe.Then，tooptimizethepredictedrangeaccordingtothemotionfeatures.Finally，inordertospeeduptheinterpredictioncoding，toskipandterminationofsomeunnecessaryCUandPUmodeaccordingtothepredictedrange.ExperimentalresultsonHM12.0showthattheproposedalgorithmcanreduceencodingtimefor48.389%，whileBDPSNRlossisonly0.068dBandBRBRincrementis1.530%．

中图分类号：TN919.8

文献标志码:A

DOI：10.16280/j.videoe.2016.01.003

基金项目：浙江省教育厅科研计划项目(Y201431212)；嘉兴市科技计划项目(2014AY11003)

作者简介：

收稿日期：2014-9-12

文献引用格式：金智鹏,代绍庆,王利华.基于运动特征的HEVC帧间模式快速判决算法[J].电视技术,2016，40(1)：13-18.

JINZP，DAISQ，WANGLH.FastintermodedecisionalgorithmforHEVCbasedonmotionfeatures[J].Videoengineering,2016,40(1)：13-18.