高彦军
(郑州地铁集团有限公司运营分公司,河南郑州 450000)
通过监控视频采集到的信息具有较强的直观性,但是由于监控视频自身占用空间较大且不易上传,因此,需要对监控视频进行处理,以提升监控视频的应用效果。可以通过压缩编码技术降低视频的占用空间,为监控视频的处理创造有利条件。
针对视频压缩问题,相关领域的学者进行了深入地研究。文献[1]提出一种全高清视频实时压缩编码与存储系统设计方法,该方法将H.264 作为技术支撑,对视频进行压缩编码处理,同时,通过FPGA+FLASH 方式对编码处理后的视频进行存储。相比传统压缩编码方法,该方法的压缩编码效率得到了提高,但是其在技术应用方面具有一定的局限性,导致该方法的整体效率较低。文献[2]提出了一种基于JND 与梯度显著度的HDR 视频编码方法,以最大熵定理为基础,分割HDR 视频帧,得到视频的不同区域。修正HDR 视频帧的JND 阈值,同时,考虑视频的视觉影像因素,建立感知模型,通过该模型实现视频压缩编码。该方法能够实现高性能的监控视频压缩编码,但是该方法的覆盖面积过大,导致对视频的压缩编码时间较长。
针对上述问题,该文提出一种基于标准H.265 的监控视频压缩编码方法,该方法的主要创新点如下:
1)采用H.265 技术对视频的色度帧数进行预测,根据预测结果选取色度帧内候选的最优模式,有助于降低传统方法预测的复杂度。
2)进一步运用DM 推导模式从不同的预测结果中可以获取最佳的监控视频压缩编码方式,避免冗余计算,有利于提升视频压缩编码效率。
3)H.265 技术可以直接避免帧间的像素数据提取操作,大幅度提高了插值精准度。
在监控视频格式中利用H.265/HEVC 选取色度帧内预测参数,并通过DM 模式进行参数提取,该模式运用分量空间形式对色度帧数进行预测,具有复杂度低的特点,能够很好地得到分量空间内亮度最大的位置,通过亮度的对比寻找不同色度帧数之间的关系变化情况[3-4]。得知DM 模式下色度帧数根据亮度不同而出现预测结果的变化后,可进行最优模式的选择[5-6]。
在监控视频格式中选取LM-L 格式、LM-T 格式和DC 格式数据进行初步预测,计算出每个种类格式的SATD,从计算结果中分析出三种模式的适应环境;对初步获取的三种模式进行选择,对三种模式的失真情况进行对比,选择最优的模式;并对最优模式进行记录和储存,实现帧内预测和帧间预测[7-8]。
选取DM 模式对色度亮度参数分量间的相关性进行计算,得到色度编码的质量阈值。一个色度亮度可以被多个DM 模式提取相关性信息,基于此可以初步构建出DM 模式候选列表,构造方法如表1所示。
表1 DM模式候选列表构造方法
为了强调监控视频压缩编码模式的最佳状态,该文还对候选列表进行冗余检查,引入可以识别色度的算法。在监控视频的某一帧图像中截取部分面积,然后引入不同模式,在不同模式下添加选择最佳模式的算法,算法公式如下:
式中,width、height 分别代表监控视频截取图像的长度和高度;x代表帧数的代号[9-10]。
DM 推导模式可以对一帧的监控视频进行不同方向的预测,从不同的预测结果中可以获取最佳的监控视频压缩编码方式。对色度帧内预测环境进行初始化,调整初始模式为DM 模式,调控DM 亮度预测模式中的角度范围为4 ≤M≤88,对M加减N值,得到的结果分别为M1和M2,式(2)和式(3)为DM 推导模式,算法表达式为:
传统的DM 推导算法受到角度范围的约束,通过以上计算可以很好地避免冗余检查,确定最优模式[11]。
H.265 监控视频压缩编码具有树形编码结构,在进行压缩编码的过程中可以将一帧图像划分成为多个相互独立的编码树单元,H.265 技术下的编码数单元大小为64×64,能够融入到高分辨率的监控视频中,从而为更高效率的压缩编码提供硬性基础[12-14]。64×64 的编码数单元还可以进一步实现分解,最多可以划分为三叉,每叉单元均可以根据相关的编码特征进行格式的平滑处理,若编码数单元小于64×64可以不进行下一阶段的分解,按照编码数单元的纹理即可完成监控视频的初步压缩编码。得到的树形编码结构如图1 所示。
图1 树形编码结构
考虑到监控视频硬件设备是否支持H.265 技术的实现问题,该文对亮度大小为4×4 的帧内预测进行了强制变换,使监控视频在解压编码的过程中亮度参数只能在DCT2 和DST7 之间反复切换。DCT2切换到DST7 的计算公式如下:
式中,T(j)代表基函数;j、i分别代表DCT2 和DST7 函数核类型。DST7 切换到DCT2 的计算函数如下所示:
式中,M(j)表示DST7切换到DCT2的计算函数[15]。
H.265 监控视频完成树形编码结构的划分后,按照预测单元的量化模式变化情况需要进行帧内/帧间预测。其中,帧内预测技术的实现基于监控视频中每一帧的两个相邻的重构图像,H.265 技术下的帧间预测技术在1/2 帧间使用对称8 阶滤波器,在1/4帧间使用非对称7 阶滤波器,直接避免了帧间的像素数据提取操作,大幅度提高了插值精准度。除此之外,帧间预测技术还利用时域/空域运动向量的相关性,定义了播放状态下不同预测模式下的编码参数,通过一个编码参数便可以索引到整个监控视频的待压缩编码片段[16]。H.265 技术下的所有编码流程均装设了传输加速方案,使得监控视频的压缩编码速度能够与视频监控的播放采集速度相匹配。
为了验证该文提出的基于标准H.265 的监控视频压缩编码方法的实际应用效果,进行实验研究。选用传统的全高清视频实时压缩编码与存储系统设计方法(文献[1]方法)和基于JND 与梯度显著度的HDR 视频编码方法(文献[2]方法)进行实验对比。
由于5.0 Hz 的无线频段能够在短时间内实现长距离传输,且信号强度更强,稳定性更好,因此该文选用5.0 Hz 的无线频段作为实验研究对象,设置传输距离为3 km,数据传输速率在600 Mb/s 以上,每隔500 m 设置一个中继点,实验环境如图2 所示。
图2 实验环境
在上述参数设置与实验环境下进行实验分析。在实验中,将压缩效率、编码效率与压缩编码成本作为实验指标,对该文方法、文献[1]方法和文献[2]方法进行对比,得出相关结论。
1)压缩效率对比
压缩效率实验结果如图3 所示。
图3 压缩效率实验结果
观察图3 可知,相比文献[1]方法与文献[2]方法,该文方法的压缩效率得到了大幅度提升,说明该文方法解决了传统方法存在的视频压缩编码效率较低的问题,具有较强的压缩编码能力。
2)编码效率对比
同时分析编码效率,得到的编码效率实验结果如图4 所示。
图4 编码效率实验结果
根据图4 可知,该文提出的编码方法编码效率最高,原因是H.265 为帧内预测模式提供了30 多种帧内预测途径,与传统方法相比,能够更细致地对图像角度进行划分,使得H.265 监控视频压缩编码具有更高的精确度,在提高了精确度的同时也减少了残差数据在压缩编码中的存在量,进而提高了压缩效率。帧间预测技术是一种运动补偿方法,可以在监控视频实时播放的状态下,利用插值法提取监控视频中非整数像素,因此,能够在短时间内实现高质量数据编码。
3)成本对比
标准H.265 能够结合上游芯片和IC 技术,降低工作运行成本,为验证标准H.265 在监控视频压缩编码方面的成本降低能力,对编码成本进行分析,得到的实验结果如表2 所示。
观察表2 可知,该文提出的H.265 压缩编码成本远低于传统的压缩编码方法。该文提出的压缩方法通过H.265 不同编码格式下的视频资源分别传输到压缩终端,终端内支持各种APP 端和flash端的流畅播放,通过压缩编码技术进行了空间释放,增加了CPU 的运算处理能力,减少了硬件设备的高负荷运转,避免了压缩编码后的监控视频出现画面卡顿、格式不兼容和音频错位等问题,有效降低了成本。
综上所述,基于H.265 的视频压缩方法相比传统方法具有更高的压缩与编码效率,且能够实现在较短的宽带内完成监控内容的上传,成本更低,能够很好地解决成本问题,更适用于实际的压缩工作。
H.265 作为未来视频压缩编码市场的主要技术标准,相比传统技术具有更高的工作效率和压缩空间。该文基于H.265 技术标准设计了监控视频的压缩编码方法,解决了监控视频压缩编码CPU 过负荷参与而导致的压缩空间小问题,还运用各种模式预测方法选择了最佳的压缩编码模式,大幅度提高了压缩编码效率。在树形编码结构、帧内/帧间预测技术和采样自适应补偿等技术优势的基础上,实现了监控视频压缩编码方法流程运作。