AVS2/AVS3视频编码标准分析

2023-01-19 03:38中央广播电视总台王晟
卫星电视与宽带多媒体 2022年24期
关键词:总台数据量滤波

中央广播电视总台:王晟

AVS(Audio Video coding Standard,音视频编码标准)系列编码标准是国内具备自主知识产权的编码标准;该系列标准从AVS至AVS+,AVS2,AVS3目前经历20年发展,广泛应用于国内数字电视、网络流媒体、IPTV、视频监控等多个领域。随着超高清时代来临,视频压缩编码技术在媒体传播领域越来越重要,在技术层面,AVS2标准主要面向4K超高清应用,压缩效率与H.265(HEVC)相当,AVS3标准主要面向8K超高清和VR等领域应用,压缩效率与H.266(VVC)相当,且AVS系列标准相对于H.26X系列标准在专利费方面具有优势。目前AVS系列标准在国家大力支持下,已经建立了从标准制定到芯片终端较为完整的产业链,面对如今的国际环境,预计未来AVS2/AVS3标准将广泛应用于国内各视音频领域。

1.视频编码算法

1.1 算法简介

视频占网络传输大部分数据量,以1920*1080,帧率30帧高清视频为例,每秒数据量1920*1080*30*24=186.6MB。经过视频压缩编码后,数据量可以达到2MB,而且并不影响用户体验。视频编码的核心是降低视频中的冗余信息。视频中的冗余信息包括空间冗余、时间冗余、结构冗余、信息商冗余。视频编码技术就是针对不同的冗余信息采用不同算法压缩数据量。

目前主流编码算法编码可分为帧内编码、帧间编码、转换编码、环路滤波、熵编码四部分。帧内编码减少空间冗余信息,基本原理为将预测图形分块,使用已编码的相邻块为参考源,通过预测模式构建预测块,计算当前块和预测块的差值,保留传送预测模式和差值实现数据压缩。帧间编码去除视频帧序列间冗余度,余每秒视频内大部分帧内容基本相同。帧间编码针对时间冗余进行编码,通过计算运动矢量信息和运动补偿计算出预测块,对比当前块与预测块的差值,保留传送运动矢量和差值实现数据压缩。转换编码算法大部分以DCT变换为基础,视频图像大部分信息存在于低频范围,高频范围信息量低,DCT变换通过离散余弦变换将原始图像信息转换成不同频率的分量系数集合;对低频集合分配较多比特数,对高频集合分配较少比特数,以此减少数据量。环路滤波通过对反变换的重建图像进行滤波,消除图像块效应(边界不连续性),再将图像输出显示并作为参考图像进行运动补偿,提升图像质量和算法准确性。熵编码算法基于统计学,通用算法为可变长度编码(VLC)、霍夫曼编码、算术编码;为无损压缩编码,通过统计学理论对数据进行编码,如霍夫曼编码对数据出现的频率进行编码,多次出现数据分配较少比特,少次出现数据分配较多比特。

主流视频压缩算法基于以上算法模块在不影响人主观感受同时最大限度地压缩数据量,根据应用场景的不同,算法模块中应用的预测模式、计算模型会有相应的适配,各系列编码算法根据编码芯片制程的缩小、算力的提高以及新型技术应用(如人工智能技术)会持续地加入新预测模式和计算模型来进一步实现数据压缩,基本上每一个新的算法会比上一代算法在编码效率上提升30%-50%,编解码所需运算量也会提升,但随着编解码芯片制程的缩小,编解码时间并没有明显变化。

1.2 H.26及AVS系列视频编码算法发展路径

1.2.1 H.26X系列

H.26X系列编码标准发展至目前为H.261,H.262,H.263,H.263v2以及H.264,H.265,H.266。其中H.261针对ISDN电话会议设计,制定时间为1990年,属于该系列原型标准。H.263推出时间为1996年,1998年推出了H.263+,为低码流通信设计,进一步改进了H.261压缩性能。2003年ITU-T与MPEG合作发布编码标准H.264(或称AVC)广泛应用于网络流媒体服务,实时监控,数字电视,视频会议等领域,H.264较以往标准节省50%的码率并能稳定保障较高的视频质量,被普遍认为是最有影响力的行业标准。H.265(或称HEVC高效率编码视频)于2013年发布,采用树编码单元对图像进行分块、帧内预测模式更加丰富,理论上H.265比H.264效率提高30%-50%,高分辨率尤其明显。H.266(VCC)于2020年发布,主要应用于超高清4k、8k流媒体视频,在H.265基础上数据量减少50%,但编码运算量远远大于H.265。

1.2.2 AVS系列

AVS工作组2002年成立至今经历20年,2003年推出第一代标准AVS,算法复杂度较H.264低,应用于国内数字电视领域,后续推出AVS+,为AVS1的增强版本,2012年被颁布为中国广播电影电视行业标准,用于高清电视上星直播。2013年6月,AVS系列标准被列为IEEE标准,标准号为IEEE 1857,走向国际。AVS2是AVS工作组制定的第二代标准,2016年颁布为广电行业标准,主要应用于4K超高清视频和视频监控领域,编码效率比AVS+提高一倍以上。AVS3为AVS工作组制定的第三代视频编码标准,2019年推出第一版。主要应用于8K超高清电视广播、VR、视频监控等多种应用场景;在超清视频方面,较AVS2减少30%数据量,且在超低码率下能保证更好的观感。2021年发布第二版,使用基于神经网络的工具实现滤波、率失真优化等功能。AVS系列相较于H.26系列的优势在于专利费,AVS不存在复杂的知识产权从属关系,因此可以只收取象征性专利费,不对内容收费,适合标准推广。

2.超高清视频编码算法技术特点对比

AVS系列编码和H.26系列编码在编码流程上一致,流程中各编码模块内算法针对自己的适用特点有一定差别。下表(表1)为AVS2编码和H.265编码在各模块算法细节的对比,从下表可见两种算法基本流程一致,但算法细节上存在差异。

表1

两类算法在实现路径及其性能上相似,但在某些应用领域中略有差异。数字音视频编解码技术标准工作组资料显示,在数字电视广播(逐行)、实时通信、数字电影、静态图像应用方面,AVS2和HEVC的编码性能相似;在数字电视广播(隔行)、视频监控的应用方面,AVS2编码性能高于HEVC。2016年在国家广播电影电视总局广播电视计量测试中心用国家广电总局指定4K 10bit序列对HEVC和AVS2在通测条件下进行比对测试,对于4K 10bit序列HEVC的编码效率普遍低于AVS2,主观感知图源质量AVS2略优,说明在超高清领域AVS2性能略优于HEVC。

新一代编码标准AVS3早于H.266完成,从上表(表2)的技术细节对比来看:在编码单元方面,两种算法编码单元块划分均扩展至128*128,不同之处为AVS3新增扩展四叉树递归结构,H.266为三叉树递归结构。在帧内预测模式中,AVS3有33个预测模式和2个MPM,H.266为67个预测模式和6个MPM。在滤波方面,AVS3通过分析参考像素与预测值的关系,训练得到针对不同块大小和不同位置像素点的滤波系数;H.266则是利用滤波和未滤波的参考像素对预测值进行加权滤波。在帧间预测模式中,两者都升级应用了基于历史信息的运动矢量预测(HMVP)并采用了仿射变换补偿(Affine);但AVS3具备5个运动矢量精度,采用16*16的运动矢量存储单元,H.266为3个运动矢量精度,采用8*8运动矢量存储单元。在变换编码方面,H.266采用低频不可分离的二次变换,具有更好的变换性能,但存储和复杂度高。

表2

3.应用探讨

《中国电子报》总结我国AVS系列标准基本形成了“技术标准-芯片终端-系统应用”的完整产业链,拉动产业规模近千亿元。从目前发展趋势来看,未来编码标准主要发展方向为超高清视频、VR、工业和工控领域。

国内AVS3率先发布面向8K超高清视频的新一代编码标准,在产业布局上实现领先,而且产权更加明晰,在政策的推动和5G网络迅速普及下,国内8K应用领域发展迅速。2019年工业和信息化部、国家广播电视总局、中央广播电视总台联合印发《超高清视频产业发展行动计划(2019-2022年)》明确“4K先行、兼顾8K”的总体技术路线,推进超高清视频产业,其中提出“2022年4K产业生态体系基本完善,8K关键技术产品研发和产业化取得突破,形成一批具有国际竞争力的企业。”2019年,华为海思发布全球首个基于AVS3标准的8K超高清解码芯片,支持120FPS解码显示;当虹科技推出8K AVS3编解码设备。2021年10月,六部委联合印发《关于开展“百城千屏”超高清视频落地推广活动的通知》支持有条件的城市设立超高清公共大屏,分享优质超高清4K/8K内容,提升超高清视频产业的渗透性。2021年1月,中央广播电视总台颁布《中央广播电视总台8K超高清电视节目制播技术要求(暂行)》对8K超高清视频编解码技术采用AVS3标准;同年2月总台试播全国首个8K超高清试验频道,并在2021年春晚期间进行首次8K直播。2022年冬奥期间,AVS3视频标准被总台CCTV-8K频道和北京广播电视台冬奥纪实8K超高清试验频道采用,并通过咪咕视频在移动端直播场景首次应用及落地。在总台技术部门进行的测试中,目前基于AVS3压缩算法在码率为120M时,能达到很好的主观收看效果;而且目前利用DVB-C标准传输8K节目的尝试正在积极进行,如果使用DVB-C2最高4096QAM调制方式,则可以有效利用现有资源实现8K超高清视频传输入户。截至2021年底,我国建成142.5万个5G基站,5G用户数达到3.55亿户;使用千兆网络用户模达3456万户。预计未来随着硬件设备成本下降,5G用户增长、资费下降及高速宽带入户的持续推进,4K及8K用户数将大幅增长,AVS3标准应用亦会随之普及。

IDC数据显示,2021年全年全球AR/VR头显出货量达1123万台,同比增长92.1%。随着硬件设备迭代加快,入局者增多,VR内容生态逐步建立,VR未来有广阔的应用场景。VR是AVS3标准应用目标之一,工作组已经将标准制定范围延伸至该领域;北京2022年冬奥会期间,AVS3编码标准、8K超高清技术以及多维度自由视角交互观赛系统已经得到实际应用检验与全球用户的广泛认可。中央广播电视总台央视频冬奥期间推出“VR看冬奥”可被安装在VR头戴硬件设备上的央视频VR应用,融合沉浸式实时3D场景渲染进行冬奥直播。

伴随着5G基础设施和用户数快速增长,VR各类应用场景相关技术和云VR技术的成熟,VR将在娱乐、教育、医疗、工业、航空等多个领域广泛应用,AVS编码标准也将伴随VR技术发展在该领域有广泛应用空间。目前AVS编码技术除在广播电视、视频监控及视频娱乐等传统领域应用之外,伴随着物联网技术和人工智能技术发展,在工业控制等领域中的应用也不断持续扩展。2020年在5G传输条件下,上海国茂开发的基于AVS标准的8K实时编码器协助完成了中国商飞大飞机预检测工作;AVS高稳定编码器在太原、甘肃酒泉卫星发射基地均得到了广泛应用。在自动驾驶和机器人领域,视频编码技术也有广泛的应用空间。预计未来国内将不断优化AVS系列编码标准,进一步在保证视频质量的前提下提高压缩效率,并实现与AI技术更加深度地融合,伴随着国内新基建和各类智能应用场景的落地,国内自主研发编码标准前景可待,未来可期。

猜你喜欢
总台数据量滤波
基于大数据量的初至层析成像算法优化
高刷新率不容易显示器需求与接口标准带宽
中央广播电视总台评出2019年国内十大体育新闻
宽带信号采集与大数据量传输系统设计与研究
中央广播电视总台、民政部联合摄制的《中国地名大会》开播
中央广播电视总台基于中国移动5G技术的4K超高清传送测试成功
从心怀诚意到心怀敬意——品读中央广播电视总台央视记者何盈作品集《于无声处》
基于EKF滤波的UWB无人机室内定位研究
一种GMPHD滤波改进算法及仿真研究
基于自适应Kalman滤波的改进PSO算法