朱晓蓉
[摘要]首先对图像编码标准的发展作了分析;然后介绍图像编码原理;最后简单地介绍图像编码新标准。
[关键词]图像编码标准 ISO/IEC ITU MPEG H.264 H.265 AVS
中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)0220018-03
1948年,信息论提出,奠定了图像数据压缩技术的基础。直至今日,图像编码已走过了整60年的历程。
一、制定图像编码标准的国际组织
(一)ISO/IEC
国际标准化组织(International Organization for Standardizati
on,简称ISO)是目前世界上最大、最具权威性的国际标准化专门机构。国际电工委员会(International Electrotechnical Commission,简称IEC)是世界上最早的国际性电工标准化机构。负责制定MPEG系列编码压缩标准。
(二)ITU
国际电信联盟(International Telecommunication Union,简称ITU),是国际电信界最权威的标准修订组织。1972年12月起,电信标准化部、无线电通信部和电信发展部承担着ITU的实质性标准制订工作。其中,电信标准化部门由原来的国际电报电话咨询委员会(CCITT)和国际无线电咨询委员会(CCIR)的标准化部门合并而成。负责制定H系列编码压缩标准。ISO/IEC与ITU有时又联合一起制定编码压缩标准。这可从图1中看出。
二、图像编码标准及所采用的技术
(一)MPEG系列标准
ISO/IEC制定了MPEG-1、MPEG-2、MPEG-4(2)以及MPEG4(10)标准。主要用于电视广播和消费类电子产品。
(二)H系列标准
ITU制定了H.261、H.262、H.263、H.263+、H.263++、H.264标准。主要用于通信类电子产品。
(三)两个系列标准的对应关系
表1示出了视频编码标准发展历程,分别由ISO/IEC与ITU制定的编码压缩标准,以及由ISO/IEC与ITU联合制定的编码压缩标准。
由表1可见,图像压缩标准可分为两大系列:MPEG-X;H.26X。它们在数据压缩技术和输出码率之间有如表2所示的对应关系。
(四)中国的AVS标准
我国是ISO/IEC组织的正式成员国,国家信标委下属的多媒体分委员会与ISO/IEC JTC1/SC29直接对口。从2000年5月开始,我国开始跟踪并参与JVT标准的制定工作,目前已有多项技术提案递交到JVT标准,有些技术已经被JVT标准所接收。
基于我国专家多年参与MPEG国际标准制定的经验,2002年6月成立的“数字音视频编解码技术标准工作组”联合国内从事数字音视频编解码技术研发的科研机构和企业,提出了我国自主的数字音视频编解码技术标准AVS(Audio Video coding Standard)。于2003年年底完成的AVS 1.0标准具有四个特点:①性能高,与H.264基本相同;②算法的复杂度比H.264低;③软件和硬件实现成本都比H.264低;④专利授权费用低。
(五)目前业界最看好的二三种主要标准的对比
1.3种编码标准的基本功能
3种编码标准的基本功能对比如表3。
这三种主要编码技术各有优缺点,MPEG-4(2)发布较早,产业化程度较高,产品相对成熟,价格也较低,同时算法复杂度较低,但是编码效率也相对较低,速率较高,对网络要求较高。对于H.264标准,已经有多家厂商提供H.264芯片和机顶盒,产品成熟,而且因为采用了多项提高图像质量和增加压缩比的技术措施,在不影响视频效果的情况下能够比MPEG-4(2)节约39%的码率。例如要达到标清质量,MPEG-4(2)编码需要1.5~2Mbit/s的码率,而H.264只需要1.2~1.5Mbit/s码率即可;对于高清图像质量,MPEG-4(2)编码的视频码率需要6~8Mbit/s,而H.264只需要4~6Mbit/s。因此在信道总容量相同的情况下能够覆盖更多的用户。同时,由于H.264是由ITU-T和ISO/IEC联合制定的,所以对解码兼容性有着明确的定义,具有较强的抗误码能力,容易获得稳定的图像,适用于丢包率高、干扰严重的信道传输。不过H.264的算法复杂度较高,系统开销也比较大。
AVS是近几年才提出的视频标准,产业化进程落后于H.264。但是AVS的编码效率与H.264相当,而算法复杂度比H.264明显低,其编码复杂度相当于H.264的30%;解码复杂度相当于H.264的70%,软硬件实现成本都低于H.264;由于具有自主知识产权,专利费用低,可以预期AVS标准将会是支撑国家数字音视频产业发展的重要标准。
2.专利费用对比
3种标准对应的专利费用如表4所示。
可以看出在专利费方面AVS占有绝对的优势。MPEG-4和H.264不仅要收软硬件的专利费,而且还要收取节目点播费用等,中国庞大用户群将给运营商带来每年数以亿计的巨大专利费负担;而AVS只收取1元人民币的象征性费用,对于运营商来讲非常具有吸引力。
3.应用情况对比
从目前情况看,MPEG-4和H.264在中国市场应用较普遍,两者已应用在中国电信和中国网通开展的手机电视试验及商用网中。由于AVS推出较晚,还处于上下游产业链的完善阶段,在市场的推广和开拓方面还有待加强,真正商用有待验证其图像质量、是否满足商用要求和产业链的逐渐成熟。目前3种标准常见的应用场景列举如表5。
(六)截至目前为止图像压缩编码所采用的技术
截至2008年国内外所有图像信源压缩标准都是采用混合编码压缩方法。它包括内插法、预测编码、变换编码和熵编码等技术,统称为混合编码压缩方法。所有标准都可用图1所示的“混合型”编码方案的框图描述。从图1可以看出,在编码器的虚线框内实际上就是解码器,所以说编码器中包括了解码器。
之所以有新旧标准的差异,是因为每个框图中所采用的技术不同,较早提出的标准技术较简单,新标准的技术较精细,带来压缩倍数的不断提高。该方案中用运动补偿帧间预测去除图像在时间域的冗余度,然后用变换变换编码去除空间域的冗余度,最后再用熵编码去除经量化后的变换系数中所含的统计冗余度。变换系数的量化利用了人眼的视觉特性,量化器的精度还受到输出缓存器状态的控制。输出缓存器是为了适应恒定码率信道的要求,平滑变字长编码器输出的不均匀码流而设置的。当缓存器接近上溢和下溢时,通过反馈控制量化器的精度调整缓存器的输入码流,保持输出数码率的恒定。但现在很多标准编码器都不加缓存器,采用变速率输出,有利于统计复用,提高图像质量。图1的信源编码方案,是积60年图像编码经验之总结。
三、图像数据格式
(一)几种典型数字电视设备数据格式
表6列出了几种典型的数字电视设备的数据格式。
注:QCIF:Quarter Common Intermediate Format(四分之一公用中间隔式);CIF:Common Intermediate Format(公用中间隔式);SIF:Source Input Format(源输入格式);VCD:Video Compact Disk(视频光盘);DVD:Digital Video Disk(数字视频光盘);HDTV:High Definition Television(高清晰度电视);D:Definition(分辨率)。H.264标准由于采用4×4整数变换,上表应采用(4×4)数据格式。
(二)极高清晰度成像(HRI)格式
ITU-R BT.1201建议书提出了极高清晰度成像(HRI)格式和规范。该建议的提出主要考虑到超高清晰度图像能够在诸如计算机图形、印刷、医疗、数码相机和电视电影等领域的图像系统中使用。HRI典型空间分辨率的级别的建议如表7所示。
四、图像编码的未来
(一)图像编码压缩遵循的规律
图像编码压缩算法的压缩比由下式决定。
压缩技术层出不穷,图像数据压缩比不断提高。著名图像专家德国Musmann教授2006年在北京主持了“图象编码的过去与未来”专题讨论会,并首先发言,对图像编码压缩技术的过去几十年工作作了总结,认为:达到广播质量的视频编码的压缩比大约每5年翻一番,并画出了图3曲线。后来被公认称为Musmann定律。
(三)未来的图像编码标准
1.新标准H.265
据报导,约于2012年推出的H.265新标准也是采用“混合型”编码方案,也可用图2框图来描述。压缩比是H.264的两倍。其技术主要在对H.264的改进和增强。可概述如下:
(1)提高压缩效率;具有鲁棒性,提高错误恢复能力(如用于手机通信);
(2)减少时延(实时时延、信道获取时间、随机接入时延);
(3)减少复杂度等。
采用的主要算法有:
(1)自适应插值滤波器,编码增益约提高1dB;
(2)1/8像素精度运动补偿预测,可使比特率减少3~14%;
(3)运动矢量竞争机制,将预测块的集合由原来的空间域扩展到了时间域及空时混合域。可得到平均为6.1%的压缩增益(对复杂运动这一增益可达20%);
(4)迭取自适应量化矩阵,对于每个宏块基于率失真函数选择最优的量化矩阵;
(5)空域和频域自适应预测残差编码,采用这一方法,与H.264相比,在相同比特率时,PSNR可提高到0.02~1dB。
2.畅谈未来
从上述可知,即使推出H.265新标准,其压缩比也不会超过400。笔者认为,如果继续采用图2所示“混合型”编码方案,压缩比再要得到大幅度提高,很难了。必须改换一种思维、改换一种方案来考虑。幸而,已有不少学者在探讨压缩比高达1000~10000的技术,只不过目前还不能实时实现。随着技术的进步,图像数据压缩编码方法方兴未艾。
参考文献:
[1]ITU-T Rec.H.264.
[2]ITU-T VCEG H.265.
[3]余兆明等,图像编码标准H.264技术,人民邮电出版社.