王靖 毛莉花
[摘要]为解决精品课程教学录像标准的应用問题,文章分析了当今主流视频编码标准以及应用实例,并据此总结出视频应用的特点与规律。在此基础上,阐述对于新技术环境下教学视频应用标准架构基本原则,即多种编码方式共存、优选通用编码方式、兼顾互操作性并考虑应用的可持续性。提出了基于应用域与应用阶段的教学视频实用标准(参考)方案。并就该方案应用于教学实践中的成功经验和面临的具体問题进行了讨论。
[关键词]视频教学资源;实用标准;视频压缩编码;GOP结构
[中图分类号]G40-057 [文献标识码]A [论文编号]1009-8097(2012)10-0040-05
一、引言
在实际应用中,我们注意到“国家精品课程教学录像上网技术标准(2010)”在关于“视频素材采集的技术标准”和“视频上网发布标准”所规定的内容中存在一些不明确之处。例如,标准中仅仅规定了视频文件的格式,而未明确相应的具体编码标准,因而在实际应用中会出现视频压缩标准和质量效果的不确定性。随着视频公开课在国内掀起的热潮,教育部近期启动了高校视频公开课的建设,使得上述問题再一次凸显。我们知道,扩展名相同的视频(在分辨率、码率相同的条件下)由于压缩方式的不同在图像质量和播放环境上会表现出相当大的差异,这势必会给教学视频的质量控制和应用效果带来問题。为此,我们尝试着对现有教学录像标准进行细化和补充,以使之更具有可操作性,并形成了能应用于教学实践的“教学视频实用标准(参考)”。
二、视频应用标准改进的依据
1.对主流视频编码标准的解读
面对众多的视频编码标准如何选择,一直以来是视频应用的一个重要問题。我们认为,首先要看视频编码的压缩效率,特别是编码能否提供质量与所用软硬件资源之间的最佳平衡,其次要看该视频格式的通用程度,即是否具有良好的互操作性,此外还需要了解主流视频编码标准及其应用情况。
(1)视步页编码向高效压缩和多领域应用发展
第一代视频编码标准中的MPEG-2,因设计了2维的类(Profile)和级(Level)的分层编码结构,加上GOP可由不同类型帧(I、P、B)灵活搭配的构成机制,能够适应多种解析度、不同应用阶段以及多种码率下的视频编码,获得了广泛的应用。MPEG-4作为第二代编码标准,压缩效率有所提高,但囚主要针对低码率视频编码故仅在一定范围内得到应用。属于第三代视频编码的MPEG-4 AVC/H.264、VC-1和AVS标准由于综合运用了多种视频编码的最新技术,压缩效率比MPEG-2编码提高了1~2倍,还能够同时满足高分辨率图像和低码率环境应用的需求,已成为高清和IP视频应用的主流格式。
(2)第三代视频编码标准的应用特点
①H.264编码的应用
H.264编码性能十分优越。这一方面得益于H.264设有4:2:2 Intra Profile类,可被用于高清视频素材和制作业务的编码;另一方面H.264具有较强的抗误码、抗丢包能力,在复杂多变的网络环境和移动应用领域能够以较低的码率传送基于1P网络协议的视频流,因此被广泛应用于IPTV的业务。
H.264的广泛应用已经从一个侧面证明其是一个优秀的压缩编码算法,但是H.264也面临一个不容忽视的問题,即其卓越性能是以增加编解码的复杂度为代价的,需要增加专用的编解码硬件或者是占用大量的CPU资源进行编解码运算。不过随着硬件技术的发展特别是显卡GPU功能的增强,H.264编解码困难的問题将有所缓解。
②VC-1和AVS的应用
VC-1和AVS这两个标准目前都不支持4:2:2取样和全I帧方式的编码,因此不适合用于高质量视频素材的记录和编辑。VC一1和AVS标准都采用了相对简化的设计理念,用降低技术复杂度方式来提高自身编解码的易实现度,非常适合于视频节目的播放和网络发布的应用。
(3)封装格式与压缩格式的关系
视频压缩格式是针对视频实体的编码方式,是决定视频压缩质量的主要因素:而视频封装格式是用于视频文件交换和播放识别的封装容器。同一种封装格式可以支持多种压缩编码格式,如同为AVI扩展名的视频文件,其压缩编码可以是DV格式,也可以是MP4或H.264格式。因此不能仅仅根据文件的扩展名来决定视频应用。
2.主流视频应用实例的参考
按照应用域与应用阶段相结合的方法进行划分,当今视频主流应用实例见表2,其中不同应用的编码方式和参数配置为教学视频应用的细化提供了参考。
3.数字视频应用的特点与规律
(1)视频压缩与透明码率
视频压缩虽属有损压缩,但只要将压缩视频的码率保持在“透明质量”要求的最低码率之上,就能获得近似“透明”的压缩效果;从素材制作到节目发布,随着对图像质量冗余度要求的依次降低视频压缩的最低码率可以相应地减少。这种适度压缩保证了质量与资源的双重优化,视频素材和节目编码应遵守最低透明码率原则。在网络视频应用中为了适应信道带宽,需要进一步压低视频编码码率时,可采用缩小图幅或降低帧频率的方法予以适配,不过应通过主观评价试验来确定图像质量的下限。
(2)不同阶段质量冗余要求与编码参数配置
数字视频工作流程包括素材采集、后期制作和节目发布等阶段。不同阶段对图像质量冗余和压缩编码结构有着不同的要求,应充分运用视频编码在取样方式、帧类型(I、P、B)和图像组(GOP)结构上具有的多重选择性,有针对性地优化编码参数配置,以获得最佳的压缩效果。
①视频素材编码
由于要用于后期编辑处理,因此素材编码要求具有帧精度的编辑能力和经受多次编解码处理的质量冗余。前者意味着编码的GOP结构宜短不宜长,采用全I帧方式要优于IBP长GOP方式;后者表明在4:2:2取样要优于4:2:0或4:1:1方式。在分辨率一定时,为满足这2个条件就必须保持相对较高的记录码率,为此IMX、DvcPr050等广播级标清素材记录格式都选择了4:2:2取样加全I帧的编码结构和50Mb/s的高码率记录。
②节目存档与发布编码
用于节目发布或存档的视频文件,处于应用链的末端,因而可以降低对质量冗余的要求,编码重点在于去除不必要的质量冗余,充分提高资源利用率。因此标清电视的DVB标准和DVD格式都选择了4:2:0取样加IBBP长GOP结构的编码组合,并将记录码率减低到6-9Mb/s。
(3)网络环境低码率应用特点
网络视频在拥有自主交互应用优势的同时,却不得不对图像进行深度压缩以适应网络带宽的限制。与广播电视编码侧重信源编码(注重图像质量的可接受性)的要求不同,网络视频编码则更具有信道编码的属性,即更多地考虑信道带宽和传输后的最终效果。在H.264标准中就设有CABAC和CAVLCL两种熵编码方式,前者运用复杂的编码技术,适用于追求高质量高码率压缩的场合;后者则采用简化的编码方式,更适用于网络和移动传输环境下使用。
三、教学视频实用标准(参考)的构架
1.关于系统架构的思考
(1)基本原则
实用标准应能适应数字视频分级分层应用的需求;应符合应用域通用图像的标准;应能体现不同应用阶段视频编码的特点。由于没有一种视频格式能够满足所有的应用,多种编码格式共存将不可避免,为此在保证主要应用的编码质量和效率时,还需兼顾不同应用间的互操作性。
(2)系统架构与标准应用的流程
首先根据应用目标进行分级分层,并以该应用域中压缩质量高,资源占用少且通用性好的标准格式作为编码格式。其次以应用域通用图像格式标准确定图像分辨率、扫描方式(隔行或逐行)和帧频率等基本参数。接下来按照应用阶段诉求重点确定编码参数配置方案。最后根据前述两项工作的组合定位从既定的编码格式标准中找出与之相对应的压缩码率。
(3)可持续性应用的考虑
视频教学资源的建设是一个长期积累的过程,在这样的一个过程中,技术的更新换代是一个不可避免的现实問题。就目前而言,用第三代压缩技术取代曾经居于主导地位的MPGE-2编码,以获得更高的图像质量和资源利用效率,已是不可逆转的趋势。但显然此过程并非一蹴而就的,因此比较可行的做法是先从高清视频素材的积累和新技术应用环境的引入着手,做好下一步全面应用的资源和技术储备,同时有计划地将现有视频资源按新标准进行转换,以实现教学视频资源的可持续性应用。
2.教学视频实用标准(参考)的内容
(1)教学视频的图像标准与压缩编码标准
教学视频须按照应用目的进行分级分类,图像的主要参数应符合应用域通用图像的标准,详见表3。
如前所述,视频编码应选用应用域中的主流视频编码格式,对于高清电视应用,首选H.264格式与WMV9格式。标清电视应用,MPEG-2、DV传统格式与H.264和WMV9格式共用。网络多媒体应用,在PC环境下应采用微软VC-1标准的WMV9格式。
(2)视频素材编码与存档标准
视频素材编码的目的在于提供符合应用域标准的高画质编辑素材,其要求是易于编辑并留有多代编解码的质量冗余。因而在编码方式上采用4:2:2取样与短GOP结构的编码组合,存档码率不低于主流应用格式素材存档的最低透明码率。
这里需要强调的是,在素材编码与存档时,应注意:1)标准选项与该应用域标准图像质量相对应,是标准应用时的首选方案;可用选项是在资源条件受限时,降低标准应用时的备选方案;2)素材的使用,应坚持不可逆的下变换原则,即高分辨率素材可用于低分辨率标准的视频制作:而低分辨率素材不得用于高分辨率标准应用的视频制作,必须使用时应作特别说明;3)用于网络直播(无需后期处理)的视频可按照网络视频节目发布的标准直接对素材源进行压缩编码和传送。
(3)教学视频节目发布与存档编码标准
与素材不同,视频节目编码旨在提供符合视频发布规范的视频文件,其要求是去除质量冗余,充分提高压缩效率。因而在编码方式上采用4:2:0取样与IBBPl5帧(PAL)长GOP结构的编码组合,存档视频码率应不低于主流应用标准节目存档的最低码率。
压缩码率的上限值与该应用域标准图像质量相对应,这是标准应用时的首选方案;下限值是在资源条件受限时,降低标准应用时的备选方案。
(4)网络发布的视频节目编码标准
网络视频编码的目的是在网络环境中提供声画同步良好,收视效果流畅的网络视频节目。根据应用环境的特点选择适合于系统平台和信道带宽的编码方式和压缩码流。
压缩码率的上限值与该应用域标准准图像质量相对应,是标准应用时的首选方案;下限值是在资源条件受限时,放低标准应用时的备选方案。
四、教学视频实用标准(参考)在我校的应用实践
1.规范视频应用操作提高视频资源质量
按照上述实用标准的具体要求,在素材采集、节目存档和网络发布等应用环节中,抓住视频编码格式(针对具体的应用域)和最低透明码率(与分辨率、编码参数配置相挂钩)这两大关键因素,推行规范化操作。从而避免了之前普遍存在的随意性和盲目性,有效地提高了视频资源的质量和应用效率。具体做法是:
(1)统一素材拍摄标准,把好视频源头质量
高质量、标准化的素材是视频节目的源头,其质量高低直接影响最终节目的效果。建议标清素材记录仍使用DVCPro 50M或25M格式,以发挥现有设备的余力。高清素材记录选用H.264编码标准。高层次应用为AVC/H.264 Intra100M格式,低层次应用为AVCI-ID格式记录。
(2)统一视频节目发布和存档标准
为了提高视频教学节目的利用率,建议高清节目存档,采用H.264或WMV9格式编码,大容量高密度Blu-ray Disc光盘存储,记录文件为蓝光DVD编著文件或H.264和VC-l的数据文件;标清节目存档,MPEG-2、H.264或WMV格式共用,以传统容量DVD光盘存档:网络应用节目发布,采用WMV和FLV格式,发布码率控制要求适配应用网络的带宽条件同时主观评价可接受。
2.应用中的問题与解决办法
(1)高码率素材的保存問题
AVC/H.264格式的素材采用P2卡记录,记录材料成本极高,需要要及时转录到其他介质上保存。即使采用大容量蓝色光盘记录也难以将码率高达100Mb/s的素材全部保留,应筛选精简后再以源码数据进行存档。
(2)H.264格式素材的后期编辑問题
H.264视频编解码的复杂程度分别是MPEG-2的10倍和3倍,因此对H.264素材的编辑具有一定难度。目前Avid等主流非编平台都已支持H.264格式素材的编辑与合成。主要采取的方式有三种,一是AVC Intra源码的直接编辑。全I帧的帧内压缩结构本身就易于实现源封装数据的直接剪辑,同时AVC Intra采用了帧内分片编码的技术,能够更好地支持多核CPU的并行处理运算,加快软件编辑的处理速度,但只适用于对素材的简单编辑。二是变换为中间编辑格式进行编辑。先将不同格式的素材统一变换成制作平台支持的中间编辑格式,再进行多层特效的合成制作是一种有效的混编制作方法。中间编辑格式都具有高质量、高效率的压缩特性,如Avid平台的DNxHD格式和Fin Cut平台的ProRes422 HD格式和Eduis平台的H0格式等。三是AVCHD格式长GOP素材的编辑。由于采用了长GOP的帧间编码,AVC HD格式在获得更高压缩比的同时,也因数据的帧间依存关系而增加了后期处理的复杂程度。好在低成本的H.264编解码硬件已开始投放市场,通过其中的硬件加速引擎实时完成H.264视频的编辑和生成,输出H.264文件的GOP结构可选,支持多种分辨率标准,压缩码率可从100Kb/s到50Mb/s不等。这使得对AVC IID格式的实时编辑不再困难。
(3)原有视频资源的转换与利用
视频教学资源在学校领域的应用具有较长的历史积累。各学校都有大量多年积累下来的视频资料,这些资料既是宝贵的资源,但同时由于其格式纷杂,我们必须采取合适的策略加以利用。在实践中,运用视频转换软件将其中有价值的部分转换成格式相对统一,压缩效率更高的视频格式进行存档。经过大量的测试,我们建议使用下述三种转换工具。一是Adobe Media Encoder CS4,作为ADOBE公司出品的压缩编码工具,其可输出多种码率、多种分辨率的H.264和WMV9文件。二是TMPGEnc 4.0 XPress,该编码工具一向以高质量著称,可输出H.264(仅BP和MP类)和WMV9(MP和Advanced P类)文件。三是JetAudio\Convert Video,其优势是可将含有字幕语言可选功能的MKV文件转换成H.264和WMV9文件。
为保证转换质量,应对源文件进行分级分类,并以实用标准中相应类别要求的码率值转换输出;保持原有图像的分辨率、图幅比例和像素高宽比是避免不必要的转码劣化,保证图像质量传承的有效方法。
五、结束语
在数字化教学资源建设中,视频资源既是重要的一环,同时也是相对薄弱的一环,其部分原因来自多媒体网络环境下视频应用多样化所带来的复杂性。视频应用多样化符合教育技术实践的要求,但也正是由于多样化应用带来的复杂性使数字视频资源建设规范的建立被有意无意的回避。教学视频应用规范的缺失势必导致视频质量缺乏保证,进而影响视频其教学应用的有效性。建设数字教学视频应用规范是一项系统工程,需要教育技术同行的共同努力。本文中的实用标准(参考)只是我们的初步探索和一孔之见。在此抛砖引玉,意在引起大家的关注,促进共同交流。
作者简介:王靖,苏州科技学院传媒科学与技术系讲师,研究方向为信息化教学设计与数字媒体。
收稿日期:2012年6月19日
编辑:李婷