媒体融合背景下视频格式的特点及选取

2021-04-10 14:36
电视技术 2021年10期
关键词:帧频视频文件码率

高 平

(安徽省铜陵市枞阳县融媒体中心,安徽 铜陵 246700)

0 引言

随着信息的多元化和网络化,现在的新闻工作者需要通过创新的传播理念和技术形式来生产信息的载体,以实现信息内容、技术平台的共融互通,以更好地服务于受众。作为信息的载体,视频在信息传播中的生命周期分为前期视频拍摄采集、中期节目制作生产、后期成品播出存档3个阶段。在这3个阶段中,只需抓住每个阶段视频的职能需求和特点,就可以适应万变的模式,有针对性地选取视频格式和转码方式。

1 视频参数的解释

视频可以理解为是一组连续的“图片”序列。这些单个“图片”的像素数就是视频的分辨率,一般用水平像素数乘以垂直像素数来表示,比如高清的分辨率就是1920×1080。对这些单个“图片”中每个像素点进行采样量化时亮度和两个色度信号取样频率的比例就是采样格式。我国常用的采样格式有4∶4∶4、4∶2∶2及4∶2∶0,很少使用4∶1∶1这样的采样格式。4∶1∶1采样格式常应用于数字化的标清NTSC制式的外国电视节目图像中。

这些单个“图片”是一次性还是分成两次从摄像机图像传感器上进行采集的方式就是扫描的格式。一次性采集的方式就是逐行扫描方式,用P表示。把图像传感器上的“电荷图片”分割成奇数行和偶数行,拆分为两幅“图片”再逐个采集下来的方式就是隔行扫描方式,用i表示。每秒钟从图像传感器上采集下来的“图片”序列的张数就是帧频,用f·s-1表示。对这些图片序列进行压缩所使用的技术标准就是编码格式。编码后的视频文件每秒播放产生的数据流比特数就是视频的码率,单位为b·s-1。将音频码流、视频码流及字幕等相关信息按照一定的方法打包存储在一个文件中并使之同步的技术标准就是封装格式。音频和视频封装好后组成的文件就是视频文件。视频文件的封装格式通常使用文件的后缀名也就是扩展名来区分。[1]

以上视频的所有属性和参数统称为视频的格式。在这些属性中,影响视频观看主观感受的主要参数是分辨率、扫描方式、帧频以及编码后的码率这四大要素。视频的细节参数还有很多,如画幅比、量化比特数、像素比等等。

我国高清广播电视播出格式标准为1920× 1080分辨率、50场25帧上场(奇数场)优先的隔行扫描、25 Mb·s-1的码率、4∶2∶0的采样格式、16∶9的画幅比、1∶1的像素比、MXF的封装格式。其他媒体平台上的视频格式没有统一标准,但可以参考高清广播电视播出格式的标准来使用。

2 视频的特点和注意要点

对于视频,要均衡考虑文件体积和画面效果,不要一味地追求高指标值。视频参数的四大要素中,帧频越高,视频的观看流畅度越好,但是高于 60 f·s-1后,人眼基本分辨不出区别了。相同编码器压缩的视频码率越高,视频的清晰度也越高,高于一定码率后人眼基本也分辨不出区别了。除非有特殊需求,否则这些过高的指标值只会无意义地增加文件的体积。因此帧频和码率都有最佳的均衡数值,并不是越大越好。

2.1 扫描格式的选取

隔行扫描方式和逐行扫描方式各有不同。隔行扫描在相同的传输带宽下可以提供更高的刷新率和视觉流畅度,所以隔行扫描广泛应用于广播电视领域。隔行扫描的图像中,高速运动的物体流畅度可以得到提高,但是垂直清晰度会下降。静止画面不会降低隔行扫描图像的垂直清晰度,但是画面上有排列整齐的行结构线和爬行线,影响总体画面细节的表现,且屏幕尺寸越大,影响越明显。由于这些缺点,现在除了广播电视领域外,其他媒体平台基本已经摒弃了隔行扫描的方式。

2.2 帧频的选取

由于我国的电视标准是50i,帧频应尽量选择50的一半或整数倍,如50P、50i或25P,不要选择24P、30P、60P、60i等等非我国广播电视标准的格式。这样便于后期帧频转换时图像不会产生规律性的步进现象。拍摄体育运动等场景时,尽量选择高帧率拍摄,如50P、50i。拍摄基本静止的风景和专题节目可以使用25P。而其他媒体平台的视频载体基本都是小屏幕,对帧频的要求不是很高,一般15~ 25 f·s-1就足够了。

2.3 逐行和隔行的转换要点

逐行扫描的视频可以无损地转换为隔行扫描的视频,但是转换出来的隔行扫描视频的场频一定要是原始逐行视频帧频的两倍,才会无损地转换,否则视频信息损失一半。25P视频转换为50i是最佳的方式,转换后视频信息没有损失,还能无损还原出原有的25P视频。50P转换为50i后的视频效果虽然更好,但是原始50P视频信息量减少一半,且不能无损恢复出原有的50P视频。

原始拍摄的隔行扫描视频尽量不要转换为逐行扫描,转换后效果很差且有严重的场效应现象,图像轮廓的边缘会出现毛刺和梳状锯齿。尽管可以通过去隔行(去交错)技术略微改善,但是整体画质受损严重,物体轮廓变得模糊,水平清晰度下降。如果反复转换扫描格式,视频清晰度下降非常严重。需要注意的是,25P视频转换为50i视频后,如果想无损还原出原有的25P视频,一定不能使用去隔行(去交错)技术,否则会降低视频的水平清晰度而无法无损还原。

2.4 采样格式的选取

在其他参数相同的情况下,4∶4∶4、4∶2∶2及4∶2∶0三种采样格式的文件体积依次减小,但人眼观看时基本分辨不出差别。因为4∶4∶4、4∶2∶2及4∶2∶0只是色度的清晰度依次减少而亮度(灰度)的清晰度不变,而人眼对色彩的分辨率又远低于对亮度的分辨率,所以这三种采样格式观看的主观感受没有多大差别。高采样率的采样格式只在对色彩清晰度要求十分高的环境下才会使用,比如抠像和三维虚拟出镜就要使用图像上的色键进行键控和混合视频,一旦色度信号不清晰,色键处理时会在图像轮廓边缘产生毛刺、抖动、镶边等现象,这时选择色度全采样的4∶4∶4的格式最佳。其他特殊领域的高端制作一般使用4∶2∶2。日常电视播出和成品节目使用4∶2∶0的采样格式即可。

2.5 视频编码格式的选取

视频参数中,编码格式是一个视频文件的核心所在,视频参数中最复杂的就是编码格式。视频编码器的种类很多,主要是两大类,一类是应用于广播电视行业的由国际标准化组织(International Organization for Standardization,ISO)下 属 的 运动图象专家组(MPEG)开发的MPEG-X编码系列,另一类是由国际电信联盟(International Telecommunication Union,ITU)主导的应用于可视电话的网络传输标准H.26X系列。除了这两种编码格式外,其他视频编码格式都是各个公司自主开发的小众编码器格式。国际通用的视频编码格式有MPEG2、MPEG4、H.264、MJPEG等几种常用的格式。MPEG-X系列和H.26X系列这两种编码方式的应用领域现在也出现交叉的情况,已不再限于广播电视和网络传输领域。目前使用最多的编码器是这两个编码组织合作开发的的H.264(ISO/MPEG称它为MPEG-4AVC),其应用领域非常广泛。更先进的H.265技术也已经成熟,但是支持H.265的软硬件正在逐渐普及。H.265技术能达到H.264两倍的压缩率,支持的最高分辨率可达到8K(8192× 4320),低于1.5 Mb·s-1码率也能在网络传上输分辨率为1920×1080的高清视频。随着视频直播对带宽的依赖加强,H.265成为未来最有前途的编码格式,已有全面取代H.264的趋势。但是目前广播电视领域和专业摄像机的高清编码格式还是以MPEG-2编码格式为多。虽然有的摄像机把它封装为扩展名MP4的文件,但是编码格式还是使用MPEG-2。在压缩比方面,MPEG-2、H.264、H.265的压缩率基本是以两倍关系成等比增加。同样清晰度下,H.265的码率只需要H.264的一半,H.264的码率只需要MPEG-2的一半。

2.6 封装格式

封装格式是一种存储音视频的“容器”,有MPG、MPEG、MPE、DAT、VOB、ASF、3GP、MP4、AVI、MOV、WMV、ASF、RM、RMVB、FLV、MKV等。其中,ASF(高级串流格式)是含音频、视频、图片以及控制命令代码的串流多媒体文件格式,可以在到达指定视频或音频的位置或时间时触发某个事件或操作,特别适合在使用IP协议的互联网上传输,是未来互联网互动视频的发展方向。MPEG-2也是常用的流媒体封装格式,它定义了固定长度包结构的传送流TS和可变长度的节目流PS流。在传输遭到干扰破坏时,TS流可以瞬时根据码长规律检测它后面的包中固定位置的同步信息,从而快速恢复同步,避免了大片视频信息的丢失。而PS包则无法快速确定下一包的同步位置,在码流传输遭到干扰破坏时,画面劣化的程度很大,但是它的压缩效率高,常用于已知节目时长的成品节目而且传输干扰小的后期播放使用。MPEGTS具有较强的抵抗传输干扰的能力,主要应用于节目时长未知的实时节目传送,也普遍使用在信道环境较为恶劣、传输误码较高的互联网直播和有线电视节目传输中。其他的封装格式区别不大,无需刻 意选择。

2.7 对原始视频的标识

分辨率、帧频等视频参数在摄像机、无人机等拍摄设备里一般称为系统模式。系统模式决定了视频的基本参数,这些原始基本参数决定了后期的应用与转换。原始视频参数在这些后期应用中才有参考价值,已经被转换的二次视频的参数失去了原始意义。转换后的视频有可能是低分辨上变换为高分辨率的视频,也可能是低码率转换为高码率的视频,这些上变换其实是通过插值计算的,并不能事实上提高清晰度,失去了后期制作的参考价值。没有必要的情况下,尽量不要做上变换,除非有些媒体平台对视频的的分辨率等参数有强制要求,这种情况下才需要进行上变换[2]。

2.8 编码格式和封装格式的区分

从以上对视频格式的说明可以看出,相同扩展名的视频文件的编码格式可以相同也可以不同,不能通过文件后缀名来辨别视频的编码格式,只能看出它的封装格式。封装格式的作用是方便应用软件识别,让应用软件能够打开视频文件,取出音频、视频、字幕等,并让它们同步播放。一种播放或编辑软件最终能否正常打开或编辑某种视频,主要取决于编码格式。因此,同样文件后缀名的文件有可能不能正常打开,打不开的文件也并不一定是损坏的文件,有可能是播放或编辑软件对该编码格 式不支持。

2.9 压缩编码的特点

所有的视频编码都是有损压缩,也叫不可逆编码。它的主要原理是利用人眼的视觉特性,通过在用户的感知忍耐范围内删除掉人眼不敏感的、多余的、无关紧要的视频信息,是一种以牺牲部分清晰度和内容丰富度来换取压缩效率的方法。这种编码是不能无损还原出原始数据的。在非编和转码剪辑App上进行编辑、合成视频时,要先对原始视频进行解码,再和其他视频混合处理,完成后再对这些剪辑好的视频进行二次编码。即使是对原始视频进行简单的裁剪,视频都需要进行二次编码,这种二次编码对视频的画质伤害很大。剪辑视频时一定要规避多次合成,也要规避使用合成后的视频进行二次编辑的现象。如果需要把剪辑完成后的视频当做一个视频文件进行二次处理,不要事先合成为单个文件,可以使用多序列技术将这个剪辑完成的序列当做视频文件拖入另一个序列中进行二次编辑,以减少压缩合成次数。实际工作中,应尽量减少视频转换和编辑合成次数,尽量使用原始拍 摄的视频[3]。

3 不同应用环境的注意事项

拍摄视频的目的就是使用最低的码率获得最佳的分辨率和流畅的画面。拍摄前,拍摄人员首先要了解镜头的CCD物理分辨率,选择视频分辨率不要大于镜头的CCD物理分辨率,与镜头的CCD物理分辨率一致为最佳。有些低档设备的CCD物理分辨率仅为1920×1080的分辨率,但是它也可以设置为拍摄4K的视频。这种通过插值计算的4K画面实际清晰度只有2K水平,而且还占用了额外的存储空间。

无人机拍摄的画面偏于固定或微量移动,使用低帧频的25P逐行扫描方式最佳。50P、120P等高帧频一般在后期需要进行时间特效的慢动作处理时才用到。

在码率设置方面,我国1080i高清广播电视播出标准使用MPEG-2编码,码率一般使用 25 Mb·s-1。其他平台使用H.264和H.265编码器时码率分别选取8 Mb·s-1和5 Mb·s-1即可。

在节目后期制作中,要使用色键做抠像处理或使用虚拟演播室时,采样率一定要选取亮度和色度采样比例一样的4∶4∶4格式或低一点的4∶2∶2格式,不可使用4∶2∶0格式[4]。

在传统网络视频直播中,视频流首先推到直播平台网络端,再通过内容分发网络(Content Delivery Network,CDN)分发至部署在各地的边缘服务器,再通过负载均衡、调度等功能模块,使直播观众就近在本地部署的边缘服务器获取视频,以提高用户访问响应速度,同时均衡流量、降低网络拥塞。因此,网络直播视频是以IP数据包形式在网络上进行传输,在转为IP数据包前,视频是连续的数据流,是一种流媒体,虽然看不到文件的名称,但它也存在封装格式,常见的流媒体封装格式有FLV、TS、ASF等。网络视频直播常用的是FLV和TS格式,ASF应用的较少。因为FLV文件体积极小、加载速度极快,可以轻松地导入网页的Flash插件中,不必通过本地播放器的加载即可自动播放,因而FLV是发展最快的网络视频流媒体格式。但是随着近几年来浏览器逐渐停用Flash插件,FLV格式也逐渐减少。TS格式除了用在网络直播上外,还常用于有线电视的节目传输上[5]。

直播的流媒体封装格式选取好后,还要使用IP流传输协议进行封包处理。常用的流传输协议有RTMP、RTSP、HTTP、HLS等。RTMP传输协议的实时性非常好,延时通常在1~3 s,因此RTMP也成为网络直播最常用的流传输协议。高清网络直播使用H.264编码、4 Mb·s-1的码率、25 f·s-1的帧率即可,选用逐行扫描格式可以有效提升图像的清晰度。针对不同的网络状况,有时候还可以选取动态码率和动态帧率。

媒体资产管理存档的主要目的是使用最高的压缩效率来减少文件体积并尽量保持视频原始参数和节目质量。这一步的关键是选取一款优秀的编码器。媒资管理设备的厂家为了达到最好的存档效率,都开发有自己专用的编码器。为了技术保护,各个厂家的编码器互不通用,也不能良好地兼容各种编辑软件。考虑到可持续性,一般不建议使用这些私有编码器。资料存档时一定要保证视频的原始参数,重新编码时一般只改变编码格式、封装格式及码率,其他参数一律不做任何修改。

4 结语

融媒体时代,手机、计算机的软硬件技术快速更新,网络技术迅速发展,宽带速度飞速提升,人们在日常生活中对视频的需求迫切。这种需求逐渐走向了两个极端,一种是对清晰度提出严苛标准的欣赏类视频,另一种是对及时性提出更高要求的信息类视频。根据媒体平台的不同,需求还会进一步分类和细化。只要充分认识视频的特性,根据受众的需求和媒体平台的规范标准,就可以灵活机动地选用最合适的视频格式,应用到节目生产中去。

猜你喜欢
帧频视频文件码率
用于高速碰撞过程拍摄的5万帧摄像系统设计
流媒体视频文件相似性识别的方法
随心定制视频文件的缩略图
一种基于HEVC 和AVC 改进的码率控制算法
基于FPGA的多码率卷积编码器设计与实现
唯快不破—从《双子杀手》看高帧频技术的前世今生
基于状态机的视频码率自适应算法
当代世界电影技术革新亮点:高帧频
多光谱图像压缩的联合码率分配—码率控制方法
视频网格中自适应热度变化的条块化存储