樊晓珂
(中央广播电视总台,北京 100020)
在当今的移动互联网时代,视频已成为社会信息传播的主要载体。据业内统计,2019 年,视频信息占据约60%的网络流量。2020 年,视频信息占据约82%的网络流量。5G 时代的来临,不仅颠覆了媒体内容生产的组织方式,更是带来视频行业的新一轮爆发,进一步加速了内容消费。5G 移动通信网络以其高速率、低时延、大容量的特点,为超高清视频传输和应用提供了基础,有力促进了数字内容制作、分发、呈现的全产业链升级[1]。5G 技术与4K、8K 超高清(Ultra High Definition,UHD)视频以及虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)等应用结合在一起,将会给视频内容的采集、编辑、传输及播出带来巨大变化。可以说,超高清电视(UHDTV)是电视发展的未来,而5G 网络则为超高清电视提供了无线传输保障[2]。
作为国家级媒体,中央广播电视总台(以下简称总台)紧紧抓住4K/8K 超高清电视推广和5G 应用这一重大机遇,大力推进4K/8K+5G+AI 战略。依托5G 移动通信网络,一方面从节目制作和片源上提供精良的4K/8K 音视频产品,满足广大人民群众更高的视听感受和需求;另一方面发挥自身优势,努力推动技术发展和产业协同,引领和打造超高清视频制播产业链。同时,顺应形势发展、进行媒体融合,在移动互联网时代积极参与多终端、多场景、多内容视频消费市场。
早在2005 年,包括迪士尼、20 世纪福克斯、派拉蒙、索尼电影、华纳兄弟等电影巨头组成的数字电影联盟(Digital Cinema Initiatives,DCI)推出了4K 分辨率标准,即4 096×2 160 分辨率,支持1.9 ∶1 宽高比,规范电影拍摄方和影院播放4K 分辨率片源。而在广播电视领域,标准高清电视的宽高比是16 ∶9(约1.78 ∶1),对应4K 的分辨率是3 840×2 160,比影院4K 横向少了256 像素。
值得一提的是,目前社会上和行业内对视频清晰度或者说分辨率有着很多的划分方法,当下比较流行的划分如图1 所示。主要划分如下。
图1 常见高清分辨率对比图
(1)高清(High Definition,HD),分辨率720p,屏幕物理像素点1 280×720 个,合计约92 万像素。
(2)全高清(Full High Definition,FHD),分辨率1 080p,屏幕物理像素点1 920×1 080 个,合计约200 万像素。
(3)超高清(Ultra High Definition,UHD),分辨率2 160p,又称4K,屏幕物理像素点3 840×2 160 个,合计约829 万像素。
国际电信联盟(International Telecommunication Union,ITU)标准定义了两种超高清视频3 840×2 160 和7 680×4 320,按其水平分辨率,分别称之为4K 和8K。相应地,之前存在的高清HD 视频1 920×1 080 则称为2K。
目前,中央广播电视总台播出系统中有三种分辨率视频信号,分别是标清(720p)、高清(1 080p)及超高清(2 160p),符合ITU 相关标准的定义。
2012 年8 月,ITU 发布了超高清电视国际标准ITU-RBT.2020。相对于之前的BT.709 标准,该最新标准定义了宽高比16 ∶9 的两种分辨率标准4K 和8K,大幅度提升了视频信号的性能规范。在清晰度方面,像素数分别达到了829 万和3 320 万,相对于1 080p 高清,4K 超高清是其4 倍,而8K 超高清是其16 倍,图像更加清晰细腻;色彩深度方面,由BT.709 标准的8 bit 提升至10 bit 或12 bit,采用了比BT.709 标准更宽广的色域空间,色彩饱和逼真,对于整个影像在色彩层次与过渡方面得到了极大的增强。BT.2020 标准另外一个很重要的改变是,取消了隔行扫描,所有超高清标准下的影像都是基于逐行扫描,有效提升了超高清影像的细腻度与流畅感,是视频标准的历史性突破。
在移动互联网时代,信息的传递和交换已不局限于传统的“电视台-家庭”模式,而是多终端(电视机、电脑、手机)、多场景(录播、直播、互动)、多内容(AR/VR、教育、游戏、医疗)、多方位(本地、异地、固定、移动)的新形态,其核心是移动互联。因此,超高清电视的应用离不开移动特征,广播电视的发展也必须与移动通信网络紧密结合,融入时代发展的大潮,才能进一步焕发出勃勃生机。
按照4K 标准,以10 位编码、60 帧率计算,16 ∶9 格式的超高清电视(UHDTV)需要的传输速率为:3 840×2 160×10×3×60 ≈15 Gb·s-1,加上音频编码等,约需17 Gb·s-1。
由此可见,相较于1 080p 高清的2.5 Gb·s-1,超高清电视对于数据带宽的要求是非常高的,必须通过视频编码技术进行压缩处理。上述17 Gb·s-1的传输速率经H.265 标准压缩后约为17 ~48 Mb·s-1。需要指出的是,以中国为主制定的AVS 音视频编码标准,作为国际上三大视频编码标准之一,目前AVS2 的压缩比基本与H.265 处于同一水准且性能略高。AVS 标准在总台已正式全面推广,率先在广电行业普及,后文还会提到。
在无压缩的情况下,传输(或者说观看)一路4K 节目需要约17 Gb·s-1的带宽。这在实际应用中无法实现,也是没有意义的;经过AVS2(或H.265)标准压缩后也需要数十兆带宽。据统计资料,各国4K 内容现场测试的传输速率在18 ~35 Mb·s-1,央视网数据显示约在50 Mb·s-1左右。所以,为保障电视信号质量,传输4K 数字信号需要至少50 Mb·s-1的稳定带宽。
目前,世界各国的移动通信4G 网络设计能力可以提供100 Mb·s-1的峰值速率,但在实际使用中,速率在8 ~60 Mb·s-1,网络时延约50 ms,难以稳定承载4K。前面提到的移动互联网时代多终端、多场景、多内容、多方位等各种应用,难以借助4G 网络体现出来。
进入5G 时代,5G 网络高达10 Gb·s-1超过4G网100 倍的速率,低至1 ms 的网络时延,多至千亿级的设备接入量,为信息时代开辟出了新的发展空间。超高清视频成为5G 网络的重要应用,需要很强带宽和低延时网络支撑的新兴媒体格式,包括赛事/剧场体验式观看、VR、AR、云游戏等沉浸式场景应用得以实现,4K+5G 带动广播电视、文教娱乐、智慧城市等各行各业迅猛发展。
5G 是第五代移动通信网(5th generation mobile networks)的简称,是最新一代蜂窝移动通信技术。不同于之前的第一到第四代移动通信(1G ~4G),5G 网络以其前所未有的超大带宽、超广连接、超低时延三大新型特性,为人与人、人与物、物与物之间的永续互联打下基础,超越了移动通信的传统狭义范畴。
4K/8K 超高清视频与5G 通信网络良好的匹配,就是因为超大数据量的UHDTV、重大活动/赛事的现场直播、基于人工智能(Artificial Intelligence,AI)的AR/VR 等沉浸式场景、大型网络游戏等,在5G 强大网络支撑下彻底解开了束缚,性能得以充分发挥[3]。国际标准化组织3GPP(第三代移动通信合作计划)对5G 定义的三大应用场景中,第一项就是增强移动宽带业务(Enhanced Mobile Broadband,eMBB),典型代表就是超高清视频、AR/VR、移动游戏等大流量应用。
2018 年6 月13 日,3GPP 组织第80 次全会上,5G NR 标准独立组网(Standalone,SA)正式完成并发布,这标志着首个真正完整意义的国际5G 标准正式出台,全球进入了产业全面冲刺新阶段。仅仅一年之后,2019 年6 月6 日,我国工信部正式向中国电信、中国移动、中国联通、中国广电发放四张5G 商用牌照,中国正式进入5G 商用元年。从广电系统首次获颁移动通信商用牌照可以看出,5G 时代的到来必将对传统广播电视行业产生巨大的冲击、带来新时代新发展的巨大机遇,这也是本文开篇强调、贯穿始终的观点。因此,作为广电行业的从业者,有必要对移动通信网有所了解。
第一代移动通信(1G)诞生于20 世纪80 年代,到现在的5G,基本上每10 年一代。1G(first generation)时代基于模拟技术实现了移动电话,但不能跨网漫游,信号质量和保密性差;2G 采用数字通信技术,标志着数字时代的到来,除了接打电话还支持发送短信,第一次有了数据传输的能力;3G代表着数据时代的到来,数据通信不再是语音通信的附属,无线通信与国际互联网等多媒体通信首次结合在一起,由此标志着移动互联网时代的到来,也迎来了智能手机时代;4G 彻底取消了电路交换技术,推出了全IP 系统,数据业务全面爆发,视频播放从传统的电视开始转向网络。第五代移动通信是最新一代蜂窝移动通信技术,是通信与信息的真正融合,实现了移动通信从以技术为中心向以用户为中心的转变,开始实现万物互联。
纵观从1G 到5G 的演变,从技术发展的角度看,1G 首次实现了移动通信(电话),实属革命性的进展;3G 一举扭转了数据依附于语音的从属地位,强大的数据通信功能赋予移动通信勃勃生机,可称第二次革命性进展;5G 提供了前所未有的移动增强宽带、海量物联、低时延高可靠连接,将移动通信、互联网、智能网、物联网融为一体,奠定了人与万物互联的坚实基础,可称为移动通信的第三次革命性进程。
图2 列出了5G 与4G 的主要性能指标差异。以下着重介绍几项与高清视频制播关联密切的性能指标。
图2 5G 与4G 的差异
2.3.1 高速度
5G 网络的峰值速率达到10 Gb·s-1,用户端速率达到100 Mb·s-1,4K 超高清视频得以畅通无阻传输。与之相伴的直播、虚拟现实、增强现实等应用技术得以实现突破,同时也会催生出大量新的市场机会与运营机制。
2.3.2 低时延
3G 网络的时延在百毫秒量级,4G 网络约50 ms,到了5G 时代,时延降至1 ~10 ms,可以较好地支持UHD 直播、大型多人在线游戏等视频应用场景。
2.3.3 边缘计算
在靠近移动设备、传感器及用户的网络边缘部署节点,进行数据缓存和计算,可以有效减轻核心网络的负载,同时降低数据传输时延。
2.3.4 网络切片
网络切片是一种按需组网的方式,通过网络功能虚拟化(Network Functions Virtualization,NFV),可以在5G 网络中分离出多个虚拟的端到端网络[4]。每个网络切片从无线接入网、承载网再到核心网上进行逻辑隔离,以适配各种各样类型的应用,从而实现灵活组网业务。比如,对一个大型重要集会场景,需要多机位摄像、现场互动制作、前后方视音频协同等多种形式的超高清视频引用,5G 网络可为这个场景实时部署专有网络,服务的效率将大大提高,集会现场所需要的网络性能也能够得到保障。
5G 的诸多特性中,高速率(峰值10 Gb·s-1、用户端100 Mb·s-1)、低时延(1 ~10 ms)强力支撑了超高清视频传输,边缘计算、网络切片等技术有力保障了UHDTV 现场场景的采编播。
在当前视频编码标准AVS2(国外采用H.265)情况下,4K 超高清视频对于承载网的总体要求是端到端带宽要大于50 Mb·s-1,往返时延要小于20 ms,丢包率要小于10-5。目前的4G 移动通信网络虽然能够提供100 Mb·s-1的峰值速率,但是实际使用速率在8 ~60 Mb·s-1,时延50 ms,在终端大量接入的情况下体验速率甚至更低,卡顿现象严重。所以,4G 网络承载高清1 080p 视频没有问题,但承载4K就很困难。5G 网络用户端最低速率为100 Mb·s-1,时延仅数毫秒,从理论上讲,5G 网络对于4K 超高清视频有着良好的承载能力,能够完全满足4K 视频的传输和观看。从总台和各大电信运营商的试验以及后续的实践来看,4K+5G 能够很好地体现UHDTV 的各项突出特点和应用。
再来看看8K 的情况。按照16 ∶9 格式,7 680×4 320 分辨率,10 位编码,60 帧率的基本型8K UHD,未经压缩的原始速率约为:7 680×4 320×10×3×60=59.7 Gb·s-1,在现行的AVS2 或H.265 编码标准下压缩后约为62 ~170 Mb·s-1,业内普遍认为需要130 Mb·s-1左右的带宽才能保证8K 超高清视频传输质量。显然,4G 网络无法承载,5G 网络也不能提供稳定的性能保障。在数字信息处理领域,我国目前正在制定的第三代AVS3 标准已取得突破性进展,并在全球范围内率先推出,有望在不久的将来,AVS3(H.266)将会使视音频编码在前代基础上再压缩一倍,这样,8K 超高清视频带宽需求将会降到50 ~60 Mb·s-1,仍然可由5G 网络承载,这也正是总台4K/8K+5G+AI 协同发展战略在技术上的基础之一。
作为国家级媒体,中央广播电视总台(总台)不仅担负着重要的广播电视制播任务,同时也在新技术、新应用方面走在前沿。2018 年10 月,中央广播电视总台建立了国内第一个4K 电视频道,以内容、制播为抓手,串起了4K 在整机、终端、网络、软件的整个产业链。这是国家在超高清领域从无到有的突破,对全行业起到了非常明显的示范带动作用。总台在大量4K+5G 先发行动的基础上,于2020 年7 月发布《中央广播电视总台5G 媒体应用白皮书(2020 版)》,这是媒体行业首次对于5G 技术应用提出的技术规范。在5G 媒体应用上的探索,总台在国内、国际均走在了第一方阵,在4K 超高清电视引领产业发展的同时,紧密结合最新一代5G 通信网络,继续引领4K+5G 发展,坚持守正创新,深化融合发展,体现出了作为新时代国家级媒体更高层面的视角和应有的担当。
2018 年以来,总台全力推进4K 超高清电视技术工程建设、5G 与4K/8K 超高清视频应用、从内容到播出的新媒体融合,并起到引领示范作用。2018年10 月,全国首个4K 超高清电视频道在总台正式开播。2018 年12 月,总台与国内三大电信运营商和华为公司共同搭建5G 新媒体平台,进行了基于5G 网络的4K 传输各项测试,同期,总台成立了5G媒体实验室,开展基于5G 网络环境的媒体应用创新研究,进行了5G+(4K传输、VR制作、移动云制作、网络家庭环境)课题研究和应用实践。随后在2019年春节联欢晚会上,总台首次实现了在5G 网络上实时传输4K 视频,并应用了VR 技术进行直播。
2019 年7 月,广电和三大电信运营商同时获颁5G 商用牌照。2019 年底,总台申报的“超高清制播国家重点实验室”获得科技部批准。总台以此为依托,进行5G+4K/8K+AI 技术研究和应用创新。到2020 年中,《中央广播电视总台5G 媒体应用白皮书(2020 版)》发布,提出了5G 网络环境下媒体采集传输、移动云制作、VR 制作及分发等关键环节的业务和技术标准,如图3 所示。
图3 5G 媒体应用白皮书
2020 年11 月,在工业和信息化部、国家广播电视总局、中央广播电视总台、广东省政府共同主办的“2020 世界超高清视频(4K/8K)产业发展大会”上,“超清视界,5G 赋能”成为大会主题。大会达成跨界重要共识——超高清视频与5G 网络融合远不止改变人们的娱乐体验,它还将惠及人类生产生活的方方面面。
2021 年春节联欢晚会,总台首次开展4K 和HD 同步制作和直播,同期开展8K 制作,首次采用了AVS3 编码标准,在总台内部IPTV 平台以8K 频道方式进行直播试验。
5G 高带宽、低时延的网络承载能力给视频媒体的采编和传送带来变革,云端强大的计算和存储能力大大降低了视频编辑处理的门槛,而人工智能(Artificial Intelligence,AI)使转码、审核、编辑、广告推荐等实现了智能化并延伸到操作端[5]。5G、云和AI 融合,将对媒体行业的采、编、播、传等各个环节带来革命性的变化。总台在4K/8K+5G 架构建设、节目制作、现场直播、多媒体融合等方面全方位发力,将5G+4K/8K+AI 战略落到实处。
3.2.1 4K 播出基础架构
总台4K 播出架构按以下原则设计部署:
(1)播出域内网络统一规划,统一架构,兼顾4K播出系统及未来新建高清播出系统的扩展需求;
(2)基础IT 平台以通用设备为主,保留播出系统高可靠、高可用、高可维的设计要求;
(3)引入刀片服务器及虚拟化平台等已经过验证的数据中心成熟技术,提高集成度,降低布线复杂度,降低空间功耗;
(4)网络安全方案设计满足等级保护2.0 标准要求。
3.2.2 视音频系统
总台本期建设6 套UHD 播出系统(系统1 目前是UHD 及高清同播),直播信号常态下由总控提供。其中,系统1、系统2 共享主4 路、备4 路直播信号;系统3、系统4 共享主2 路、备2 路直播信号,系统5、系统6 共享主4 路、备4 路直播信号,共主10 路、备10 路直播信号。
每频道末级输出主备2 路UHD 信号(系统1还有主备各1 路HD 信号),采用前级共享调度+频道切换的信号调度方式,采用主备双链路+末级2选1 实现播出末级信号应急倒换。
采取通道包装“虚拟内键”方式,同时完成台标和时钟以及环绕声等副标的叠加,通过下变换方式实现同播,同时完成动态范围、色域、帧率的转换,采用标准动态范围(Standard Dynamic Range,SDR)/高动态范围(High Dynamic Range,HDR)分离监看。如图4 所示。
图4 4K 播出音视频系统架构
3.2.3 管理系统
管理系统围绕总台超高清电视内容运营的实际情况和业务拓展要求,为总台在UHDTV 领域的长远发展提供可靠支撑,实现超高清播出系统与台内现有业务系统间的全流程系统对接,安全高效地完成超高清节目文件的备播整备工作,提供高度稳定可靠的自动播出控制手段,实现超高清节目、广告和直播信号的帧精度切换播出,并能够自动监控、诊断系统运行状态,确保各项播出任务高质量有序完成。项目一期建设4K 超高清播出系统6 套,满足3 ~5 个频道的4K 超高清播出。播出控制及管理系统总体架构如图5 所示。
图5 播出控制及管理系统
3.2.4 虚拟切换
当前,4K/8K 超高清电视节目内容还比较少,对此,总台采用智能虚拟切换技术,实现了4K 伴随HD 制作和直播模式,有效解决了这一短板。如图6所示,通过增加的4K 摄像机、多通道收录系统和新建智能虚拟切换系统,实现了在原有的高清电视制播平台上同步制作4K 超高清电视节目。
图6 4K/HD 同步制播
3.2.5 VR 和虚拟网络交互系统
为提升“VR 视频+三维声”节目制作能力和质量,总台研发了虚拟网络交互系统(VNIS),在外场地进行VR 全景+三维声采集,通过5G 将信号传输到虚拟演播室,实现了主持人在多场景穿越呈现,大幅度提升了VR 全景视音频的沉浸式体验效果,如图7 所示。
图7 VR 虚拟制作
3.2.6 5G+4K/8K 移动传输系统(5G 背包)
以往的大型重要活动、演出、体育赛事、突发事件现场直播,通常由转播车系统、信号传输系统以及后方制播系统等组成,现场内容通过摄像机送入转播车,经过技术处理后,再通过光纤、卫星或微波回传方式将信号传输至演播导控室。在体育场、大剧院等固定的场所内直播时,通常在现场部署专用光纤,将信号回传至中心机房,而且摄像机点位通常是固定的,需要移动拍摄时需要拖着电缆;对于室外全程跟随拍摄的场景,如马拉松赛事直播,需要提前沿途架设微波通道,通过微波进行移动回传。微波由于频率高、直线传输特性,直播时还要注意避开建筑物阻挡,而且时延比较大,遇到互动情景,后方主持人与现场记者的对话经常有数秒甚至十几秒的延迟,影响观看效果。
如今,5G 背包(如图8 所示)内置5G 客户前置设备(Customer Premise Equipment,CPE),连上超高清摄影机和编码器,再通过5G 网络将视音频数据流实时传送到演播导控室,不再需要敷设大量光纤,也不再需要微波系统和卫星转播车,前方记者背着包就可以完成现场采编任务。5G 背包不仅解决了直播布线尤其是转播车无法到达现场的问题,而且具备无线覆盖功能,可以同时连接手机、摄像机、PAD、无人机等各种终端,多现场、前后方可以直接在视频中实时互动,并支持回看与实时数据统计,这是传统直播无法比拟的。5G 背包的拓扑结构如图9 所示。此外,5G 超高带宽可以同时支持4K 超高清信号的多路直播回传,实现了超高清直播节目的多屏、多视角全新场景。
图8 5G 背包
图9 5G 背包拓扑
4K超高清视频给人们带来前所未有的震撼体验,5G 网络的高速率、低时延、高可靠性、万物互联和边缘计算、网络切片这些前所未有的网络能力极好地承载了4K 传输应用,并有效支撑了人工智能从中心节点向边缘终端拓展,使AI 计算架构实现云端和终端侧之间最灵活的配比,从而向虚拟现实、增强现实、混合现实等新兴应用注入了活力。5G+4K/8K+AI 必将催生包括数字内容生产、制作、传输、分发在内的全产业链升级,为用户带来极致体验,也将深刻改变视频行业产业格局,孕育巨大的发展机遇。