孙 镝
(北京安达斯信息技术有限公司,北京 100080)
自中央广播电视总台开播国内首个4K 超高清上星频道以来,4K 超高清内容需求量与日俱增。《中央广播电视总台4K 超高清电视节目制播技术规范》明确了该频道以5.1 环绕声方式进行播出,同时对音频技术参数、成品节目电平和响度、监听及扬声器布局、音频元数据以及16 路声道分配等进行了定义,为后续三维声制作播出打下技术实现基础[1]。
广播电视音频制作系统的信号传输方式也在不断发展。网络化的音频信号传输架构始于二十多年前,基于以太网的解决方案也已经存在了近二十年。AES67 标准于2013 年首次颁布,这是数字音频IP 化的里程碑事件。2017 年后,SMPTE 2110标准集不断完善,其中的ST 2110-30 和2110-31 标准主要描述的就是流化音频信号。ST 2110-30 标准和AES67 标准实质上非常接近,而自《高性能流化音频在IP 网络上的互操作性规范》(GY/T 304—2016)[2]正式颁布以来,我国广播电视音频IP 化进程也不断加快。基带向IP 过渡,是系统架构发展的必然趋势[3]。现代电视转播越来越成为一个专业化的系统工程,如何构建一套稳定、安全、高效的网络化电视制播系统,已经成为全行业的焦点[4]。
因此,中央广播电视总台拟设计并建造一台符合国家标准的“IP 化、三维声制作”的数字环绕声制作录音车。
该录音车主要有三个方面的设计目标。
(1)功能和系统方面,设计一个能够完成各种大中型政治活动、大中型综艺节目、国家级庆典活动以及大中型国际体育赛事等重大电视播出节目的三维声制作系统。系统应具有国际化水准,并能够兼容环绕声和立体声制作与音频信号供给;具有安全可靠的大型节目直播能力,具有同时录制两套不同节目的能力,具有同时级联多台转播车的能力。建立以IP 化音频(Audio over IP,AOIP)为信号传输方式的音频系统,充分发挥IP 网络特点,实现多个子系统间IP 化传输和信号交换,搭建一个对未来广播电视节目制作播出具有示范性和指导意义的、先进的音频转播制作系统;充分体现技术上的先进性、功能上的灵活性和可扩展性,实现建设现阶段国内国际一流水平的大型电视三维环绕声录音车系统的目标。
(2)声学环境和指标方面,重视移动音频录制空间与声学环境,主制作区监听布局满足《用于节目制作的先进声音系统》(GY/T 316—2018)对三维声监听标准的要求,第二制作区满足环绕声监听布局。整车隔音标准达到Rw ≥40 dB,车厢内制作区噪声评价曲线达到或优于NR30,主、第二制作区平均混响时间T60 ≤0.30 s[5]。
(3)车体和布局方面,采用先进、成熟、可靠的传动方式,提供电控和手动两种驱动方式控制调节箱体的收放位置,并有直观的平衡显示窗口功能。主要设备机柜均采用封闭隔声式设计,具有独立的进风与出风设计。所有灯光避免直射眼睛,采用漫反射光源。车体合理设置检修门,要能满足方便维修的需要,检修门应考虑隔声密封设计,隔声标准不小于整车隔声要求。根据多样态的制作需求合理分配车体空间,实现一车多用的目的。制造工艺先进,车体质量一流,美观实用耐用,实现车体使用年限15 年的设计目标。
3.1.1 调音台
主制作区调音台(即主调音台)选择LAWO MC²56 MK3,48 推子版本。该调音台采用了21.5寸高清显示屏作为表桥,并采用了下沉式设计,表桥顶端与推子高度差仅24 cm,高度合适且不会阻挡中置扬声器的正常摆位,也可避免视频画面显示设备安装过高导致仰头观看。表桥屏幕具有触控功能,可单指点击打开菜单,直接完成母线分配、电平表设置以及通道信号源选择等操作。调音台内嵌安装了一台RTW TM9 音频监测表,具有音频响度监测、音频相位监测以及实时频谱分析等功能。调音台内置一张“音频网关”电路板,可将调音台背后的话放、模拟、AES3 及多通道音频数字接口(serial Multi-channel Audio Digital Interface,MADI)等 信号与AoIP 信号进行双向转换,用于基带信号的IP化共享或是送出基带信号。
主调音台核心处理机箱为LAWO A_UHD Core,为512 全处理通道版本,共配置了2 台,互为主备。每台A UHD_Core 具有8 个SFP 插槽,可绑定为4 个ST 2022-7 SPS 端口组,可支持1 Gb·s-1电模块、1 Gb·s-1/10 Gb·s-1光模块。本系统配置了8 个1 Gb·s-1电模块,每个电模块可收、发各512 声道IP音频信号。A UHD_Core 处理延时可低至1 ms,与传统基带处理机箱差别不大。A UHD_Core 仅1 RU的高度也为“空间分配合理”的设计要求提供了更多的可能性。
副制作区调音台(即副调音台,或备调音台)为LAWO MC²36 MK2,32 推子版本。该调音台采用了与MC²56 完全相同的表桥屏幕与设计,为一体式调音台。除了少量的基带接口外,MC²36 具有6个AoIP 接口,可绑定为3 个2022-7 SPS 端口组。
其他IP 共享接口包括车内配置的1 台LAWO A stage64、1 台LAWO A digital64、2 台A MADI6 以及车外配置的2 台LAWO Astage64。这使得调音台系统的总接口数量达到了128 个话放/模拟输入、64 个模拟输出、48 个AES 输入、48 个AES 输出、18 个MADI I/O 以及超过500 个声道的AoIP I/O 余量。
3.1.2 音频工作站
作为一辆录音车,音频工作站是必不可少的。本车配置了2 套Protools 多轨录音工作站,其中一套支持192 声道录音,另一套支持64 声道录音。两套录音工作站都配置了MAC PRO 机架安装版以及带有MADI 接口的MTRX 接口箱,其中192 声道录音工作站还配置了Waves 插件包。
此外,本车配置了1 台便携式Protools 录音工作站,可通过AoIP 虚拟声卡接入系统,实现32 声道多轨音频回放功能,能够满足同时回放“5.1.4 三维声+5.1 环绕声+2.0 立体声”共计18 声道的使用场景。
3.1.3 核心交换机
相较于基带音频系统,交换机在AoIP 系统中可以扮演“跳线盘”与“音分”的角色。区别仅在于用户操作层面。按照前期调研预估,本车选用2 台华为CE6865 交换机作为本车的核心交换机。该型号产品广泛应用于国内IP 架构超高清转播车。
华为CE6865 交换机常用于园区和数据中心组 网场景。它具有48 个1/10/25GE 端 口,8 个40GE/100GE 上行接口;可支持16 台堆叠,可支持长距离堆叠模式;支持跨设备线路聚合,服务器双活接入和交换机零中断升级,确保业务7×24 小时在线;开放可编程网络,可灵活定制;具有多种硬件资源分配组合方式,系统中的芯片表项资源为多业务共享,当ARP、MAC、ACL 或路由表项不能满足业务需求时,可以调整芯片的资源模式以获得更大的配置表项。对于AoIP 网络来说,其PTP 边界时钟功能、灵活的组播功能将起到关键作用。
3.1.4 AoIP 实时监测系统
随着AoIP 技术的普及,音频信号监管控系统方面的需求逐渐增加。国外广电制播监、管、控系统均已有一定程度的发展,成型的产品数不胜数,如LAWO 公司的VSM/SMART 体系、SONY 公司的LSM 以及GV 公司的ORBIT 等。中央广播电视总台2017 年建造的全IP 架构的音频系统就已经具有监管控系统的加持。监控管能力的进一步提升,将成为IP 化视音频系统安全播出的保障[4]。
对于流化音频来说,能够直观地看到组播音频流内容的峰值电平表,可以解决“不可见”的问题,即可“监”,让工程师“心里有底”。市场上已经有了类似的产品,如Lawo 公司的Stream Monitor。其作为一个独立的应用程序,已经具有较为完善的功能,但在批量部署、同时使用的场景下造价较高,且不便于定制开发。
北京安达斯信息技术有限公司在近期的央视工程项目中根据用户需求定制开发了基于浏览器/服务器(Browser/Server,B/S)架构的“组播音频流解析”功能,部署在已有的监管控服务器中,与已有的监管控服务(即安达斯云监控系统,可对设备端口状态、带宽和PTP 同步抖动值等进行全方位监测、智能告警与日志记录)融为一体,可在客户端中使用浏览器实时监看网络中组播音频流的峰值电平表。该系统还具有“低电平报警”功能,可设置电平阈值和持续时间,实现一定逻辑的报警功能。该功能已在台内多个音频制作系统中使用,本车中也有应用,并已迭代了多个版本,功能细节也正在逐渐丰富。
本车音频系统架构如图1 所示。音频系统为全IP 架构,使用“主”“备”“控制”3 台交换机,在满足2022-7 SPS 组网要求的同时,主、备交换机之间连接了“PTP only”连线,以使全网BMCA 算法正常工作。车内外的基带输入信号包括话放、模拟、数字及MADI 等信号,均转换成组播音频流发至主、备交换机,供收流端使用。通过LAWO 的“HOME”软件进行收流或切换收流操作后,组播音频流将被转换为基带信号送出。“HOME”是LAWO 近期发布的AoIP 管理系统,通过浏览器访问“HOME”页面,可在网页内更改LAWO 设备的IP 地址、收发流等。本车的模拟音频、数字音频信号仍然通过跳线盘进行连接。
图1 本车音频系统架构
根据总台的IP 地址规划要求,本车终端地址共分为“音频主”“音频备”“通话”“管理控制”“其他AoIP 设备”“网络设备互联”“插件服务器网络”等多个网段。考虑到优化网络带宽的利用率,与合理利用有限的组播地址资源,根据总台组播地址规划要求,本车组播音频声道数量按照每条组播8 声道、16 声道、32 声道、64 声道方式进行规划,实际规划发出音频组播约400 条(约200 条2022-7 SPS),预留约600 条。
监听环境设计是录音车系统设计一贯的重点、难点。受到车内空间尤其是高度的限制,设计出与录音棚一样的监听环境是一项非常具有挑战性的任务。Genelec 以其多种专利,尤其是GLM 自动校准技术,赢得了诸多转播车、录音车的青睐,本车也选用了Genelec 产品作为车内三个制作区的监听扬声器。
主制作区按照GY/T—316 标准“4+5+0”(即5.1.4)设计。平层5.0 采用Genelec 8351 同轴扬声器,顶层4.0 采用Genelec 8331 同轴扬声器,超低声道采用Genelec 7360 超低扬声器。副制作区按照5.0环绕声设计,采用Genelec8430 扬声器,该扬声器具有AoIP 接口。多功能制作区按照2.0 立体声设计。
为应对灵活多变的应用场景,系统配置了各类音频周边设备。
考虑到本车存在与其他转播车、音频车、扩声系统进行信号对接的场景,声道较多的情况下通常采用MADI 接口或是Dante 接口,因此系统配置了一台多格式音频转换器,可将64 声道MADI 信号与64声道Dante 信号转换为符合ST2110-30 标准的128声道组播音频流接入系统,反之亦然。考虑到多个MADI 对接时的同步锁相问题,本车配置了MADI 采样率转换设备,可在两个不同步的系统之间正常稳定地传输MADI 信号。考虑到还音介质的多样性,本车除了配置了还音工作站之外,还配置了蓝光DVD、解码功放以及CD 播放机等还音设备。此外,本车还配置了降噪处理硬件、环绕声效果器、立体声效果器、插件服务器、自动混音处理器、音频上变换器以及监听单元等周边设备,丰富了声音制作手段。
同步系统方面,本车采用以PTP 为主、基带同步为辅助与备份的方式进行同步。2 台SPG8000A同步机可锁相于GPS 或是外部BB+VITC,为音频系统提供PTP 同步。全车以SPG8000A 同步机作为PTP GrandMaster,华为CE6865 交换机作为边界时钟,下发PTP 消息。
视频系统方面,设计了外来超高清信号与高清信号的接入,车内计算机、服务器类设备输出的画面经过转换器转换为SDI 信号。上述信号进入视频矩阵,监视器、显示器等设备通过视频矩阵切换后送出。为确保SDI 视频信号的可用性,本车还安装了视频跳线盘。
通话系统方面,配置了RTS OMS IP 通话主站、各区域通话面板以及远端无线接入点与无线主持人腰包。通话设备间的音频信号传输基于Dante 协议,其主、备网络分别位于2 台不同的交换机实体中。
时钟系统方面,除各区域所需要的显示时钟外,还从时间码分配器送出一路信号至多轨录音工作站,用于时间码同步。
试运行期间,技术人员对录音车进行了网络系统实测,测得系统核心交换机的下联端口带宽用量百分比如图2 所示。其中,1 ~40 端口手工配置为千兆端口,41 ~48 端口手工配置为10 Gb·s-1端口,41 端口正在进行M-LAG 技术相关测试。
图2 核心交换机(主)端口使用率实测结果
普通1 Gb·s-1端口带宽用量最多的为LAWO A_UHD Core 上的AoIP 接口。按照规划,该接口共发出24 条组播音频流,共计448 声道,总带宽约571 Mb·s-1,共接收8 条组播音频流,共计464 声道,总带宽约占538 Mb·s-1,并且该端口可能涉及一些网络协议报文(如PTP、各类发现协议、生成树等)以及带内控制(如音频接口箱控制、网页服务、连接管理等),端口实际使用率达到63.59%/57.14%,仍留有一定裕量。
业界对于AoIP 系统的优化具有多种观点。
第一是带宽利用率方面。对于48 kHz/24 bit的PCM 编码,用8 声道/0.125 ms 打包时间封装成帧,这样的一条音频流带宽利用率约为72.73%,而用64 声道/0.125 ms 打包时间封装成帧,这样的一条音频流带宽利用率约为95.5%。如果希望多传输一些声道,无疑应当在不超过最大传输单元(Maximum Transmission Unit,MTU)的情况下每一包封装尽可能多的声道。如前文所述,464 声道比448 声道占用的总带宽还小,正是因为464 声道所在的传输方向上,64 声道流有7 条,16 声道流有1条;而另一个方向64声道流有4条,32声道流1条,16声道流1条,其余均为8声道流,“大流”占比较高,对带宽利用率的优化有明显的作用。
第二是延迟方面。“收流延时”是AoIP 系统延时结构的关键环节。若收流延时过大,不但耗费设备缓存空间,还有可能对视音频、甚至是更大的网络系统整体的延时结构产生无法接受的影响;而收流延时过小,则可能出现由于丢包而产生的可闻的声音劣化。如果想要收流延迟低又尽量避免丢包,可以考虑发流端采用尽可能小的打包时间,但这样又会降低带宽利用率。
第三是管理难度方面。在一些需要“实时切流”的场景,由于收流的“容器”在对数据包解封装后需要对内部的实质数据(如PCM 编码)进行解析,而解析参数如流的声道数量、打包时间等,往往需要在“流切换”之前和之后保持一致,否则不论是操作人员手动修改还是使用监管控软件,均会加大管理难度。
综上所述,对AoIP 系统进行优化,需要在声道数量、延迟大小以及管理难度等多方面进行权衡,依据系统应用场景进行优化。
本文介绍了中央广播电视总台新建的B1 录音车系统。首先从功能和系统、声学环境和指标、车体及布局三个方面阐述了本车的系统设计目标,其次从核心设备选型、音频系统架构、监听环境、周边设备选型以及各辅助系统简介等方面简要介绍了本车的音频系统,最后回顾了网络实测数据,并提出需要从带宽利用率、延迟即管理难度三个方面进行权衡,依据应用场景对系统进行优化的观点。如果一条条组播音频流相当于道路上的车流,那么AoIP 技术可被认为是“修路”;如果声音作品是一栋大楼,那么车内装载的正是建造大楼所需要的原材料。路修通了,只是第一步,使用者希望原材料更快地运输到位,同时也要确保交通安全。与广电行业类似,低延迟传输和系统高可靠性是广播电视声音制作一直以来的追求。