内蒙古广电网络4K智能机顶盒声音自适应调控方案

2019-08-05 14:11冯勇

数字传媒研究 2019年7期

冯勇

内蒙古广播电视网络集团有限公司内蒙古呼和浩特市 010051

1 研究背景与意义

1.1 研究背景

声音是人们接触世界、了解世界的重要介质。近年来，随着科技日新月异的进步，数字电子产品越来越丰富人们的生活，电视作为家用电子设备在日常生活中已经普及开来，成为人们生活中不可缺少的重要组成部分。随着科技的不断发展，人们的生活水平不断提高，对电视能提供的功能及带来的感官效果越来越注重，在追求大屏幕、高清晰度的同时，对电视音质及立体声效果上也不断提出要求。在这样的背景下，电视机声音菜单的功能越来越强大，配有各种音效设置以及均衡器调节，以满足人们的视听需求。

各卫视电视台制作电视节目，并将通过审核的节目上传到卫星，但是各卫视电视台通过卫星传播的直播节目，由于没有统一的音量标准，因此在同一个机顶盒终端上用同样的音量播出时，存在声音有高有低的情况，并且目前大多数电视机在左右声道的平衡调节方面，都是凭借用户自身的听觉技巧来判断声道是否平衡，而且还需要用户再次通过手动调整的方法在电视机的声道均衡器中进行调节。显而易见，同样音量播出时音量高低的不同使得用户需要不断进行人工调节，不仅费时费力，还会给用户带来很不好的使用体验。为了顺应时代的发展、满足社会的需要，广电行业一直对视频清晰特性、声音特性进行着深入的研究与试验，推动着相关产业技术的发展，目前超高清视频产业已经开始广泛发展，视频声音自适应技术产业也有了一定的成果，但还需进一步的开发创新。

1.2 研究意义

随着社会的快速发展，人们对生活质量的追求越来越高，对音视频的各种功能及所带来的体验效果要求也越来越高。先进的声音自适应技术可以节约用户宝贵的时间，给用户的日常工作和生活带来便利，可以满足人们对声音更舒适化、调控更简单化、统一化的需求，有利于提高广大用户的体验效果。同时又可以帮助有关运营商节约成本，推动广电行业相关技术的进步，从而实现多赢的局面。

2 现有的解决方案

各卫视电视台通过卫星传播的直播节目，由于没有统一音量标准，因此在同一个机顶盒终端上用同样的音量播出时，存在声音高低不同的情况。因此迫切需要开发出一种技术，可以根据电视机等的声音播放装置或其他设备，自动调整扬声器播放声音时的音量，使得在同一机顶盒用同样的音量播放不同卫视节目时，声音音量高低效果一致。针对这一问题，业内的解决方式大体可概括为以下两种方案。

2.1 声音自适应解决方案一

针对上述问题，其中一种方案是在声源传输的前端加入相关控制设备，对声音进行调控处理。主要形式表现为：在前端加入声音采集设备，包含声音采集模块、音频分析模块等。声音采集模块主要对声音进行采集，获取声音信息；音频分析模块实时记录信号音频，并根据电视机当前设定的音量，计算出该电视信号音频通过所述扬声器产生的分贝值，计算出与设定音量之间的增益。在前端加入声音控制设备，将声音信号及计算结果发送到声音控制设备，控制模块对声音进行增益处理，使其达到标准设定值，然后输出。总之，该方案是通过在前端加入相关音频处理设备进行调控。

2.2 声音自适应解决方案二

为了解决上述问题，一些企业一直在进行积极的研究与试验，同时将各大运营商的运营成本考虑在内，提出了一种基于终端的解决方案。为了保证现网的单双向机顶盒均能够适用，该方案首先基于前端相关设备判断出音频与采用音量标准之间的差值，确定增益值，然后采用通过EPG系统播发私有描述符（音频属性描述符）的方式，将各service 的默认音频参数通过单向网络广播下发到机顶盒终端，由机顶盒终端接收并处理，达到自动适应各频道声音的目的。

2.2.1 具体实现（音频属性描述符）

将该描述符插入到SDT 表中，用于描述频道的默认声音参数。描述符的语法结构如表1所示。

描述符标签descriptor_tag

8 位字段，声音属性描述的标签固定为0xF0。

描述符长度descriptor_length

表1

8 位字段，指出从本字段的下一个字节开始的描述符的总字节长度，本描述符中该字段值固定为2。

默认音轨audio_track

2 位字段，描述该service 的默认伴音，按照PMT 表中的伴音顺序从0 至3。

默认声道audio_mode

2 位字段，描述该service 的默认声道，具体定义如表2所示。

表2

音量增益audio_level

4 位字段，描述该service 的音量增益，分为15级，对应于基础音量的调整步长（如表3所示）。

2.2.2 声音自适应解决方案二创新点

声音自适应解决方案二具有以下几点创新。第一，采用基于终端的处理方式，即通过EPG 系统播发私有描述符（音频属性描述符）的方式，将各service 的默认音频参数通过单向网络广播下发到机顶盒终端，由机顶盒终端接收并处理。第二，在EPG 软件系统里播发音频描述符，操作性强，便于实现和修改。第三，保证了现有网络的单双向机顶盒均能够适用。第四，帮助运营商节省了运营成本。第五，从新的方向促进了广电行业相关技术的进一步研究与发展。

表3

2.3 两种解决方案具体实现对比分析

通过对上述两种方案进行详细的对比可以发现以下主要不同。第一，针对声音自适应问题的研究，第一种方案更注重在音频信号传输前端进行解决，例如声音采集器、音频控制器、声音均衡器等相关设备，其解决方法主要是通过添加硬件设备进行相关的音频采集与分析；第二种方案主要是基于终端机顶盒，在前端判断出音频音量与标准音量之间的差值之后，通过在EPG 软件系统添加私有的音频描述符下发到机顶盒，然后进行相关处理。第二，第一种解决方案在前端增加了设备，也就意味着风险的增多；第二种方案是在EPG 软件系统里添加描述符，相对来说风险极小。第三，增加硬件设备意味着成本投入的增加，而第二种方案的成本相对较小。

3 实际应用效果和结论

在内蒙古广播电视网络集团有限公司有线电视前端，利用声音自适应解决方案二进行如下应用测试。

（1）利用解码器和编码器微调CCTV-1 高清节目的声音音量，用分贝仪和人耳相结合的方式测试，电视机音量值固定为默认50、机顶盒音量值为25 时，音量大小适中，声音效果良好。后续以CCTV-1 高清节目的声音音量为基准。

（2）在调整其他播出节目音量时，电视机音量值固定为默认50、机顶盒音量值为25 时，用分贝仪结合人耳判断出其他播出节目音量与CCTV-1高清基准音量之间的差值，确定调整增益值，如表4所示。

表4

（3）按照调整差值，在EPG 系统调整播发私有描述符（音频属性描述符）。

（4）通过分贝仪结合人耳试听调整后节目音量，在电视机音量值固定为默认50、机顶盒音量值为25 时，全网节目音量基本均衡，声音效果良好，达到预期目的。

该方案有效地解决了音频均衡问题，满足了用户对声音更舒适化、调控更简单化统一化等需求，进一步提升了用户的使用体验，同时最大程度的为运营商节约了成本，实现了多赢。