音频编码技术及广播电台数字编码压缩传输系统建设

2015-03-03 07:11杨中央人民广播电台北京100866

科技传播 2015年11期

张　杨中央人民广播电台，北京　　100866

张杨
中央人民广播电台，北京100866

摘要随着广播电视数字化技术的迅猛发展，数字音频压缩编码技术已在广电领域得到广泛应用。本文介绍了音频编码的分类、原理、现行主流标准以及我国自主研发的DRA数字音频编码标准。同时以广播电台为实例，对播出音频信号的数字编码压缩传输系统进行了简要介绍。

关键词数字化；音频编码；DRA；压缩传输

0 引言

随着我国广播电视技术数字化的快速推进和发展，模拟信号在传输中存在着带宽高效果差等问题，已不能满足广播电视发展的需要，目前图像、声音都采用了较为常见的数字编码技术。为了追求更高的编码效率，产生了许多音频编码标准。不同用户针对各自业务类型，选用不同的编码标准实现音频信号的数字化传输。

1 音频编码分类及原理

与传统模拟音频技术相比，数字音频具有无法比拟的优点，例如传输质量高、可采用纠错编码技术提高抗干扰能力，可实现大规模集成等。

通常意义上，数字音频编码主要分为两大类：

1）无损压缩，对音频数据进行编码后，将信息冗余去除，采用该方式进行压缩，可保证信号声音质量不受损伤，但压缩效率不高，通常最高只有一倍左右。目前在互联网应用中，比较常用的无损压缩方式有FLAC，LPAC， APE， WavPack等。

2）有损压缩，心理声学模型是这类算法的核心思想，由于人类对信号的不敏感性，压缩过程中会损失一部分信息，但通常能够获得较高的压缩比，常用的有损压缩方式有MP3，AAC等。

根据音频压缩技术原理的差异，音频编码主要分为如下四种编码[1]：

1）基于音频数据的统计特性进行编码，其中对波形编码是典型技术。其目标是使重建语音波形保持原波形的形状。利用音频抽样的幅度分布规律和相邻样值具有相关性的特点。波形编码适应性强，音频质量好，但压缩比不大，因而数据率较高。

2）基于音频的声学参数来进行编码，可进一步降低数据率。其目标是使重建音频保持原音频的特性。常用的音频参数有线性预测系数、共振峰、滤波器组等。这种编码技术的优点是压缩数据率低，但还原信号的质量不好，语音可能不清晰。

3）混合编码方式即是将波形编码的高质量与参数编码的低数据率这两者特性相结合，这样就能在较低的码率上得到较高的音质。目前在通讯中用到的大多数语音编码器都是采用了混合编码方式。

4）感知编码是基于人的听觉特性来进行：从人的听觉系统出发，基于心里声学模型，利用人耳的听觉阈值特性和掩蔽效应，消除不被感知的冗余信息来实现对音频数据进行压缩的编码方式。

根据应用场合的不同，可以分为如下两种编码：

1）语音编码：针对语音信号进行的编码压缩，主要应用于实时语音通信中减少语音信号的数据量。典型的编码标准有3GPP2 QCELP8k、QCELP 13k、3GPPAMRNB、AMR-WB；ITU-T G.711、G.722、G.723.1、G.729；GSMHR、FR、EFR； EVRC、4GV-NB等。

2）音频编码：对频率范围比较宽的音频信号进行的一种编码方式。主要应用于数字广播和数字电视广播、消费电子产品、音频信息的存储、下载等。典型的编码有MPEG1/MPEG2的layer1、2、3和MPEG 4 AAC的音频编码，还有最新的ITU-T G.722.1、3GPP AMR-WB+和3GPP 2 4GV-WB。

2 几种主流音频编码标准

1）杜比AC-3标准。

杜比AC-3是由美国杜比实验室主要针对环绕声开发的一种音频压缩技术，它将特殊的心理音响知识、先进的数字信号处理技术与人耳效应最新研究成果很好的结合，形成了“数字多声道音频处理技术”，该技术能够将多个音频信道的信号编成一个码流，码率为32~640kbit/s，取样频率为48kHz。它具备单声道、立体声和5.1环绕声功能。

杜比AC-3最早是针对影院系统设计开发的，目前已成为应用最为广泛的环绕声压缩技术之一，该标准在DVD数字视盘机、数字电视广播、院线系统以及直播卫星平台等方面都得到广泛应用。

2）MPEG-1音频编码标准（MP3）。

MPEG-1标准第3部分(IS0/IEC 11172-3《信息技术具有1.5 Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码第3部分:音频》)是第一个高保真音频数据压缩标准，作为MPEG-1标准的一部分，可以完全独立应用。MPEG-1是以人类听觉系统的心理声学原理为基础的感知编码，采用了MUSICAM（掩蔽型通用子带综合编码和复用）和ASPEC（自适应频谱心理声学熵编码）算法，利用最小听阈和掩蔽特性创建的编码模型来进行数据压缩。

3）MPEG-2音频编码标准。

MPEG-2的音频(ISO/IEC 13818-3《信息技术运动图像及其伴音信号的通用编码第3部分:音频》)采用感觉压缩编码技术的多声道系统，充分利用心理声学的掩蔽效应和哈斯效应，将原始音频信号中不相关分量和冗余分量有效的去除，在不影响人耳听觉阈度和听音效果质量的前提下，将音频信号进行压缩，与MP3相比，在听感质量相同的条件下数据率是它的70%，其缺点是兼容性差。

由于MPEG-2的压缩技术特点，因此特别适用于广播级的数字电视的编码和传送。目前我国的有线数字电视系统采用的就是MPEG-2编码标准。

4）WMA音频编码标准。

WMA是基于音频信号在互联网等领域应用的数字音频压缩算法。由于其具有更低的码率，目前已经成为网络音频资源的重要标准之一。

目前，有许多在线音频网站使用的都是WMA格式（通常码率为64kbps）。

3 中国数字音频编码标准

从上述几个流行标准看出，全球市场上音频编码的核心技术基本掌握在美国、欧洲等国家手中，据统计，我国每年需要向前杜比、MPEG2等国外企业组织提供数亿美元的数字音频技术专利费用。

所以，我国通过自己的技术力量，相继研发了具有自主知识产权的音频编码技术。

1）DRA标准。

我国在2009年颁布了具有自主知识产权的音频编码国家标准GB/T22726-2008《多声道数字音频编解码技术规范》（DRA）[4]

我国自主研发的DRA技术的主要性能指标已经达到国际先进水平，具有音质好、压缩效率高、容错能力强和解码复杂度低的显著优点，可广泛应用于数字电视、数字音频广播、宽带多媒体及移动多媒体等领域。

目前，DRA已经作为中国移动多媒体广播（CMMB）的必选音频标准，随后，在我国地面数字电视系统（DTMB）、直播卫星系统（ABS-S）中验证了DRA标准的可行性，并且在调频频段数字音频广播（CDR）系统中，采用DRA+标准作为音频新源编码算法使用[5]。

2）AVS标准。

AVS是我国具有自主知识产权的的编码标准，它能够对数字音视频的海量数据进行编码压缩，达到了国际的先进水平，AVS音视频编码压缩标准的各类指标甚至超过了MPEG AAC。

4 广播电台数字编码压缩传输系统建设

4.1数字压缩编码传输

广播电台在完成数字化改造的基础上，也在实现从基带传输向数字压缩编码传输逐渐过渡，目标是将立体声广播的音频基带信号（AES/EBU）进行MPEG编码和MPEG-2 TS复用，形成1路或多路标准的多节目流（MPTS），经过传输链路向下一级单位提供广播电台的广播业务。

4.2ASI架构与IP架构的比较

在数字压缩编码复用系统的选型上，有ASI架构与IP架构两种方式，ASI架构是广播电视数字化改造后的第一代前端架构，随着IP技术与业务类型的拓展，有越来越多的运营商选择了IP架构前端。但ASI架构与IP架构由于采用不同的信号传输类型、物理接口、线缆类型，所以在系统特点上有所差异，下面从功能性、集成性、安全性、扩展性四个方面进行比较。

1）功能性。

编码、复用是一个数字前端必备的两个功能环节，数字化改造后，在有线数字电视运营前端机房、电台/电视台传输机房，都会建设编码复用系统。

就ASI架构而言，早期是由编码器、复用器等独立设备单元组成，编码器接收各种类型信源信号（如卫星接收机输出、电台/电视台制作输出、国干网下传接收等），输出ASI码流至复用器，经过复用器，将多路单节目ASI码流复用成1路多节目ASI码流输出，供后端链路使用。随着技术的进步，设备集成度越来越高，编码与复用功能可以通过一台高集成度设备完成，减少了设备数量、线缆数量，一定程度上降低了系统复杂度。

在IP架构中，编码、复用设备都是通过IP以太网连接，目前大多数系统采用编码复用一体机，支持多种信源业务输入，完成功能与ASI架构一样。但IP架构中采用的编码复用设备，一般都可支持ASI与IP方式同步双路输出。

2）集成性。

ASI架构中，设备独立性强，且1个ASI通道只能传送1路TS流，在广播电视业务中，1路TS流一般不会超过20套节目，所以，ASI架构的集成性较弱。

IP架构中，由于IP通道特性，在带宽允许的情况下，1个IP通道可以传送多路TS流，所以1个通道可以传送几十套甚至上百套节目。

在节目数量较多的情况下，IP架构的系统结构简洁、占用空间小，管理简化，集成性优于ASI架构。

3）安全性。

ASI架构中，设备之间按照严格的逻辑关系连接构建，每台设备的上下游连接是确定的，每个通道都是单向传输，通道之间完全独立；在IP架构中，无需考虑设备连线之间的逻辑结构，直接将IP信号送至交换机的任意端口即可，通过对信号IP地址的规划配置，实现信号流的传送，因为IP为双向传输，通道之间需要通过VLAN划分等处理才可实现通道间的独立，同时由于IP传输协议的特性，在传输数字码流时会出现延迟、抖动现象，TS流的传输将受到网络服务质量的影响，并最终影响接收质量。

由此可见，ASI架构的安全性、稳定性更加出色。

4）扩展性。

基于前面几点的分析，IP架构为双向通道，利用了成熟的IP协议、路由交换及网络技术，不仅可以完美支持ASI平台的各种增值业务，并且可方便的支持基于IP传输的各种类型业务，更加适用于三网融合应用。

4.3 电台采用ASI架构的考虑

在数字电视大规模普及的今年，几乎所有的有线运营商均采用了IP架构的前端，这是因为作为运营商前端，节目数量庞大、业务类型繁多，可以采用集成度很高的设备，在系统扩展性、灵活性上都有突出优势。但IP架构在可靠性、安全性方面，则比ASI略逊一筹。

广播电台作为节目制作单位，有以下几个特点，一是作为第一级信源单位，对信号传输的可靠性要求最高；二是节目数量不多；三是业务类型单一，为单纯的音频广播节目。

在传统的ASI解决方案中，设备之间是通过ASI电缆进行连接，它们之间的连接逻辑是十分严格的，每条通道之间相互没有交叉，可以完全确保节目传输的安全性，ASI架构相对IP架构，系统的封闭性更好，能够很好的防止安全播出事故的发生。所以，针对广播电台，更多采用ASI架构，能够达到最安全最优质的传输。

4.4典型广播电台数字传输系统

1）编码复用与应急系统。

以典型的广播电台传输系统为例，整个系统由编码复用切换系统和应急系统组成，其中编码复用切换系统包括编码器1+1备份，复用器的1+1备份和切换器的1+1备份，经过主、备适配器传输到下一级单位。自主、备复用器的MPTS实现分析和监测，在特定的报警切换条件下，实现码流的无缝切换，并支持断电直通功能。切换条件包括TR101-290标准，节目丢失，比特率异常等。

应急系统是编码复用切换系统的又一级保障，通过编码器编码和复用器的节目拷贝功能，复用成1路含有多路音频的多节目码流（MPTS）。发生故障时，通过跳线，实现与编码复用切换系统手动切换。为了保证下一级接收单元和终端接收者的正常接收，此MPTS和编码复用切换系的MPTS保证完全的一致，包括PSI/SI信息、音频的PID、总码率等。

2）码流监测系统。

根据业务传输系统链路，在编码复用切换系统中共设置了码流质量监测系统，监测节点包括主备编码器输出、主备复用器输出、应急复用器输出、主备切换器输出，以提供有效的报警信息及应急处理预案，保证整个编码复用生产系统的稳定运营。

5 结论

音频技术的数字化时代早已开始，音频领域的变革在随时随地的发生，人们对收听质量的要求也越来越高。广播电台的编码复用系统建设，要从业务需求出发，选择适合的音频编码技术与传输方案，服务于广大听众。

编码复用切换单元将主、备路立体声数字音频基带信号（AES/EBU）作为主、备编码器的输入源，对其进行MPEG1 Layer2编码压缩和MPEG2的码流封装，压缩后的音频节目SPTS流，输入到主、备复用器。复用器对输入码流进行统一规划，包括节目名称，节目号，音频PID等，复用成1路标准的多节目码流（MPTS）。主、备编码器和主、备复用器之间水平和交叉连接，复用器支持端口1+1热备份和编码器的1+1热备份。

主、备复用器和主、备切换器采用水平和交叉连接，切换器支持主备复用器的设备1+1热切换。切换器对来

参考文献

[1]韩宪柱.数字音频技术及应用[M].北京：中国广播电视出版，2003.

[2]杨震.数字音频及其在数字电视中应用[M].北京：信息技术&标准化，2010（3）.

[3]唐峰.数字音频压缩技术研究[M].北京：中国传媒科技，2008（5）.

[4]游余立，张新刚，徐茂，等.GB/T 22726-2008多声道数字音频编解码技术规范[S].北京:中国标准出版社，2008.

[5]高鹏.调频频段数字音频广播（CDR）研究与试验.2013.

中图分类号G2

文献标识码A

文章编号1674-6708（2015）140-0113-03