基于SIP协议的互联网音频传输浅谈

2014-04-18 11:14薛勇
视听 2014年3期
关键词:编解码延时音频

薛勇

随着互联网技术的快速发展,广电行业音频实时传输的技术也日益更新。特别是近年来IP技术普遍应用,使得研究IP技术在专业广电领域实现数字音频实时传输势在必行。使用低成本、适应局域网网络环境、高可用性的SIP协议,通过成熟而容易获得的互联网宽带将外场直播的音频信号高质实时回传到直播室,是一种高质量、低成本的音频传输手段。

一、常用外场直播音频传输方式简介

1.光纤:传输质量高,安全度较高,通信容量大,抗干扰能力强,但费用高,且必须在有光纤接入点的地方才可以使用。

2.微波:带宽较大,稳定性较高,但城市里高楼林立,容易受到遮挡,可行性不高。

3.ISDN:用MPEG-1、MPEG-2等编解码方法,传输高质量的音频(立体声)。缺点是申请繁琐,调试也比较复杂,中国电信已经停止新申请布点了。

4.电话线:方便容易获取,但传输质量不高。

5.基于IP的音频传输:IP 传输是完全建立在Internet 网络基础上的传输模式,可以认为是经济实用且高效的传输模式,缺点是延时比较大,有些设备调试比较复杂,需要用电脑进行设置,同时稳定性容易受网络状况影响。

图1 系统连接框图

6. 3G传输:3G和IP在传输模式和工作原理上是完全相同的,具有灵活、不受场地限制的优点,对外场传输线路几乎没有要求。但3G 传输方式受制于基站的信号强度和上行速率,在基站附近人数众多、使用量较大的时候容易受带宽和基站负荷等各种外在干扰的影响,对于音频传输而言会出现瓶颈现象。

本单位在近年每年都有不少外场活动,实时音频信号根据具体活动的需求,采取了光纤、ISDN以及电话线来进行回传。许多活动节目部门需要进行成本核算,因而选取一种既有优秀的传输质量,成本又不太高的传输方式尤为重要。经过研究和实验,我们发现基于互联网的SIP网络传输比较符合我们的要求。

二、SIP协议简介

SIP协议是由互联网工程任务组(IETF)制定的应用层控制协议,主要功能是完成多媒体的呼叫控制,它借鉴了HTTP和SMTP等互联网上成功的应用层控制协议,是一种基于文本的应用层控制信令协议,独立于底层协议,可以使用TCP或UDP作为底层传输协议。SIP 协议和其他协议一起给用户提供完整的服务,用于建立、修改和终止IP网上的双方或多方多媒体会话。SIP协议支持代理、重定向、登记定位用户等功能,支持移动用户,与RTP/RTCP、SDP、RTSP、DNS 等协议配合,可支持和应用与语音、视频、数据等多媒体业务。随着SIP协议及其应用的不断完善,3GPP组织已经将SIP作为3G 全IP网络多媒体子系统(IMS)的控制协议,下一代网络(NGN)中SIP协议也成为核心协议。

三、基于SIP服务的音频传输的工作流程

以往基于互联网进行实时音频传输的方式都存在一些问题,如设置比较繁琐,需要用电脑对设备的参数进行设置与调整,同时对网络的要求比较高,如果一方或双方不在同一个局域网进行传输,容易被防火墙阻隔,难以穿透局域网NAT等。

而基于SIP服务的实时网络音频传输优势在于其便利性。去到新的直播场地,只要接上宽带网络,设备自动登陆SIP服务器,连接成功后,即可连接当前在该服务器上登记注册地址的另一台SIP设备进行传输。

1.基于SIP服务的音频传输的连接方式

外场信号→ZIP音频编解码设备1→【互联网】→ZIP音频编解码设备2→电台播控室→电台直播室。系统连接图如图1。

2.工作流程

和以往基于IP网络的实时音频传输点对点直接连接不一样的是,SIP采取通过第三方服务器的方法获得连接。

SIP协议采用逻辑帐号与物理地址相分离的方式,先给设备设定名称,这个作为该设备的逻辑账号,一个逻辑帐号可以对应若干真实的物理地址,SIP 用户可以在不同的地方注册到SIP服务器,将当前物理地址存储在位置服务器中,因此,即使每次在不同地点直播,也不需要手动设置客户端的物理地址。

SIP服务器的功能就是接受SIP终端的注册请求,将用户的逻辑帐号和物理地址在位置服务器中建立绑定关系,当有对该用户的呼叫时,从服务器中获取被叫用户的物理地址,然后将呼叫请求转移到被叫用户。连接流程如图2。

从流程框图可以看到,基于SIP服务的实时音频传输方式,设备A和B只需要连接到互联网,它们会自动连接到服务器,连接成功后,呼叫另一方即可建立连接。将网络调试、连接工作交给服务器及设备端去自动执行,简化了技术人员的工作流程,使得易用性大大增加。由于SIP有着这样的便利性,因此各大厂商也研发出通过SIP协议对音频进行实时传输的设备,用于简化操作流程。

3.音频编解码方式的选择

采用IP网络的传输,延时较大是它的一个不足之处。因此应该选取合适的编解码方式尽量减少延时,既要提供高质量的音频,同时也要保证延时不能太大。我们采用的是AAC-ELD系列通信编解码。

传统的窄带电话仅能传输最高3.5kHz的音频带宽,而AAC全高清语音系统则能传输从14kHz到人耳能听到的全部音频频谱。通过这种方法,我们可以做到利用较小的带宽得到优秀的音质。AAC系列的全高清语音编解码器包括低延迟AAC(Low Delay AAC,AACLD)、增强型低延迟AAC(Enhanced Low Delay AAC,AAC-ELD)。

AAC-LD是高品质视频会议的行业标准,可提供全带宽、低延迟的音频编码。理论上仅有20毫秒的算法延迟,同时为所有类型的音频信号提供良好的压缩率和高声质。

AAC-ELD是AAC-LD的增强型版本,结合了MPEG-4AAC-LD和频谱复制。AAC-ELD也是所有要求在24kbps低数据速率下拥有全音频带宽的延迟敏感型应用的最佳选择。据统计,AAC-ELD在同样的码率情况下,比MP3的延迟要减少三分之一。

AAC-LD和AAC-ELD目前已经用于专业及消费级视频会议,例如,苹果的Face Time应用就是基于AACELD。

4.稳定性测试

经过测试和研究,我们使用Telos公司的Z/IP ONE音频传输设备,远程连接后,音频传输延迟在1秒以内,在可接受范围内。对于必须使用双向传送的节目直播,可使用模拟电话作为返送传输,以减少传输延时。

在测试中发现,这套系统的性能主要决定因素是网络状况,可以根据网络状况来选择设备的编码码率,缓冲时间的上下限等,以保证传输不中断。在正常情况下4M Adsl就能够满足本系统的要求,传输延时一方面取决于设备设定的缓冲时间,另一方面取决于网络中数据传输的延时。

在今年全国两会期间,深圳广播新闻频率先锋898使用本套系统进行直播音频的传输主路,以数字电话耦合器通过电话线作为传输备路,北京直播室使用电信宽带,深圳直播室通过单位局域网连接,设备连接成功后,10天内持续通电保持连接未有中断,稳定性还是比较高的。需要注意的是,当处于同一局域网的电脑或网络设备进行大量的下载时,将会导致网络波动,延迟增大,严重的话甚至会有中断的情况,因此建议申请的宽带网络带宽由传输设备独享,不要连接其他设备或电脑,以保证播出的安全可靠。

1.彭焕峰:《SIP注册服务器的研究与设计》,《电脑知识与技术》,2010年第32期。

2.赵军:《基于互联网的远距离音频传输应用》,《中国传媒科技》,2010年第5期。

图2 SIP协议连接流程

猜你喜欢
编解码延时音频
基于级联步进延时的顺序等效采样方法及实现
1553B总线控制器编解码设计
为多重编解码世界做好准备
大型民机试飞遥测视频编解码方法研究
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法
Pro Tools音频剪辑及修正
Two-dimensional Eulerian-Lagrangian Modeling of Shocks on an Electronic Package Embedded in a Projectile with Ultra-high Acceleration
桑塔纳车发动机延时熄火