夏必东
(北京大唐高鸿数据网络技术有限公司,北京 100195)
基于IP 的语音传输(Voice over Internet Protocol,VoIP)技术包括会话初始化、信令传输、语音编码、H.323 协议以及会议初始协议(Session initialization Protocol,SIP)等内容。通过对这些协议的组合应用,可以实现VoIP 技术的全部功能。VoIP 技术的应用为传统的Call Center 系统提供解决问题的新思路和新手段,因此将Call Center 与VoIP 技术融合十分必要。
建立用户会话,即注册。在注册过程中,由服务器向用户发送一个会话初始化消息。该消息包括以下内容。一是该用户的注册号(用来标识该用户是否属于会话初始化系统)。二是服务器向用户提供一个初始的会话号码。在注册过程中,服务器会发送一个会话号码给用户,方便用户在呼叫时能直接发起连接。在某些特殊情况下,服务器会发送一个身份标识号(Identity document,ID)来标识特定服务提供商的用户。三是服务器将用户的注册号与某服务提供商的服务进行绑定,以便在呼叫时能直接发起连接。四是如果服务器有一个可配置的会话号码,它将在呼叫时直接发送给呼叫者。如果服务器没有可配置的会话号码,则服务器在呼叫中将所拥有的某些特定功能发送给呼叫者,如允许呼叫者拨入指定号码等。五是服务器会将用户与服务提供商之间的所有会话进行初始化处理,并把所有相关信息存储在数据库中。提供商在任何时刻都可以访问到数据库中的信息,并允许呼叫者发起连接,可以为用户提供有关会话号码、用户和服务提供商等相关信息。当服务器将会话号码发送给呼叫者时,服务提供商可以从数据库中获得所需的相关信息[1]。
会话管理是为用户提供一个会话的初始化解决方案,主要包括会话设置、会话跟踪以及会话维护3部分。
1.2.1 会话设置
对用户进行身份认证,根据用户的需要完成网络初始化设置。在会话设置中,需要定义用户的各项基本信息,如用户号、用户名、用户密码以及密码保护模式等。此外,修改终端设备的相关配置。
1.2.2 会话跟踪
根据不同的业务,对用户的会话进行跟踪,包括会话查询、会话发起以及会话取消等。具体实施时,需要对各种会话进行管理和控制,主要包括:对SIP协议栈中的各个协议进行操作控制;对终端设备的各种状态信息进行跟踪;对各种会话进行管理和控制;对终端设备进行配置管理等。
1.2.3 会话维护
会话维护主要负责为用户提供各种服务。根据业务需求对用户的所有会话进行管理和维护,主要包括:对各种业务进行管理;为各种业务提供支持;负责为用户提供各种服务。在实际应用中,由于会话初始化具有较高的复杂性,一般只需支持一种初始化方式即可。在某些特殊情况下,需要结合多种方式使用。不同设备所采用的初始化方式有所差别,常见的有固定电话初始化方式、移动终端设备初始化方式、传统固定电话初始化方式以及新推出的基于SIP 协议的初始化方式等。
传统的电话通信中,通常需要对终端设备进行认证才能实现会话的初始化。在VoIP 系统中,用户的终端设备需要支持SIP 协议[2]。目前,对于采用SIP 协议的终端设备,通常有2 种认证方式,即基于网关认证方式和基于注册网关认证方式。
基于网关认证方式下,用户需要将所有的终端设备都连接到网络上。系统统一管理用户的终端设备,操作方便。用户只需选择一个适合自己的网络环境的网关即可实现会话初始化。该方式下,用户终端设备需要完成网关配置、SS7 和SS8 等认证模块的配置,并对其进行管理和维护。基于注册网关认证方式需要系统具备一定的复杂性,用户需要安装一个支持SIP协议且可管理和维护的注册网关。如果该注册网关不支持SIP 协议,则用户需要另行配置一个注册网关并进行相关操作。
实际应用中,2 种方式都可以实现会话初始化。基于网关认证方式具有较好的可扩展性和灵活性,而基于注册网关认证方式则具有更高的安全性和稳定性[3]。
借助信令传输实现语音通信,使用SIP 或呼叫控制协议(Call Control Protocol,CCP)进行信息交互。VoIP 主要依靠SIP 协议实现数据包的交换和控制。在实际的VoIP 系统应用中,一般通过网络层的协议来完成整个呼叫过程,包括语音信号的解码、语音信号的合成等。在信令传输过程中,SIP 主要用于网络层协议,CCP 主要用于语音层协议。在网络层中,SIP主要实现话音信令的传输和控制功能,CCP 主要实现媒体层协议。在VoIP 系统中,如果仅采用SIP 来完成话音信令传输,则要将SIP 信令模块嵌入网络层模块;如果采用CCP 来完成话音信令传输,则可以使用CCP 模块对网络层协议进行处理,完成话音信令的传输。在VoIP 系统中,采用SIP 协议和CCP 协议传输话音信号时,可以通过路由器来实现信息交换,从而简化VoIP 系统的结构,降低系统复杂性。VoIP传输过程如图1 所示。
图1 VoIP 传输过程
基于波形数据的语音编码是在语音合成中将波形特征作为参数进行编码,实质是用一种相对简单的方法来模拟原始语音信号。其优点是无须对语音信号进行频谱分析,提高编码效率,更适用于对带宽要求较高的实时性传输。
基于波形数据的语音编码主要分为2 类,即基于幅度分析和基于波形分析。基于幅度分析的语音编码方法是将语音信号的幅度信息作为参数来进行编码,典型的方法是线性预测。线性预测又可分为正交线性预测和脉冲对数谱分析等。基于波形分析的语音编码方法是在语音波形合成时引入波形特征来提升合成语音的质量,如线性预测、脉冲对数谱分析以及自适应参数化等。该方法的主要特点是只需完成波形的预处理和参数合成操作就能较好地保持原始语音的质量。
多速率编码是一种新的编码方式,可以在一个码率范围内进行编码,提升语音质量的同时,提高频谱利用率。多速率编码是基于码分复用(Code Division Multiplexing,CDM)和码激励线性预测(Code Excited Linear Prediction,CELP)的编码方式。实际应用中,CDM 编码中码率不对称,即每个码元代表的比特不相同[4]。为克服码率不对称带来的问题,利用多速率编码控制合成语音和原始语音间的差异。
非对称参数化指在保证语音合成效果的前提下,通过调节某些参数来实现对合成语音和原始语音的动态控制。应用基于自适应线性预测的非对称参数化算法,在保持合成效果的情况下,只需改变一些参数就能动态控制原始语音和合成语音,得到更高质量的音频。
数据处理主要包括3个方面。一是在VoIP系统中,音频信号通过媒体网关(Media Gateway,MGW)控制芯片进行编码、压缩。由MGW 上的语音活动检测器(Voice Activity Detector,VAD)进行解码、打包,之后由网关进行传输。其中,处理过程主要包括音频数据解码和音频数据压缩2 个部分。二是在终端与网关之间实现媒体流的路由。在IP 网络中,不同终端与不同网关之间一般通过信令交互的方式进行路由选择。当终端向网关发送路由请求时,网关需要确定路由选择策略,然后将其发送给相应的网络侧设备。网络侧设备会根据路由选择策略,选择最合适的路由来传输数据流。三是对终端上传输过来的声音信号进行处理,主要包括声音信号的同步、语音信号的合成以及语音信号的传送等操作。在VoIP 系统中,这3 个操作主要通过网管系统来实现。
在VoIP 网络中,呼叫控制和管理主要是对用户的呼叫建立、连接释放和取消等进行控制,实现对用户资源的有效管理。在呼叫建立阶段,需要将被叫用户的有关信息(地址、终端类型以及归属网络等)发送给相应的网元设备,并由网元设备对这些信息进行分析,以确定是否可以建立呼叫连接。如果可以建立呼叫连接,则通知被叫用户进行下一步操作。在呼叫连接释放阶段,需要根据被叫用户的信息,将呼叫放回指定的状态,并通知相应的网元设备。如果被叫用户提出取消连接请求,则将该请求发送到相应的网元设备。在呼叫取消阶段,需要通过一定的信令流程来实现。其中最主要的信令流程就是将呼叫建立时产生的信令帧经过分析,发送给相应的网元设备,确定是否可以取消连接。通过呼叫控制和管理功能,可以有效提升VoIP 网络的稳定性和可靠性[5]。
在VoIP 系统中,加密和解密操作是保证语音信息传输安全的重要手段。在VoIP 系统中,采用H.323协议和SIP 协议作为加密和解密的标准,通过这2 种协议各自的优势来保证语音信息在网络中的安全传输。SIP 协议中,信息都是以明文形式存在,可以在互联网上任意传送,且不需要进行加密。H.323 协议中,信息以密文的形式传送,只能在使用相应的设备上进行解密。由于SIP协议采用明文传输,存在被非法截获、篡改以及重放等安全隐患。为解决这一问题,提出一种端到端加密方案,即用一组预先分配好的密钥加密处理语音信息,即使信息被截获也无法解读出原始信息。在VoIP 系统中,通过对语音信息进行加密和解密处理,可以防止非法用户截获原始语音信息,保证语音信息在网络中的安全传输。同时,可以防止攻击者通过非法手段窃取原始语音数据信息。
VoIP 技术是一种基于网络的语音传输技术,通过互联网将语音信号从一方传送到另一方。与传统的电话和数据通信技术相比,VoIP 技术具有更高的网络带宽和更低的延迟。Call Center 是一种用于管理和控制电话、数据等通信业务的应用程序。它可以通过软件或硬件将多个电话和数据业务集中管理和控制。VoIP 技术与Call Center 的融合使网络运营商能更有效地管理和控制不同应用程序的通信业务,从而提高网络运营效率和服务质量。