李雷
摘要:视频会议系统是计算机网络、数据库、多媒体及通讯技术不断发展的产物,它通过通信网络把多个地点的多媒体会议终端连接起来,在期间传送各种图像、声音和数据信号,使出席会议者有亲临现场的感觉。H.323标准的出台,使得未来的视频会议业务有更广阔的前景。H.323的特点是以MCU为中心建立集中式管理,支持多点会议的召开,用户只需要关心多媒体压缩编解码,系统维护更为集中简洁。
国际电信联盟(ITU)专门从事定义音频和视频通信以及电话会议的标准。H.323则是ITU指定的一个标准协议簇,H.323协议,提供了基于IP网络的音视频、数据传输技术的基础。由于H.323是行业的基本标准,所以所有厂商都遵守H.323协议进行开发,此标准也同样是不同厂商系统互联的基础。目前市场上大多的视频会议MCU和终端都是遵循H.323协议研制开发的。H.323协议可以与各个不同的网络、终端进行互通。通过网关,它可以与ISDN上的H.310、H.321、H.320、H.324终端进行相互通讯。
H.323的优点有很多,主要表现在
1. 网络的独立性。H.323是基于网络运行设计的。随着网络技术的不断发展以及带宽、传输速率管理技术的不断进步,基于H.323设计的解决方案能够伴随着网络技术的发展而带来更多的好处。
2. 带宽管理。视频和音频在网络上传输时,对带宽要求很高,如果不实时地监控就会对网络造成阻塞。H.323可以通过带宽管理来解决这一问题。它能够对网络中并发的H.323连接数和H.323应用可获得的带宽总数进行限制。这样它不但可以保证关键的应用不被终断,还可以很好地为其他应用保留出足够的资源。它能够根据网络的延迟、抖动、丢包等状况提示或者降低视频传输速率。
3. 平台及应用的独立性。H.323不会依赖于任何特定的硬件和操作系统,它兼容的平台有很多种规格和类型。
4. 支持多点连接和多点广播。H.323能支持3点或者更多点的视频会议。可以通过组播将单一信息包发送至网络上的多个目标,而无需重发。这能够更有效地利用带宽。
5. 编解码标准。H.323为音视频数据流的压缩和解压建立了标准,保证来自于不同厂家的产品有共同支持的领域,它也为基于厂家特殊的软硬件的特性提供了很大的灵活性。
H.323系统的基本体系结构在逻辑上包括以下3个实体
1. 终端。H.323终端是提供实时性、双向通信的节点设备。所有的终端都支持语音通信、视频音频通信和数据通信。语音通信是必须要支持的。H.323规定了不同的音视频和数据终端协同工作所需的操作。如下图所示:
视频编解码采用了H.261、H.263、H.264以及H.264hp等标准,对采集到的视频进行压缩编码和对远端发送来的视频进行解码。
音频编码采用了G.711、G.722、G.723、G.728、G.729等标准对音频进行编解码处理。
用户数据应用使用T.120规定标准化的数据应用,还可以和H.245协议协同使用。
系统控制用户接口采用H.245、H.225协议实现终端的通信建立和控制。
2. 网守(Gatekeeper)。网守是一个可选设置。它执行两个重要的控制功能。第一是地址翻译功能,将终端的别名翻译为IP地址。第二是带宽管理功能,它可以定义同时参加会议用户数的限制,一旦用户数到达此值,网守就可以拒绝任何超过该门限值的连接请求。它可以将整个会议占用的带宽限制在整个带宽的某一个可行范围内,剩余的带宽可以保证用户其他应用的使用。网守还可以包含访问控制、呼叫验证等功能。
3. 多点控制单元(MCU)。多点控制单元用于支持三个以上视频终端设备的会议。它处理终端间的H.245控制信息,从而决定它对视频和音频通常的处理能力。在必要的情况下,MCU还可以判断哪些音视频流需要多播处理,以控制会议系统使用的资源。
多点控制单元由一个多点控制器和几个多点处理器组成。
多点控制器不直接处理任何媒体流,它与所有终端协商性能。完成多点传送的资源控制。在多点会议中,它将进行每一个终端间的能力交换,从而确定会议中的公共能力。它还为会议选定通信模式,保证参会的所有节点都工作在共同的通信模式中。
多点处理器进行媒体流的处理,对音视频或者数据信息进行混合、切换以及其他处理。媒体流在经过多点处理器的处理后再送回到终端去。
H.323标准下的通讯
H.323标准下的通讯可以看成是音视频、数据和控制包的混合体。音频功能、Q.931呼叫的建立、RAS控制以及H.245信令是必须的。其他的视频和数据会议都是可选的。当编码器支持多种编码算法时,编码器使用的算法由解码器根据H.245协议传输过来的信息决定。H.323终端也能不对称地工作,也就是说支持不同的编码和解码算法。并能够发送和接受多个视频和音频通道。
H.323控制。呼叫控制是H.323终端的核心。整个系统控制由三个不同规定信道提供。H.245控制信道、Q.931呼叫信道和RAS信道,控制功能包括呼叫加密信号、性能协商、命令和指示信号以及开通并描述逻辑信道内容的信息。所有的音视频和控制信息经过控制层处理,输出到网络接口,对于输入信息流,过程正好相反。H.245控制信道是传送控制信息的可靠信道,这些控制信息支配H.323的工作,包括性能协商、开通和关闭逻辑通道、有限选择请求、流控制信息以及其他命令。H.245将发送和接受能力分隔开来以及提供向别的H.323终端描述这些能力的方法。在任何两个终端之前只有一个H.245控制信道。呼叫信道视同Q.931在两个终端之间建立连接。RAS信令功能在终端与网守之间执行注册、许可、改变带宽、状态及脱离程序。没有网守的情况下,RAS不需要使用。
H.323音频。H.323支持的压缩算法都是ITU的标准。H.323终端必须支持G.711声音压缩标准。对其他的ITU的音频标准可选。不同的音频数字化和压缩标准反映了声音的质量和比特率以及信号延迟。G.711通常以56Kbit/s或者64Kbit/s的速率传输声音。此外H.323还支持G.723、G.728、G.722等音频编解码算法。
H.323视频。H.323必须支持H.261编码算法。其余编码算法可选。视频信息以不超过性能协商时所选定的速率进行传输。H.261提供了许多不同的ITU标准之间的兼容性尺度。除此之外它还支持H.263、H.264、H.264hp等效率更高的协议。这些协议可以在保证视频分辨率的前提下节省带宽开销。基于硬件的编码器的优点在于能够支持大图像的高比特和帧速率,例如cif、4cif、720p、1080p等。
H.323通信原理
H.323终端之间的呼叫、断开过程如下图所示。两台基于H.323协议的终端进行呼叫的过程首先使用H.225的Q.931呼叫建立协议。终端1使用TCP1720端口发送一个SETUP请求给终端2,终端2回复CALL PROCEEDING信息。然后再发送ALERTING信息后,听到铃声,终端1知道电话正在连接,最后CONNECT消息建立连接。当连接结束时,端点1发送一个DISCONNECT消息到终端2。终端2发送一个RELEASE让终端1知道通道关闭, 终端1发送一个RELEASE COMPLETE完成通话。
若存在网守时,终端与网守之间的通信过程如下:
此时会使用到H.225的RAS协议。RAS消息通常发送使用TCP端口1719。首先终端发送一个RRQ注册信息给网守询问是否可以注册。网守将发送回一个RCF注册确认,或RRJ注册拒绝。当你使用注册到网守上的终端进行呼叫,终端将发送一个ARQ接入允许请求,这是询问网守是否可以建立呼叫。它会努力找到终端拨号,回复ACF允许接入或者ARJ拒绝接入。当挂断电话,终端发送DRQ脱离请求。网守会回复一个DCF断开确认或DRJ拒绝断开确认。如果网守发送DRQ断开请求,那么所有的端点必须返回一个DCF允许结束通话。
H.323能力级交换
当呼叫建立后,H.245接管和处理我们的能力级交换。要么打开通信端口,要么呼叫中断。H.245会协商两个终端设备所能接受的呼叫带宽、音视频协议、主从关系等各自的能力,然后根据大家的能力进行合理的连接。一旦呼叫建立,H.245仍然需要继续工作,它处理我们的控制和显示功能。例如,一个终端请求图片刷新,在那里整幅图片就会被重发,在多点叫H.245还用于请求主席权利。
基于IP的H.323标准可以充分利用网络资源,使用户从根本上摆脱开会必须去固定会议室的限制,实现真正意义上的视频通信,并且互联互通性好,支持所有厂家设备均能互联互通,是目前主流的视频会议协议,也是视频会议的灵魂所在。