赵麟杰
车地无线局域网承载TCP/IP实时可靠通信问题的分析
赵麟杰
中国铁路通信信号上海工程局集团有限公司,上海 200436
轨道交通车地无线局域网作为车地可靠通信的主要承载技术,具有通信带宽大、延时小,能支持多种业务系统的特点。但其技术体制存在天然的传输丢包、延迟中断等问题,会对传输车载关键实时信息造成较大影响。因此,分析了TCP/IP传输层协议应用于车地无线局域网时存在的不足之处,提出了对多连接TCP通信协议的优化建议,以实现应用系统的实时性、准确性和可靠性目标。
车地无线局域网;丢包;时延;可靠性;TCP;多连接
基于通信的列车控制系统(CBTC)、乘客信息系统(PIS)、车地列车安防系统都已经承载在无线局域网(WLAN)技术这种新型的数据通信系统之上。车地无线局域网具有通信带宽大、延时小,支持车载业务类型多的优势,为控制中心实现对列车各种车载信息的监控提供了基本能力。本文讨论和分析了上述车载信息业务系统在车地无线局域网中传输所需要关注的问题,并提出了优化建议。
参考RFC2544网络基准测试标准,车地无线局域网主要服务质量指标包括吞吐量、转发延迟及丢包率。
吞吐量体现了网络节点之间的数据传输能力,即每秒能够传输的最大数据量,用“Mbps”表示。测试点分别选择地面端和车载端之间。某城市地铁线路隧道内车地无线局域网吞吐量测试结果如图1所示。
图1 数据传输吞吐量测试结果
测试线路为三站两区间,无线信号覆盖较佳区域,吞吐量一般稳定在18 Mbps。即便是覆盖不佳区域,带宽平均也有14 Mbps。由于实时通信系统数据传递包的带宽利用率较低,所占用的带宽不超过500 kbps。车地无线局域网传输通道带宽远大于系统业务带宽,实现较大的传输占空比,非常有利于传输的可靠性。
转发延迟主要体现数据发送从网络某一节点至另一节点接收所需要时间,单位用“s”来表示。由于无法具备测试单向通道时延的条件,因此采用响应时间指标,即数据双向时延+响应端数据处理时间。同一地铁区间内响应时间测试结果如图2所示。
图2 数据转发延迟测试结果
丢包率体现了网络某一节点至另一节点数据包的丢失情况,即丢失包与发送数据包数量的比值,一般用%表示。图2中可以看到漫游切换时,当通信设备缓存能力足够应付时可能不会发生丢包现象;但当数据流量超出缓存能力时,还是会发生数据包丢失。丢包代表着数据完整性的残缺,而在车地无线局域网中不可能完全避免丢包问题,那就需要应用系统通过有效的处理手段来弥补。
UDP是一种无连接的传输层协议,只能提供面向事务的简单不可靠信息传送服务。UDP传送数据前不与对方建立连接;不对收到的数据进行排序;对接收到的数据报不发送确认信号,发送端不知道数据是否被正确接收,也不会重发数据。由于缺乏拥塞控制机制,需要基于网络的机制来减小因失控和高速UDP流量负荷而导致的拥塞崩溃效应。当网络中的丢包、延迟现象较为严重时,应用系统将必然发生数据残缺。因此,面对对实时性可靠性非常高的应用系统,不建议在车地无线环境下采用UDP通信方式。
TCP一种面向连接的通信技术。TCP通信连接建立,首先采用三次握手的方式,保证了通信的有效性,如图3所示:
2.2.1 三次握手(Three-way handshake)
图3 TCP通信三次握手示意图
三次握手机制的主要过程包括:请求端(通常称为客户)发送一个SYN报文指明客户连接的服务器的端口,以及初始序号;服务器发回包含服务器初始序号的SYN报文应答,同时将确认序号设置为客户的ISN加1进行确认。请求端必须将确认序号设置为服务器的ISN加1进行确认(报文段3),这样实现了客户端和服务器初始连接认证。
2.2.2 TCP通信报文确认机制
当TCP发出一个报文后,启动一个定时器,等待目的端确认收到这个报文。若不能及时收到一个确认,将重发这个报文。当TCP收到发自TCP连接另一端的数据,它判断数据无错误,则发送一个确认。
基于TCP通信的三次握手机制和报文确认机制,就可以实现数据报文的重发能力。当无线网络发生瞬断时,尤其是AP漫游切换过程阶段所产生的数据包丢失,可以有效实现数据恢复能力,因此TCP通信技术至少可以胜任少量丢包情况时的可靠通信能力。但是较长时间的通信中断或者通信频繁中断,TCP通信的客户端和服务器端是如何确保数据有效重传或则中断后重新连接的,则又是要重点考虑的问题。
2.2.3 TCP通信窗口轮训侦听机制
由于网络丢包中断情况是随机产生并频繁发生的,会在通信过程中产生无效连接,即服务器端无法识别TCP是否依然保持连接而继续保持连接状态,而客户端实际已近放弃连接而又向服务器端申请建立连接,因此造成服务器端连接数量成几何级增长,导致内存溢出现象的发生。所以,如何处理这些无效连接也是实际面临的重要问题之一。
一般车地无线应用系统多采用Modbus/TCP协议,在此标准协议之上可进行二次优化,如图4所示,额外增加了“请求—响应”机制(图中1、2阶段),以强化通信的可靠性和稳定性。
图4 优化后的Modbus/TCP协议通信机制
车载端作为客户端,向服务器(控制中心子系统)发出通信请求,服务器接到请求后返回其响应;当客户端接收到后,将所要传输的数据依次传输至服务器端,完成通信。当通信中断时,客户端可将数据暂时放入缓存,待通信重新建立后,重新发送至控制中心服务器。增加多一次认证握手步骤,进一步强化TCP通信可靠性。
车地无线局域网的不稳定性,可能造成某个连接短时间内的断开。当客户端重新请求建立连接,服务器端为其建立新的连接后,此时还需要将同一客户端发起的上一个“无效连接”从连接队列中删除,从而提高通信效率。“删除无效连接”既可以实时、准确地进行多对一通信,又可以有效地删除由于网络或车载客户端故障而导致的无效连接,避免“无效链接”不断膨胀,造成服务器端响应能力骤降。
通过对应用系统侧的TCP/IP通信协议的优化,有效改善了业务系统的实时可靠通信的能力,在多次仿真实验和现场应用中效果良好。因此,在部署车地无线局域网时一定要重视其自身固有的一系列传输问题和特性,除了通过优化无线网络提升网络服务质量外,更重要的是业务系统开发时重视TCP/IP通信交互的可靠性措施,尤其是传输层协议的优化,确保数据包的安全传输,从而实现整个应用系统的实时性和可靠性目标。
[1]赵麟杰,王志麟,郑国莘.车地无线局域网可靠通信的研究[J].城市轨道交通研究,2012,15(1):45-48.
[2]王金廉,谢剑英,贾青.基于TCP/IP的多线程通信及其在远程监控系统中的应用[J].电子技术应用,2000,26(1):47-49.
[3]赵麟杰,张培松,朱峰浩.车辆实时监测系统及方法:ZL200910198104.7[P].2011-09-28.
Analysis of Real-Time and Reliable Communication Problems in Train-Ground Wireless LAN Carrying TCP/IP
Zhao Linjie
China Railway Signals & Communication Shanghai Engineering Bureau Group Co., Ltd., Shanghai 200436
The rail transit vehicle and local area wireless LAN is used as the main bearing technology for the reliable communication of vehicles. It has the characteristics of large communication bandwidth, small delay, and ability to support multiple service systems. However, its technical system has problems such as natural transmission loss and delay interruption, which will have a great impact on the transmission of key real-time information on board. Therefore, the insufficiency of the TCP/IP transport layer protocol applied in the vehicle-to-ground wireless local area network is analyzed. The optimization proposal of the multi-connection TCP communication protocol is proposed to realize the real-time, accuracy and reliability objectives of the application system.
train-ground wireless local area network; packet loss; delay; reliability; TCP; multiple connections
TN925+.93
A
赵麟杰(1980—),男,高级工程师,研究方向为通信工程。