摘要:为解决铁路调度通信中无线通信系统的可信度问题,提高列车运行的安全性,以广东省铁路枢纽调度系统为研究对象,运用MATLAB分析程序中Actor-Critic异步优势强化学习法,对CBTC的无线通信系统进行仿真分析,研究通信系统遭受Sybil攻击时的可信性,并基于可行性优化对铁路的无线通信传输延迟和加速度指标进行分析。结果表明,基于Actor-Critic异步优势强化学习方法可以有效提高铁路列车控制系统无线通信技术的可信性;优化后无线信号传输延迟的曲线波动极大地收敛,背景波动范围在15~20 s之间,传输延迟峰值约为优化前的50%;通过优化无线通信技术可信性,铁路列车运行的加速度周期明显缩小,大大地提高了列车对加速度的控制能力。
关键词:列车安全;无线通信系统;异步优势Actor-Critic强化学习;协同安全检测
doi:10.3969/J.ISSN.1672-7274.2024.10.052
中图分类号:TN 92;U 22 文献标志码:B 文章编码:1672-7274(2024)10-0-03
Exploration of the Application of Wireless Communication Technology
in Train Operation Safety
Abstract: In order to improve the reliability of wireless communication systems in railway dispatch communication and enhance the safety of train operation, the Guangdong Railway Hub Dispatch System is taken as the research object. The Actor Critic asynchronous advantage reinforcement learning method in MATLAB analysis program is used to simulate and analyze the CBTC wireless communication system for train control. The reliability of the communication system under Sybil attack is studied, and the wireless communication transmission delay and acceleration indicators of the railway are analyzed based on feasibility optimization. The results indicate that reinforcement learning based on Actor Critic asynchronous advantage can effectively improve the reliability of wireless communication technology in railway train control systems; The curve fluctuation of optimized wireless signal transmission delay greatly converges, with a background fluctuation range between 15 s and 20 s, and the peak transmission delay is about 50% of that before optimization; After optimizing the reliability of wireless communication technology, the acceleration period of railway train operation has been significantly reduced, greatly improving the train's ability to control acceleration.
Keywords: train safety; wireless communication system; asynchronous advantage actor critic reinforcement learning; collaborative security detection
1 列车中心控制无线通信系统
以广东省某处铁路调度系统为例。列车中心控制系统主要由中央控制系统、核心网、无线通信系统和车载控制子系统组成。列车在巡航中,车载ZC与CI可以根据车-车通信链路,获取前方车辆的距离、速度、加速度等信息,自主计算MA信息与相关控制命令,产生的信号通过车地通信链路与无线通信系统进行并网运行,信号通过BBU1和BBU2设备汇入核心网,与中央控制系统进行链接,达到提高系统传输效率与控制命令传输高效的目的。
2 基于Actor-Critic异步优势强化学习
的无线通信技术的可信性
Actor-Critic异步优势强化学习是Asynchronous Advantage Actor-Critic异步强化学习的简称,它通过将无线通信系统中的行为策略参数化,对协作式检测决策进行策略参数优化更新,以降低无线通信系统AOI指标,通过计算得到最优的系统行为和较好的收敛性[1-2]。与传统基于价值的学习方法(Q-learning算法)相比,Actor-Critic异步优势强化学习法可以引入极限评价系统,基于系统策略学习,分析无线通信系统的时序差分误差,得到全域内的价值函数最优解。Actor-Critic异步优势强化学习法的价值函数如式(1)所示。
式中,为价值函数;εu为价值函数的参数;t为时间;ρ为行为策略;s(t)为时间序列;λ为折扣因子;r(t)为系统奖励函数。
基于行为策略,研究者对价值函数进行积分运算,通过该公式得到价值函数的变换式,如式(2)所示。
技术人员可以采取Actor-Critic异步优势强化学习法,应用MATLAB软件编程进行程序代码编制计算。计算过程如表1所示。
为了研究列车控制无线通信技术的可行性,本文基于MATLAB程序对CBTC无线通信系统进行仿真分析,模拟Sybil攻击过程中无线通信系统AOI值整体变化情况,以反映无线通信系统的Sybil攻击次数性能。采用的安全检测方案有3种,分别是传统的安全检测方案、传统的协同安全检测方案以及基于Actor-Critic异步优势强化学习法的检测方案,计算的时间长度分别为列车进入巡航后的Sybil攻击峰值期,分别为0~30 s和80~110 s。3种不同检测方案得到的无线通信轨道AOI值曲线如图1所示。图1(a)、图1(b)为基于传统的安全检测方案的轨道列车控制中心由于Sybil攻击引起的AOI值变化,图1(c)、图1(d)为基于传统的协同安全检测方案的轨道列车控制中心由于Sybil攻击引起的AOI值变化,图1(e)、图1(f)为基于Actor-Critic异步优势强化学习法检测方案的轨道列车控制中心由于Sybil攻击引起的AOI值变化。从图1(a)和1(b)中可以看出,在0~30 s内AOI值出现了剧烈的波动,AOI值峰值超过600的次数达到7次,而在80~110 s内,尽管AOI值的波动有所缓解,但AOI峰值仍较大,超过600的次数达到了4次,这是因为基于传统安全检测方案的Sybil攻击监测,需要对巡航中的列车控制无线通信系统进行密钥认证,因此在系统监测时不能有效快速地捕捉Sybil攻击,导致发生Sybil节点攻击时,列车控制无线通信系统的AOI值出现剧烈波动,难以满足列车运行时在特定失效内收集运行预警信息的要求,对列车控制无线通信系统的信息可行性产生严重影响,引发列车事故响应延迟,防御效果不理想。从图1(c)和1(d)中可以看出,相对于传统的安全检测方案,传统的协调安全检测方案得到的0~30 s内AOI值和80~110 s内AOI值波动均有明显改善,获得了优于传统安全检测方案的Sybil攻击性能参数,有效地降低了整体AOI值的波动次数,0~30 s内AOI值峰值超过600的次数达到2次,而在80~110 s内AOI值峰值超过600的次数达到4次,两个时段内的AOI值的峰值仍能达到1 500,这有效保障了巡航4vv6ZOTtg35OZ/E9tufiWQ==的轨道列车能在受到Sybil攻击时,可得到正确的安全苛求信息反馈,保证了列车正常运行时,其安全监测程序能够做出及时和准确的应急反应,有效地提高了无线通信系统的及时性、可行性、可靠性。尽管如此,基于传统的协同安全检测方案在阻拦偶发错误时存在缺陷,导致难以高效地识别并阻拦偶发错误,AOI在小范围内的剧烈波动,错误的检测结果甚至会引发整体效应,对整个系统造成不良影响。AOI在小范围内的剧烈波动,错误的检测结果甚至会引发整体效应,对整个系统造成不良影响。从图1(e)和图1(d)中可以看出,相对于传统的安全检测方案和传统的协调安全检测方案,由于列车控制无线通信系统采用了基于Actor-Critic异步优势强化学习法的检测方案,能够有效地捕捉Sybil攻击,避免了AOI值的剧烈波动,在0~30 s内AOI值峰值均小于600,且AOI峰值大于300的次数仅有10次,而在80~110 s内AOI值峰值也均小于600,且AOI峰值大于300的次数仅有4次,有效地控制了Sybil攻击触发的AOI值波动,为列车安全运行提供了可靠性高的基础信息,是这3种检测方案中最好的优化效果,可信性最高。
3 基于无线通信技术可信性优化的列车
控制系统性能提升
在信息技术不断发展、无线通信技术应用力度不断加大的背景下,列车无线通信网络应用水平不断提高。然而,无线通信网络在受到扰动时极易引发安全苛求信息无法在时效内生成,技术人员应对无线通信环环境的不稳定性因素进行细致全面地分析和控制,从而使列车通信链路能够及时准确地收集安全信息,并输出相应的MA响应信息,正确地评估列车无线通信系统可信性受到扰动的影响程度,达到列车控制水平提升的目的[3-5]。通过以上分析可知,基于Actor-Critic异步优势强化学习可以有效提高列车控制系统无线通信技术的可信性。
为提升列车控制系统性能,相关技术人员可以考虑合理应用Actor-Critic异步系统,将无线通信抗扰动能力提高。在Actor-Critic异步技术支持下,列车k能够针对列车n的信息输出预估控制效果计算方式如式(3)所示。
扰动后最小通信延迟;为列车状态行为函数。
4 结束语
本文以广东省枢纽地区列车调度系统为研究对象,运用MATLAB分析程序中Actor-Critic异步优势强化学习法,对CBTC无线通信系统进行仿真分析,研究通信系统遭受Sybil攻击时的可信性,并基于可行性优化对列车的无线通信传输延迟和加速度指标进行分析,得到以下几个结论:
(1)相对于传统的安全检测方案,传统的协调安全检测方案得到的0~30 s内AOI值和80~110 s内AOI值波动均有明显改善,获得优于传统安全检测方案的Sybil攻击性能参数,有效地降低了整体AOI值的波动次数,表明基于Actor-Critic异步优势强化学习可以有效提高列车控制系统无线通信技术的可信性。
(2)在优化前,列车的无线信号传输会受到不同程度的扰动,信号的波动范围在15~40 s之间,最大延迟达到240 s;优化后,列车的无线信号传输延迟的曲线波动情况得到极大地改善,背景波动范围在15~20 s之间,最大延迟缩短到112 s,传输延迟峰值约为优化前的50%;
(3)在采用Actor-Critic异步优势强化学习方法进行通信系统优化后,列车运行的加速度周期明显缩小,大大地提高了列车对加速度的控制能力。
参考文献
[1] 潘威炜.城市轨道交通车地无线通信技术的演进历程及未来发展[J].城市轨道交通研究,2022,25(8):149-152.
[2] 蒲豫园.城市轨道交通车地无线专用通信系统5G技术应用探讨[J].都市快轨交通,2022,35(1):107-113.
[3] 陈琦.基于5G技术的城市轨道交通车地数据转储方案研究[J].城市轨道交通研究,2022,25(1):23-26.
[4] 高翔.5G移动通信技术在城市轨道交通车地无线通信系统中的应用[J].城市轨道交通研究,2018,21(z2):61-64.
[5] 何小兵,陈学锋,陈俊,等.多源异构数据实时主动处理技术在城市轨道交通供电智能运维中的应用研究[J].城市轨道交通研究,2022,25(9):16-22.