滕 达 ,赵 阳 ,范 楷 ,张 淼 ,王 翔
TENG Da1, 2, ZHAO Yang1, 2, FAN Kai1, 2, ZHANG Miao1, 2, WANG Xiang1, 2
(1.中国铁道科学研究院集团有限公司 通信信号研究所,北京 100081;2.中国铁道科学研究院集团有限公司 国家铁路智能运输系统工程技术研究中心,北京 100081)
(1.Signal & Communication Research Institute, China Academy of Railway Sciences Corporation Limited, Beijing 100081, China; 2.National Research Center of Railway Intelligence Transportation System Engineering Technology, China Academy of Railway Sciences Corporation Limited, Beijing 100081, China)
目前,国内外新型列车运行控制系统实现移动闭塞,根本前提是实现列车的精确自主定位,最大程度地减少轨旁设备。基于北斗卫星的列车自主定位技术是实现列车精确自主定位的最优解决方案,但在特殊地形下的卫星信号“盲区”问题是该方案的主要技术问题,而采用图像识别技术为解决卫星信号“盲区”问题提供了一种解决方案。
列车运行控制系统是指挥列车运行,保证行车安全,改善行车组织方式,提高运输效率的关键设施。目前世界各国均在进行新型列车运行控制系统的研究与开发,其中区间闭塞技术是列车运行控制系统的核心技术手段。区间闭塞是分段对区间线路进行逻辑封锁,同一时间只允许一列列车在其间运行,从而防止列车相撞的安全控制手段,该技术是线路运输效率的主要决定因素之一,主要分为站间闭塞、自动闭塞和移动闭塞等制式。移动闭塞制式取消了由轨旁设备划分出的固定闭塞分区,动态计算前后两车追踪间隔,后车行车许可随前车的位置、速度等运行状态的变化而动态移动,相较于站间闭塞和自动闭塞,具有更高效、更灵活、更经济的特点,是提高铁路运输效率的重要手段之一[1-2]。由于列车运行控制系统实现移动闭塞的前提条件是实现列车的精确自主定位,而目前列车定位方式仍然依靠轨道电路等轨旁设备完成,导致建设与运维成本较高、维修难度较大。因此,在最大程度简化轨旁设备的同时实现列车自主定位,成为国内外新型列控运行控制系统研究的核心关键点[3-4]。
基于北斗卫星的列车定位技术是基于一种多源定位信息安全融合算法,数据来源包括:北斗卫星提供的列车定位信息、地面卫星差分基站提供的地面差分信息、速度传感器和加速度计等多种传感器提供的实时测量数据,以及地面应答器信息,最终结合电子地图进行综合运算,实现列车的精确测速和自主定位,使列车具备在区间不依靠轨旁设备实现高精度自主定位的能力[5-6]。由于速度传感器和加速度计等传感器的精度有限,基于北斗卫星的列车定位技术方案主要依靠的定位信息来源是卫星定位信息,由于卫星定位信息存在信号“盲区”问题,尤其在偏远地区铁路沿线地形具有多山、多隧道的特点,这样的地形会极大消减、遮蔽卫星信号,严重影响列车自主定位精度[7]。针对这一问题,现有的解决方案是在卫星定位信号不佳的地区加装定位应答器,每隔一段距离对列车的定位误差进行矫正,保证列车自主定位的精度。但是,定位应答器在列车时速高于350 km/h时效果不佳,而且线路上加装的大量应答器不但提高了建设及运维的成本,也与最大程度减少轨旁设备的发展趋势相悖。
针对信号“盲区”问题,提出一种将图像识别技术应用至列车自主定位的方案,在铁路沿线设置视觉标签,通过加装视觉采集及处理设备,为列控车载子系统增加图像识别定位单元,该单元的功能是在列车行驶过程中采集并识别这些视觉标签的图像信息,结合电子地图当中预存的视觉标签位置信息精确校正列车定位累积误差。图像识别定位单元是新型列车运行控制系统车载子系统的新增功能单元,与车载子系统协同工作,需要结合列车运行控制系统车载子系统对其进行方案设计。
图像识别技术已经在铁路领域开展了大量的应用研究,为图像识别技术在铁路领域的应用打下了良好基础。但是,这些研究主要针对静止或低速目标进行图像识别,并没有开展针对列车高速行驶场景下的图像识别研究。因此,列车高速行驶场景进行列车自主定位图像识别技术研究,重点解决卫星信号“盲区”问题,提高新型列车运行控制系统列车自主定位技术定位精确度及地形适应能力。
图像识别技术应用核心要素包括视觉标签、图像采集设备及图像处理设备。视觉标签需要设置于轨旁易于识别位置且表面文字信息在线路中具有惟一性,以便将具有惟一性的文字信息与位置关联。在铁路沿线存在许多具有固定位置的标志,如公里标、百米标、桥涵标等,这些固定标志当中与位置相关性最大且显示信息在线路中具有唯一性的是公里标,通过前期的精确测量,准确获知公里标在线路中的精确位置,并将公里标文字信息及精确位置信息对应保存在列车运行控制系统电子地图当中,进而将线路既有的公里标定义为视觉标签进行利用,从而省去重新设计、生产、安装及维护视觉标签的工作。
在卫星信号较强的非“盲区”运行环境下,无需图像识别列车定位单元的校正也能获得较小的列车定位误差。图像识别列车定位单元合理的工作方式是通过与列车运行控制系统车载子系统进行信息交互实时获取列车位置、卫星信号强度、电子地图等信息,预知列车即将进入卫星信号“盲区”或是发现当前卫星信号不佳时,控制图像采集设备在接近公里标时开始工作,首先对公里标文字信息进行识别,再通过对电子地图当中预存的公里标信息的检索得出列车正在跨越的唯一公里标,最终通过电子地图预存的位置信息掌握该公里标的精确位置信息,根据该信息生成列车定位误差校正信息,将其提供给车载子系统,完成基于图像识别的列车定位过程。列车自主定位图像识别技术架构示意图如图1所示。
列车自主定位图像识别技术方案的核心设备,图像识别处理单元软件由运行状态综合判断模块、图像预处理模块、视觉标签定位模块、视觉标签识别模块、位置计算及报告模块组成。结合运营场景,分析各软件模块的功能、实现方式,以及各软件模块间如何协同工作。
运行状态综合判断模块的功能是根据车载设备提供的位置信息及卫星信号强度,综合判断图像识别单元工作的时机,控制图像采集设备开始工作。当预知列车即将进入卫星信号“盲区”或是发现当前卫星信号不佳时,运行状态综合判断模块控制图像识别单元在接近公里标时开始工作。因此,运行状态综合判断模块功能主要有2项,一是从列控车载系统处获知列车位置,结合电子地图,预知列车即将进入隧道山区等信号“盲区”时,控制图像识别单元在接近公里标时开始工作。二是通过列控车载系统实时监测卫星信号强度,当卫星信号低于一定阈值时,结合电子地图,控制图像识别单元在接近公里标时开始工作。
得到图像采集设备输入的图像数据后,预处理模块的功能包括对原始图像数据进行图像抽取和图像增强。该模块应适应最高时速将达到400 km/h的高速铁路应用场景,图像采集设备需要有足够的曝光速度,据测算,在时速400 km/h的列车上清晰地拍摄公里标,需要视频采集的帧率达到每秒330帧,现有的设备网络负载和图像处理能力都无法满足如此高帧率的处理需求,因而在图像预处理模块实现了图像抽取处理的方式,即每秒以固定时间间隔抽取10帧图片来进行文本检测和识别,该模块一方面能够使现有的图像识别设备计算能力满足需求,另一方面使图像识别单元能够适应各种级别列车的运行速度。
图1 列车自主定位图像识别技术架构示意图Fig.1 Structure diagram of train positioning scheme based on image recognition
原始图像于列车运行过程中采集,可能亮度较低或存在雨、雾等天气影响因素,影响后续图像识别的进行,图像预处理模块需要使用去雾、补光等算法对原始图像进行处理,消除雨雾环境对图像质量的影响,从而增加图像的可视度,提高识别准确率。方案使用的图像增强技术是运算量较少同时效果较好的暗通道去雾算法,经典雾图形成模型为
式中:I(x)为现有的有雾图像;J(x)为无雾图像;t(x)为透射率;A为全球大气光成分。
将经典雾图形成模型进行变形,可以得到去雾后的表达式为
式中:t0为透射率t的下限值,其作用是在输入图像的浓雾区域保留一定的雾。
视觉标签定位模块的功能包括公里标字符的检测定位及公里标跨越时机的检测。视觉标签定位模块需精确地检测并定位自然图像中的每一个字符,图像识别技术方案构建了一个可以预测字符,以及字符之间连接关系的深度神经网络模型。该深度神经网络模型的结构以牛津大学视觉小组提出的VGG-16全卷积神经网络作为主干网络,并在其末端加入新的4层卷积神经网络进行补充训练微调。改造优化后的VGG-16全卷积神经网络模型目标函数L为
式中:p为图像中像素是视觉标签组成部分的概率;conf(p)为像素落在范围中的置信度,当使用合成数据集时,该置信度为1;Sr(p)及Sa(p)为预测范围和连接关系是已标注的训练集范围和连接关系。
视觉标签定位模块的另一重要功能是通过识别帧图像当中公里标的存在和运动趋势判断出列车车头在何时跨越了公里标,在列车跨越公里标的同时将图像识别结果告知位置计算及报告模块,从而形成位置报告,完成定位校准。
视觉标签识别模块在字符检测模块的基础上完成字符的识别任务,识别出检测出的字符当中包含的数字或英文字母。图像识别技术方案构建了一个具有字符识别功能的深度神经网络模型,深度神经网络的结构仍然是以VGG-16全卷积神经网络作为主干网络,在末端加入双向长短时记忆网络(LSTM)进行补充训练微调,最终输出模型所识别出字符的置信度。LSTM的核心思想是将每个节点作为一个细胞元,并设计输入门、遗忘门、输出门来有选择地过滤输入到细胞的信息。双向LSTM的特点是对于每个时刻t,输入会同时提供2个方向相反的LSTM,输出由2个LSTM共同确定。VGG-16加LSTM的组合网络模型目标函数为
式中:Train表示训练集;Xi表示图像;Yi表示字符。
模型通过最小化目标函数,即字符条件概率的负对数似然性进行训练。
通过前期的精确测量,准确获知每一公里标在线路中的精确位置,并将公里标文字信息及精确位置信息对应保存在列控系统电子地图中。位置计算及报告模块需与列控车载设备保持通信连接,同步获取列车当前所在区间的电子地图。当位置计算及报告模块收到视觉标签定位模块发出的列车跨越公里标信息时,可根据视觉标签识别模块识别出的公里标文字信息,结合电子地图,检索出列车当前跨越的唯一公里标,再根据电子地图当中预存的对应公里标精确位置信息,得出列车当前的精确位置,进而向列控车载设备报告该位置信息,校正列车定位误差,达到解决卫星信号“盲区”问题,提高新型列控系统列车自主定位技术定位精确度及地形适应能力的目的。
基于图像识别的列车自主定位方案功能设计流程图如图2所示。
图2 基于图像识别的列车自主定位方案功能设计流程图Fig.2 Flow chart of function design of autonomous train positioning scheme based on image recognition
为实现视觉标签定位模块及视觉标签识别模块功能,构建深度神经网络模型,并使用大量训练数据集对其进行训练,使模型中的参数取值达到最优化。研究使用的训练集分为2部分,一部分是公开数据集,另一部分是合成数据集。其中公开数据集使用的是微软COCO数据集,而合成的数据集则是自行研发的图片合成及标注软件生成的数据集。训练模型的设备为CPU I9 10900K 8核,双GTX 2080Ti显卡,64 G内存的PC机,使用语言为Python,深度学习框架是Facebook公司的开源深度学习框架Pytorch。
在仿真试验阶段,使用一段网上公开的行车记录[8],从该视频中选取了200帧带有公里标的图片,以及200帧不带公里标,无其他字符干扰的图片作为对照。试验使用常用的F-Measure评价标准,作为评价结果的标准。F-Measure评价体系结合准确率、精确率及召回率等参数综合计算调和平均数,是信息检索、机器学习等领域的常用的评价标准,常用于综合考量模型的实用性。
在仿真试验过程中,没有对不存在公里标的图片发生误判,而对于存在公里标的图片,由于网络视频拍摄设备效果不佳且上传网络过程中存在多次压缩造成的失真,导致字符识别难度加大,共造成27个图片的误判,最终模型取得了89.99%的F-Measure评价值。仿真试验结果如表1所示。
表1 仿真试验结果Tab.1 Simulation test results
由表1中准确率和F-Measure数值可以得出,构建的深度神经网络模型能够实现视觉标签定位模块及视觉标签识别模块功能,具备一定的实用性。
列车运行控制系统是铁路信号系统的核心组成部分,在高速铁路运营当中发挥着“神经中枢和大脑”的重要作用。列车自主定位图像识别技术方案在校正卫星信号“盲区”所带来的列车自主定位误差的同时,还具有无需额外加装地面设备、维护工作量小、适应各种列车运行速度、满足多种线路运营需求的优点,方案经济性好,实用性高,满足我国铁路信号系统发展的新需求,是计算机视觉技术在铁路领域应用的一种新探索。