宋修德,徐涌,宁勇,余旸,官小波,张亮,王龙宝
(中国铁路成都局集团有限公司,四川 成都 610081)
随着路网规模的不断扩大,铁路每日将产生大量的生产数据和安全信息,但目前铁路企业对安全数据信息的运用开发较为落后,存在安全大数据利用率低、智能化分析不高、分析结果展示不直观等问题,使大量安全数据不能转化为有价值的信息从而为铁路安全管理提供更加优质服务[1]。如何借助信息手段提高大数据开发利用价值,如何有效运用各类大数据为铁路企业安全管理提供精准分析和决策支撑,进一步优化安全管理手段,提高安全管理效能,是铁路企业亟须解决的问题,也是铁路安全管理的迫切需求[2]。因此,有必要结合铁路安全管理需要和大数据管理思维与挖掘方法,建立铁路安全管理大数据分析平台(简称安全大数据平台),为铁路安全管理提供科学的数据支撑和决策依据。
在《中国铁路总公司关于印发铁路大数据应用实施方案的通知》框架下,开展安全度量方法研究,综合考量作业人员、设备、环境、管理方面失效危险等因素,建立安全大数据平台,有效整合各专业系统生产数据,通过对各类数据的综合处理分析,形成各类指数并用于安全预警和安全管理,数字量化单位的安全管理状态,解决安全大数据利用率不够、安全分析智能化不高、安全分析不直观等问题,实现安全大数据的智能化、可视化、定制化分析,提高风险预警的精准性和安全管理的针对性[3]。
建立以大数据为基础的安全大数据平台,与各类铁路管理系统进行数据链接,实现信息共享与互递[4]。数据主要来源于车务、机务、工务、供电、电务、车辆等专业系统,包括安全生产信息、安全问题隐患、安全履职信息等涉及安全管理的所有数据。
安全大数据平台(见图1)由安全大数据智能化分析、可视化展示、智能报告3个部分10个子系统组成。其中,智能化分析包含安全管理综合指数、重点风险分析、重点问题分析、职工违章分析4个子系统;可视化展示包含检查频次可视化显示、问题分布可视化显示、安全生产信息可视化显示、干部履职问题可视化显示、安全定制分析展示屏5个子系统;智能报告由安全分析报告子系统组成[5-6]。
图1 安全大数据平台构架
以安全管理综合指数中的检查力度指数为例,简要说明平台的特征工程过程及预测算法原理。
2.1.1 特征工程过程
在风险预测的问题中,选取如下一次特征:问题项点累计值、问题严重性累计值、对应的风险等级累计、问题平均检查次数、检查出的问题次数(月)、部门量化率(量化人员数/部门工作量)、检查地点覆盖率(实际检查地点/所有的作业地点)、干部履职平均记分分数。
对问题平均检查次数这个特征进行深入分析后,发现在不同的时间尺度下,即把检查时间细分来看,精确到1周内的周几以及在0~24点中哪个时段发生,会发现巨大的风险隐患。因此,以问题检查频次数据为研究对象,对其特性和模式进行建模,并形成二次特征。
问题检查本质上是发生在时间维度上的一系列特定动作,利用时间序列来描述一段时间内的问题检查。时间序列是一种非平稳信号,其统计特征随时间改变而改变。在特征值的提取上,考虑到检查问题的实际情况,仅从时频域或频域的单方面识别达不到理想的评价效果,因此在算法架构中提出结合时域与频域的时频特征,即解决检查时间分布下的问题频次统计特征。
在构建检查频次二次特征中,选用小波变换实现将每一层的低频信号逐层分解,小波变换是一种解决非平稳信号的较好工具。在小波的选取中,不同的小波对信号进行分析则会得到不同的数据结果。针对大量曲线图分析发现哈尔(Haar)小波较好表现了检查频次信号时频域信号高低的特点,因此在模型中选用Haar小波函数对信号进行小波变换分解,得到小波系数向量。把同时选取于同一时间窗口内的一次特征和二次特征合并,组成16维的特征向量。
2.1.2 预测算法原理
通过上文描述的特征工程思路,对安全管理综合指数体系进行所有子指数的特征提取工作,并构建一个神经网络用以智能预测未来风险情况。算法步骤为:对风险问题频次信号加窗处理→在时间窗内计算检查频次的二次特性向量(小波系数特征)→一次特征与二次特征合并综合特征向量→设计并构建一个神经网络模型→将综合特性参数作为输入层神经元输入到神经网络中去训练→用训练好的神经网络进行测试集的分类定量(故障、事故、一般风险、低风险4个级别),从而得到不通过风险区间的分布。
在此设计3层神经网络(见图2),将16个特征向量作为网络的输入,网络的输入神经元个数为16,隐层神经元个数为8,4种风险状态为网络的输出,网络的输出神经元个数为4。样本数据随机标签,分成2部分运用,其中一部分(70%)作为训练集,剩下一部分作为测试集。用训练集数据对设计的BP神经网络进行训练,然后对测试集数据进行测试并对测试结果进行分析,达到收敛。
图2 3层神经网络结构
通过神经网络模型对铁路局集团公司每月的风险做预测。铁路局集团公司日常检查工作有明确的检查计划和指标,按照配置好的检查项目表、检查风险对检查点和班组进行检查,其中每个检查出来的问题、每个发生的安全生产事故都会关联到具体的按部门配置好的基础问题库,一个基础问题包括问题项点、问题类型、问题分项、问题严重性质、部门的量化率、检查地点覆盖率、风险等级等特征属性,将已经发生的安全事故作为训练集输出,获取该安全事故关联的基础问题库的问题项点、该部门1个月内对该问题项点的检查工作的一些指标,如检查次数、出现问题次数,还有该部门日常检查的一些其他指标综合在一起形成综合特征向量作为输入。
对于隐层神经元通常选用f(x)=1/(1+e-x)传递函数,输出层则根据输出量的范围选择S型传递函数或线性函数。依据样本,网络训练选用Levenberg-Marquardt(LM)算法,定义其性能指数为:
式中:P为样本个数,200;K为输出个数,4;dsk为第s个样本输入时第k个量的期望输出;zsk为相应的实际输出;W=[w1,w2, …,wN]T为网络中权值、阈值所组成的向量;N为所有权值与阈值的个数总和。式(1)可以改写为:
式中:E=[e11, …,e1k, …,e1K,es1, …,esk,…,esK,eP1,…,ePk, …,ePK]T;S=1, 2, …,P;k=1, 2, …,K。
为累积误差向量,向量元素esk=zsk-dsk。由式(2),Jacobian矩阵定义为:
设WN为第N次迭代的权值与阈值所组成的向量,则新的权值与阈值为:
式中:I为单位矩阵,μ为大于0的学习参数。将式(2)和式(3)合并整理为:
利用由式(3)得到的权值、阈值计算出相应的流量,将计算结果与实际结果进行对比,若效果理想,则说明式(4)能反映风险等级与问题检查特征之间的关系。通过给定检查问题特征属性能计算相应的风险等级。
2.1.3 举例
输入的综合特征向量[问题项点累计值,问题严重性累计值,对应的风险等级累计,问题平均检查次数,检查出的问题次数(月),部门量化率(量化人员数/部门工作量),检查地点覆盖率(实际检查地点/所有的作业地点),干部履职平均记分分数],8个小波系数对应的测试值为 [20, 5, 10, 150, 12, 0.01, 0.001, 152,0.835, 0.247, 0.126, 0.254, 0.369, 0.124, 0.874, 0.295],通过神经网络计算,8个一级特征和8个二级特征被映射到了1个短向量[1.00, 0.125, 0.03, 0.011],每个值分别对应故障、事故、一般风险和低风险判定。综合评判,目前状态在故障上较为突出,但总体风险水平不是很高。这样就有了一个非常明确且容易解释的结果。
安全大数据智能化分析主要对重点风险、重点问题、职工违章、安全管理综合指数进行智能分析,分析结果作为铁路局集团公司管理的参考依据和辅助决策,可有效提高铁路安全管理效能。
2.2.1 安全管理综合指数
海恩法则指出每一起严重事故的背后,必然有29起轻微事故和300起未遂先兆以及1 000起事故隐患,铁路安全生产过程中必然积累大量安全风险,当风险积累到一定程度就容易引发安全事故,要防止事故发生就必须通过暴露问题、解决问题的方式,提前释放积累的风险,阻断风险从量变向质变演变。安全管理综合指数体系(见图3)以海恩法则为理念,坚持问题导向,借助安全大数据分析平台,建立不同维度指数并进行量化排序,通过事故故障进行反馈印证,不断调整完善指数机制,实现对安全发展态势的准确把控。同时利用综合指数排序效应,强化排名末位单位的安全预警和督导,提醒相关部门及时开展风险排查,强化安全预警布控,有效消除安全隐患。
图3 安全管理综合指数体系
安全管理综合指数分为铁路局集团公司、专业、站段3个层级,包含检查力度指数、检查均衡度指数、问题暴露度指数、考核力度指数、评价力度指数、问题整改指数共6个分指数29个子指数。
2.2.2 重点风险分析
分为铁路局集团公司、专业、站段3个层级。建立重点风险指数,每个专业指定1个风险类型,分别根据各层级的安全监督检查情况、安全问题情况、问题整改效果等情况建立数学模型,自动形成安全风险管理综合指数,可使不同层级管理者掌握并管控各单位、各车间、各班组的风险情况,并以事故故障为反馈印证,动态修正模型参数[7]。
2.2.3 重点问题分析
自动分析各专业、各单位存在的安全管理不到位、干部职责不履行、作业标准不执行等重点问题,分析重点问题的时间、地段分布等,并在电子地图上进行直观展示,协助分析重点问题的规律,得到一些经验性结论或预测性趋势。
2.2.4 职工违章分析
以职工被考核率、问题考核率、问题返奖率、职工违章周期、违章次数为主要项点,综合分析职工违章情况,重点将违章详情在地图上进行可视化显示,为职工违章管理提供有力的决策依据和支撑。
采取电子地图、柱状图、曲线图等形式,可视化展示智能分析结果,提高数据的可读性和易用性,便于管理层及时掌握安全关键,并迅速做出针对性决策,有效提高工作效率[8]。
2.3.1 固定展示
固定展示部分主要是安全定制分析展示子系统(见图4),该部分作为决策支持数据展示入口,利用仪表盘可视化展示运输生产作业、干部履职情况、安全问题查处等安全管理工作相关重点信息,确保显示一目了然,实现宏观视角掌握全局运输安全情况[9]。集团公司和站段管理层可根据实时信息及时作出反应,高效安排各项安全管理工作,有效解决安全大数据利用率低、重点信息梳理工作量大、显示不直观等问题,大大提高了安全管理效能。
图4 固定展示大屏
2.3.2 自选展示
自选展示部分(见图5)包含检查频次可视化显示、问题分布可视化显示、安全生产信息可视化显示、干部履职问题可视化显示4个子系统。该部分以智能电子地图为载体,以地图和坐标点为形式,通过颜色及色差来表现各部门状态。通过设计简单易用的筛选器辅助,使用者可快速定位目标区间,锁定符合设想模式的单位,实现具体问题速查和问题溯因,有效满足管理需求,便于辅助决策者做出准确预判,提高安全管理的针对性和实效性[10]。
智能报告系统可根据管理需要,进行多角度的数据组合式智能分析,并自动生成安全定制分析报告,使管理层能够全面、准确、科学地掌握安全关键和重点,大幅提高安全分析效率和水平。安全大数据智能报告包含干部安全履职报告和集团公司各层级的日、周、月安全分析报告、报表。其中干部安全履职报告以干部个人为单位,报告内容包含干部安全履职指数、干部安全履职检查写实、干部安全履职分析等,每名干部可查看自己上月安全检查、问题质量、安全谈心、履职评价方面的安全履职指数及在本专业同类干部中的排名情况,根据报告可针对性调整后期安全履职工作,提高安全履职能力。
图5 自选展示大屏
安全大数据平台的建立优化了安全数据分析手段,完善了安全分析内容项点,丰富了分析结果的展示形式,实现了安全大数据开发价值的最大化,使安全分析更科学,辅助决策更直观,安全预警更精准。平台运用以来,得到基层单位的广泛认可,中国铁路成都局集团有限公司63个站段已全部正式启用,并作为指导其安全管理的重要决策依据,安全管理成效较为明显。
安全大数据平台创新建立了检查力度指数、评价力度指数、考核力度指数、检查均衡度指数、问题暴露指数、问题整改效果指数等六大管理综合指数,通过对指数进行数字量化和排名排序,定量标尺各单位安全发展态势,使管理层能够更加容易了解各单位安全管理情况,能全面、准确、动态掌握各单位安全风险发展态势,便于及时进行安全响应、强化安全管理。在平台运用初期,通过各项指数水平分析,发现并提出了安全预警,但由于未引起高度重视,未执行预警措施,随后发生了事故。因此,安全大数据平台对各单位整体安全态势把控具有一定的全面性和精准性。
安全大数据平台的智能化分析和可视化展示,能够精准找出安全问题变化规律和风险发展态势,为铁路局集团公司管理层提供科学的数据支撑和决策依据,使决策者能够根据分析结果快速作出响应,确保安全管理更具有针对性。特别是通过对单位安全情况、风险管控情况、职工违章情况等安全关键的定向分析,能够及时发现“违章大王”、关键风险、薄弱单位等影响安全的主要因素,使管理层能够将主要精力用在转化“违章大王”、消除关键风险、帮扶薄弱单位等主要安全工作上,大大节约安全管理的人力和物力投入,确保安全管理能够因地制宜、对症下药[11]。
以安全大数据平台为载体,建立并运用各类安全管理指数,对安全关键进行差异化精准预警。通过对各单位安全情况、重点风险、重要问题、严重违章等关键指标数据变化进行建模分析,精准查找风险变化规律,并与现实安全情况进行对比验证,优化指数模型和计算方式,逐步摸准预警阀门值设置标准,有效提高各类安全管理指数的实用性和时效性,使差异化精准预警更加贴近生产实际,确保集团公司能够提前进行预警布控。例如,某车站8月份在平台的各项指数均处于较低值,随后该站发生了调车脱轨事故,印证了平台分析差异化预警的精准性和科学性。
随着云计算、移动互联网、物联网等新一代信息技术的广泛应用,在铁路安全管理过程中运用大数据已具备了一定的基础条件。中国铁路成都局集团有限公司结合山区铁路安全管理实际,研发安全大数据分析平台,不仅是积极落实安全生产主体责任,不断推进铁路安全理念创新、管理创新、机制创新的一次有益探索,更是运用信息化手段前移风险关口、强化预警预控、加强安全分析、严格干部履职,全面提升安全管理信息化、科学化水平的一次重要实践。