王艳辉,苏宏明,李 曼,贾利民,李宇杰,楚柏青
(1.北京交通大学 轨道交通控制与安全国家重点实验室,北京 100044;2.北京交通大学 交通运输学院,北京 100044;3.中交星宇科技有限公司 科技研发中心,北京 100088;4.北京市地铁运营有限公司 技术部,北京 100088)
随着城市轨道交通运营规模的不断扩大,安全风险问题日益突显。城市轨道交通运营环境密闭性强,设施、设备的人员布设密度高,一旦发生局部故障或突发事件,很可能影响整个运营系统,处置不当将会造成重大的人身财产损失[1]。因此国家层面对城轨运营安全提出非常高的要求,相继印发《风险分级管控和隐患排查治理》[2]《城市轨道交通运营期间安全技术规范》[3]等政策文件,着重提倡风险的主动防控治理,坚持超前防范、关口前移,从而最大限度地避免运营安全事故的发生。
近些年,在城轨行业逐步兴起的风险防控信息化平台是一种以规范、高效、科学的风险管控理念为基础,结合互联网技术对业务流程进行优化的管理新方法,能够及时发现并治理运营中存在的风险。现阶段,如何运用信息化平台实现运营安全保障,是国内各家城轨运营公司普遍重点关注的问题之一[4]。厦门地铁针对供电系统引进安全管理平台,保障了供电运行和检修的工作效率[5]。哈尔滨地铁提出,利用高集成手段建设智能监控、报警防灾、智能电力系统全面融合的信息化平台,全面提升地铁运营预警预报功能,实现高效联动与快速反应[6]。福州地铁针对地铁施工过程,设计开发了基于B/S 模式的城市轨道交通安全管控信息平台,实现了风险巡查、风险响应等施工操作的信息化管理[7]。乌鲁木齐地铁针对人员安全和治安防护设计地铁安防集成平台,实现了地铁全线安防子系统的综合管理[8]。南京地铁设计了安全管理一体化信息系统,实现了不同部门之间的信息化统筹管理为管理者提供了及时的决策辅助[9]。
现行的信息平台在城轨运营安全保障中发挥了极大作用,但仍然存在一定优化空间,主要体现为:以各部门下独自运行的信息平台为主,缺乏全局级别的城轨运营风险信息一体化平台,信息难以集成和共享,易造成信息孤岛现象;以应用于施工过程的安全管理平台为主,缺乏针对运营过程的风险管理信息系统,且系统不能实现自由配置,灵活性差;以基于被动安全的运营安全平台为主,多仅针对发生的故障进行安全信息统计分析,易造成“小故障、大影响”现象,缺乏主动开展风险防控,防患于未然。
从超前防范故障和事故的角度出发,本文将风险主动防控的核心理念归纳为风险辨识、风险分析、风险治理和风险监督反馈4 个环节构成的闭环管理过程,并分别确立各环节的具体操作流程;在此基础上设计风险主动防控平台,明确平台的逻辑架构、功能架构、业务流程和数据关系;最后将平台应用于实践,采取端-边-云一体化和微服务系统架构进行开发,基于北京城市轨道交通路网数据进行部署应用,证实平台的应用效果。
风险是发生不幸事件的概率,是一种不良后果的可能性与严重程度的组合[10]。风险管理是安全管理的高级阶段,是将风险造成的影响降到最低的管理过程。作为风险管理的最终目的,风险主动防控通过事前主动性的管理和预防,提前辨识并判断风险的状态,进而治理风险关键节点并阻断其可能传播路径,从源头处防范风险。
如图1 所示,风险主动防控的核心理念可归纳为风险辨识、风险分析、风险治理和风险监督反馈4个环节构成的闭环管理过程,4个环节环环相扣、相互依托,共同完成风险主动防控工作,并经过不断反馈学习,提高整体的风险主动防控能力。事实上,将风险主动防控闭环管理理念引入城轨运营安全管理信息平台,建立规范的业务管理流程,已被认为是实现运营零事故最好的方法。
图1 风险主动防控闭环管控理念
城轨组分节点是指参与运营过程中的各个组成成分,为了便于统计分析,对城轨组分节点按照“人”“机”“环”“管”合理抽象并归类。其中:“人”类组分节点指的是参与城市轨道交通系统运营的所有人员,人的不安全行为是造成城轨运营事故的重要原因;“机”类组分节点是城轨运营系统内部的组分节点,主要包括参与运营过程的所有设备设施;“环”类组分节点是城轨运营系统外部的组分节点,主要包括会对运营过程产生影响的所有因素;“管”类组分节点是指城轨运营过程中影响城轨正常运行的规章制度、政策法规和调度管理等。
风险辨识是风险主动防控闭环管理的第一步。城轨运营中的风险辨识可表现为按照一定方法直观地发现那些可能产生和传播风险、且具有较大风险因素的组分节点辨识为风险点,并将其列为重点监测对象。风险点的辨识示意图如图2 所示。图中:下层结构表示城轨运营组成成分节点;上层结构表示从组分节点中辨识出的风险点。并不是所有的组分节点都可能产生和传播风险,故风险点数量必然少于组分节点数量。
图2 风险点辨识示意图
为了更全面地辨识风险点,需要从风险管理角度对城轨公司工作人员的安全排查工作(如工作人员对设施设备的每日巡检等)进行完善,在充分调研城轨运营公司日常设施设备排查记录、历史事故等数据的基础上,主观和客观相结合地进行风险点辨识。以如下3类组分节点作为重点考察对象,并将其辨识为需要日常重点监测的风险点。
1)曾造成过事故的组分节点
梳理历史事故报告,为避免类似事故/事件再次发生,将报告中出现过的组分节点判断为风险点,即
式中:m为统计得到的事故记录总数;si为0-1 变量,当遍历的第i个事故记录中存在当前正在辨识的组分节点pk(k为组分节点编号,k=1,2,…,n,其中n为辨识过程中所统计的组分节点总数)时取值为1,反之取值为0。
2)故障次数较高的组分节点
梳理历史维修记录,识别在维修过程中故障次数较高的组分节点,将记录中大于统计故障次数平均值的组分节点判断为风险点,即
3)关联度较高的组分节点
重点关注运营过程中与其他组分关联度较高、极易造成/受到影响导致状态改变的组分节点,根据在实际运营过程中对周围组分造成/受到影响的次数,将造成/受到影响次数大于平均的节点判断为风险点,即
可认为,风险点处于异常状态时,能量的意外释放及相互传播影响会造成事故的发生。因此风险点拥有稳定及不稳定2 种状态。基于能量意外释放的风险点状态转移机制如图3所示,当施加能量超过风险点可承受阈值/受到超过其承受阈值的其他风险点的能量传递时,则认为此时风险点的安全屏障失效,能量将失去控制,导致风险点转化为不稳定状态[11]。
图3 风险点状态转移机制
针对风险点状态改变阈值,认为风险点状态值越大其内部能量越混乱,越容易向其他风险点传播风险,由此提出风险点状态值计算方法,不稳定状态和稳定状态可分别按照式(4)和式(5)计算。
风险点之间存在着相互作用关系,当风险点处于不稳定状态时,即触发风险点状态转移机制,从而须对与其关联的风险点状态进行再次评估。抽象得到风险传播模型如图4所示。
图4 风险传播模型
根据图4 揭示的源风险点传播内在影响机理,当需要再次评估风险状态时,可结合传播过程中影响的范围和触发的风险点重要度不同,重新评估风险状态的级别。
风险分析结果不仅可用于了解风险传播路径,还能指导风险治理。风险治理包括根因风险治理和可控风险治理,前者指对源风险点进行维修、更替等,后者指对传播路径或预测出传播路径上功能重要的关键节点进行治理。
先根据风险点的传播范围对城轨运营系统全局风险进行分级,再按照对应等级制定相应的治理调控策略,指导源头处和传播路径处开展针对性风险治理,从而有效避免重大事故的发生。整理得到风险分析结果对应治理策略见表1。
表1 风险分析结果对应治理策略
在城轨运营公司中,一般由安全管理部门实时监督整个风险主动防控工作,查看相关员工具体负责的风险点状态和风险巡检、处置的执行情况、总体完成率等。由此,建立风险监督反馈机制如图5所示。基于对历史事故和未遂事件的学习反馈,建立得到风险管控档案;风险点数据库根据管控档案及时更新,并将风险点位置、负责人等基础信息及时反馈于管控档案;风险点治理策略根据风险点数据库识别得到的关键风险点信息及时更新,并将风险点历史治理维护信息反馈于数据库;管控档案、风险点数据库、风险点治理策略三者形成闭环管理,能够有效避免重大事故的发生;另外,还可根据实际不断对业务流程进行重组,修订公司风险点管控策略,摒弃冗余的流程,优化得到最直接有效的操作流程。
图5 风险监督反馈机制示意图
1)平台逻辑架构
设计风险主动防控平台时,为实现全部组分和业务流程的自由配置,采用“1+1+1”模式,将整体平台划分为“基础平台+风险防控平台+大数据中心”,构建得到的平台逻辑架构如图6 所示。平台采取分层模式,从下到上依次是基础层、应用层、模型层和展示层,共4层;基础平台对应逻辑架构基础层,可实现不同运营公司基础信息的自由灵活配置,增强了平台的可移植性;应用层、模型层和展示层共同组成风险防控平台,可实现城轨风险主动防控的各项功能和图形界面展示;城轨大数据中心则负责接入管理平台运算所需的各种数据。
图6 “1+1+1”模式风险主动防控平台逻辑架构
对平台逻辑架构中的各层详细说明如下。
(1)基础层针对我国不同城轨运营公司的不同组织架构、部门职能、岗位信息、员工配置、线路站点和设施设备等,采取完全自由配置的模式,可以实现平台在不同公司下的灵活通用。
(2)应用层主要包括对风险点、风险传播、风险预案、业务流程和历史事故的管理。其中:风险点由基础层的组分配置管理按照一定的规则模型辨识提取而来;应用层最核心的功能是对风险传播分析的管理和基于经验的风险预案的触发,执行对应的业务流程,并通过下发工单将风险处置责任落实到个人;总结分析历史事故,进而补充完善风险点,实现风险主动防控的闭环管理。
(3)模型层提供包括风险点识别模型、风险传播模型、系统综合评估模型和事故反演模型,为应用层提供模型和算法的支撑。
(4)展示层提供图形化展示,包括:基础层形成的组分间的拓扑网络、应用层的风险传播预测路线、业务处置的流程图、个人工单的执行首页、系统全局风险状态和处置结果分析等。
主动防控平台是多部门、多业务、多应用的模式,为了更好地融合、集成和应用多源异构数据,构建元数据标准体系,形成管理接口和数据互操作技术体系,完成对数据的接入、解析、清洗转化、存储及数据安全分区管理。通过大数据中心,平台实现对各个监测点(包括供电系统、工务、机电系统、车辆、线路、桥梁、隧道、行车调度、通信信号和运营环境等)的全部安全数据接入,实现了整个风险主动防控平台的数据保障。
2)平台功能架构
为使平台闭环管理整个风险防控业务,满足运营公司风险管理和工作人员不同功能需求,平台设计采取开放式、模块式、集成化的思路,得到10个功能模块如图7 所示。其中:为了实现平台的自由灵活性,将基础平台设计为4个功能模块,实现具体的线路、站点、车辆、设施设备、机构和人员等配置;风险防控平台则通过配置合理的业务流程,实现风险辨识、传播分析、治理和事故统计一系列功能的集成。
图7 城轨运营风险主动防控平台功能架构
3)平台业务流程
既往许多城轨运营事故都是由于管理上的疏忽或者员工的不规范操作造成的,面对这一情况,如今多数企业采取了加强人员安全管理的培训或罚款等措施,这显然是不合理的[12]。只有建立标准的业务流程,将安全管理连接到每一个具体组分和每一个负责的工作人员,组织所有的员工全程参与风险主动防控管理,创造一个规范化、信息化的风险管理环境和团队,这样才能将事故的发生的概率降为最低[13]。基于这一思路,重新描述运营风险主动防控的业务流程,将用户分为安全管理部门和现场执行部门2 个用户群,其中前者只需要对管控过程进行任务下达和监督,后者只需要进行任务执行和上报,通过两者分工协作,完成整个风险辨识、风险分析、风险治理和风险监督反馈业务流程。平台详细平台业务流程如图8所示。图中:实线和虚线分别表示平台的正向业务流程和负向业务反馈。图8 体现了不同功能下对应用户需要执行的操作(其中管控平台指系统自行操作)。这一业务流程设计旨在将基础理论落实到公司风险管控实际中,最终实现流程的标准化,并为平台的设计提供技术支撑。
图8 风险主动防控业务流程图
4)平台数据关系
平台数据关系如图9 所示,展示了平台业务功能间数据的传递关系。数据中心定时输入2 类数据,分别为故障日志和节点状态,再分别将这2 类数据保存到故障记录表和节点状态表中;状态监测功能可以从节点状态表中获取数据,用以构建风险传播链,将预测的结果保存到风险分级表中,并将异常状态和处置策略展示给管控人员;故障记录分析功能从记录表里获取故障记录进行分析,得到分析结果并将其进行归档,以便反馈学习,不断更新风险点,最终实现风险主动防控过程中数据流通的闭环。
图9 平台数据关系设计
考虑采取端-边-云一体化进行平台部署,架构如图10 所示。其中:“端”指智能终端,即主动防控平台业务的客户端和手持端;“边”指将计算扩展到靠近客户端、设备端的地方,尽量避免网络延时等问题[14],由车站/车辆段和线路现场人员或传感器上传风险数据,员工通过平台手持端或客户端接收指令;“云”指云计算,通过云终端进行数据的处理。
图10 端--边--云协同架构
平台采用便于开发维护、易于水平扩展、整体可用性强[15]的微服务架构进行设计。平台部署需要的3 个服务器分别为:应用服务器,负责运行平台的应用逻辑部分,完成平台的接入处理,进行数据转换等工作;网络服务器,对必要的功能提供浏览器/服务器模式(B/S)的访问;数据服务器,运行平台需要的数据库程序。
平台以北京市城市轨道交通路网为应用背景,已经在地铁大厦3层调度指挥中心进行了成功部署,接入太平湖数据中心,完成了整体的调试与功能测试。平台主界面如图11所示。用户可以通过主界面察觉整个路网的风险辨识、分析和治理情况,及时对各个子公司和部门出现的风险情况进行监督反馈管理,从而实现风险的闭环管理与主动防控。
图11 主动防控平台主界面
从应用范围来看,平台在北京地铁运营一公司的15条线路和300余座车站试运行后,大大简化了管理者和工作人员风险管控操作的流程,解决了城轨运营风险数据量大、机理复杂且实时性强等问题,且具有较高的安全性和稳定性,便于管理和维护。
从数据处理情况来看,平台已经辨识并录入的“人”“机”“环”“管”各类风险点共591 个,推演得到风险路径58 条,有效提供风险处置预案268例,大大降低了因人为、技术和设备原因导致的安全事故潜在发生率。
本文剖析了风险主动防控的理念,形成以风险辨识、风险分析、风险治理和风险监督反馈为闭环的风险防控4 个阶段,设计并研发了以机构管理、组分管理、路网配置、风险点管理、业务流程管理、风险传播管理、事故管理、风险评价和风险处置等功能为一体的风险主动防控平台,完成了城轨运营风险主动防控闭环管理的信息化和智能化,为日常风险管控和决策提供支持。同时,针对国内城市轨道交通运营单位的安全管理工作基本处于各自为营的状态,重复、低水平的投入现象较为普遍的问题,平台建立了标准的业务流程和数据关系,让风险预控的责任精确到每个岗位的每一个工作流程,同时让每一个风险点都做到“标准清晰、责任清晰”。通过将传统的巡检工单、人工监察的安全作业方式与现代信息技术结合,让安全预控管理更规范、更智能。经过部署测试,平台具备较好的灵活性和安全性,预留的许多接口,还可支持未来更多业务的融合扩展,具有一定的应用价值和前景。