刘懿文,朱 琳,刘志钢,骆华荣,杭 海
(1. 上海工程技术大学,上海 201620;2. 上海市交通委员会轨道交通处,上海 200125;3. 上海市交通委员会执法总队,上海 200125)
城市轨道交通具有客流量大、速度快、起停频繁,对运行环境要求高,应急疏散困难等特点[1]。其安全事件的发生往往不是由单一因素造成,风险之间存在相互影响的关系。刘福泽等[2]基于贝叶斯网络模型分析风险源导致的风险事件,对北京轨道交通运营状态进行风险评估。刘双庆等[3]对某城市地铁运营事故资料进行统计,从人、机、环、管4个角度分析了运营事故发生的原因并提出了安全管理对策。赵金宝等[4]根据大量的城市道路交通事故数据,与专家知识结合构建贝叶斯网络,通过参数学习结合网络模型推断在不同因素下交通事故类型的概率分布。Xu等[5]收集分析了国内外轨道车站的风险事故,研究风险之间的相互作用,得出敏感风险与关键风险链。
总结既有研究,缺乏基于数据的安全风险分析评价与安全风险防控策略的系统化研究,二者之间往往缺乏相互关联。本文以所收集到的64起地铁运营风险事件为基础,更为细致地提取了事件案例中的风险元,将事件的发生追溯到更具体的原因,由此构建贝叶斯风险互动网络,进行影响强度分析、灵敏性分析,得出关键风险,并制定相应风险防控管理策略。
城市轨道交通运营安全事件一般是指在运营生产过程中造成了人员伤亡、设备设施损坏、财产损失、运营中断或运营计划调整等危害性后果的事件(事故)[6]。城市轨道交通运营系统是复杂的动态系统,运营安全事件通常由多个风险共同作用,逐级放大后造成[7];风险存在于安全事件发生、发展过程的多个环节中,风险元即为在某一特定环境下,特定时间段内对具体实际结果产生影响的不确定性因素[8]。风险之间这种复杂联系表现为相互依存相互影响的互动关系。基于事故致因理论,事故致因链往往包含不止一个风险元。本文的风险元指运营事件风险致因链上的各个节点。将这些风险元作为不同的节点依据事件发生的因果关系连接起来,利用贝叶斯网络构建风险互动网络,从系统整体角度来研究风险之间的关系。
对所获取的64起样本事件进行筛选,按照风险链构建方法[9],从事故后果角度分析,选取满足以下3个条件的安全事件:①风险事件发生在正式运营的线路、车站、车场等城市轨道交通系统范围内;②造成人员伤亡,财产损失,导致运营计划调整或列车延误15 min以上;③事件中包含不止一个风险元。分析结果显示地铁实际运营的 64起案例中未发生人员伤亡等高风险重大事故,因此主要围绕运营事件进行分析。根据事故发生因果关系,从事件中提取了56条不重复风险致因链,整合风险链上的风险节点也即风险元并剔除重复节点,例如:风险链1:车辆制动设备故障→制动不缓→列车迫停;风险链 2:车门故障→制动不缓→列车迫停。从这两条风险链中可提取以下风险元:车辆制动设备故障、车门故障、制动不缓、列车迫停。其中,车辆制动设备故障、车门故障为风险链中的根节点,一般是设备的具体故障因素、人的不安全行为因素;制动不缓为风险链的中间节点,通常为设备功能状态;列车迫停为风险链的叶节点,为系统运营后果。最终,经过合并重复节点后,从56条风险链中共提取出28个节点,即风险元,具体见表1所示。
表1 运营安全事件风险元Table 1 Operational security incident risk item
贝叶斯网络由有向无环图和条件概率组成,由(D,C)来表示,D为有向无环图(包括节点与弧线),C为条件概率,表示父节点fi指向Xi节点条件概率的参数集,其中Xi(1≤i≤n)为一组随机变量(子节点)。
将先验知识与观测概率结合从而可以对节点进行概率推理,计算公式如下:
其中,P(β|α)是条件概率,指当α发生时,β发生的可能性;P(α)和P(β)分别指α、β发生的先验概率;所求P(α|β)指β发生时,α发生的后验概率。
风险具有不确定性,而贝叶斯网络模型结合了因果关系与概率,可以用来研究风险之间互动关系[10]。因此,本文采用贝叶斯网络构建风险互动网络,并运用GeNie2.0构建贝叶斯网络模型。基于所建立的城市轨道交通运用安全事件致因链及风险“父子”关系,以所提取的风险元作为网络节点,连接生成风险互动网络,如图1所示。
图1 城市轨道交通运营安全事件的贝叶斯风险互动关系网络Figure 1 Bayesian risk interaction network diagram of urban rail transit operation safety events
网络图中的每个节点即风险元。所有可以引出指向其他节点的风险元称为父节点,被引出指向的节点则对应为其子节点。父、子节点是一种对应关系,一个节点的父节点在不同的风险因果关系中也可能是其他节点的子节点。根据节点对应风险在统计数据中的频率,将父、子节点之间的相互关系作为先验知识,来对每个节点输入条件概率。
风险之间的影响关系存在一定程度上的差异,影响强度大小可以用父节点与子节点之间连接线的宽度来表示。父节点对子节点的影响强度越大,则连接线越粗。对影响强度的量化可以用节点的条件概率与先验概率的欧式距离公式来计算表示[11],如式(2)。
E(Xi,fi)表示父节点fi与子节点Xi的影响强度,其值域为[0,1]。P(Xi|fi)表示父节点为fi的Xi子节点条件概率,P(Xi)为子节点Xi的先验概率。
图1展示了所建立的城市轨道交通运营安全风险关系网络中风险元之间的影响强度分析结果。以上风险网络中影响强度最大的8个父子节点路径分别是:①信号SD设备故障→无法排列进路;②维修施工人员误操作或违规操作→道岔设备故障;③制动不缓→司机误操作、违规操作或技能不熟练;④信号设备离线或信号中断→列车无速度码;⑤车门故障→开门动车;⑥道岔定位失表→挤岔;⑦车辆牵引设备故障→无法牵引;⑧供电轨/受电弓/接触网设备故障→触网失电。可以从这 8个风险路径中发现主要涉及设备与人员两类风险因素,而设备类风险涵括信号、车辆、供电3个专业。
灵敏性分析通过研究输入数据的微小变化对输出后验概率的影响来帮助验证贝叶斯网络模型的概率参数。参数敏感度越高,对推理结果的影响越显著。灵敏性计算公式如式(3)、(4)所示。
其中,P(y|e)(θ)是关于概率参数θ的后验概率,可以表示为2个关于参数θ的线性函数比值;P(y|e)(θ)是y,e关于θ的联合概率分布;P(e)(θ)是e关于参数θ的先验概率;a、b、c、d是常数项。而S(θ|y,e)是P(y|e)(θ)对θ的偏导数。如果参数θ的导数很大,那么θ的小偏差可能导致目标后验值出现较大的差异。如果导数很小,那么即使参数有很大的偏差,后验值也不会产生明显区别。根据这个特质可以确定网络中哪些参数对目标概率有更强的影响。
Kjaerulff等[12]在2000年提出了基于GeNie软件灵敏性分析的相关算法。本文将节点“风险事件发生”设置为目标节点,使用灵敏性分析工具,得到不同颜色深度的节点图,如图2所示。
图2 灵敏性分析Figure 2 Sensitivity analysis
在这28个风险元中,依据灵敏性大小排列出了前10位较敏感风险元,如表2所示。
表2 风险元灵敏值Table 2 Risk item sensitivity value
风险元的灵敏性越高,造成风险事件发生的可能性就越高。从以上分析结果中信息交互滞后的灵敏性值是最高为0.372,其次较高是道岔设备故障、车辆制动设备故障。
在城市轨道交通运营中人为因素主要是乘客与工作人员的不安全行为。根据对 64起风险事件案例分析,其中有26起运营风险事件发生涉及人为因素,主要是地铁工作人员的不安全行为,包括司机、维修施工人员、乘务员等其他工作人员存在技能不熟练、误操作、违规操作或者操作遗漏等。
人为因素具有主观能动性,在影响强度分析中也发现,人为因素对设备等其他因素的影响强度较高。例如维修施工人员误操作、违规操作对道岔信号设备的影响较大,容易造成道岔故障,进而引发道岔定位失表并最终导致地铁运营造成延误等后果。在灵敏性分析中,司机行为因素达到了 0.312,维修施工人员行为因素达0.185,这两条分析结果也能说明人为因素在一定条件下可以影响其他因素,工作人员良好的专业素养、应急反应能力可以挽回事态的恶化甚至阻断事故发生。因此加强员工安全意识,提高员工的工作能力至关重要。
针对人为因素提出以下对策:
1) 提高乘客安全意识,引导乘客安全乘车,并完善地铁内部安全设施,结合监控监测等手段,提前防范风险,保障地铁运营安全。
2) 强化员工自觉履职守法的法治观念,提高公共安全与国家资产守法责任意识,保持员工对“安全红线”的敬畏与警戒。杜绝员工工作懈怠、违规作业行为。
3) 加强司机、乘务、调度、检修施工等岗位职业技能培训,要进一步提高各岗位队伍人员素质、体质等综合能力的动态评估管控。特别是调度、司机等关键岗位加强值乘作业期间的心理生理状态掌握,建立合理的轮岗换班机制。
设备因素是影响城市轨道交通运营的客观因素,包括各系统设备老化、设计缺陷、维修养护不合理以及人为因素导致设备出现突发故障。根据本文案例统计分析,设备故障影响运营事件发生的比例高达89.06%,依次是信号、车辆、供电、通信设备。
影响强度分析结果说明信号设备与车辆设备较容易受到影响且影响强度值普遍较高,其中信号SD设备、道岔、车门、车辆牵引设备发生故障后导致的影响相对其他设备较大。而这几种设备在灵敏性分析中,道岔设备故障的灵敏值达到0.335,车辆制动设备故障灵敏值达0.316,这两种设备的灵敏性处于较高水平。由此说明道岔设备和车辆制动设备状态的细微变化对整个系统安全有很大影响。
针对设备因素提出策略:加强设备设施全寿命维护管理体系的落地。对于车辆、信号、供电等多发故障的设施设备夯实基础管理,采用高精度传感采集技术对关键部件的状态进行实时成像、图像分析以及故障诊断,并将数据收集建立可视化数据平台,通过数据挖掘分析实现对设备可靠性实时监测及潜在风险预警,为维修保养工作的周期性提供合理建议。
在收集的案例中未发生由于环境因素导致的运营事件。恶劣的运行环境是不可消除的危险因素,为预防或控制其损失,在日常运营生产过程中通过采取各种生产技术和管理手段进行环境风险预防和控制,且目前基本可以消除其危害。
城市轨道交通环境包括外部环境和内部环境。外部环境通常受自然因素、天气因素和社会活动影响。内部环境是指地铁运营作业环境,包括车站、线路区间、车场、设备用房等区域。对于多数城市来说地铁运营环境多处于一个封闭的环境中,自然因素相对稳定,恶劣天气因素可能会影响到地铁运营的安全,往往会导致地铁延误、运营计划的调整等。
针对环境因素提出以下策略:
1) 强化基础设施建设,完善地铁车站防灾设计,确保防灾备品备件的齐全。对于较容易发生的异物侵限风险区域,加强对运营外部环境监控与治理,做好恶劣天气预警及防护工作。
2) 建立全覆盖的地铁运营监控系统,对客流实时监控,实现对大客流预警,避免或减少突发大客流带来的运营影响。
3) 优化应急预案、加强应急演练,提高各部门应对自然灾害、恶劣天气的现场处置能力。
管理因素并不是导致风险运营事件发生的直接因素,然而从人为、设备、环境因素致使事故发生的案例中,或多或少可以反映出管理这一环节存在的不足。换句话说,管理因素对其他3个因素有着调节作用。在灵敏性分析结果中,信息交互滞后的灵敏性值达到了0.372,相比其他风险敏感值处于较高水平。这说明在应急处理环节,命令下达与信息传递反馈的不及时不畅通易造成列车的延误等运营事件发生。
针对管理因素提出以下策略:
1) 管理单位应细化相关规章制度,明确操作规范,严格规范操作人员按要求操作。完善各岗位培训、检查、考核机制。
2) 做好监督管理工作,加强现场作业监管。编制应急预案,加强应急演练。统筹运营调整、响应协调、信息传递等,确保应急抢修组织的有序高效。
3) 针对信息交互滞后风险,应加强信息化建设和一体化管理改革,确保信息渠道畅通,提高各部门之间信息交流与沟通效益,做好信息交互、互联互控工作。增强信息发布的时效性和真实性,杜绝现场人员瞒报、漏报、错报、迟报行为,确保快速有效处置。
1) 本文对所收集的城市轨道交通运营安全事件案例进行了详细分析,提取风险致因链,基于贝叶斯网络构建了风险互动网络。通过影响强度分析与灵敏性分析,得出人为与设备因素引发其他风险的概率较高。其中信号设备故障、车辆设备故障、信息交互滞后对运营系统安全影响最大。
2) 针对分析结果,从影响城市轨道运营安全的4个因素:人为、设备、环境、管理的角度,结合关键风险路径节点、敏感风险元分别提出了风险预防控制的管理思路与策略。后续将持续对所建立的风险互动关系进行进一步论证分析,并适时引入地铁运营安全风险管控机制中加以验证。
3) 基于所分析的样本事件中未涉及环境因素导致运营事件的案例,此处默认为运营环境处于安全状态,可能为分析不全面之处。其次,本文考虑到风险的致因关系及交互作用,但忽略了不同风险或同类风险之间的耦合关系对运营事件发生的影响。再者,虽然结合数据分析结果提出了相应的风险防控策略,但是没有给出详细措施方案,形成完整的管理体系。后续研究可以根据城市轨道交通运营单位的实际需求,建立风险分级的管理体系。