卢 弋,宋晓敏,翟昕茹,李瑜芬,庄异凡
(1.上海申通地铁集团有限公司运营管理中心,上海 201100;2.交通运输部科学研究院,北京 100029;3.城市公共交通智能化交通运输行业重点实验室,北京 100029;4.上海工程技术大学城市轨道交通学院,上海 201620)
地铁运营延误可能由多种因素综合所致,包括高架、地下和地面等复杂运行空间环境、人的不安全行为和设备故障的偶发性因素等。不同致因的影响程度及措施方案均有所差异,这就要求运营管理者在事件发生后第一时间判断事件特性和内在关联,预测延误影响程度并做出合理决策。目前上述过程仍以主观经验判断为主,缺乏结构化情景构建方法形成可量化的属性知识来辅助决策,不利于提升地铁运营延误事件应急响应水平。因此,研究地铁运营延误事件结构化情景构建方法势在必行。
统计学模型是事故分析的常用方法,已运用于地铁施工事故类型分析[1],揭示了地铁施工事故的一般发展规律[2],并建立了相关事故案例库[3]。在突发事故致因和影响统计方面,学者们分别对人为因素[4]、自然灾害因素[5]和延误时间[6]进行详尽统计。但统计学模型仅能提供数据支撑,未能实现事故的结构化情景构建。为此,学者们探索运用语义网络结构、概念树、案例推理模型、机器学习模型等方法[7-13],从文本本身的理解对运营事故进行情景构建和知识推演。但由于地铁运营延误事件日志存在多样性、相似性等特点,使得单纯从文本语义理解上所构建的情景及知识准确度不够,需要建立一套符合事件演化逻辑的结构化框架,对事故内容进行分类和组织。朱伟等[14]提出的“灾情-情景-对象-环境资源”结构能够实现情景空间维度的自由拓展并实现半量化;贾楠等[15]将系统要素分为“特性-功能-行为-分析”等结构化形式,建立相似事故机理;其他的衍生架构,如“案例-情景-对象-要素”四层架构[16]、“灾情-对象-应急管理”案例拆解框架[17]等,均增加了不同的维度进行结构化拆解,但对于事件本身的描述仍存在遗漏,降低了案例之间的比较和学习效果。近年来有学者针对突发事件中“要素”“对象”“结果”“环境”“管理与响应”“情景”等6个基本概念,提出了一种突发事件分析框架,即“要素-对象-结果”(Element-Object-Consequence,EOC)模 型[18],表现为突发事件关键情景特点在时间和空间上混合发展的变化过程,提高了事件呈现的定性和定量表达能力,具有较大应用潜力。Qian 等[19]进一步将EOC 模型与本体模型结合,以灾害本体为基础,采用多类别结构,开发完整的情景和灾难情景,提供了一种构建灾难情景的标准框架和程序。黄昕桐等[20]将EOC 模型与分层全息建模、评级与管理模型相结合,结合暴雨灾害的特性,提出了对暴雨洪水案例的结构化拆解方法。但EOC模型尚未应用到地铁运营延误事件结构化分析中。
综上,地铁运营延误事件致因复杂、决策时效和准确性要求高、响应难度大等特点,使得运用统计学模型或文本语义理解相关模型难以准确描述事件特性和内在关联,需要一套定性和定量相结合的情景构建方法,来辅助影响预测并进行措施决策。本文结合人-机-环安全体系和运营延误事件特征,将传统的EOC 模型优化为“要素(Element)-对象(Object)-结果(Consequence)-管理与响应(Management and Response)”的四维情景构建框架,以列车运行为核心明确框架各部分的定性/定量字段属性,构建情景属性关联分析模型,设计应用于应急辅助决策流程并进行案例验证,为地铁运营延误事件结构化分析提供新思路,提升应急辅助决策的科学性和合理性。
地铁运营延误是指在执行列车运行图过程中受到各种因素影响,造成列车进入区间(车站)或在区间(车站)运行过程中偏离(滞后)计划运行轨迹的综合表现形式[21]。其中各种因素影响事件可以统称为运营延误事件。地铁运营延误事件通常按延误时长进行分类,包括5 min 以下、5~15 min、15~30 min、30 min 及以上 等4 个 等级[22]。其中,对于15~30 min运营延误事件,将启动五级应急预警;30 min 及以上运营延误事件则属于一般E 类事故,对地铁线网运营乃至城市交通将产生负面影响。因此,15 min 及以上运营延误事件是地铁调度和安全人员重点关注对象,也是本文研究对象。目前,针对15 min 及以上运营延误事件统计分析存在以下难点。
1)地铁运营延误事件的成因极为复杂,包括设备因素、人为因素、恶劣天气条件和管理因素等方面。各因素间相互作用和演化逻辑关系的差异会导致事件产生不同的后果及影响。这对运营延误事件的结构化情景构建和内因分析带来极大挑战。
2)现有的地铁运营延误事件日志通常不够简洁,文字记录缺乏规范格式要求,导致数据的结构化可操作性不足,难以深入挖掘事件的细节和关键属性。这使得运营延误事件日志难以形成有价值的经验知识来科学地辅助应急处置决策。
上述难点使得难以精准把握地铁运营延误事件的风险致因和演化过程,同时也限制了对事件关键情景特点的深入理解和预防措施的制定。因此有必要针对地铁运营延误事件成因特点展开分析,设计一种灵活的结构化情景构建方法,强化对事理关联的理解。
结合地铁运营系统危险源和风险隐患点,总结地铁运营延误事件成因分类。从因素归属和专业类别来看,事件成因可分为“车辆”“通号”“工务”“供电”“客运”“总调”和“客观条件”七大类。其中,可将“客运”和“总调”归为人员因素;“车辆”“通号”“工务”和“供电”归为设备因素;“客观条件”归为环境因素。每类因素在地铁正常运营中都起重要作用,异常情况可能造成严重延误事件。地铁运营延误事件成因要素如图1所示。
图1 地铁运营延误事件成因要素
运营延误事件的直接对象是地铁列车,与地铁列车相关的信息包括列车号、涉及线路、运营年限等。
运营延误事件的最直接后果就是列车延误。此外根据应急预案内容,其他后果还包括因处置延误事件进行的其他运营调整及对乘客造成的影响,如图2所示。
图2 地铁运营延误事件对象及延误结果
考虑现场辅助决策应用需求,在EOC 模型[16-17]基础上,增加“管理与响应”,形成“要素”“对象”“结果”“管理与响应”四个维度对运营延误事件进行结构化拆解,将拆解后的“要素”“对象”和“结果”的属性之间进行关联分析后,对新事件进行管理决策,形成地铁运营延误事件结构化情景构建方法框架,如图3所示。
图3 地铁运营延误事件结构化情景构建方法框架
根据对地铁运营延误事件成因和后果的分析,E是突发事件发生的诱因,由若干超出临界值或发生意外的要素构成;O是突发事件的载体,为风险暴露和损伤的对象,地铁运营延误事件的对象即为地铁列车;C表征突发事件的负面影响,用于判定突发事件构成与否以及损害程度,地铁列车晚点和乘客安全即为被延误结果。同时结果C可能也会影响要素E的属性。管理与响应M则为防止突发事件发生、防止事态恶化、减缓负面影响的手段与措施,约束E,O,C的作用效果。以下将分别从这4 个方面对地铁运营延误事件进行结构化拆解(如图4所示),完成事件案例的知识积累。
图4 EOC模型理论和延误事件结构化方法
3.2.1 要素E的结构化拆解
根据2.2.1的分析,参考安全体系中的人-机-环3 个不安全因素,要素E可分为人员要素E1、设备要素E2和环境要素E33 个方面。其中,人员要素E1主要与人员的身份相关;设备要素E2主要与设备的类别及设备本身名称相关;环境要素E3是要素发生的背景信息,如气象条件、地理条件、事件开始时间、站点名称、影响方向以及发生延误的时间等,都可以直接且独立地影响事件的演化。考虑到数据的可获得性,本文中各类要素的属性均来自某地铁2010—2022 年的延误事件日志和事故分析报告,具体分类见表1,后续可随着事件案例的增加进行调增。根据E的分类,拆解E类别与对应属性,建立E特征属性变量表达式如下:
表1 要素E类别及其属性
式(1)中:P(Em|Rij)为E类别与属性值对应集合;m=1,2,3,表示类别序号;i∈Z,表示案例序号;j∈Z,表示属性序号;Ri1,Ri2,…,Ri14为E类别的属性值。
3.2.2 对象O的结构化拆解
在地铁运营延误事件中,最直接的暴露损害对象是列车本身,因此对象O为列车。将列车号及事件发生时列车最大运营年限、线路及其开通年份等定义为列车属性,具体分类见表2。
表2 对象O及其属性
根据O的分类,拆解O类别与对应属性,并建立O特征属性变量表达式如下:
式(2)中:P(O|Rij)为O类别与属性值对应集合,Ri15,Ri16,Ri17,Ri18为O类别的属性值。
3.2.3 结果C的结构化拆解
结果C是要素E作用于对象O后产生的影响和后果。运营延误事件的结果可以是直接的,如设备损坏或人员受伤,也可以是间接的,如服务中断或经济损失。在地铁运营延误事件中,C主要围绕延误时间和影响乘客人数来定义,因此将C分为晚点时间C1(包括最大晚点时间以及初始延误持续时间)、5 min 晚点列次C2、清客列次C3以及乘客影响情况C4,具体分类见表3。
表3 结果C及其属性
根据C的分类,拆解C类别与对应属性,并建立C特征属性变量表达式如下:
式(3)中:P(Cn|Rij)为C类别与属性值对应集合;Ri19,Ri20,…,Ri23为C类别的属性值。
式(4)为EOC 模型的逻辑公式,反映要素、对象、结果间作用关系,具体函数形式根据Em和O之间的关系而定,不同的情况下Em对O的影响可能是不同的。
3.2.4 管理与响应M的结构化拆解
管理与响应M是针对突发事件所采取的手段与措施,地铁运营延误事件的管理与响应措施包括行车调整、四长联动(地铁站所在地镇长、派出所警长、轨交警长及地铁站站长联动)、大客流预警等措施。当要素E作用在对象O上产生结果C后,针对C将实施合理的M方案,同时,E和O的属性不同也会影响M方案。根据地铁的运营规范及现场处置方案,将M分为行车调整M1、实施救援M2、发布预警M3、启动大客流响应M4、启动公交预案M5、启动四长联动M6六大类措施,具体分类见表4。
表4 管理与响应M及其属性
通过对15 min 以上延误事件进行EOC 模型结构化拆解,建立历史延误事件情景案例库。当发生新的延误事件时,可通过属性关联分析进行辅助决策。计算要素E和对象O的属性关联度,找出历史相似案例。历史相似案例的结果C的属性可以辅助运营管理人员预判事件影响范围和影响程度,管理与响应M的属性可以辅助运营管理人员采取合适的运营调整措施。
1)数值型属性关联度
数值型属性关联大小即为数字之间的距离长短,考虑到数值型属性值的单位与取值范围不同,因此运用标准化的Hamming 距离计算数值型属性的关联度[23],见式(5)。
式(5)中:ωj为属性关联度;i,k∈Z 且i≠k,则Rij,Rkj分别为案例i,k的第j个属性值;Rj为所有案例的第j个属性值的集合。
2)类别型属性关联度
对于地铁运营延误事件中的类别型属性,赋予从1 开始的分类值,如表5 所示。因此地铁运营延误事件中1 个类别型属性可以表示为1 个向量。向量的维度为类别型属性数量,每个维度的值为对应属性的分类值。运用标准化熵求权重,并利用相关系数求得关联度值。
表5 属性值数据类型及其分类值
熵的数据标准化处理[24]公式为:
式(6)中:Yij为标准化处理后的属性值。
接下来计算信息熵:
式(7)中:Ej为第j个类别属性值的熵值;n为第j个类别属性值不为空的案例总数;pij为第i个案例的第j个类别属性值在该类别总属性值中所占比重,其计算公式为:
根据信息熵计算类别属性值的权重,如下所示:
式(9)中:Wj为第j个类别属性值的权重;s为类别总数。
计算类别属性的加权指标值,如下所示:
结合式(6)~式(10),形成类别属性关联度计算公式,如下所示:
3)各属性关联度和总关联度
考虑属性间重要程度的差异,结合上述数值型和类别型属性的关联度计算公式,分别设计要素、对象、结果以及管理与响应的关联度计算公式,用来对比当前案例和历史案例间的相似程度。以要素、对象关联度的加权和作为总关联度,作为辅助决策判断依据之一。要素关联度计算公式如下:
式(12)中:ωE为要素E的关联度;λj为第j个属性占该要素的权重,可采用专家打分、监督学习等方法确定;δj为第j个属性是否纳入关联度计算的标识,0表示不计算,1表示计算;n1为要素属性数量,如果两案例在某一要素属性上存在数据缺失,则该要素属性不参与计算,要素属性数量减1。对象关联度计算公式如下:
式(13)中:ωO为对象O的关联度;λj为第j个属性占该对象的权重,可采用专家打分、监督学习等方法确定;n2为对象属性数量。如果两案例在某一对象属性上存在数据缺失,则该对象属性不参与计算,对象属性数量减1。结果关联度计算公式如下:
式(14)中:ωC为结果C的关联度;λj为第j个属性占该结果的权重,可采用专家打分、监督学习等方法确定;δj为第j个属性是否纳入关联度计算的标识,0表示不计算,1表示计算;n3为结果属性数量。如果两案例在某一结果属性上存在数值缺失,则该结果属性不参与计算,结果属性数量减一。管理与响应关联度计算公式如下:
式(15)中:ωM为管理与响应M的关联度;λj为第j个属性占该结果的权重,可采用专家打分、监督学习等方法确定;n4为管理与响应属性数量。如果两案例在同一“管理与响应”属性值上存在数据缺失,则该管理与响应属性不参与计算,管理与响应属性数量减1。总关联度计算公式如下:
式(16)中:ω总为总关联度;γE与γO分别为要素E和对象O所占权重,可采用专家打分、监督学习等方法确定。
将历史运营延误事件按3.2 节的方法进行结构化拆解,形成运营延误案例库。利用运营延误案例库的数据,结合3.3 节的关联度公式,对新运营延误事件的影响结果进行辅助预测,并提出措施建议。具体流程(如图5所示)如下。
图5 相关事件结果推理应用流程
步骤1:将新运营延误事件进行结构化拆解,得到要素E和对象O。
步骤2:计算新运营延误事件与运营延误案例库中各案例的总关联度,并按从大到小排序。
步骤3:如果总关联度最大值大于等于0.9(即置信度为90%),则根据所对应的案例(即目标案例)中结果C以及管理与响应M,可得出新事件将造成的影响时间、影响程度等,并提出响应措施建议。如果不超过0.9,则需要根据总关联度从大到小的顺序,依次判断新事件与当前案例的要素关联度是否大于等于与新事件相同设备专业所对应的阈值,如果某序号案例满足前述判断条件(此时定义为目标案例),则输出新事件将造成的影响时间、影响程度、响应措施,同时输出总关联度作为置信度。如果全部案例都不满足,则输出“无相似案例”。
对于要素关联度阈值,依据设备专业(设备要素下),提取既有案例库中相同数值所对应的案例数据,计算案例数据间的平均要素关联度。
步骤4:记录新事件最终的结果和响应措施,并进行结构化。如果在步骤3 中输出无相似案例,则将结构化后的新事件所有属性更新到运营延误案例库中。否则,分别计算新事件与目标案例间的结果C关联度和管理与响应M关联度,如果都大于等于0.8,则无操作;否则,将结构化后的新事件所有属性增加到运营延误案例库中。
本文以上海地铁2010—2022年的延误事件日志和事故分析报告中7个供电类故障导致的15 min以上延误事件为例,进行EOC 模型构建和属性关联度分析说明。
案例1:2010 年4 月1 日,上海地铁11 号线于10:38 在马陆至南翔上行发生触网失电,造成最大晚点24 min。
案例2:2010 年6 月13 日,上海地铁3 号线于14:03 在上海南站至漕溪路上行触网失电,造成最大晚点57 min。
案例3:2017 年3 月20 日,上海地铁11 号线于8:07 在嘉定西站至嘉定北站下行发生触网支架异常,供电检查为定位点支撑螺丝松动滑移,造成最大晚点26 min。
案例4:2021 年10 月24 日,上海地铁11 号线于8:08 在嘉定北折返线至白银路下行发生触网支架脱落,造成最大晚点21 min。
案例5:2021 年11 月12 日,上海地铁1 号线于10:21 在莲花路至上海南站上行发生触网失电,造成最大晚点57 min。
案例6:2019 年7 月21 日,上海地铁9 号线于9:57 在洞泾至松江大学城下行发生触网失电,造成最大晚点28 min。
案例7:2015 年3 月30 日,上海地铁5 号线于11:05 在闵行开发区至华宁下行发生牵引站213开关跳闸,造成最大晚点22 min。
对以上7 个案例进行要素拆解,按照上文所述的EOC模型拆解方法,将案例结构化,如表6~表9 所示。其中:环境要素中的年份、日期、事件开始时间、站点名称,以及对象中的列车号和线路名称为事件基本信息,因此不计算其关联度。
表6 案例设备要素拆解
表7 案例环境要素——与关联度计算相关要素拆解
表8 案例环境要素——基本信息要素拆解
表9 案例对象拆解
使用Protégé软件对基于EOC模型构建的情景进行可视化图谱展示。将案例6 作为实例,见图6。经分析可知,本事件中未涉及工作人员失误导致的故障,因此人员要素为无。设备要素为接触网/轨,故障现象为触网失电,影响该区段内多列车,事件发生于9号线(9号线至事件发生已建成12 年),造成最大晚点28 min,发布五级预警,启动公交预案。经过事后分析,发现故障的根本原因为洞泾至松江大学城区段开关短路,可能与线路老化有关。
图6 Protégé可视化图谱
在选取的7 个案例中,将案例1 与案例2、案例3与案例4、案例1与案例5、案例6与案例7分别进行共性对比,如表10所示。由于是模型应用的可行性示例,在本文属性关联度计算中,将属性内各权重均设置为相同,要素E和对象O所占权重也为相同。
表10 案例对比分析
1)设备要素E2关联度
对于供电类故障的地铁运营延误事件的设备名称和故障名称属性进行进一步关联度计算,其指标分类值如表11所示。关联度计算结果如表12所示。
表11 供电类故障下的设备要素属性指标分类值
表12 设备要素对比分析
根据表12可知,供电故障事件中时,设备要素关联度皆趋近于1,当不同设备发生不同故障时,设备要素关联度稍有下降。结论与案例实际情况相符。
2)环境要素E3关联度
对于供电类故障的地铁运营延误事件的环境要素属性进行进一步关联度计算,其指标分类值如表13所示。关联度计算结果如表14所示。
表13 供电类故障下的环境要素属性指标分类值
表14 环境要素对比分析
根据表14可知,在供电事件中的环境相似度较高,大多数在0.9 以上,事件发生的位置、日期、时段等比较类似,是影响总关联度的一个重要因素。
3)对象O关联度
大多数的供电故障发生在较老和新建成的线路。新线路可能由于供电设备还未完全磨合,导致设备容易出现故障。而较老线路由于设备老化,可能导致设备状态不稳定,见表15。
表15 对象对比分析
4)总关联度
参考表10对供电案例的分析,可知设备、环境、对象三者的权重难以区分。通过对维保供电专业人员调研打分,暂定三者关联度的权重为1∶1∶1,即要素关联度=(设备关联度+环境关联度)/2,总关联度=(要素关联度+对象关联度)/2。总关联度对比分析计算结果见表16。
表16 总关联度对比分析
如表16 所示,案例3 与案例4 的总关联度达到了0.95 以上,其故障的设备、事故发生年限及发生事故的环境都有相似性,且造成的延误时间相近。案例6 与案例7 的总关联度次之,其环境的不同影响了总关联度的大小,但仍有较强相关性(大于0.9),延误时间差异较小。虽然案例1与案例2 的设备与环境要素都呈现强相关,但由于其对象关联程度较小,案例2 线路开通年份较早,存在设备线路老化的现象,因此案例2 比案例1的延误时间更长,两个案例的总关联度较低。与其相似的,案例1与案例5的总关联度低于0.7,对象属性关联程度更弱,延误时间也较长。由此可见供电故障事件的整体关联度都较高,发生故障的设备及现象也较为相似,总关联度阈值(取0.9)满足实际情况。环境因素、线路开通年份、列车最大运营年限对总关联度的影响较大。
选取新供电运营延误事件做应用演示。新案例信息:6 月17 日,上海地铁7 号线于8:37 在美兰湖至潘广路上行发生触网失电。根据4.3 节结果,定供电专业要素关联性阈值为0.962。通过计算新事件与既有案例库中每个案例的总关联度,发现与案例1 的总关联度最高为0.98,超过0.9 可直接作为目标案例。因此参考案例1 的结果和管理与响应数据,推断本案例延误时间在24 min 左右,预计发生5 min晚点列次4次及以上,无需启动救援。新事件实际延误时间为28 min,5 min晚点列次为7次,与目标案例的结果关联度为0.938 3,延误时间误差在15%以内,不对案例库进行更新。
本文提出了一种灵活的结构化情景构建框架,基于EOC 模型理论对地铁运营延误事件进行多维度、结构化的属性和特征描述,为理解地铁运营延误事件的时空特点和演化逻辑提供了有效的方法。研究发现:在“要素E(人员E1-设备E2-环境E3)-对象O-结果C(晚点时间C1-5 min 晚点事件C2-清客事件C3-乘客影响情况C4)-管理与响应M”维度下,可以结合地铁运营不同专业特点,对事件的发生原因、过程进行清晰地分类和组织,对事件结果进行合理地推理,强化了事件的定性和定量结构化表达。最后,通过构建运营延误事件案例的可视谱图并分析不同案例间属性关联度,验证了结构化情景构建框架在实际应用中的可行性。本研究在权重标定、属性定义等方面还存在一定的不足,需要深化研究关联度计算中属性权重的数值标定问题,以及模型应用的时效性问题。