李 君,徐春婕,杨国元
(1.中国铁道科学研究院集团有限公司 北京经纬信息技术有限公司,北京 100081;2.中国铁道科学 研究院集团有限公司 电子计算技术研究所,北京 100081)
物联网、人工智能、大数据等技术和智能交通领域的飞速发展,同步提升铁路客运车站业务应用的拓展速度和智能化程度,致使在满足安全性、稳定性运行要求的基础上,铁路客站各种设备的异构信息无论从维度、广度、深度均呈现井喷式增长,传统单一的处理方式早已无法满足行业应用需求,迫切需要汲取不同模态的优点,完成对多元化异构数据的融合,满足铁路客站设备的智能化发展需求。服务于2022年北京冬奥会、冬残奥会的一批智能化铁路客站,由于其设备信息采集较广、处理速度较快,故其设备信息属于多元化异构数据。
近年来,国内外学者对数据的多源异构问题及应用进行了一定研究。在基于异构信息融合的评价方面,周安美等[1]将风电设备维护数据,以扩展公共本体的形式,构建全局查询的沟通机制;李萌等[2]开展多属性评估,并确定大坝综合性等级;谢云鹏等[3]建立智慧城市三维模型;郜帅等[4]基于多模态网络环境,提出一种异构标识空间的管理控制架构并验证,但并未对数据进行具体的融合分析;段礼祥等[5]提出了基于改进卷积神经网络(Convolutional Neural Network,CNN)的多源异构信息数据级融合诊断方法,由于其采用的数据融合方式有限,未采用其他信息融合方式。
目前针对数据融合结果评价的研究中,多注重某种具体的融合方式或偏重于数据级融合,但并未对融合结果进行有效评估。为探索铁路客站这一典型场景下客站设备的智能化水平,利用设备数据多元且多源的特点,基于北京冬奥会个性化、智能化服务需求,以车站基础设施数据类型、结构、格式等多种模态数据为研究对象,从设备类型、数据特点、冬奥智能服务特性等方面展开设备智能化评价的研究分析,从而为铁路客站设备智能化发展提供参考依据。
多模态信息指文本、图像、视频、音频等多种模式信息,异构融合是利用计算机等相关手段依据事先给定的优化原则,处理信息在时间或空间上的冗余、竞争、互补和协同关系[6-7]。与传统单一模态处理相比,异构融合的稳定性强、覆盖范围广[8],其主要包括数据选择、数据的预处理、数据融合、数据分析和结果评价,由于获取到信息的维度、颗粒度、表达方式及展现方式等均不尽相同,可按照数据级融合、特征级融合、决策级融合进行划分[9-10],对于铁路客站设备智能评估来说,数据级融合处理的是原始数据,未能充分体现设备智能化水平;决策级融合是对所有属性和特征的综合性分析推理,覆盖面较广,也不便于聚焦具体评价方向,故选择从多源异构数据中提取具有代表性的特征,如以设备智能化为主要特征对多模态设备信息进行异构融合,从而实现对铁路客站设备的智能化评价,不同层次融合方式如图1所示。
图 1 不同层次融合方式Fig.1 Fusion modes at different levels
由于铁路客站设备种类繁多、数量巨大、专业领域差异,且涉及供货方、维保商、铁路客站、开发商、科研机构等诸多单位,管控平台与各相关单位之间的设备接口也不尽相同,除此之外,目前铁路客站设备数据也存在明显的存储格式差异化[11]、网络部署分散化、智能化定义颗粒度不统一等现象,无法为铁路客站设备智能化发展提供有力的数据支撑和指引作用。
通过分析车站设备智能化的发展方向,将数据的融合拆分为指标体系构建和数据库构建2部分,其中,指标体系的构建过程包括:智能化指标的分析、铁路客站设备智能化指标模型搭建、层次分析法(Analytic Hierarchy Process,AHP)分析给出指标权重、通过改进优劣解距离法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)进行指标合理性分析、为搭建的指标赋予对应权重;数据库构建则包括:铁路客站设备类型及数据类型划分、客站设备数据库构建、确定设备运行状况数据均值及范围,结合指标权重对多模态数据进行划分和评价,最终得出车站设备的智能化评估结果。在铁路客站设备智能评估的数据融合时,根据明确的铁路客站智能化要求,分析了铁路客站设备类型、所采集到的各模态数据,建立铁路客站设备数据库,并以某类型设备数据均值为基准,以±5%为范围,结合建立的评价模型和赋权后的指标对铁路客站设备智能化进行综合评估,结合数字孪生车站给出评估结果的三维展示,便于工作人员判定指标的合理性、偏离程度、设备智能化程度等。铁路客站设备智能评估数据融合思路如图2所示。
图 2 铁路客站设备智能评估数据融合思路 Fig.2 Idea of data fusion for intelligent assessment of railway passenger station equipment
根据铁路客站智能化评判要求和设备设施智能化发展内涵,以及评价指标体系构建原则,通过深入分析智能客站全部性能特征,基于AHP法,从经济性、效率性、准确性、拓展性、复用性、便捷性和实用性等7个主要方面[12]为所有评价指标赋予了对应权重,并基于数据波动性的客观赋权法(Criteria Importance Though Intercrieria Correlation,CRITIC)判断准则,对权重进行标准差准则判断,从而构建铁路客站设备的智能化评估指标。
京张高速铁路(北京北—张家口)作为2022年北京冬奥会、冬残奥会的专线,以客站设备智能化为目标,采用无人驾驶、5G物联网通讯等多项国内领先的信息技术,整体智能化水平较高。选取京张高速铁路清河站进行铁路客站设备智能化的评估指标体系构建,分别以高可靠性、高稳定性、高精度、灵活拓展、可持续性、自主可控、绿色低碳、人机交互为评判原则[13-15],运用AHP法设计综合性的评估指标体系。铁路客站设备智能化评估指标体系如表1所示。
表 1 铁路客站设备智能化评估指标体系 Tab.1 Intelligent assessment index system for railway passenger station equipment
对于铁路客站设备的智能化评价方法有多种,其中,AHP方法的主观性相对较强,权重的分配基本以评判者意志为转移,客观性相对较差;而CRITIC法不能反映评判者对不同指标的重视程度,且会有一定比例的权重与实际指标相反,故通过计算接近度确定评价指标的重要度来评判铁路客站设备的智能化程度,充分利用原始数据,信息量损失降到最低,保证计算结果科学、客观。基于铁路客站设备智能化评估指标体系,选取冬奥高清视频转播为典型场景,构造评价指标初始矩阵,归一化处理分类指标,通过“主观+客观”相结合改进TOPSIS方法,对评价指标进行优化赋权,以聚类分析和CRITIC进行权重的合理性、准确性判定,通过组合赋权确定指标重要程度和最终排序从而完成最终评价。
改进TOPSIS方法设定一个最优值即正向最大值,一个负向最大值,通过排序(即评价对象接近正向最大值的程度)确定重要度。根据已经搭建的铁路客站设备智能化指标层次结构,通过1-9标度法两两比较指标间重要程度形成重要性对比矩阵C,该矩阵为31个指标之间的重要性对比程度,是一个31×31的方阵。为避免对评价结果的影响,将其进行正向化处理,即对于矩阵中的元素Cij(i= 1,2,…,31;j= 1,2,…,31),按照±10%的比例分别设定上、下限,得出正向化矩阵(i= 1,2,…,31;j= 1,2,…,31)。
用向量规范化方法对正向化矩阵进行规范化处理,为避免对评价结果的影响,对其进行归一化处理,得到归一化的重要性判断矩阵Z= (zij)31×31,zij计算公式为
式中:zij为第i个评价对象的第j个评价指标数据归一化处理后所得结果,其中,
得到正向化矩阵的最大值组合为Z+= {z1+,z2+,…,z+31},其中,z1+= {z+11,z+12,…,z+1n} (n= 1,2,…,31),最小值组合为Z-= {z1-,z2-,…,z-31},其中,z1-= {z-11,z-12,…,z-1m} (m= 1,2,…,31)。
权重分为主观权重和客观权重2个部分。
3.2.1 主观权重计算
通过对铁路客站相关人员和专家问卷调查,综合得出31个三级指标各自的主观权重ωi,其中,带有偏差的最大特征值为λmax。
计算一致性指标CI为
式中:n为一致性矩阵具有的最大特征值,经一致性判断得重要性判断矩阵Z= (zij)31×31符合一致性检验要求,否则需要对其进行调整。
3.2.2 客观权重计算
将重要性对比矩阵C中的每个元素Cij(i,j= 1,2,…,31)均进行标准化处理,得到标准化矩阵Y= {Yi1,Yi2,…,Yin} (i= 1,2,…,31;j= 1,2,…,31),标准化矩阵Y中的元素Yi1= {Y11,Y21,Y31,…,Yi1} (i= 1,2,…,31)。
根据标准化矩阵的每个元素Yin与其对应行或列的和的比值,求各指标的信息熵,其计算公式为
其中tij为第j个三级指标在第i个二级指标中的特征比重,计算公式为
通过信息熵的计算公式,计算出各指标的信息熵Ei。根据权重计算公式得到指标客观权重分配结果,客观权重计算公式为
式 中:Wi(i= 1,2,…,31)为评价指标的客观权重。
根据计算出的指标权重W,以及各指标信息熵E,得出铁路客站设备智能化指标的最终得分,根据得分结果可以从客观角度反映每个三级评价指标的智能化程度。
为了统筹考虑评价指标,结合主观因素综合给出铁路客站设备的智能化评价结果,故利用组合赋权的方式计算最终的评价结果。
根据主观权重和客观权重,得到各评价指标的组合权重θi,θi计算公式为
式中:θi为组合权重;ωi为主观权重;Wi为客观权重;α为比例参数,这里α取0.4。
最后,利用CRITIC中标准差对准则层各个评判指标进行判定,根据CRITIC权重法判断准则,数据标准差越大则波动越大,相应权重越高。结合CRITIC方法的判定结果综合考虑评判指标的赋权结果是否合适,进一步判定其合理性。
结合铁路客站设备智能化的发展要求,人工智能技术在冬奥会设备设施应用方面都有比较突出的体现,如:运动员动作精准判断及分析指导、多语种实时翻译、AI虚拟播报、站内智能导航等。冬奥会超高清视频直播、转播、显示,是以5G通信技术为网络支撑,建立基于5G的列车多媒体冬奥信息服务系统,利用其大带宽、低时延等特性,支持4K甚至8K的超高清视频分辨率,很好地解决超高清视频等大带宽业务转播。因此以高清视频转播为典型应用场景,运用智能化评价指标模型,评价冬奥会该场景的智能化程度。
通过对三级指标的正向化、归一化处理,以及主客观权重计算,得出三级指标权重分配结果如表2所示。
表2 三级指标权重分配结果Tab.2 Results of weight allocation for third-level indexes
为了验证指标权重的合理性,再次采用CRITIC法对评价指标权重进行合理化分析, CRITIC权重分析结果如表3所示。表3中的指标变异性代表该指标的信息熵,变异程度越大则表示该指标提供的信息量越多,在综合评价中所能起到的作用越大,其权重越大,反之,权重越小。综合以上结果来讲,权重最大值为C1(9.203%),最小值为C30(0.2%)。综合对指标的CRITIC分析结果,可见设备失效概率等高可靠性指标、MTBF等高稳定性指标以及故障自诊断及预判、AR/VR沉浸体验等人机交互指标均有比较突出的表现,比较客观地体现了目前铁路客站设备智能化发展趋势,也较完备地契合了冬奥会的智能化办会理念。
表3 CRITIC权重分析结果 Tab.3 Weight analysis results of CRITIC
通过类似方法得出二级指标权重分配结果如表4所示。根据表4,以高清视频转播为典型场景的冬奥设备智能化权重均值为0.64,由于该场景主要反映数据高效传输、自主可控、视频转播等方面的内容,故相应指标所占权重比例较大(主要分布在B1,B2,B6,B8这4个指标),但也基本反映出智能化评价体系的综合评估效果。
表4 二级指标权重分配结果Tab.4 Results of weight allocation for second-level indexes
通过分析铁路客站设备多模态数据的融合方式及特点,建立铁路客站设备智能化评价模型,采用“主观+客观”相结合方式为指标赋权,从侧面反映铁路客站设备智能化水平,解决传统评判方式过于片面且无法综合反映工作人员需求和车站智能化发展趋势的双重弊端,充分体现评价结果的合理性、准确性和客观性。对铁路客站设备智能化评价,为客运工作人员提供生产指挥决策总体思路,便于其根据设备智能化水平、重要程度,结合设备种类、数量和物理分布等因素,综合制定差异化的运维策略,也为铁路客站设备智能化发展提供解决思路。