杨东盛,王卫东,马小宁,徐贵红,苏尔慈,刘 敏
近年来,随着云计算、大数据、物联网、人工智能、5G、区块链等一系列新兴信息技术在城际轨道交通领域的创新应用,城际铁路智能化水平得到大幅提升,建设智能化城际铁路已成为城际间轨道交通发展的主要方向[1]。基于城际铁路丰富的数据资源,采用“平台+应用”模式,围绕城际铁路全专业领域,开展智能化典型应用,实现大数据技术与智能城际铁路核心业务的深度融合,构建城际铁路数据服务的架构体系,成为智能城际铁路发展的迫切需求[2]。
数据交互是行业从信息化向智能化发展的重要基础性工作,多个行业领域已有一定的探索。在航空领域,《机场数据规范与交互技术指南》明确规范智慧机场数据定义和数据交互,以数字平台为数据交换集中地,提供机场内综合业务所需通用数据和服务,并兼顾机场与其他运行和保障单位的数据交互[3]。在道路交通领域,已形成《基于车路协同的高等级自动驾驶数据交互内容》行业标准,详细规定系统中车辆与车辆、路侧设施与车辆、云控与第三方平台等各类对象之间的信息交互内容和技术要求[4]。在国家铁路层面,智能高速铁路及铁路数据交互也已形成较多技术积累[5]。作为铁路大数据应用的基础和技术支撑,铁路数据服务平台已先后形成相关技术要求及接口规范,明确提出平台应能够支撑各类业务应用,实现各类信息资源按需调取、业务应用与基础数据的无缝对接,数据交互系统的设计也应满足低耦合、可扩展、标准化、兼容性、先进性、一致性等原则[6]。目前,铁路数据服务平台已逐步完成在中国国家铁路集团有限公司(以下简称“国铁集团”)及部分铁路局集团公司的部署,为我国铁路各业务领域的数据交互提供支撑[7-8]。
综上所述,智能城际铁路的发展需要依托轨道交通多领域跨专业的数据驱动。根据智能城际铁路总体架构的设计[9],智能城际铁路业务应用设计,自上而下可划分为支持平台、板块、领域、应用4个层面,可概括为“1-6-16-X”的应用架构设计,城际铁路云脑平台将作统一的云平台基础设施为各专项业务应用提供大数据、云计算、人工智能、决策支撑等综合服务能力支撑[9]。面向城际铁路各专业应用的智能化特点,分析形成城际铁路应用的数据服务需求及数据交互需求,提出适用于智能城际铁路的数据技术架构和数据服务架构,并基于此,形成城际铁路的数据交互设计,最终根据城际铁路云脑平台构建出数据交互通道,旨在为城际铁路的智能化大数据服务架构设计及数据交互设计研究提供借鉴。
在智能城际铁路的建设中,数据服务是实现覆盖城际铁路规划、设计、建设、运营和维护全业务流程、全价值链条、全生态体系智能化的必要支撑[10]。当前,城际铁路的系统建设主要依托业务应用分散建设为主,还需要进一步对数字化与智能化进行统一的设计规划[11-12]。在数据方面,需对城际铁路信息系统进行全面统一的数据标注,形成统一的规模化的数据清洗、数据汇集、数据共享及数据分析应用等服务,其重点解决以下4方面需求。
(1)数据标准的统一。既有城际铁路信息系统建设以分散独立建设模式为主,各系统面向公共字典表及通用数据的定义各不相同,导致数据难以互通,即使可以开放共享,也无法使用。
(2)统一的数据清洗服务。既有城际铁路信息系统在数据开放共享方面由于缺少统一的数据清洗与治理手段,大量数据汇集到大数据平台以后,存在许多干扰数据、冗余数据以及非标准化数据,使得数据利用率较低,亟需建立统一的数据清洗服务,将数据清洗为可用数据。
(3)统一的大数据汇集与共享服务。既有城际铁路信息系统在数据汇集与共享方面,采取的模式是各业务系统单独对接系统数据接口,造成数据接口的标准不统一,维护难度大,消耗人力过多等问题,亟需建设统一的大数据服务,以统一的接口规范及技术规范,提供数据接入与共享服务。同时,为满足智能城际铁路总体架构设计中提出的6 大板块和16个子领域的功能业务需求[9],还需在汇集与共享服务的基础上建立统一的数据交互设计,各个子系统需根据自身情况设定相应的管理权限并明确数据开放服务范围,并以此设计对应的数据交互接口。
(4)统一的大数据分析应用服务。既有城际铁路信息系统在大数据分析及数据应用方面,由于缺少统一的平台支撑,暂未实现规模化、跨专业的数据融合分析应用。现有的大数据分析功能,主要由单一业务主导,数据内容及应用范围有限,缺乏在可视分析、挖掘算法、预测性分析等方面的模型积累,分析结果的准确性及可靠性、服务的响应时间及维护成本等方面存在不足,使得分析结果难以直接服务于生产决策,需结合城际铁路的各项专业智能化应用,建设统一的数据分析应用服务,实现跨专业的数据融合分析。
云脑平台是智能城际铁路的中枢大脑,为各板块的智能化应用提供统一的平台支撑服务和基础数据服务,并基于数据驱动的理念为管理部门提供智能决策分析。云脑平台由云数据中心、人工智能服务、大数据服务、主数据服务、BIM+GIS 数据管理服务和决策支持服务构成。
遵循业界领先的“平台+应用”的技术架构设计理念,智能城际铁路的数据服务架构主要基于统一的云脑平台为智能检测监测、智能施工、智能列车、智能运维、智能客运、智能调度与列控6 大板块进行智能化赋能。6 大业务板块在统一的基础设施层(IaaS)提供物理资源、操作系统资源、计算存储资源等的基础上,以云脑平台“云数据中心服务”(数据层)和“智能大脑服务”(支撑服务)2个层面作为智能化核心,进行各数据的智能采集、处理、输出,以可视化、自动化等方式展示在用户应用层,如可视化的应急指挥大屏、智能客站枢纽的一键开关站管理、智能施工中地基处理桩钻杆就位引导等,具体的智能城际铁路数据服务架构如图1所示。基础设施层(IaaS)通过云数据中心统筹基础硬件资源,动态调配基础资源,提供存储、计算、网络,安全等服务;应用支撑层(PaaS),主要可分为负责云数据中心的数据层及提供智能大脑服务的支撑服务部分,数据层可以向支撑服务提供数据的传输调用;其中,根据应用支撑层服务的业务方向不同,又可分为通用技术架构的云脑平台及专用技术架构的6 大业务板块;通用部分的云脑平台可以向专用部分的业务板块提供平台支撑及数据调用。应用支撑层(PaaS)可以通过网关及负载均衡配置对外向用户提供人工智能、大数据、主数据、BIM+GIS 数据管理和决策支持等智能数据服务,从而可以在用户应用层实现无感进出站、应急指挥大屏等一系列的城际铁路智能化应用。
图1 智能城际铁路数据服务架构Fig.1 Intelligent intercity railway data service architecture
智能化城际铁路的总体数据架构采用“湖仓一体”的架构设计,基于云脑平台构建数据中心实现覆盖智能城际铁路的数据湖统一规划。
2.2.1 “湖仓一体”数据存储技术
在智能化及大数据应用方面,数据仓库技术已有较为成熟的使用经验,其主要用于数据分析及决策支持相关业务。数据仓库技术的出现及大规模并行计算的使用,使得系统可以通过多种服务器的组合来满足大规模数据处理的需求[13]。数据湖提供了一种可承载多样化数据分析应用的存储架构,同时也可实现数据的仓库化存储[14],但其同样缺少一些关键功能,比如不支持事务、缺乏一致性、不保证执行数据质量等,不适合承载读写访问、批处理及流作业。
“湖仓一体”作为一种新的数据管理架构,逐步独立地出现在许多智能化业务应用场景中,其在轨道交通智能化方面也逐步得到普及[15],且“湖仓一体”数据架构的提出,很好地解决了数据湖及数据仓库的局限性,其是一种新型开放式架构,将数据湖和数据仓库的优势充分结合,构建在数据湖低成本的数据存储架构之上,又继承了数据仓库的数据处理和管理功能,适用于城际轨道交通领域海量数据分析及业务应用智能化的发展方向。
2.2.2 “湖仓一体”技术在智能城际铁路的应用
智能城际铁路可利用数据仓库和数据湖融合技术,创建湖仓统一封装的云脑平台。云脑平台可针对城际铁路不同数据需求和业务场景,集成数据湖、数据仓库技术优势,制定湖与仓间的数据流转方案,制定数据存储策略,形成数据湖仓统一规划、统一封装的一体化存储方案,满足智能城际铁路的数据统一管理、互联互通、共享共用、高效存储、分析的使用需求。
智能城际铁路“湖仓一体”的数据模型如图2所示,通过多模轨道交通数据湖仓统一封装的设计,可支撑智能城际数据在湖仓不同的存储形式之间进行流转,云脑平台可根据智能城际铁路业务场景的复杂性和多样性,根据数据使用的频度及数据分类层级,设计构建基于频度、层级的数据流批融合存储模型,并制定不同类型数据在数据湖和数据仓库之间的迁移策略。进一步可支撑跨模态的数据索引及检索,针对智能城际铁路中海量异构数据检索及数据交互访问需求,基于大数据存储、大数据计算分析引擎等数据底座,建立数据检索的统一入口,实现数据的高效组织及无感访问。
图2 智能城际铁路“湖仓一体”的数据模型Fig.2 Data model of intelligent intercity railway “Data Lakehouse”
具体来说,智能城际铁路的数据存储主要基于数据温度、分级分域等技术构建分区分域分级管理,其主要由云脑平台提供湖仓一体的存储方案。云脑平台提供数据仓库(Greenplum)、HBase、Hive等组件对结构化数据进行存储。对于有实时共享需求或应用查询需求的温数据存放在数据仓库或HBase 中;对于历史全量冷数据,则将这些数据存放在Hive 中用于离线分析。平台针对非结构化数据的存储可提供HDFS 文件系统和对象存储组件。对于零碎的中小文件,平台将这些数据存放在对象存储组件中,而数据量较多的大文件,平台则会将数据存放在HDFS文件系统中。
根据智能城际铁路的数据架构设计,为打破各业务间的数据孤岛,需要通过各类数据接口实现专业间的数据交互。数据交互主要需要考虑交互方式、传输协议及数据格式3方面。
在传统的信息化系统建设过程中,常见的数据交互方式主要有数据库交互共享、文件服务器交互以及基于一些通用接口协议(如TCP/IP协议、HTTP协议)方式的数据交互等。在这种情况下,由于没有企业级的数据共享服务中心的存在,各个业务系统之间有数据交互的需求时,各业务系统就会相互协商,按照业务需求,通过FTP 或者数据服务的方式实现数据的共享,其存在问题主要有:①系统间的数据共享为按需提供,对数据需求方、提供方而言都会带来较多的重复工作量;②系统间数据共享的安全性无法得到保障;③系统间的数据耦合无法得到保障,提供方在系统升级改造时,将影响数据需求方;④各系统间的数据标准不统一。
随着近年来云计算及面向服务技术架构的广泛应用,企业级的业务系统多采用分布式方式进行设计部署。通过基础设施、平台及软件的有效整合,建设统一服务的数据共享中心,可有效提高业务系统的安全性、可靠性、可扩展性并兼顾成本及效益。统一的数据共享服务中心通过采用RESTful API 接口、分布式消息队列等技术方式[7],可实现更为灵活、便捷、可靠且时效性更强的数据采集与共享,方便业务间的数据融合,为实现跨制式、跨层级、跨区域的数据互联互通提供支撑。
在当前智能城际铁路的规划设计中,采用云脑平台作为整个企业的数据共享服务中心;为了更加方便数据的共享,提出了包括数据目录等在内的云脑数据共享方案。
在智能城际铁路的设计实现中,各个专业大类间、业务系统间及具体的数据表间,均存在着广泛、复杂且涵盖不同层级的数据交互过程。智能城际铁路专业间数据交互示意图如图3 所示,将智能城际铁路的业务应用分为旅客服务类、城际运营类及城际运维类,梳理形成各类别的业务应用涉及的功能项点,并展开列出智能调度及工电供运维两专业间可交互的主要业务数据,图3 中用的箭头表示不同大类的数据从数据源端某一专业的某项应用,指向数据共享端某一专业的某项应用,箭头旁边虚线框中的文字则表示2 项应用间交互的具体数据内容。以城际运维大类工电供运维专业中的综合维修生产管理应用和城际运营大类的智能调度应用为例,它们之间的连接箭头表示将调度系统施工管理模块的天窗计划、调度命令、天窗取消信息等数据共享给综合维修生产管理系统,用于维修作业编制。同时,智能检测监测也会将相关参数基础数据提供给调度综合监控应用中的工电供设备与动车组列车集中监控模块,实现数据的交互。在具体操作层面,专业应用间的数据交互以云脑平台为数据交换中心,以智能城际铁路主数据为功能业务实现的基础数据,分析各板块和子系统内外的原始数据、中间数据、分析数据、结构化和非结构化数据等的数据流向,制定统一的数据分级标准、数据格式编码规范和交互处理策略,依托大数据技术生态体系,最终实现系统内外数据的深度交互融合和应用创新。
图3 智能城际铁路专业间数据交互示意图Fig.3 Data interchange between intelligent intercity railway professions
智能城际铁路各专业间的数据交互以云脑平台作为数据底座支撑,云脑平台为大数据应用提供数据基础、存储、计算和分析等能力,其可以将数据服务边缘计算和云计算的价值最大化,达到减少时延、降低能耗以及提高用户体验质量的目的,从而有效地提高平台整体的服务性能及可靠性。云脑平台包含4 层,分别为基础设施层、数据中心层、数据服务层以及支撑服务层。其中基础网络及云数据中心构成“云”,数据湖及支撑服务构成“脑”,采取“云存脑算”的模式,全面承载智能轨道交通信息化应用并提供数据智能分析服务。
基于云脑平台的数据交互通道如图4 所示,云脑平台在专业间数据交互的过程中,提供数据的交互通道,如图4 中橙色箭头指向所示,源数据通过数据服务层提供的大数据服务能力,经过数据登记、数据汇聚、元数据处理、数据目录管理、数据质量管理、数据资产管理、数据价值评估直至数据共享等一系列数据服务操作流程,最终将数据及相关服务能力提供至需求数据的用户应用层,这期间平台可为数据交互提供标准的规范流程体系、完备的数据安全防护体系以及可靠的运行维护体系,确保数据交互传输通道的稳定、可靠及高效。
图4 基于云脑平台的数据交互通道Fig.4 Data interchange channel based on cloud-brain platform
此外,利用云脑平台建设统一的数据服务架构体系,将进一步利用统一集成的计算资源及不断累积的历史数据,对人工智能算法模型训练、决策支持分析模型的建立等数据应用需求提供有力支撑。从而以大数据云脑平台为基础,构建集成智能检测监测、智能施工、智能列车、智能运维、智能客运、智能调度与列控六大板块的各项智能化应用,为各项城际铁路业务的智能化实现赋能,进而实现覆盖城际铁路规划、设计、建设、运营和维护全业务流程、全价值链条、全生态体系的智能化。
以智能调度及智能运输组织专业的数据交互为例,其中调度的计划管理中的线路数据、施工计划数据提供给运输组织中的运行图智能编制功能,在云脑平台的应用间数据交互共享流程示意图如图5所示,主要流程为:①调度计划管理专业应用在云脑平台中进行线路及施工计划数据的登记;②登记后云脑平台通过数据汇聚接口进行数据汇聚;③汇聚后的数据经过元数据处理及数据质量管理工作,存储至云脑平台的数据湖仓;④对形成数据资产的线路数据、施工计划数据在数据目录中进行登记发布;⑤对于希望使用线路及施工计划数据的运输组织专业中的运行图智能编制应用,可以在数据目录中检索选择需要的数据并提出数据使用申请;⑥调度计划管理专业在收到申请后,可对申请进行审批;⑦审批通过后,云脑平台对线路数据、施工计划数据开放相应数据共享接口给运行图编制应用;⑧运行图智能编制应用调用接口获取到线路数据、施工计划数据。
图5 应用间数据交互共享流程示意图Fig.5 Data interchange process between applications
从城际铁路的智能化数据服务发展需求出发,分析得出智能城际铁路的数据需求,并根据城际铁路智能化业务应用的特征,提出了适应性的数据服务架构、关键技术及适用于城际铁路的数据交互设计,给出了应用间数据交互的实现方案,为轨道交通智能化应用间数据交互服务研究提供了新的思路及参考方案。下一步,随着城际铁路各业务领域智能化应用的深入实践,大数据技术及数据服务将更全面地融入到城际铁路规划、设计、建设、运营和维护的各个方面,构建一个高效、可靠且覆盖全面的数据服务架构及数据交互机制,将为智能城际铁路的发展提供更加完备的服务支撑。