中国铁路太原局集团有限公司科信部 王 凯
大秦铁路股份有限公司科学技术研究所 王健慧
中国铁路太原局集团有限公司科信部 杜 军
西南交通大学机械工程学院 杨 岗 周 奥
随着铁路行业信息化、网络化的不断深入以及重载铁路方面的业务流程也在逐渐标准化,该过程中产生的数据信息在呈指数的形式日益增长。针对这些海量的、多类型的数据信息,由于目前重载铁路方面缺乏一套完整、规范及统一的数据管理标准,使用传统的数据处理方法进行管理显得有些能力不足。利用元数据在数据组织、管理、共享方面的优势,可以有效的对海量的、多源异构的重载铁路数据进行处理,实现了铁路数据的管理和共享。针对基于元数据是实现数据处理的重要手段,本文从元数据概述、铁路元数据管理及其标准、发展现状和未来发展趋势等几个方面综合阐述了重载铁路元数据的研究状况。
随着科技的不断发展以及铁路工程建设网络化、信息化的全面推进,动车组信息系统相关信息资源日益增大,该过程中产生的相关数据也在以指数的形式飞速增加。但是当前在国内动车组数据服务平台建设各方面还不太成熟,且当前传统的数据处理方式在对海量的、多源异构的数据处理上显得能力有些欠缺,如:系统检索的响应缓慢,数据不规范、不标准缺乏严格的格式标准,同时系统接口相关管理可能不统一。这些问题都可能给后期对数据的使用或分析带来很多困难,导致这些数据资源不能都有效的发挥其价值。因此在重载铁路方面急需要相关解决措施,对该方面海量的大数据进行实时获取与处理。通过研究重载铁路元数据来制订一套有益于互操作、统一的数据描述标准规范,能够实现对铁路工程方面数据的收集、整理、存储、传递、保存。这样就能够有效的解决铁路数据信息查询不方便、数据规范化不统一、数据信息不可操作性等问题。
元数据被称为“描述(或关于)数据的数据”,它是对数据及信息资源的描述性信息,也可以表示为某种资源的相关信息的结构数据。它不但能够对数据提供相关描述的作用,同时还能够对数据进行有效管理。
元数据可以说是由一些数据项共同组成的集合,这些数据项都是用来描述某具体资源对象。其中元数据元素是它的最基本组成单元,每个元数据元素都有一些相关属性(如:定义、约束性等)来对数据信息来进行关键性描述。由于各行业产生的数据信息日益增加,数据类型也是各有差异,因此对于这些多源异构的数据信息的管理和描述需要不同的元数据类型。对于元数据的类型将其按用途分类有:描述性元数据、业务性元数据,管理性元数据和技术性元数据。
描述性元数据是用于阐述和识别信息资源对象的属性、内容和特征的元数据。如:专题索引,用户注释等。描述性元数据能够对信息资源进行相关叙述、定位以及检索,可以让用户不需要浏览信息对象,也能对该信息有基本的理解和相关的认识。
业务性元数据是用来让用户了解相关业务数据信息的一种方式,它是数据仓库环境搭建的关键,它是先进决策开发的一种支持工具。业务元数据主要作用是为业务处理提供统一的解释。
管理性元数据简单来说就是对信息资源进行管控和支配的元数据。如:用户使用权限及数据存储格式、信息收集、信息管理流程、信息所有者、版权与翻版跟踪等。
技术性元数据就是与信息系统运行状态相关的元数据,通常是指用来开发和管理数据仓库使用的相关数据。如:软件与硬件的信息、数据验证安全、软件版本的控制、系统的响应跟踪及数字化信息的格式等。
元数据在网络信息资源组织方面的作用可以概括为:描述、检索、选择、定位、管理和评估这六个方面。应用元数据结构可以构建信息资源,利用元数据的内容信息,可以让用户快速、准确的查询到数据所在的位置,实现数据的共享。应为元数据是对数据的描述,所以可以让使用者准确对数据进行了解与评价;同时元数据中提供了相应数据的位置的信息,所以通过元数据可以对数据提供者所属机构和个人资料进行查询;能够使得数据在共享时更加方便,并且减少了冗杂数据的产生,大大提高了工作效率。元数据的不仅能描述信息,而且还对数据具有规范性。元数据标准性促使相关信息按照统一的标准呈现,及时有效的减少了用户在数据对接时不兼容的问题。利用以上元数据特性,可以通过搭建数据共享平台对数据进行及时更新、有效管理和数据共享等工作。
随着计算机技术和信息化在各行各业的飞速发展,各行业特别是重载铁路方面的数据资源总量正呈指数增长,近几年产生的数据量比以往有很大增长,这些大量的多源异构的数据处理起来会有很大的困难,而大数据技术提供了一种高效快速的机制去处理这些海量的数据。如今各国都在推进大数据的发展和应用,中国更是对其给予了厚望。而大数据发展还在起步阶段,关于大数据的资源共享,面对处理哪种资源可以开放、资源的开放前提、开放什么程度等问题,必须需要制定相关的国家标准及建立相应的元数据资源库去解决这些问题。
目前国内外在铁路工程信息资源方面缺少一套完整的、统一的元数据标准体系,这就导致无法有效的规范铁路数据信息。在《地理信息分类与编码规则》(GB/T 25529-2010)中,只是将铁路工程在地理方面相关要素信息进行了划分,并未对铁路工程相关领域做出全面的、详细的定义和划分。在发布的《建筑工程设计信息模型分类和编码标准》当中,主要对建筑工程领域的信息资源进行了相关分类和编码,其中把铁路工程与建筑工程有重叠或类似的领域不再单独编写,而是均采用的是这个标准来进行相关分类和编码,但是这个标准缺少对铁路工程元数据系统性和全面性的描述。因此目前在重载铁路方面急需要一个适合铁路工程信息数据管理的标准规范。为了响应铁路行业发展要求,铁路BIM联盟2019年发布了《铁路基础设施元数据标准》,该标准结合了铁路行业自身特点及过往经验,对铁路工程数据信息的元数据标准进行了科学性、系统性规定。该标准根据铁路工程项目生命周期包含的设计、建设、运维三个阶段所需要的元数据不一样,将铁路元数据划分成了基本、设计、建设和运维元数据四个类别。其中基本元数据是三个阶段中通用的部分,该标准的发布解决了铁路工程方面存在的数据定义、处理、储存、共享和使用等方面数据格式不统一的问题,有效的推动了铁路工程建设数字化、网络化和信息化快速发展。
(1)吸取过去的经验,结合铁路行业的特点及其实际应用需求,提高数据的可操作性及指导性。
(2)参照其他行业已有的标准,铁路行业与其重叠的专业领域不再定义专门的标准,直接应用现有的标准,保持数据的统一实现数据信息的共享。
(3)应该实现铁路工程信息资源的产生、管理、保存和使用的标准化,体现元数据使用的科学性及合理性。
关于BIM联盟发布的《铁路基础设施元数据标准》该内容主要分为了8个部分来编写,分别是总则、规范性引用文件、术语和定义、各单位职责、元数据阶段划分、元数据描述方法、元数据管理及元数据管理平台应用接入。这里主要是对元数据描述方法进行相关说明。该标准结合铁路基础设施数据管理要求的实际情况,将元数据从概念的层次上区分为文档类、组织类、人员类和项目类。该标准分别使用了“IFD编码、数据元中文和英文名称、定义、目的、约束性、可重复性、元素类型、数据类型、是非枚举、值域、数据元值的最大和最小长度、表示格式、数据元最大和最小允许值、计量单位、子元素、信息来源、相关元素和注释”18个方面对元数据元素进行了有关描述。元数据元素描述方法如表1所示。
铁路基础设施元数据的管理主要由元数据的著录、审核和发布三个部分组成(如图1所示)。其中元数据的著录和审核由铁路BIM联盟各个成员负责,而元数据的发布有铁路BIM联盟负责。
表1 元数据元素描述方法
图1 元数据管理流程
其中元数据的著录分为录入元数据相关填报模板、导入元数据填报Excel文件以及提交审核这三个步骤。即BIM联盟各成员在完成元数据梳理后,按照规定的格式将元数据相关信息录入填报模板,然后将元数据分类(如“项目”、“路线”等)导入BIM联盟元数据管理平台,同时每次只能导入一个分类下的元数据,然后提交给联盟其他成员审核。
元数据的审核由下载元数据填报的文件、修改元数据填报文件、上传修改后元数据文件及审核的意见四个步骤完成。即审核人员对提交的元数据文件查阅,并对相关内容进行修改,然后上传BIM元数据管理平台,同时给出审核意见。当元数据著录和审核的成员对该文件都无异议后,将其内容移到待发布库中。
元数据发布。由BIM联盟管理人员将审核通过的元数据进行发布新版本,提供给信息供应链中各方使用。同时BIM联盟会为发布的新元数据配备相应的版本编号,并更新相关的版本列表。
针对铁路行业数据量庞大、数据关联复杂且数据范围广泛所带来的挑战,元数据提供了有效的管理手段为数据资源的使用者和提供者。将铁路元数据与大数据处理技术结合实施到铁路数据服务平台中,为铁路工程建设行业各业务相关的应用系统提供数据的采集、整理、储存、传递和共享以及大数据分析等服务。
对于重载铁路工程元数据的未来发展首先得保证元数据的质量,目前我国的元数据质量状态存在很大的问题,尤其在铁路方面没有一套高质量完整的元数据,在数据平台存在着“基本元数据覆盖率(完整性)”、“开放格式”等质量方面的问题。可以参照“欧洲数据门户EDP”开创的元数据质量保障模块来监督铁路各领域信息资源的相关元数据质量。该模块元数据质量标准有三个度量标准,第一个标准是用来考察元数据是否符合规范,后两个标准是关于数据资源的可获取程度以及机器可读文件所含比率,这两个标准用来评价元数据记录是否具有准确性以及数据集是否具有开放性。
由于信息时代的到来,各领域都在朝着数字化、信息化方向发展,那避免不了数据平台或系统间的数据信息交换和共享。这就必须要求系统具备一种能够统一的来正确理解和有效使用数据和元数据的能力,即数据资源在系统间的可互操作性。解决“语义可互操作性”保证了在交换数据信息时,发送和接受双方能够有同一的方式理解和解析数据信息,知道信息所蕴含的意义。从而突破数据资源跨领域和跨国界交流和共享的障碍。
结束语:随着铁路网络化、信息化建设的全面推进,信息化管理在重载铁路方面进而得到实施并产生了显著的成效。目前我国对重载铁路元数据建设还落后于国际先进水平,为建设铁路工程数据信息共享平台带来了困难,使铁路领域产生的海量数据的处理面领着挑战。针对铁路工程建设的特点,研究铁路元数据的有效治理、元数据的高质量以及解决互操作性等问题都将成为未来发展要解决的课题。