程智博,史天运,王英杰
(1.中国铁道科学研究院 研究生部,北京 100081;2.中国铁道科学研究院 电子计算技术研究所,北京 100081)
铁路专业公用地理信息数据获取及关键技术研究
Study on Data Acquisition of Railway-Dedicated Public Geographic Information and Its Key Technologies
程智博1,史天运2,王英杰2
(1.中国铁道科学研究院 研究生部,北京 100081;2.中国铁道科学研究院 电子计算技术研究所,北京 100081)
铁路地理信息平台是铁路信息化最重要的支撑平台之一,能够直观展示铁路地理要素。铁路地理信息数据是铁路地理信息平台的核心基础,在深入研究铁路业务系统对空间数据需求的基础上,根据铁路呈线状分布的特点提出基于数据分类、数据收集、数据采集、数据处理和数据更新的铁路专业公用地理信息数据获取流程,并对空间数据分类与表达、线性参考模型应用、采集方法等关键技术进行研究,使得平台能够正确、完整展现全路专业公用地理信息数据。
铁路地理信息平台;地理信息数据;数据获取;关键技术
铁路地理信息平台 (Railway Geographical Information Platform) 是将国家基础地理信息与铁路专业地理信息完整集成,以形成“全国全路一张图”,向全路用户和专业系统提供标准、规范的铁路地理信息数据和服务的基础平台,它以铁路空间数据库为载体,以 GIS 技术为核心,以实现铁路空间信息服务和共享为目标[1]。铁路地理信息平台通过展现设备信息促进铁路地理信息维护和共享。GIS 系统建设过程中,70% 以上的人力和物力花费在空间数据获取方面,铁路地理信息数据是铁路地理信息平台的核心基础。根据《铁路地理信息平台总体方案》,铁路地理信息数据从内容上分为国家基础地理信息数据、铁路专业公用地理信息数据和铁路专业专用地理信息数据[2]。其中,铁路专业公用地理信息根据铁路专业进行分类,包括铁路基础设施信息、铁路管理类信息 (工务、电务、供电、给水、房建等);根据数据类型分为矢量数据、属性数据、web 图片、台账数据等[3]。当前各管理部门主要通过属性信息和纸质图纸查阅、管理铁路数据,如果将铁路各专业设备设施数据赋予空间信息的特性,目前数据普遍存在以下问题。
(1)数据分布较为分散,没有专门管理所有数据的部门。
(2)空间矢量数据较少,并且空间分辨率较低。
(3)有些数据只具有属性信息,缺乏坐标系等空间信息。
(5)多源异构数据导致数据格式、坐标系等不统一。
(6)位置精度、属性正确性、逻辑一致性、完备性和现势性等达不到数据使用、共享的要求。
为满足不同业务系统和用户对铁路地理信息的需求,从梳理铁路专业公用数据获取方法的源头出发,通过控制数据来源、采集方法和数据质量 3 个因素,降低整个平台的建设成本并提高应用潜力。
铁路专业公用地理信息数据涉及不同比例尺、不同类型的空间数据,数据来源包括各管理部门、业务系统、设计院、施工单位等。建立一个统一标准化的铁路空间数据库,获取完整、高精度的地理信息数据,需要从数据分类、数据收集、数据采集、数据处理及数据更新等方面逐一实施,如图1所示。
图1 数据获取流程
(1)数据分类。目前铁路各专业地理信息以纸质图纸、电子地图和台账等形式存在。在细化数据分类时,依据铁路各专业现有的地理信息数据和标准,采用地理本体方法建立铁路领域本体,结合专家经验补充细化内容,明确地理概念上下位和同位关系等,以便于检索和管理地理数据分类信息[4]。同时使用 2000 国家大地坐标系 (CGCS2000) 地理坐标系统,拟定统一通用的数据交换格式标准和数据质量标准等。对于铁路地理实体分类标准而言,目前有企业标准《铁路地理信息分类与标准》,该标准明确中小比例尺地图(1 ∶ 1 万—1 ∶ 100 万) 展现内容及类别,对于大比例尺地图(大于 1 ∶ 1 万)需要在该标准基础上进行细化和补充地理信息内容[3]。例如,路基本体需要细化成路堤和路堑,房建附属设备中应该添加客服设备等。
(2)数据收集。确定现有铁路空间信息相关数据资料的归属管理部门,并将收集资料的存储形式进行归类,依据数据的属性信息、参考坐标系和数据完整度等对每种资料的地图参数进行归纳,针对不同数据格式将数据收集机制进行分类,以拟定不同的数据处理方式。具有空间信息数据的铁路地理要素,如工务专业路基、轨道、隧道、桥涵等部分数据,电务专业通信和信号部分数据,供电专业接触网部分数据等,这部分数据主要包括纸质图纸、电子地图等形式;只具有属性信息而没有空间信息的铁路线路,如标准轨铁路数据,这部分数据源主要包括设备台账、设备履历、综合检测列车 GPS 轨迹数据等;因历史久远导致资料不全或精度较差的数据,如既有线、驻地及管界、给水专业等部分数据。前 2 类数据仅需进行数据质量检查,而缺失或质量较差的数据需要通过数据采集来获取。
(3)数据采集。目前国内外数据采集方法已不再局限于传统的野外测量,而是呈现多样化、智能化的特点。针对呈线状分布的铁路地理空间数据,可以采用卫星定位测量、无人机航拍、三维激光扫描和移动摄影测量等方法。根据铁路线路环境情况拟定不同的采集方法,以提高数据的采集效率并保证数据质量。
(4)数据处理。结合铁路地理信息数据使用和服务的需求,根据上述不同数据收集机制、采集方法,制订相应的数据处理方法。处理方法包括数据转换、线性参考模型建立、采集数据提取等;处理内容包括数据去重、数据纠错、坐标变换、检查拓扑关系等。
(5)数据更新。铁路空间数据库建成后,需要对空间数据提供更新维护服务,以提高铁路地理信息平台的使用价值。根据铁路专业公用数据的不同来源建立相应维护管理方法,以确保数据准确性及现势性。
本文的提出的页面去噪模块没有整合在主题爬虫模块的信息抓取部分,其主要原因是防止与主题爬虫模块中设定的信息抓取条件相互影响。另外,该模块只作用于本地计算机,基本不与互联网建立联系,可减轻主题爬虫在互联网中进行运算的强度,同时,设计对不需要的信息进行删除操作,减轻本地数据的存储压力。
图2 标准轨铁路分类
3.1空间数据分类与表达
铁路空间数据分类作为数据组织与表达的基础,要从实际需求出发,将信息按照某种属性或特征进行逻辑分类,按照一定次序将信息分类并排列成有机的体系,以此来规范空间信息结构、数据存储方式,同时便于计算机有效处理信息和管理数据。根据《铁路地理信息分类与编码》,从先验知识的角度,基于线分类法继续深化铁路专业公用地理信息数据分类[5]。如铁路地理要素中“铁路”类下的一级小类“标准轨铁路”没有二级小类,仅按此方法组织数据会造成数据冗余,并且难以管理。标准轨铁路分类如图2所示,根据不同需求向下细化分类,不仅便于空间数据的组织与表达,而且便于制作不同应用目的的专题图。
在管理多源分类时,利用地理本体模型描述对象之间的关系,包括同位关系、上下位关系、整体—部分关系等,添加语义约束规则,建立铁路本体分类体系,满足铁路要素多尺度表达的需求,使同一铁路地理实体在不同分类体系中处于相同分类位置,以达到标准统一和知识共享的目的[6-7]。利用本体方法建立的路堤本体结构实例如图 3 所示,路堤的上位是路基本体,同位是路堑。
图3 路堤本体结构实例
从表达内容的角度,铁路专业公用地理信息需要建成 1 ∶ 100 万—1 ∶ 2 000 的多级比例尺电子地图,同一地理实体在不同比例尺下表现形式不尽相同。在制订数据标准过程中,明确不同比例尺下数据组成、内容、图形符号展现形式,为数据获取提供策略。供电专业下二级小类“牵引变电”在不同比例尺下的要素显示方式如表1所示,“牵引变电所”在 1 ∶ 100 万—1 ∶ 2 000 比例尺下均显示地理实体,在 1 ∶ 100 万—1 ∶ 1 万比例尺下表现为点要素,在 1 ∶ 2 000 比例尺下表现为面要素。表1中“√”表示该比例尺下地理实体需要进行显示,PT 表示显示为点要素,PG 表示显示为面要素。
表1 牵引变电类信息在各比例尺下显示内容
3.2线性参考模型应用
铁路线路具有线性地理分布特征数据量大、范围跨度广、新线建设多、更新速度快等特点,其数量占铁路专业公用地理信息数据 80% 以上。基础设施检测中心的综合检测列车借助装备的高精度差分定位 GPS 和沿线每隔 5 km 接触网杆安装的电子标签及编码器获取列车运行轨迹,并且与设备台账结合,根据台账上的线路编号、起始里程、终止里程等字段建立铁路线性要素,通过制图软件提供的线性参考工具创建铁路路径,使得每条铁路路径具有惟一的标识符[8];同时校准路径,添加铁路路径事件图层,通过动态分段技术生成具有空间信息的铁路线路数据,线性参考流程如图4所示。
图4 线性参考流程图
3.3数据采集技术
传统野外测量采集工作量大,并且对于线状分布的铁路而言,工作效率低,干扰列车正常运行。目前大多采用新型测绘方法,如卫星定位测量技术,利用全球导航卫星系统,使用终端接收数据,具有精度高、速度快的特点。利用车载式、站点式、便携式三维激光扫描机对铁路空间数据进行采集,其获取的点云数据能够准确、完整地提取铁路轨道、横断面、两侧地形地貌的几何信息[9]。无人机航拍方式无需专用机场,能够实现低空数码影像获取,适合铁路线状区域测量。移动测量方法可集成惯性导航等技术,在车辆高速行进中快速采集道路及两旁地物的空间数据信息。利用综合检测列车GPS 轨迹获取线路的方式可以避开影响列车运行、无上道权、受到天气及地域影响等因素,能够达到建设周期短、建设费用低、更新快的目的,因而是目前获取铁路线路数据的最优方式[10]。铁路线路数据获取方法对比如表2所示。
表2 铁路线路数据获取方法对比
不同测量方法具有不同优缺点,应根据铁路区域地形地貌采用经济、便捷方法进行采集。铁路长隧道区域受到岩石、混凝土等影响,接收卫星信号较为微弱,光线较暗甚至全无,摄影测量等方法受到限制,且地形起伏较大,洞内洞外测量人员联系沟通较为困难,鉴于这些受限因素,利用移动测量技术采集隧道部分区域空间数据最为适合。铁路编组站不在铁路综合检测列车检测范围内,这种占地面积较大且设备间位置较为复杂的区域,可采用无人机航拍测量手段。
3.4数据处理方法
数据获取的多源性决定数据处理方法不同,对于已有空间信息的数据,可通过直接转换和标准格式转换方法生成地理信息数据。对于采集后的数据根据不同数据格式采用不同处理手段,三维激光扫描技术获取的空间点云数据通过配准、合并,利用格网建立、数据缩减、数据分割、曲面拟合等技术进行特征提取,形成三维模型。数据处理流程如图5 所示。
图5 数据处理流程
铁路专业公用地理信息数据获取是铁路地理信息平台建设的基础,由于铁路空间数据具有管理部门多、数据来源多、数据类型多、表达形式多等特征,通过优化的铁路空间数据获取流程及先进的数据采集和处理方法,可以高效便捷地建立铁路空间数据库,为用户和业务系统正确、完整地展现全路专业公用地理信息数据,并实现数据的利用和共享,满足铁路地理信息平台展示管理的需要,提高铁路运营管理水平。
[1] 史天运,王英杰,李 平. 数字铁路框架体系的研究[J].交通运输系统工程与信息,2010,10(6):29-33.
SHI Tian-yun,WANG Ying-jie,LI Ping. Research on Digital Railway System Architecture[J]. Journal of Transporta-tion Systems Engineering and Information Technology,2010,10(6):29-33.
[2] 中国铁道科学研究院. 铁路地理信息平台总体方案[R]. 北京:中国铁道科学研究院,2014.
[3] 中国铁道科学研究院. 铁路地理信息分类与编码[R]. 北京:中国铁道科学研究院,2016.
[4] 李 霖,王 红. 基于形式化本体的基础地理信息分类[J].武汉大学学报 (信息科学版),2006,31(6):523-526.
LI Lin,WANG Hong. Classification of Fundamental Geographic Information based on Formal Ontology[J]. Geomatics and Information Science of Wuhan University,2006,31(6):523-526.
[5] 马小宁,史天运,李 芳. 铁路公用基础信息分类与编码研究[C]//第七届中国智能交通年会学术委员会. 第七届中国智能交通年会优秀论文集,北京:电子工业出版社,2012:323-328.
[6] 李德仁,崔 巍. 地理本体与空间信息多级网格[J]. 测绘学报,2006,35(2):143-148.
LI De-ren,CUI Wei. Geographic Ontology and SIMG[J]. Acta Geodaetica et Cartographica Sinica,2006,35(2):143-148.
[7] 李军利,何宗宜,晏雄锋,等. 一种形式概念分析的陆地水系语义分类[J]. 测绘学报,2014,43(9):976-981.
LI Jun-li,HE Zong-yi,YAN Xiong-feng,et al. A Semantic Categorization of Hydrological Domain based on Formal Concept Analysis[J]. Acta Geodaetica et Cartographica Sinica,2014,43(9):976-981.
[8] 王亚飞,徐 柱. 基于线性参照模型的铁路空间数据建模方法研究[J]. 中国铁路,2011(12):56-59.
WANG Ya-fei,XU Zhu. Research on Modeling Methods of Railway Spatial Data based on Linear Referencing Model[J]. Chinese Railways,2011(12):56-59.
[9] 吴 俣,叶泽田,杨长强,等. 车载三维激光扫描系统在铁路沿线景观建模中的应用[J]. 工程勘察,2009,37(11):61-66.
WU Yu,YE Ze-tian,YANG Chang-qiang,et al. Application of Railway Scene Modeling based on Vehicle-Borne 3D Laser Scanning System[J]. Geotechnical Investigation & Surveying,2009,37(11):61-66.
[10] 周慧娟,贾利民,李红艳,等. 检测数据全息可视化系统设计与实现[J]. 铁道运输与经济,2013,35(1):17-23.
ZHOU Hui-juan,JIA Li-min,LI Hong-yan,et al. Design and Realization of Holographic Visualization System of Inspection Data[J]. Railway Transport and Economy,2013,35(1):17-23.
责任编辑:吕向茹
CHENG Zhi-bo1, SHI Tian-yun2, WANG Ying-jie2
(1.Postgraduate Department, China Academy of Railway Sciences, Beijing 100081, China; 2.Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)
Railway Geographic Information Platform is one of the most important supporting platforms of railway informatization, which can directly show the railway geographical elements. The railway geographic information data are the core and foundation of railway geographic information platform. Based on deeply researching the demand of railway operation system to spatial data and according to the characteristics of railways distributed linearly, this paper puts forward the that data acquisition process of railway-dedicated public geographic information are based on data classification, data collection, data acquisition, data processing and data updating, and studies some key technologies like classification and expression of spatial data, application of linear reference model and acquisition method, which enable the platform to show the railwaydedicated public geographic information data correctly and completely.
Railway Geographic Information Platform; Geographic Information Data; Data Acquisition; Key Technologies
1003-1421(2016)09-0082-06
U29;TP315
A
10.16668/j.cnki.issn.1003-1421.2016.09.16
2016-05-10
铁道科学技术研究发展中心科研项目(2015YJ086)