上海大众燃气有限公司 应克明
应用智能寻址技术提高燃气输配基础数据挖掘效率
上海大众燃气有限公司 应克明
在燃气行业应用环境下,依靠不同于现有燃气基础数据管理的模式,围绕如何消除信息化建设中的“信息孤岛”的目标,以“智能寻址”为桥梁,对燃气已经存在各应用系统的数据实现空间上的集成,以数据挖掘的手段,从大量数据之间的寻求关联,并最终提高决策效率进行了探索,文章展望了燃气信息化管理的未来前景。
智能寻址 管线完整性管理 燃气地理信息系统
上海大众燃气有限公司输配部主要负责本市苏州河以南、黄浦江以西的燃气地下管线设施的安全、稳定运行。日常工作包括燃气管线设备的安全运维,地下管线的巡检巡视、停气降压、外配合和管线监护工作、工程施工测绘档案管理和燃气地理信息系统等管理。燃气企业实现科技创新时,其设想的前提就是任何时刻,社会都是发展的,资源(人、财、物、时间)总是稀缺的,安全要求却是常态的、刚性的和及时到位的,且随着技术进步和社会发展具有棘轮效应,而企业是追求经济效益的,我们在这些矛盾中寻找均衡点的同时,也在不断进步,这是我们技术创新的动力源泉。
1.1 企业生产安全管理的需要
随着城市建设的发展,燃气输配管理一直面临管理上的更高要求和考验,将“安全第一、预防为主、综合治理”作为生产经营方针贯彻到工作的每一个角落,职工的安全意识和责任心与过去相比有了很大的提高,但我们也可以看到,近两年来全国各地的各种安全事故屡有发生,在兄弟城市和同行业中发生的如:东黄油气管道爆炸特大事故、台湾高雄丙烯泄漏事故等,均造成人员伤亡和财产损失,给我们敲响了警钟。环境性的、系统性的风险,迫切需要燃气运营单位加强管道完整性管理。管道完整性管理与规划、设计、施工、运维、抢修等各个过程是密切相关的,也是对管道整个生命周期的系统管理。由于各种原因,这些过程中产生的数据,是单独存在,或仅在决策层以数据统计方式予以呈现的。近年来,集团层面自上而下的推进隐患管道整治工作以及危化达标和自我安全评价工作,近阶段即将开展的压力管道全面检测工作,在宏观上也推动各种数据的整合,形成有效的信息,防患于未然是一个长期和系统性的课题。预防的基础就是预测,而预测的基础就是对各种基础数据的感知和识别,掌控和挖掘,因此,因地制宜的坚持观念创新、制度创新、技术创新,对燃气输配管网的运行进行科学的、高效的管理十分必要。
1.2 企业信息化建设发展趋势的需要
随着信息时代的到来,各种数据围绕在我们周围,目前在燃气企业内部已建立大量的业务信息系统,如合同管理系统、工程管理系统(市场、质监、安监、输配)、燃气地理信息系统、客户(帐户、检修)管理信息系统、抢修辅助决策系统、管线巡检监护系统、急修故障分析系统等。通过几年来的积累产生了大量的数据,这些数据都是结构化的数据(即预定义的数据类型、格式和结构的数据)。随着数据采集的多样化,日常管理中会产生如照片、音频、视频、电子邮件、文档、CAD、巡检轨迹、日志、甚至微信和微博记录等,可以预见,这些非结构化的数据(包括半结构化、准结构化数据)增长量是惊人的。这些数据对燃气企业来讲都是资产,能拥有大量数据并善加利用,企业将更具效率和竞争力。这是一种新的价值观和方法论,我们面对的不再是抽样调查、随机样本而是全体数据,不是因果关系而是相关关系。
现有燃气企业信息系统中超过 90%的数据与地理空间位置密切相关,而且与其周边的地理环境也有着密不可分的联系,然而在大多数业务系统中,这些关于地址数据的记录仅是一些文本描述(有的甚至非常不规范),缺少空间地理位置坐标信息,因此无法与其它信息库中的数据形成空间上的相关性,也无法形成时间上的相关性,这些系统数据的现在、将来如果一直不能互相关联,不仅浪费了越来愈多的数据资源,而且对上级决策部门不时要求的各项数据分析工作,不仅费时费力而且不全面,这种情况必须改变。
为了解决企业管理中特别是输配管理面临的上述问题,必须推进跨专业、跨部门、跨时间的信息共享,并实现以地理信息系统为平台的自动空间关联数据分析及可视化能力,因此实施“应用寻址技术提高燃气输配基础数据挖掘效率”的课题具有现实性与紧迫性。
如果有一种技术引入到这些业务信息系统,并可以通过综合地理信息可视化平台,将所有与地理位置有关的业务数据全部关联到空间地图上,将众多业务信息系统中相互独立的“信息孤岛”进行整合,实现数据的共享和综合利用,实现燃气基础信息在电子地图平台上的直观化、可视化管理,改变目前管理信息系统(MIS)中单一的文字、数据操作模式,让各层级管理人员最快速度了解需要查询的数据,再辅助以一定的知识规则和机器学习能力,就可以让计算机自动担当起守门人,及时发现挖掘数据流中的敏感信息,并快速反映给相关责任人员或系统。
那么,如何将现有管理信息系统中的有用数据如实定位到电子地图上,就成为燃气综合地理信息系统建设的一个关键问题。解决这个问题的有效办法是运用所谓“寻址技术”,即将现有地址实体如地名、道路名、门址等进行空间化、数字化和规范化,建立较为完备的地址数据库,通过研究制定智能寻址匹配算法、开发地地址匹配软件,为各种业务需求提供地址查询、地址匹配等服务,进一步为整合空间信息和业务信息系统提供有力的工具。地址匹配,是指将地址映射成地理坐标的过程,提供了一种把描述成文本地址的地理位置信息转换成地理坐标的方式。计算机无法通过文字叙述直接找到目标位置,所以无法直接获取其具体的经纬度空间坐标。例如,用“龙漕路 79号”来表示上海大众燃气有限公司输配所的位置,计算机无法仅从“龙漕路 79号”获得输配所的具体坐标位置,也就无法在空间上显示出来。地理编码可以利用地址预置数据库来建立通用地址与地理坐标空间的对应关系。再利用中文地址匹配技术即一种基于汉语分词理解的地址匹配技术,通过分析汉语地址描述特点,构造一种分级地址库,并转换成地址分词库,使用分词索引的方式进行特征匹配并对语言要素进行权重打分,从而得到更为精确的匹配结果以及候选集,并在此基础上构建一个可自学习的地址库,不断丰富完善,提高匹配范围与匹配精度。
对于燃气管理企业来说,不规范的地址数据一直以来都是实现管网数据“及时性、正确性、完整性、安全性”的障碍,以前不明显是因为数据共享不高。
从近几年实践来看,由于行业缺少统一的地址编码规范,日常系统中各业务功能中所填写的地址数据都是不规范的,尤其在接受用户故障报修时的地址描述更是存在口语化现象,这给系统快速定位数据的空间位置带来的困难,严重阻碍了GIS系统优势的发挥,具体影响包括:
(1)MIS数据与GIS数据割裂,数据共享和整合困难。
(2)系统整体决策能力低下,智能化程度不高。
(3)数据管理手段落后,突发事件处置能力不足。
因此,燃气管理企业急需在GIS系统中引入高效的地址匹配技术以满足大量不规范地址数据的空间编码需求,从而弥补现有系统对地址数据处理能力的不足。
随着GIS在燃气业务中的作用越来越重要,对于根据文本地址快速、准确地查找其地理坐标的需求日益明显。在外业工作领域,基于位置的业务被越来越多地应用,采用地址编码技术,地图搜索引擎和地图服务网站的准确度和响应速度将得到提高,对于燃气管理企业来说,高效合理的数据管理和挖掘手段增加了燃气管网的整体安全性,快速有效的分析决策能力减少了突发事件带来的危害性,这也是本文的出发点。具体包括:
(1)将 MIS系统中业务数据与管线设施等数据建立空间逻辑关系,提高数据完整性。
(2)利用GIS系统的空间分析能力,整合管网基础数据资源,增强系统决策能力。
(3)利用强大的数据智能分析能力,增加管理和技术手段,为突发事件建立应对机制。
预期准备建设的燃气地理信息系统涉及的规模较大,需要做好需求分析和可行性实验,关于智能寻址就属于今后新一代燃气地理信息系统建设前要做的准备工作,智能寻址的架构见图1。
图1 智能寻址架构
通过分析现有的各种应用系统,我们确定要实现的核心功能:
(1)功能层:实现燃气数据关联分析,现在的目标是提供工具让操作人员可以去主动发现,未来的目标是信息后台的智能化自动发现、传递或发布。
(2)应用层:实现地址匹配引擎算法。
(3)核心层:实现语言分析及分词引擎算法。
(4)数据层:建设地址数据库。
按照设想目标进行了探索和实践,目前初步实现的功能列举:
3.1 实现基本地址匹配功能
按照设想,基本功能可以外挂在原有输配部燃气地理信息系统、抢修决策系统、设备管理系统、管线巡检系统、管线监护系统,条件允许的话,跨部门的工程管理系统、合同管理系统、燃气客户信息系统也可通过模块外挂,可方便的实现定位。在定位功能的基础上可以产生有空间位置信息的属性数据,返回到原有数据库中。实现对燃气专用地址库进行动态维护。
路名+门牌匹配:在地址查询文本中输入莘谭路408号,可以在地图上显示该地址,该项功能可以外挂在需要的管理信息系统上,见图2。
图2 路名+门牌匹配截屏
路口地址匹配:如输入吴中路宋园路口。可以定位在吴中路宋园路口,此项功能多用在抢修故障分析中。
兴趣点(企业、场所)匹配:光大会展中心东馆,同样只要对地址数据库进行数据维护,不断加入企业实体地址信息,就能实现地址匹配。这个地址数据库公用部分可由专业公司进行数据维护,自用部分可加上燃气企业自己需要管理的兴趣点,如占压管、重要场所等,见图3。
图3 兴趣点(企业、场所)匹配截屏
3.2 实现了含错别字以及模糊方位描述
如匹配地址:写的是瀑布湾唯园西南 10米,实际地址是瀑布湾道,维园道交叉口,见图4。
图4 含错别字以及模糊方位定位截屏
该项功能十分重要,既能满足对输入地址误操作的提示性修正,又提高了对存在于各个信息系统的原有地址数据的再利用效率,提高匹配正确率。
3.3 批量地址匹配并空间可视化分析
如设想一样,存在于各个信息管理系统中的地址数据资源十分丰富,对各类数据进行再次挖掘,会有意想不到的结果,如图5该功能加快了数据处理的效率。
图5 批量地址匹配并空间可视化分析截屏
实现的案例有:三年地下隐患管线改造已近尾声,地下零星承插管还有多少,需要作出一下评估。经常听急修中心抢修人员讲,在某个时候,记得抢修时挖到一些管道接口还是承插管的,做了登记。这些被确认的承插管是不是后来已经改造了,还是仍然还在,对着三年来的故障分析数据,一条一条对着地址再在GIS中查显然费时费力,既然有了智能寻址功能,我们把急修中心三年中抢修时发现的承插管数据(地址与时间)与GIS中现有的地下承插管数据(地址与时间)和工程管理系统中的承插管改造工程地址数据(地址与开竣工时间)批量进入综合分析平台进行综合分析,按时间轴分析来确认承插管的改造是否彻底。分析的成果可以为管线巡检和下一步管线改造所采用。由于数据处理效率的提高,使得各站点及职能部门既不只看到单一的视角,又不纠缠于海量数据的苦恼,风险意识和责任意识明显提高,更加愿意协同作战,达到大家共同做好科学化管理这篇文章的目的。
3.4 巡检作业样板关注点的可视化
将存在于输配所不同管理信息系统中一些关键场所的地址、年久管线、查(修)漏数据地址、管线监护地址等,结合巡检作业样板,可以快速可视化显示出来,便于突出巡检样板的重点。在 2015到 2016年,我们尝试先在巡检查漏车上放置专用导航仪,利用智能寻址技术+GPRS,将需要巡检关注的地点实时地从管理部门发送到现场。
巡检作业样板关注点的可视化,见图6。
图6 巡检作业样板关注点的可视化截屏
3.5 数据空间关联性分析
通过分析报修,工程等数据的空间、时间关联性,可以有效避免因信息不对称造成的施工冲突。另外也可以发现一些潜在的规律,从而找到提高管理工作的突破点,见图7。
图7 数据空间关联性分析截屏
具体管理案例有:在管理中我们经常会发现,有些桥管不在巡查范围内,不仅油漆未漆影响市容,而且万一河道上的船只对桥管进行撞击后再逃逸,若受损桥管未巡查,一旦漏气,会使我们的工作很被动,究其原因,主要是较长历史阶段中,由于人为原因,在基础资料中未能标示桥管信息,所以也未进入巡检和桥管油漆样板。对于这种在台帐上未登记的桥管还有多少,我们心里没底,但又不能被动等待出了问题才解决,按照以前的方法,我们必然是在巡检中加强普查力度,将每根桥管进行登记,寻找出以前漏登记的桥管,如果那样的话,我们将花费很长时间,至少一个季度吧,效果也不一定理想。因为在任何历史阶段,都会出现上述问题,然后再花大力气减少不明数据。我们想快速彻底的解决这个问题。
我们将地理信息数据库中的河流水系数据、燃气管线图形数据和桥管卡(含地址)三个数据批量导入管线综合分析平台,利用智能寻址技术,使桥管卡的地址数据在平台上找到其位置,对这些数据进行关联分析,见图8。
图8 桥管水系关联性分析截屏
让空间河流线层与管线线层进行叠加,形成的交叉点,给以适度的缓冲区,形成“桥管”(需排除地下穿越管),并与桥管卡数据进行空间地址关联,三项数据叠加的,为已有桥管数据,接下来就是分析未叠加的数据,或者河流数据的问题,或者就找到了以前未登记的桥管数据,一般这项关联性工作一天就可完成,接下来的重点就是去现场核实了,这要比管线普查省时省力多了。虽然桥管寻找只是较简单的关联分析功能应用,却使我们绕开了原来的路径,用几天的时间换取几个月的时间,寻找到快速可以解决问题的技术手段。今后我们唯一要做的就是,经常更新水系数据库,并要求桥管地址按地址规范输入,然后就让信息系统自己去做。
我们对“智能寻址”功能结合在输配基础管理的应用进行了初步应用,效果主要有:通过利用智能寻址的基本功能,使输配部内部几个非地理信息系统的地址输入,实现数据空间定位可视化、可存储的目标,我们能够预见随着系统的完善和应用的深入,企业内各个系统的数据都有空间定位时,各个系统的集成必然成为可能,“信息孤岛”的现象会逐渐消失,许多横亘在燃气管理前的难题会迎刃而解,因此该课题作出了有益的尝试。
智能寻址在不同场合的运用,快速解决了一些管理中平时需要化较大物力人力才能解决的事情,使一些部门和站点产生了兴趣,他们会提出更多的需求,反过来对智能寻址提出了更高的要求,促进了智能寻址模块的完善,并进一步促进了数据挖掘效率高。
在智能寻址功能的初步实现中,仍存在有地址格式不符合规范,即使有较大的辨识能力,也未能准确定位的现象,有待改进,但已经实现的功能为我们今后各项应用提供了可能性,展望如下:
(1)使管线巡检作业样板自动化成为可能,为管线完整性管理打下基础,作为智能寻址的反向应用,对已绘制的管线可以自动就近注入空间地址,解决了管线属性中输入地址的难题,使空间区域内的样板数据更趋于实际情况,而不是以前人工输入路格路段,费时费力,由此网格化管理中的数据处理更高效,也为今后压力管道年度检测与作业样板实现关联提供可能。
(2)使统计区域内影响客户数又多了一条途径,营业所客户数据库是一个拥有大量空间地址的数据库,用智能寻址将其批量处理,可以快速得到用户的平面分布,将其与楼宇实体或建筑物实体关联起来,再将楼宇与管线拓扑勾联起来,可以得到抢修决策中需要的影响用户数。跨越了以前设想的对百万客户数据中的地址数据一一与燃气立管进行对接的不可能实现之鸿沟。
(3)使空间分析平台成为一个智能体,实时捕获各个数据库输入的数据,按一定规则获取敏感数据,例如,停通气的时间和地址与管线应急抢修时输入的地址就构成敏感性分析,提醒抢修决策人员注意作业的次序;当我们在燃气输气管上预设敏感空间的规则后,一旦抢修地址中含有敏感空间地址的话,空间分析服务平台就会提醒,提醒抢修决策人员注意停通气的时间,希望系统也有自学习的功能,不断遇到问题,不断学习规则。
以上只是对智能寻址如何应用于燃气输配管理并提高效率,提出了自己的想法和采取的一些行动,在实践中取得了一些效果,由于刚开始起步,还有许多应用尚不成熟,需要在后续的实践中逐步完善和提高。相信随着燃气地理信息系统的升级改造,新的管理引擎必然会出现,那时智能寻址将大有用武之地,真正迎来智慧管网的时代。
Application of Intelligent Addressing Technology to Improve the Efficiency of Basic Data Mining in Gas Transmission and Distribution
Shanghai Dazhong Gas Co., Ltd. Yin Keming
Relying on the model which is different from the existing gas basic datum management, focusing onhow to eliminate the "information island" in the information construction, this paper uses "intelligent addressing" as a bridge, achieves spatial integration for the datum existing in the different application system.Through data mining,relevance can be found in large amounts of datum,and ultimately the efficiency of decision-making will be improved.The future prospect of gas information management is prospected in the end.
intelligent addressing, gas pipeline integrity management, gas geographic information system(GIS)