面向智慧油田的工业物联网语义集成技术研究

2016-11-15 11:34刘阳曾鹏于海斌
中兴通讯技术 2016年5期
关键词:信息检索数据分析

刘阳 曾鹏 于海斌

摘要:认为工业物联网技术在油田生产信息的实时获取和即时分析等方面具有重要作用。建议引入语义技术,构建覆盖油田勘探、开发、生产、运营等全流程的语义集成平台,实现对智慧油田的实时分析,为油田生产运行参数实时优化调整提供支持。此外,还详细介绍了工业物联网语义集成平台的架构及关键技术,指出其将是未来智慧油田信息集成的重要发展方向。

关键词:智慧油田;语义技术;工业物联网;信息检索;数据优化;数据分析

Abstract: Industrial Internet of things plays an important role in real time getting and analysis of the production information for the oil filed. By inducing the semantic technology, a semantic-based integrated platform can be built, including exploring, developing, producing and operating of the oil field. In this way, real time analytics of the smart oil field and real time optimization of the production parameters can be realized. Moreover, the framework and key technologies for industrial Internet of things semantic integration are detailed, and an important developing direction for information integration of the smart oil field is provided.

Key words: smart oil field; semantic technology; industrial Internet of things; information retrieval; data analysis; data optimization

工业物联网可以实现对工业生产制造全流程的泛在感知与控制,已经成为企业降低人工成本,减少生产消耗,保证设备可靠性,提高产品质量,以及增强核心竞争力的主要手段。

智慧油田是工业物联网技术在油田领域的延伸与应用,其在数字油田的信息化和互联化等基础上,进一步实现了信息管理的物联化以及智能化。

进入高含水后期开采阶段后,中国油田产液量大幅度上升,面临着液油比急剧增高,地面工程难以适应,维持油田稳产的措施工作量和费用明显增加等诸多困难。因此,中国智慧油田的目标是依据油井工况、地下油藏变化及国际油价形势实时修正注采井作业参数,优化调整采油过程,实现节能运行,提升油田采收率与经济效益。

智慧油田的发展需要依托工业物联网对油田生产信息全面控制,对覆盖油田勘探、开发、生产、运营及外部环境因素等全流程的各类信息系统进行集成,并统一分析与反馈,形成闭环式智慧油田运行模式,如图1所示。

当前,各类油田信息系统中的数据以不同形式存储。而语义作为数据含义和关联关系的表征技术,可实现对异构系统中数据的统一理解及深层关联的建立。因此,基于工业物联网的智慧油田数据语义集成具有广阔的研究前景。

1 语义集成架构

1.1 语义集成概念

语义集成,又称为语义互操作,强调在一定语义下实现信息的互操作。文献[1]提出了一种语义集成的定义:系统之间能够消除来自于不同信息源的语义异构,从而实现信息的共享与集成的机制。从语义集成的定义可知语义集成具有以下3个特点:(1)信息源多样性,互操作的信息可能会来自于两个或以上的信息源;(2)系统之间可以相互理解来自对方信息的含义;(3)系统之间可以共享和交换信息。语义集成的关键在于系统之间可以理解信息的含义。而信息源之间产生的异构可以分为语法异构(数据格式不同),结构异构(不同的信息源存储数据的结构不同),以及语义异构(同一概念在不同系统中有不同的语义,不同的概念在不同的系统中有相同的语义)。采用XML和Web Service可以很好的解决语法异构和结构异构的问题,至于语义异构的问题则可以通过本体来解决[2]。

本体是一个领域中概念显示的形式化规约。本体主要是由类、属性、实例以及公理组成[3],为不同实体之间信息的共享、重用和交互提供共同的理解。本体部署有3种不同的结构方法:单本体结构、多本体结构和混合本体结构[4]。单本体结构方法只使用一个全局本体提供可共享的词汇表。不同来源的信息源都使用这个共同的全局本体获得信息的语义描述,从而解决了不同信息源语义异构的问题,实现了不同系统之间的语义集成。利用该本体结构的一个比较显著的实例是多源单接口(SIMS)[5],SIMS模型采用一个分层的术语知识库,用节点表示对象、动作和状态。但是单本体结构在使用时有很大的局限性,由于要使用同一个全局本体,这些信息源要提供相似领域的信息,并且不适合信息源动态变化的情况;多本体结构中,每个信息源的语义都是由自己本地的局部本体描述的,这些局部本体之间不一定共享相同的词汇表,信息源之间的语义异构是通过不同局部本体的映射解决的。如OBSERVER系统就是由多个局部本体描述系统内不同信息源的语义。对于多本体结构而言,本体间的映射是一项很繁琐的工作,尤其是在不同局部本体之间语义异构很严重的情况下。针对语义集成中单本体结构和多本体结构方法存在的缺点,又提出了混合本体结构的方法。与多本体结构相类似,混合本体结构中每个信息源的语义信息都是由他们局部本体描述的,为解决不同本体间语义异构的问题,混合本体结构又在局部本体上层构建了全局共享词汇表,共享词汇表也可以是一个本体[6]。

1.2 面向智慧油田的语义集成架构

随着智慧油田的发展,油田开发的数据资源越来越丰富,已经成为一个巨大的信息仓库,各不同系统内数据具有半结构性、异构性以及分布性等特点,需要将数据提供统一的模式进行集成管理。为此,本文提出了面向智慧油田的语义集成的3层架构,如图2所示。

现场数据采集层是智慧油田中数据的来源,其综合考虑了国际油价、开采成本等外部因素,以及油藏结构、测井数据、注采工况等物理因素的影响。采集的数据包括了实时数据以及历史数据,数据类型上有文件数据以及关系型数据等。现场数据采集层是该架构的基础,为语义集成提供了数据源。

语义集成层是实现智慧油田的关键技术,主要包括数据语义转换、语义关联检索引擎以及油田领域知识库这3个部分。其中,数据语义转换需要对异构的油田全流程信息进行统一语义建模,对数据的统一使用模式提供支持;语义关联检索引擎实现对具有关联关系的油田各系统数据进行统一检索功能,降低数据集成难度;油田领域知识库对油田既有工艺流程、设备关联、分析关系进行形式化描述,为语义关联检索以及后续应用提供支持。

应用层实现对覆盖油田勘探生产分析全流程的跨层跨域信息的综合应用。

2 智慧油田语义集成关键

技术

2.1 异构数据语义建模

目前,针对物联网数据描述的语义模型主要有开放地理空间联盟(OGC)提出的SensorML、万维网联盟(W3C)提出的传感器网络接入(SWE)[7]体系,又以SWE的应用范围最广泛。SWE对传感Web的语义描述仅包含时间、空间和主题3大类要素,其中主题涵盖范围较模糊,而对于工艺流程明确的工业生产全过程,对主题进行更明确的划分将有利于对数据的精准提取与使用。因此,可通过工业数据流使用模式与习惯的分析,结合热点挖掘技术,提取出互联生产元数据关键因素,具体包括时间、地点、使用者、操作对象、功能、操作类型以及操作描述(映射为when、where、who、which、what、how、do what)等7大类因素,实现全局生产异构元数据的语义封装。

2.2 油田领域知识库

针对油田数据海量、异构以及元数据信息语义不一致问题,在语义建模基础上,需要解决各系统信息语义歧义的问题。通过对工业处理过程的抽象,构建层次化语义本体库,构建异构数据与生产设备之间的时空与业务联系,并针对领域构建基于模型与经验的领域知识库,实现全局信息的共享与推理功能。

(1)层次化语义本体库

层次化语义本体库采用手工、半自动和自动的方法进行,可以根据具体情况有所裁剪,层次化语义本体库的架构如图3所示。

其中,顶层是跨领域词汇表,作为各领域表达基准表;域层为语义域本体,在工业领域按照终端使用模式进行配置;设备层是面向应用的核心本体库,包括向上与应用的关联和向下与语义描述的映射;语义模型为语义描述标准化框架;消歧本体库则用以完成各层次各实体的语义歧义消除工作。

(2)领域知识库

领域知识库主要实现各工业装备领域内模式知识与经验知识基于本体的形式化表示。以油田油井注采状态的计算模型为例,其注采知识库主要包括基于功图的单井产量计算模型、动液面计算模型、产液量计算模型、泵效计算模型、平衡度计算模型等,经验知识方面主要包括油藏地质状态判断知识库。通过对全局中各不同领域知识库的建立,基于层次化本体实现生产全流程全局优化的推理能力。

2.3 时空数据流关联检索

典型工业应用场景主要面向生产过程控制与分析人员,当出现特定生产场景时,需要综合各系统内相关信息作出相应反馈。以油田抽油井优化方案制定为例,当前的油田油井方案制定工程师需要分别到不同系统中手动调取油藏地质文件数据、数值模拟数据、单井小层数据以及单井实时动液面、示功图等信息,效率低下。因此,针对这类典型的具有业务关联的使用流程,需要开展面向关联的快速数据检索技术的研究。对于工业生产过程,主要表现为针对由于时空关系导致的具有上下游业务流程因果关系的关联,通过关联检索的实现,解决高效获取相关数据信息的问题。

关联模型的构建需要综合时间与空间视角。如图4所示,在时空转换关系中,传感器可作为连接两个空间的桥梁,通过构建基于传感器连接点的层次划分来实现两个空间之间的关联。

在图4中,对应用系统在时间、空间以及功能域上逐级划分形成语义关联索引树,通过生产过程信息汇聚节点的连接实现时空联合检索,并以元数据能力发布作为检索入口,实现时空关联检索。以油田注采互联生产过程为例,通过建立油田应用实体多层次本体命名体系来显式标明时空与应用的关联,包括空间检索命名、时间检索命名和应用检索命名体系等,继而提供了数据的查询与管理机制。

基于时空语义检索树的语义检索过程如图5所示。

数据的语义检索,需要首先对检索请求进行解析,可支持Web本体语言(OWL)、词网(WN)和Web服务建模本体(WSMO)解析,形成检索解析结果,与时空关联索引树进行匹配,最终从标准化的语义数据中进行检索并返回检索结果。以油田注采装备检索为例,当作业井中某节点压力值发生突变后,可以通过时空关联检索对相同/临近作业区块同期抽油井、注水井的相关压力、温度等信息进行关联检索分析,进而为判断当前作业井压力突变的原因分析提供依据和解决方案支持。

3 展望

当前,中国相继推出了“工业化信息化两化融合”、“中国制造2025”等一系列顶层设计方案,工业物联网的发展日益成为人们关注的焦点。同时智慧油田概念的提出将数字油田逐渐向智慧化、高效化的开发中转变。在工业物联网发展的基础上,通过语义技术,将跨层跨域的数据集成变成了可能,而将语义集成技术广泛应用在智慧油田的建设与推进中,又能够进一步促进油田的数据信息利用更加高效、更加合理。因此,对基于工业物联网的智慧油田语义集成技术体系进行更加全面与深入的研究,将促进油田生产运行新模式的实现与发展。

参考文献

[1] TERRASA A N. Semantic Integration of Thematic Geographic Information in a Multimedia Context[D]. Barcelona: Pompeu Fabra University, 2006

[2] ZHOU J, YANG H, WANG M, et al. A Survey of Semantic Enterprise Information Integration[C]// International Conference on Information Sciences and Interaction Sciences. USA, IEEE:234-239, 2010. DOI:10.1109/ICICIS.2010.5534744

[3] GRUNINGER M, USCHOLD M. Ontologies: Principles, Methods and Applications[J]. Knowledge Engineering Review, 1996, 11(2):93-136. DOI:http://dx.doi.org/10.1017/S0269888900007797

[4] WACHE H, VISSER U, STUCKENSCHMIDT H, et al. Ontology-Based Integration of Information-A Survey of Existing Approaches[C]// Ijcai01 Workshop on Ontologies & Information Sharing, USA, IJCAI: 108-117, 2001

[5] ARENS Y, HSU C N, KNOBLOCK C A. Query Processing in the SIMS Information Mediator[M]// Tate A Advanced Planning Technology Aaai Press Menlo Park Ca, 1997: 82-90

[6] STUCKENSCHMIDT H, WACHE H, VISSER U, et al. Enabling Technologies for Interoperability[C]// Information Sharing: Methods and Applications at the 14th International Symposium of Computer Science for Environmental Protection, Bonn, TZI: 35-46, 2000

[7] SHETH A, HENSON C. Semantic Sensor Web[J]. IEEE Internet Computing. 2008, 12(4):78-83. DOI:10.1109/MIC.2008.87

猜你喜欢
信息检索数据分析
浅析开源情报信息检索与信息鉴别
对大学案理研讨课学生信息检索意识若干问题的思考
医学信息检索与利用的探讨
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于读者到馆行为数据分析的高校图书馆服务优化建议
空难事故跨媒体信息采集与检索方法的研究
中外档案网站信息检索功能比较研究