李媛媛, 陈长胜
( 中国石化石油勘探开发研究院 信息资料中心,北京 100083 )
基于井位部署业务的勘探开发领域业务过程本体构建
李媛媛, 陈长胜
( 中国石化石油勘探开发研究院 信息资料中心,北京100083 )
为解决勘探开发领域知识提取和共享问题,以井位部署业务为例,将过程本体思想引入勘探开发领域,形成勘探开发领域过程本体及其框架;借鉴过程本体在其他领域的构建方法,利用勘探开发领域的业务模型形成的统一标准的数据资源,提出勘探开发领域的业务过程本体的构建方法。该结果对勘探开发领域知识库和勘探开发决策支持系统建设有一定的借鉴作用。
领域本体; 过程本体; 业务模型; 业务流程; 井位部署; 勘探开发领域
随着油气勘探开发信息化的发展,造成勘探开发领域的各种数据、公式、图表和文件等信息散落于各处,重复利用这些信息、有效提取相关的知识元和构建石油勘探开发知识服务是石油行业信息化的难题。本体(Ontology)作为一种能在语义和知识层次上描述概念模型的建模工具[1],以一种相对复杂的组织形式首先应用于人工智能领域,随后在各领域的信息系统建设中发挥其语义表达明确、共享程度高及本体复用率高的特点[2]。在勘探开发领域也开始引入本体的概念,以解决行业的知识提取和知识共享问题。
李国和等[3]提出使用三元组表示法构建海相油气概念本体知识,认为每个陈述都可以分解为主语、谓语和宾语[4],根据由概念和语义关系构成的有向无环图表征知识及其语义间的关系[5],在构建文本分词词条库和关联关系词库的基础上,进一步完成文本预处理、文本分词、概念本体知识存储及归一化处理,为用户提供概念本体的知识检索和共享服务。邓小亚[6]结合勘探开发业务模型,在业务活动领域划分的基础上建立业务活动的本体模型[7],构建勘探开发领域的本体库。根据勘探开发业务及其领域信息集成的特点,文必龙[8]等提出围绕勘探开发领域现有专业数据库、应用软件等和勘探开发核心业务模型[9]的业务需求,建立分层级的包括本体对象、特性和业务过程为主体的勘探开发领域的领域本体框架[10],以业务模型和数据模型为参照体系[11],实现基于业务模型和数据模型的领域概念的自动抽取。概念本体更适合描述静态的、公理性的定义和概念等知识,而勘探开发业务是由若干个业务领域下的业务活动构成的,因此概念本体不能全面地描述勘探开发领域内的知识。
笔者引入过程本体概念,根据勘探开发领域业务流程、业务活动驱动特点,将过程本体和领域本体结合,以石油行业制定的石油天然气业务分类模型标准为基础,采用分层级的过程本体定义方式,以现有行业的专业数据库、软件、应用系统为依托,以井位部署为例,提出勘探开发领域本体的构建方法。
本体是概念化的、明确的和规范化的说明[7]。知识的表示通常包括静态的事物和动态的过程或者行为,概念本体更加偏重于描述知识的静态面。过程本体属于动态的过程或行为,可以分为事务过程本体、紧急计划过程本体和搜索服务过程本体[13]等,其共同特点是不能独立于应用领域而存在。文中将过程本体应用于勘探开发领域,从而形成领域过程本体。
采用一个四元组进行本体定义[14],过程本体作为本体的分支可以采用本体的定义,只是组员的含义发生变化,考虑勘探开发业务领域的业务过程因素,过程本体(Process Ontology,简称POntology)可用四元组表示:
POntology=
其中,pDomain为业务过程本体的集合;pEntity为过程本体的实例集合;pAttribute为过程本体的过程节点相关属性集合,包括输入项、输出项及执行者等信息;pRelationship为过程节点间的关系集合。
一个过程本体包括一系列构成过程的过程节点及每个节点的相关属性,它们是过程本体的主体,其定义采用层级结构,对于过程节点的相关属性用自然语言进行概念的描述。
中国石化石油天然气勘探开发数据模型标准SPBPM(Sinopec Petroleum Business Process Model)[14]将勘探开发业务分为6个业务域,每个业务域由若干业务流程组成,每个业务流程由若干业务活动组成,勘探开发业务由三层结构表示。每个业务域一般采用三级或四级业务流程表达。结合勘探开发实际的业务过程,一般截取业务域的二级业务流程作为勘探开发领域过程本体的业务集合,特殊情况如分析化验业务域覆盖层不大,只截取一级业务流程。
勘探开发业务领域过程本体复杂而庞大,需要构建一个适合过程本体检索使用的框架组织。将它分为三层架构:第一层为SPBPM业务模型的业务域;第二层为业务域的第一级业务流程;第三层为业务域的第二级业务流程。第三层也是作为过程本体的原子本体,原则上不可再分(见图1)。
图1 勘探开发领域业务过程本体框架Fig.1 The frameworks of progress ontology on petroleum exploration and production
以综合研究业务域[15]为例,它分为5个一级业务流程,勘探地质研究业务流程包含10个二级业务流程,因此综合研究业务域包含26个原子过程本体(见图1)。整个勘探开发领域业务过程本体包含115个原子过程本体。构建过程本体框架后,在系统的数据存储层中,过程本体框架表中增加一个Parent字段,在后期过程本体服务应用中,可以遍历原子过程本体的一层架构和二层架构,进行相关性的配合和应用。
3.1构建方法
典型的本体构建方法有骨架法、企业建模法、KACTUS、Methontology法、IDEF5法和七步法等[16]。参考七步法和过程本体构建[17]方法,确定勘探开发领域的业务本体构建步骤:
(1)确定石油勘探开发领域的过程本体需求。围绕石油行业的勘探和开发业务,构建过程本体知识,为工作人员提供知识共享和信息集成服务,需要满足业务需求和信息集成需求。业务需求主要围绕勘探、钻井、测井、录井和采油[8]等业务展开,采取先易后难的方式。信息集成需求是在勘探开发领域信息化的基础上,选取已建成使用的专业信息系统、应用系统及各种专业数据库等,作为构建过程本体的信息集成基础。
(2)选取统一的勘探开发业务模型,确定勘探开发领域过程本体的业务。以选定的勘探开发业务模型为标准,按照业务模型中的业务域划分和业务流程划分,结合勘探开发领域实际过程的特点和业务需求,确定过程本体的业务对象集合,有利于过程本体功能的描述和过程本体间关系的确定。遵循全面和少重复的原则,以SPBPM为标准确定过程本体范畴。整个过程本体采用分层级组织的方式,有利于过程本体的检索和使用。
(3)列出重要的术语。列出勘探开发领域涉及到的所有术语,并进行详细的描述和含义界定。对含义不清或语义有交叉的术语,可以考虑使用语义网的方式对定义进行补充,如对定义上位词、下位词、近义词或者反义词等进行说明。
(4)定义业务对象集合中的每一个过程本体。勘探开发领域的业务分类复杂且数据流交错,将一个过程本体分为三级过程模型进行描述:一级过程模型是一个整体的过程;二级过程模型是在一级过程模型的基础上更加细化的过程;三级过程模型是对二级过程模型中的各个节点的过程操作、数据流程和业务流程等。因此,构建勘探开发领域的过程本体模型采用自上而下逐级细化的方法,由相关业务专家完成。
(5)过程本体实例化。过程本体实例化的过程是以研究人员的业务需求作为驱动:首先,确定地质实体,地质实体包括地质单位、区带、圈闭、井和层位等。其次,确定需要的业务流程即需要实例化的过程本体。然后,以业务模型为标准,以数据流和业务流为基础,将过程本体的每个过程节点作为关键字进行检索匹配,不仅按照语义进行匹配,还包括按照业务流程的分类等级进行匹配。如一个过程节点在业务模型中属于一个业务流程,在检索时不仅将业务流程对应的地质实体的数据流和业务流作推送,而且将业务流程的子类的相关信息也作推送。最后,调整人工检索匹配的结果。
3.2构建过程
在业务模型的基础上,根据业务划分的复杂程度和业务涉及的知识粒度[18],选取二级业务作为构建过程本体的模型,因此需要构建勘探开发领域的过程本体有89个一级过程本体;按照业务操作的过程,每个过程本体加入过程节点涉及的因素和数据支撑,从业务模型分类中挑取所需的业务活动或数据完善过程本体[16]。过程本体与业务模型中的业务分类的区别在于:过程本体关注的是每个业务本体过程本身及过程中涉及的相关因素和数据,业务分类更加偏重于业务的操作范围,两者从不同的维度对勘探开发领域的业务进行描述,最终在过程本体实例化过程中相交,为勘探开发提供支持。
图2 过程节点构成Fig.2 The construction of progress node
以井位部署为例,首先列出井位部署业务涉及的所有术语[19],按照勘探开发业务领域过程本体框架对术语进行关系的整理归类,包括分类关系、所属关系和因果关系等,定义术语的上位词、下位词、近义词和反义词等,形成井位部署术语库;其次梳理井位部署业务的过程,将勘探开发领域各个专家形成的主观思想,通过过程本体的方式利用计算机语言,进行规范、清晰、系统地表达。过程本体由若干个具有先后顺序的过程节点组成,每个过程节点包括输入、输出、外部数据和组织/人员等属性构成(见图2)。过程节点之间又存在数据或者信息的输入、输出关系。根据井位部署的一级过程本体模型(见图3),以烃源岩分析过程节点为例,它包括两种类型的数据输入,一种是外部数据的输入,包括测井数据和分析化验数据;另一种是上一个过程本体节点区域地质概况的输出数据,包括沉积环境、构造特征、地层层序和开发概况等数据。烃源岩分析过程节点的输出数据可以作为下一个过程本体节点的输入,建立过程本体模型关系。
以勘探井位部署初始数据为输入,经过区域地质概况、烃源岩分析、储层评价、区域盖层确定、油气运聚关系分析、圈闭类型判断、井位布署的综合分析和研究等7个过程,包括每个过程节点的输入和输出,最终论证勘探井位部署的具体位置的正确性。
图3 井位部署业务一级过程本体模型Fig.3 The first degree model of progress ontology in well deployment business
一级过程本体中的过程节点又可以细化为二级过程本体,一般过程本体节点细化到三级后不再细化,三级过程本体是对二级过程本体中的各个节点的过程操作、数据流程和业务流程等。以一级过程本体的储层评价节点为例,构建二级过程本体(见图4)。
以储层评价二级过程本体中的储层岩性识别节点为例,构建三级过程本体(见图5)。三级过程本体作为过程本体体系中的最小模型,主要由过程操作、数据流程和业务流程组成,数据流程和业务流程由按照业务模型完成的数据提供。
井位部署的过程本体包括1个一级过程本体、7个二级过程本体和 49个三级过程本体。三级过程本体利用地质、油藏、测井、地震和实验数据等资料,将相应的数据流和业务流进行系统的整合,最后形成勘探井位部署的有机整体。
过程本体实例化的过程实质上是业务过程方法在实际中结合地质实体的应用过程,同时结合井位部署三级过程本体中每一个节点的数据输入和输出,以及过程本体的信息集成需求,尽量多地选取勘探开发专业系统和数据库的数据作为过程本体实例化的数据源。以XX区HH组的M、N井区两个地质实体[20]在井位部署过程本体的应用为例,采用自上而下的遍历方法,以井位部署一级过程本体的节点为单位,每个单位节点的输入来源于下一级过程本体的输出和输入,根据业务模型中的数据流和业务流,遍历采用智能搜索和语义相关的查找方式;然后按照一定的规则输出并由人工进行整理。通过井位部署过程本体的三个级别的过程本体模型遍历,结合井位部署术语库和领域专家知识,以勘探开发专业系统和数据为基础,得到井位部署数据的综合分析输出结果(见表1)。
经过区域地质概况、烃源岩分析及生、储、盖的综合分析,井位J570(N井区)相较于井位J555(M井区)为更加有利的勘探潜力区,适合部署新的勘探井或者调整井。因此,构建勘探开发业务领域的过程本体为勘探领域专家提供更加可靠、高效及全面的数据信息支持,进而有助于勘探开发决策。
图4 储层评价二级过程本体模型Fig.4 The second degree model of progress ontology in reservoir evaluation business
图5 储层岩性识别三级过程本体模型Fig.5 The third degree model of progress ontology in reservoir lithology identification
井区J555J570区域有效厚度/m41.9132.58孔隙度/%18.1720.36渗透率/(10-3μm2)17.48822.045含油饱和度/%58.663.8储层品质因子0.9811.041最大进汞饱和度/%90.196.4最终预测采收率/%38.5042.80烃源岩盖层岩性深色泥岩圈闭类型被断层复杂化的短轴背斜厚度/m30圈闭的形成时间1.50Maw(TOC)/%0.78盖层的形成时间1.20Maw(氯仿沥青“A”)/%0.11油气开始生成年代古新世早期距今0.86Ma岩性致密泥岩油气运聚的通道断层、断裂厚度/m13~16油气运聚的动力毛管力、地层压力、流体压力分布特征全区稳定分布综合评价生、储、盖时空搭配比较好
(1)将过程本体思想引入勘探开发业务领域,通过借鉴过程本体在其他领域的应用模式,与勘探开发业务领域的特点和信息化建设成果结合,提出该领域的过程本体的概念及过程本体的构建方法,以井位部署业务为例,给出过程本体的构建方法。
(2)以统一的业务模型为基础,构建勘探开发领域过程本体框架,保证石油勘探领域的不同单位、不同专业间的数据来源的一致性,有利于过程本体实例化过程中的数据使用效率,为勘探开发领域知识库和勘探开发决策支持系统的建设提供借鉴。
[1]Nntalya F N, Deborah L M. Ontology development 101: A guide to creating your first ontology [D]. Stanford, USA: Stanford University, 2000.
[2]李乃峰.基于石油领域本体的语义关联机制研究[D].大庆:东北石油大学,2014.
Li Naifeng. Research on mechanism of semantic association based on ontology of petroleum domain [D]. Daqing: Northeast Petroleum University, 2014.
[3]李国和,杨新颖,叶婷,等.海相油气地质的概念本体知识系统设计与实现[J].计算机应用,2010,30(2):533-535.
Li Guohe, Yang Xinying, Ye Ting, et al. Design and implementation of ontology-based knowledge base system for marine hydrocarbon geology [J]. Journal of Computer Application, 2010,30(2):533-535.
[4]唐培丽,王树明,胡明.基于语义的汉语文献主题词提取算法研究[J].吉林大学学报:信息科学版,2005,23(5):536-540.
Tang Peili, Wang Shuming, Hu Ming. Algorithm of thematic words extraction from Chinese texts based on semantic [J]. Journal of Jilin University: Information Science Edition, 2005,23(5):536-540.
[5]张德政,庄洪波.基于领域本体网络模型的知识获取技术[J].计算机工程, 2007,33(7):190-200.
Zhang Dezheng, Zhuang Hongbo. Technique of knowledge acquisition based on domain ontology network model [J]. Computer Engineering, 2007,33(7):190-200.
[6]邓小亚.石油领域本体库的构建研究[J].电子设计工程,2011,20(19):1-4.
Deng Xiaoya. Research of ontology construction theory in oilfiled [J]. Electronic Design Engineering, 2011,20(19):1-4.
[7]Peter M. Ontologies are us: A unified model of social networks and semantics [J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2007,5(1):5-15.
[8]文必龙,张莉.石油勘探开发领域本体的构建方法研究[J].计算机工程与应用,2009,45(34):1-4.
Wen Bilong, Zhang Li. Method of building petroleum exploration and production domain ontology [J]. Computer Engineering and Application, 2009,45(34):1-4.
[9]肖波,文必龙,邵庆.基于业务模型的油气勘探开发数据标准体系设计[J].东北石油大学学报,2014,38(4):86-91.
Xiao Bo, Wen Bilong, Shao Qing. Design of petroleum exploration and production data standard system based on business model [J]. Journal of Northeast Petroleum University, 2014,38(4):86-91.
[10]文必龙,肖波,陈新荣.石油勘探开发数据元管理技术[J].大庆石油学院学报,2012,36(1):83-87.
Wen Bilong, Xiao Bo, Chen Xinrong. Research on management technology of petroleum exploration and production data element [J]. Journal of Daqing Petroleum Institute, 2012,36(1):83-87.
[11]李剑锋,肖波,段鸿杰.中国石化油田企业数据中心总体框架设计[J].大庆石油学院学报,2012,36(1):73-77.
Li Jianfeng, Xiao Bo, Duan Hongjie. Design of architecture for oilfield enterprise data center in SINOPEC [J]. Journal of Daqing Petroleum Institute, 2012,36(1):73-77.
[12]陈刚,陆汝钤,金芝.基于领域知识重用的虚拟领域本体构造[J].软件学报,2003,14(3):350-355.
Chen Gang, Lu Ruyin, Jin Zhi. Constructing virtual domain ontologies based on domain knowledge reuse [J]. Journal of Software, 2003,14(3):350-355.
[13]李杰.几何过程本体的构建及其应用研究[D].成都:电子科技大学,2012:2-4.
Li Jie. The research of construction and application on geometry process ontology [D]. Chengdu: University of Electronic Science and Technology of China, 2012:2-4.
[14]徐安建,王海涛,尉伯虎,等.地理本体构建方法研究[J].测绘与空间地理信息,2013,36(7):38-40.
Xu Anjian, Wang Haitao, Yu Bohu, et al. Research on entity based geodata model [J]. Geomatics & Spatial Information Technology, 2013,36(7):38-40.
[15]于洋.基于POSC的石油勘探开发数据模型研究与设计[D].北京:中国石油大学,2009.
Yu Yang. Research and design on petroleum exploration and development data model based on POSC [D]. Beijing: China University of Petroleum, 2009.
[16]徐勇,高雅,刘艳华.农业过程本体及其构建方法——以玉米为例[J].农业网络信息:研究与开发,2009(11):9-11.
Xu Yong, Gao Ya, Liu Yanhua. Building method of agriculture process ontology: A case of corn [J]. Agriculture Network Information: Research and development, 2009(11):9-11.
[17]高鹏,林兰芬,蔡铭,等.基于本体映射的产品配置模型自动获取[J].计算机集成制造系统,2003,9(9):810-816.
Gao Peng, Lin Lanfen, Cai Ming, et al. Automatic acquisition of product configuration model based on ontology mapping [J]. Computer Integrated Manufacturing Systems, 2003,9(9):810-816.
[18]王海平.基于POSC的油田业务分析与建模方法研究[D].北京:中国石油大学,2010.
Wang Haiping. Business process modeling method study based on POSC in petroleum industry [D]. Beijing: China University of Petroleum, 2010.
[19]唐博.中国石化勘探开发业务模型及数据元模型研究与设计[D].北京:中国石油大学,2009.
Tang Bo. Research and design of SINOPEC E&P business model and data element standardization [D]. Beijing: China University of Petroleum, 2009.
[20]李洪奇,谭锋奇,许长福,等.基于决策树方法的砾岩油藏岩性识别——以克拉玛依油田六中区克下组油藏为例[J].石油天然气学报,2010,32(3):73-79.
Li Hongqi, Tan Fengqi, Xu Changfu, et al. The lithology identification of conglomerate reservoir based on decision tree: An example from the Kexia formation in the Liuzhong block of Karamay oilfield [J]. Journal of Oil and Gas Technology, 2010,32(3):73-79.
2015-11-16;编辑:任志平
国家科技支撑计划项目(2012BAH34F00)
李媛媛(1979-),女,硕士,工程师,主要从事勘探开发信息化建设方面的研究。
10.3969/j.issn.2095-4107.2016.02.008
TE11
A
2095-4107(2016)02-0064-07