尚福华 薛诚 曹茂俊
摘要:为提高测井处理解释软件的智能性,如何以一种显示的、形式化的方式来表示测井领域知识是面临的一个重要问题。在研究测井处理解释业务流程的基础上引入本体的概念,将领域本体与测井处理解释的具体应用需求相结合提出了一种基于业务流程的领域本体构建方法,实现了测井处理解释领域本体的构建,解决了传统知识表示方法难以适应大规模信息的处理和表示的问题。该方法使知识与测井处理解释流程紧密关联,更加高效的满足应用需求。以地层评价业务流程为例,详细介绍了领域本体的构建过程。
关键词:测井处理解释,领域本体,业务流程,知识表示
中图分类号:TP18
文献标识码:A
1 引言
随着计算机技术的飞速发展,测井处理与解释软件已经成为测井资料储层评价工作中不可缺少的重要工具,同时勘探开发的油气藏越来越复杂,对测井及资料处理解释的要求也越来越高,地下储集层的隐蔽性与非均质性,造成测井解释对地下地质特性的分析与还原能力,很大程度上取决于测井分析专家的经验、技能与判断力,然而,具有这种经验的专家要花很长的时间才能形成,且形成之后往往有流失的可能,所以测井资料处理与解释自动化及智能化是当前测井解释领域追求的目标之一。目前,国内外测井软件如CIFLog、TechLog和GeoLog已经在知识库方面进行了思考和工作的开展[1-2],但是面临的一个主要的问题是如何对测井处理解释领域庞大的知识进行表示,以便能够在知识库中快速获取目标知识。传统的知识表示方法[3]如产生式表示法无法呈现完整的知识,只能用单一的规则描述部分的知识,但是在测井解释过程中不仅要有推理逻辑,还要进行许多算术运算,纯粹的产生式表示法无法满足要求。知识库的发展面临的重要问题是如何让计算机能理解和处理知识,解决这个问题的难点是建立怎样的模型来描述知识,实现领域知识的共享与重用[4]。
本体(Ontology)是共享概念模型的明确确的形式化规范说明,定义了组成主题领域的基本术语和关系等。诞生以来就在信息科学领域受到广泛的关注,其重要性也在许多方面表现出来,其应用研究已经延伸到多个领域,如知识工程、自然语言处理、软件工程领域。国内对本体论的研究,主要有信息检索[5]、常识知识库等方面。国外较为成熟的通用本体库系统有WordNet,Dbpedia,Cyc,以及生物医学领域本体、企业领域本体,国内比较著名的通用本体库系统是HowNetc6]、浙江大学人工智能研究所基于本体论的产品信息集成研究等[7]。由于在测井解释过程中不仅需要进行知识的推理还要进行很多算术运算,领域本体在该领域中的应用很好的满足了要求,同时实现了测井领域知识的重用,以及测井领域信息知识内容的集成、挖掘和关联。
本文研究了测井处理解释业务流程,提出了基于业务流程的测井处理解释领域本体构建方法,实现了测井领域本体的构建。并以地层评价为例,阐述了其在构建领域本体中的具体应用。
2 测井处理解释领域本体概述
2.1 本体概述
本体最为广泛接受的概念是:本体是对共同的概念进行规范化的说明[8,9]。本体的表示方式有很多种,其中最常见的表示形式是一个五元组的集合O=(C,R,σ,A,I)。其中:C为概念集合,也称为类的集合。R是领域中概念之间的关系。σ表示函数。A表示公理,用来说明函数之间或关系之间存在的关联和约束。I是指实例,即概念中的具体例子。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。
本体可以划分为顶层本体、领域本体和应用本体,其中顶层本体描述的是通用的概念即概念之间的关系,比如时间,空间等;领域本体描述的是特定领域如测井处理解释领域的概念和概念间的关系;应用本体描述的是依赖于特定领域和任务的概念和概念间关系。本文在测井处理解释系统中引入本体,通过对测井处理解释流程的具体分析,构建面向测井处理解释的领域本体,实现了知识的重用和逻辑推理,提高了測井处理解释软件的智能性。
2.2 测井处理解释概述
测井数据处理与综合解释,就是按照预定的地质任务,用计算机对测井资料进行自动处理,并综合地质、录井和开发资料进行综合分析解释,以解决地层划分、油气储集层和有用矿藏的评价及其勘探开发中的其它地质与工程技术问题[10]。
测井处理解释领域本体,就是通过引入本体和描述逻辑对测井处理解释领域的知识进行形式化和规范化的描述。通过在测井处理解释软件框架的支持层中引入测井处理解释领域本体,实现在领域本体中定义测井领域基础信息本体概念如:骨架密度、压实系数、孔隙度和渗透率等,同时还要从概念中抽取关系。领域本体为解决语义异构问题提供了解决方法,不同测井处理解释领域实体通过领域本体实现了语义共享。所以将本体与测井处理解释领域相结合,明确领域概念及其之间的关系,实现了测井处理解释领域的集成和共享。
3 测井处理解释领域本体构建
目前比较流行的领域本体构建方法有:“骨架法”、“评估法”、“Bernaras”、“Methontology”、“Sen-sus”以及斯坦福大学的“七步法”[11-15],比较这些本体构建方法,它们的特点如下[16].
1)本体构建大致可划分为阶段法(如骨架法)和原型演化法(如Methontology浅}等;
2)在构建过程中可分为“非形式化描述本体”和用正规描述语言“形式化描述本体”前后两个阶段;
3)希望通过累积的方法来构建本体,即先构建一个基础本体,然后做进一步开发。
但是目前的本体构建方法还未能像软件工程那样形成一种统一的、标准的、通用的本体方法论。本文的研究是在骨架法以及“七步法”的基础上,结合测井处理解释业务流程提出一套基于业务流程领域的本体构建方法。该方法的核心是:将领域本体的构建与业务需求紧密的联系起来,以具体的测井处理解释业务为起点,并且贯穿于本体构建的全部过程,这样易于知识的获取和本体功能的描述。本体的概念以及关系的抽取是一个不断循环迭代的过程,先以应用需求抽取规则,然后辅助完善领域本体,直至本体趋于完善。同时结合传统方法采用从上到下的方式,首先构建顶层本体,然后是领域本体,后是应用本体,通过这一系列过程构建的领域本体在满足应用需求的前提下,还具有一定的通用性、完整性和共享性。
3.1 测井处理解释领域本体构建框架
随着人工智能等技术的发展,测井处理解释也逐渐向着自动化和智能化转变,利用本体方法可以构建测井处理解释领域的知识脉络,能更好地继承共享已有的知识。结合测井处理解释业务流程提出基于业务流程的领域本体构建方法,具体过程如图1所示:
1)明确所属领域及应用范围:为后续构建过程的明确方向。领域本体构建的目的是把领域的概念、属性和规则等形式化的表达出来,为知识的共享和推理提供基础。
2)需求分析:从业务功能需求方面入手使本体与应用紧密结合。采用软件工程方法,细化业务需求,形成详细的说明文档以便后续应用。例如单孔隙度测井泥沙岩分析,需要首先对该过程进行详细的说明,如:期望输出的结果和涉及到的领域信息如参数、公式等。
信息收集:包含两个部分,一是对输入的文档进行先期处理(如断句,分词等),二是要考虑本体的复用,即对已有领域本体的使用,可以省去元本体和顶层本体的建立,专注于领域本体的构建。
3)概念、属性抽取:主要功能是从输入文本中提取那些和目标领域高度相关的概念。概念的抽取主要分为两部分:一是从第一步确定的领域范围内的相关词典和相关文献中直接抽取;二是结合建立的业务流程模型,根据具体业务步骤抽取每一步骤中涉及到的术语。这样得到的本体概念更加完整,覆盖度高。
4)关系抽取:包括层次关系抽取和非层次关系抽取。关系抽取的核心在于怎样选择和提取关系特征[17],为解决该问题从业务流程入手,分析每一步骤涉及到的概念,从中抽取本體概念关系。从语义上来说概念之间的基本关系有整体一部分关系、分类关系、实例与概念关系和属性关系,但是实际建模过程中并不止这四种,可以根据领域的具体情况来定义。
5)本体的形式化:采用OWL DL语言,在保证描述能力的同时也兼顾了推理能力。构建领域本体文档,可以对后续的领域本体优化奠定基础。
6)本体评价和本体应用:对形成的本体进行一致性,完整性等的评价,然后针对某一具体业务,进行初始领域本体的试运行,来验证是否满足业务需求,若符合则可以投入实际应用,否则根据试运行结果进行更改。
3.2 测井处理解释领域本体构建
地层评价是一种复杂的、运用多学科知识和实践经验对地层进行综合分析的过程,涉及到大量的数值运算及复杂的推理,是测井资料处理与解释过程中最为重要和关键的一个环节。下面以地层评价为例说明测井领域本体的构建过程。使用protege
4.3 作为构建工具,OWL DL为构建语言。
1)明确所属领域以及需求分析
(1)本体构建目标:解决测井处理解释领域的知识表示的不足,使系统更好的辅助操作人员进行综合分析以及演绎推理最后做出决策得到地层评价结果。
(2)应用需求分析:首先构建地层评价的整体知识模型,然后对每一阶段进行具体分析形成详细的功能说明以及所涉及到的概念说明。例如在划分储集层时的岩性识别过程,在淡水泥浆的井内可以根据自然电位曲线、微电极曲线、声波时差曲线和电阻率来划分,首先如果SP有明显负异常微电极有正幅度差,则为砂岩或者生物灰岩;如果声波时差高则为砂岩其次为生物岩。在这个过程中明确了业务需要的信息,为后续的构建提供了基础。地层评价的知识模型如图2所示。
为了保证领域本体的完整性,信息收集要从多方面进行。本领域的基本信息主要来自两方面:一是测井基础信息数据库,二是本领域行业规范相关词典,如《测井原始资料质量要求》、《测井解释报告编写规范》和《裸眼井单井测井数据处理流程》等。
2)概念、属性的抽取
概念的抽取主要采用两种方式,一种是根据建立好的业务流程框架从上到下顺序抽取,逐步细化。在概念的抽取过程中要紧密的结合测井处理解释的具体业务流程,如在进行储集层评价时,非储集层判别过程中,需要根据不同测井曲线在不同岩性中表现出来的不同测井特征来划分岩性,测井曲线是属于测井信息。首先需要建立测井曲线的概念本体,例如:自然电位曲线(SP)、自然伽马曲线(GR)和微电极曲线(MD,而测井曲线是由各种不同的测井方法生成的,所以需要抽取测井方法的概念本体,自然电位测井、微电极测井、中子伽马测井等,同时还需要构建岩性本体例如泥岩、煤、砂岩等。
另一种是采用搜索的方法,对所收集的信息进行搜索包括基础信息数据库、文档等,来获得需要定义的概念。如:对“处理参数”进行搜索,可以查到的结果可能有“AMN”、“骨架密度”、“GRmin”、“GRmax”、“压实系数”等,这些结果可以作为本体中的概念进行直接定义。在定义这些概念后,需要根据具体情况进行分析,区分概念和属性,调整类的层次结构。得到的概念模型包括,参数、模型和图版,其中参数包括孔隙度、渗透率、饱和度、沉积特征等;模型有李宁通解方程、双水模型、Archie公式等;图版有标准解释图版和地区解释图版等。
这样抽取出来的概念能够最大程度的确保覆盖率,同时还能为后续的本体的应用建立良好的基础。
3)关系的定义
关系是领域中概念之间的交互作用,由于在类中所涉及到的属性及关系较多,会形成一个层次关系,这种层次关系反映了属性的类别知识,我们采用属性本体结构以及聚类属性的方式来表示这种属性关系间的分类关系。POR分析程序是单孔隙度测井泥质砂岩地层评价的一种常用方法,以此为例说明关系的抽取。
根据抽取的概念,以及需求分析中得到的结果,进一步明确各类之间的关系。例如测井曲线与测井信息之间存在着is-part-of的关系,测井方法与测井曲线之间存在着generate(关系),模型和处理参数之间存在着calculate(计算)的关系,等等。在关系的定义过程中,业务的流程有着十分重要的作用,例如在POR分析程序中计算地层泥质含量时采用的公式为
由此可得到处理参数与储层参数的关系,储层参数有处理弹数经计算分析得到。同样经过对地层孔隙度计算和含水饱和度计算流程的分析,同样能得到更加细化的关系。又如岩性的划分需要根据测井曲线的响应特征,所以岩性与测井曲线之间存在着divide(划分岩性)。部分关系定义如表1所示。
4)本体形式化
采用OWL DL对本体进行形式化的描述,根据测井处理解释领域本体设计的基本原则,在对类进行描述时主要包括类(categories),表示专业领域中的归属集体,每一个类中都有相应的个体(indi-viduals)及实例Gnstances)。类间的基本关系是继承Gnheritances)和为了描述类及类的个体及实例,我们使用属性(attribute)及关系(relationship)的描述符,并对属性及关系的值进行限制
5)本体评价
对构建完的本体进行评价,评价通过后应用本体。对本体的评价采用基于特定应用的本体评价策略,即基于测井处理解释业务的本体评价,其基本思想是直接将构建的本体用于解决实际问题中去检验本体的质量,即在底层评价过程中实际检验本体,这种评价策略虽然无法完全保证本体的质量,但是简单、直观。
经过如上的操作,得到构建的测井处理解释领域初始本体,如图3展示的是部分与地层评价相关的领域本体。
4 结论
结合传统本体构建方法提出了适合测井处理解释领域的基于业务流程领域本体构建方法,并且初步构建了测井处理解释本体,很好的解决了知识重用性差以及逻辑推理困难的问题。在本体在测井领域的应用进行了初步的探索,同时为后续的研究工作打下了基础。测井处理解释领域本体库的构建是一个十分庞大的工程,涉及到各学科如人工智能、石油、地质等,并不是一蹴而就的而是一个十分复杂的过程。领域本体的构建与应用又是其中最有广阔发展前景的方面,本文对测井处理解释领域本体的研究和应用,希望对相关领域的同行有所借鉴。
参考文献
[1] Li Ning,WANC Ming-chao,CUI Jian,et al.CifNet networkmulti-well data managenent system [J]. Applied Ceophysics,2004,1(2):129-131.
[2]尚福华,原野,王才志,等.基于知识库的解释模型智能优选的测井数据处理方法[J].石油学报,2015,36 (11):1449-1454.
[3] 尚福华,李想,巩淼.基于模糊框架一产生式知识表示及推理研究[J].计算机技术与发展,2014,24(7):38-42.
[4]魏春良.本体的构建方法与应用研究[D].成都:电子科技大学,2011
[5]邓志鸿,唐世渭,杨冬青.基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究[J].计算机工程,2002, 28(6):37-38
[6]杨月华,杜军平,平源.基于本體的智能检索系统[J].软件学报,2015,26 (7) ,1677-1680
[7] CUO Ming,U Shan-ping,DONC Jin-xiang, et al.Ontology-based product data integration. In: Proc of the 17th Intrl Confon Ad -vanced Information Networking and Applications(AINA) .Xi'an, China:IEEE Coruputer Soc-ety, 2003.530-533
[8] CRUBE T R.Ontolingua:A Transla-tion Approach to Potahle On-tology Specifi cation [J]. Knowledge Acquisition,1993,5 (2): 199-200
[9]
STUDER R,BENJAMINS R,FENSEL D.Knowledge engineering:principles and methods [J]. Data&knowledge engineering,1998,25(1):161-197
[10]常蕾.华庆油田测井技术系列评价及应用研究[D].西安,西安石油大学,2011
[11] USCHOLD M,KINC M.Towards a methodology for building on-tologies ECl.Proceedings of the Workshop on Basic OntologicalIssues in Knowledge Sharing, Intemational Joint Conference onArtificial Intelligence (IJCAI-95) ,1995.
[12] CRUNINCER M, FOX M S.Methodology for the design and e-valuation of ontologies ECl. Workshop on Basic Ontological Is-sues in Knowledge Sharing, (IJCAI-95) .1995
[13] BERNARAS A,LARESCOITI I,CORERA J."Build- ing andreusing ontologies forelectrical network applications" [C].Pro-ceedings of the European Conference on Artiicial Intelligence(ECAI'96).1996.
[14] GRUNINCER M,FOX M S.Methodology for the design and e-valuation of ontologies [C]. Workshop on Basic Ontological Is-sues in Knowledge Sharing,( UCAI-95) ,1995.
[15] KNICHT K,LUK S K.Building A Large-scale Knowledge Basefor Machine rrranslation [C].American Association of ArtificialIntelligence Conference (AAAI-94) ,1994.
[16]蔡皎洁,张玉峰,基于软件工程开发的领域本体构建研究[J].现代情报,2012,32 (8):37-40
[17]甘丽新,万常选,刘德喜等.基于句法语义特征的中文实体关系抽取啪.计算机研究与发展.2016,53 (2):284-302.