油气勘探开发数据集成/交换优化探讨

2014-04-29 21:32徐金兰谭远华李中泉李文涛
中国管理信息化 2014年17期
关键词:数据集成计算机应用

徐金兰 谭远华 李中泉 李文涛

[摘 要] 数据模型的复杂化和多元化以及油田应用系统的不断增多,使油气勘探开发信息系统的数据集成/交换日趋复杂,大幅增加了建立和维护数据集成/交换关系的成本。本文从优化数据模型体系的角度探讨在现行数据模型体系下,实现异构和复杂数据模型之间数据集成/交换以及自动维护管理的思路和方法。

[关键词] 计算机应用;数据集成/交换;知识本体;语义网络;油气勘探开发

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 17. 020

[中图分类号] TP391 [文献标识码] A [文章编号] 1673 - 0194(2014)17- 0029- 05

1 前 言

石油天然气勘探开发涉及地质、地球物理、地球化学、油藏工程、钻井工程、井下作业、油田地面工程等多个专业技术领域。不同专业技术、不同管理部门、不同生产阶段的业务关联性、继承性很强,对信息的共享需求很高,通过在数据库之间建立数据集成/交换关系是信息共享的基本技术手段之一。随着油田勘探开发信息建设和应用的深化,数据模型复杂化和多元化已经成为趋势。如何在已经建成的大量信息资源及其构架其上的数十套信息系统的基础上,解决异构和复杂数据模型之间的数据集成/交换,并满足智能油田建设对信息本体结构的管理和数据的知识化管理需求?我们认为,优化数据模型体系是最主要的途径。

2 数据集成/交换现状分析

中国陆上各大油气田于20世纪90年代初开始规模化地勘探开发信息系统建设。目前,已经建成了覆盖勘探开发核心业务的完整信息体系,包括数据模型体系。该体系主导了数字油田建设的数据组织、存储和应用,并充分证明其具有的强大功能、高技术可靠性以及低成本优势。油田应用系统的增多以及油田对数据应用复杂化、数据模型多元化的趋向,使现行数据模型体系已逐渐不能适应复杂数据集成/交换的需求。现行数据库模型作为关系数据模型(Relational Data Model),是用二维表结构来表示实体及实体间联系的模型,缺少对复杂数据的表达,不能关联对象和行为,不能准确地表达和理解数据语义。因此,不直接支持向复杂数据模型投影;现行数据库模型体系是面向应用建立的,在很大程度上简化了应用系统访问数据库的过程,具有很强的实用性,但同时也影响了对业务的客观性和完整性的描述;现行数据模型由于缺乏语义功能和对业务联系的完整描述,增加了实现数据集成/交换自动维护管理及数据进行知识化管理的难度。

在现行的勘探开发信息系统中,数据集成/交换主要发生于中心数据库与各应用数据库之间(见图1),中心数据库起着数据集成/交换的枢纽作用。由于模型方法不直接支持向复杂数据模型转换/投影,缺乏对复杂数据体、多业务关联描述以及数据自动演绎管理手段等,导致通过优化中心数据库数据模型体系来改善数据集成/交换问题十分困难。

鉴于关系数据模型方法本身的缺陷难以有效解决复杂数据模型转换/投影和数据集成/交换问题,我们提出在现行数据模型体系基础上再建一个公共数据集成/交换模型,在保障基于现行数据模型体系数据资源、软件信息平台和应用系统正常运行的基础上,改善目前数据集成/交换的困难局面。

依据上述分析,我们认为该公共数据集成/交换模型应至少具备以下功能:

(1)满足不同类型数据模型之间的模型转换/投影和数据集成/交换;

(2)有利于已建成的数据库资源的利用以及基于现行数据库和软件平台的应用系统的正常运行;

(3)有利于实现复杂数据模型自动转换/投影和数据集成/交换关系的自动维护管理;

(4)支持智能油田建设对数据的复杂应用,语义查询及对数据的知识化管理等。

新疆油田勘探开发信息系统数据集成/交换体系优化示意图见图2。

3 公共数据集成/交换模型的设计与实现

依据公共数据集成/交换模型的需求,该模型包括数据元素模型自动投影语义本体模型,语义本体模型自动投影数据集成/交换元数据模型,以及源与目标数据模型语义描述等关键技术环节,并以此实现公共数据的集成/交换。

3.1 模型设计思想

3.1.1 以业务为主导

一方面,对于同一信息资源,不同业务、不同部门和管理层级的应用需求会不同,同一信息系统的应用需求也是不断变化的。另一方面,信息技术本身的快速更替和软件工程化程度低也是造成信息系统升级频次远远大于油田传统技术工程的原因,如缺乏成熟的业务分析建模和维护管理标准、流程和工具,软件开发过程的可控程度低等。相对于无穷的应用需求变化和尚难控制的软件开发工程质量,油田勘探开发业务是相对稳定的,随之产生的信息是稳定的。在大型企业的复杂信息系统建设中,只有以成熟、稳定的业务为主导建立数据模型体系,才能对业务进行客观、完整的描述,而只有符合业务流程和客观、完整描述业务的数据,才能适应不同的需求,并保障作为企业信息系统基础的数据层的稳定。因此,公共数据集成/交换模型必须是以业务为主导的模型。

3.1.2 力求业务内容全面完整

对于同一业务,管理理念、管理体系、信息建设阶段等不同,关注的范围和程度也不同。在以业务为主导的数据模型体系确定了业务类及具体业务范围的基础上,需尽可能完整描述业务,以保障需求变化的需要。现行数据模型中的部分数据集是面向应用设计的,例如:《试油(气)成果数据(AJSY01)》,完全是依照勘探管理报表将地质分层、地质实验、酸化、压裂、射孔、测井等多个不同专业的业务活动信息组合的结果,是应用数据集;再如压裂数据,仅表达了活动基本特征,未表达地层因此产生的变化和产能的变化,且勘探、开发信息系统是依据各自的需求分别设计的,使描述同一业务的数据结构、内容、名称、代码等大相径庭,没有对业务进行客观、完整的描述。

3.1.3 建立广泛的业务联系

每一个对象和活动都与相关对象、活动存在直接的或间接的相互制约和影响。这种显性或隐性的关系是对数据进行知识化管理的基本条件之一,只有广泛建立业务对象、活动、特征值之间的联系,才能实现对数据的知识化管理。现行数据模型仅限于数据结构中对主外键、参照表等最基本的逻辑关系的描述。业务活动之间,不同专业数据库之间、数据集之间,存在大量关联关系、经验、知识信息未能记录、描述和管理。

3.1.4 多维度描述业务

对同一业务活动信息,需求角度不同,组织(访问)数据的方式可能完全不同。现行数据库模型作为关系数据模型是用二维表结构来表示实体及实体间的联系,制约了对数据进行多维度的访问。公共数据集成/交换模型可借鉴POSC标准体系的6W和“对象—活动—关联—特性”思想,对业务活动内在关系从多个维度进行描述,实现多视角和更加灵活的数据组织(访问)方式。

3.1.5 最小化原则

原则上,模型体系对业务分解的越细,模型的灵活性越高,稳定性越好。如同人们认识构成物质的分子、原子及其化学和物理性质,远比只认识物质的表征性状更能掌控它一样。对于公共数据集成/交换模型,一是对业务活动描述单元的最小化,通过业务域、业务过程、业务活动、业务单元和业务要素将业务内在描述单元分解到最小单元;二是对数据元的最小化,通过业务对属性特征进行系列、集合、实体、子集定义到不可再分的最小单元,即数据元素,实现数据元的最小单元定义,为异构数据集成/交换提供语义分析基础。

综上,公共数据集成/交换模型应该是一个更加符合业务流程,而与任何管理体系无关的模型;对业务的描述更加客观、完整和规范,而不针对任何具体应用;对业务的描述是多维度的,而不拘于目前在用的模型方法(关系模型方法、面向对象模型方法等);公共数据集成/交换模型比现行数据模型(采集模型、中心数据库存储模型、应用数据模型等)对业务之间相互关系和活动状态描述得更加丰富,更具有通用性、稳定性和灵活性。

3.2 建模方法探讨

3.2.1 面向业务的业务流分析与业务建模

油气勘探开发业务种类繁多、业务流程复杂。以往设计勘探开发数据标准、制定信息规划和进行业务流程分析,没有完全以业务为主导以及缺乏模型管理环境,业务模型标准化的设计大多以流程图、Word文档的形式进行,很难开展动态管理。因此,需要建立以业务流程为主导的业务分析流程和业务建模标准规范,形成符合行业技术规范及业务特色的业务分析、建模工作流程。通过规范化的勘探开发业务分析和模型维护流程,实现业务模型的可持续管理,为勘探开发相关数据模型设计和智能系统的开发提供业务参照和模型转换依据(见图3)。

油气勘探开发业务模型是在勘探开发业务分析的基础上,对勘探开发业务流进行结构化、标准化、规范化加工处理和优化整合,形成整体统一可管理、可转换的“勘探开发业务流模型标准”,成为数据模型和应用系统之间的关键桥梁。通过划分业务域,识别、定义业务域的业务流程,分解业务流程中的各项业务活动,对业务活动及其单元进行描述;业务流程是对业务域的再分解,是业务域中一组联系紧密的活动。一个业务域可以有多个业务流程。业务活动是业务流程分解后最基本的、不可再分解的最小功能单元。一般来说,一个业务流程包括若干个业务活动,如:测井业务包括测井设计、测井施工、测井数据预处理、测井数据处理、测井资料解释5个业务活动(见图4)。

3.2.2 面向活动的6W模型分析

1990年,美国的BP Exploration、Chevron Corporation、Elf Aquitaine、Mobile Corporation及Texaco Inc五大石油公司联合发起并成立了POSC组织,该组织是目前最具权威的一个石油数据标准化组织。它定义的数据模型从1.0、2.0、2.1、2.2,一直发展到目前的3.0。模型的定义反映了石油勘探与开发中各种业务关系及技术关系。其核心精湛理念就是6W和“对象—活动—关联—特性”思想。

对业务活动的文字性概要描述按照“6W”的模式进行,即活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Where)发起的、为什么(Why)要发起这个活动、在这个活动中涉及哪些(Which)对象、这些对象的特性是什么(What)。6W模型示意图见图5。

3.2.3 基于业务模型的模型转换与投影

这里所说的模型,包含但不限于数据模型、业务模型、功能模型、系统模型、集成模型、协同工作模型、知识管理模型、空间拓扑模型、业务权限模型等。同一业务活动信息,需求角度不同,活动、特性组织(访问)的方式可能完全不同,在基于多维度描述的基础上,按照实际需求重新组织活动,以适应油田业务的不断发展,实现不同类别和同类异构间的模型相互转换。基于业务模型的模型转换与投影示意图见图6。

3.2.4 基于业务模型的数据访问逻辑自动转换

该业务模型完整描述了活动与活动之间的关系,活动与对象之间的关系,活动、对象、特性之间的关系。数据库中所使用到的关系,在业务模型中均可以找到相应的描述,而且无论任何结构的数据库,所存储的数据最终都是以业务实体的形式展现给用户,因此,其形式是可以相互转换的,通过规范化的映射规则,可以满足业务实体与复杂的物理数据库结构的映射,用以支撑数据查询、写入等操作,承担起替代中心数据库的重任。

3.2.5 元数据登记和基于元数据的应用

采用定时扫描数据库、读取数据库系统日志等方式,以业务活动为单位对数据库数据进行登记,并建立主题模型与活动的关系,对所有数据库数据进行统一描述,满足不同用户对于数据查询和管理,如:

(1)数据资料管理。将资料管理办法的要求与业务活动、活动中的某个特性值建立关系,依据活动是否应该发生或者已经发生,判断相关数据资料的齐全性。

(2)数据采集管理。将数据采集流程与活动建立映射,用活动的生命周期来控制采集任务的流转,实现采集任务的自动下发,数据的自动抽取等。

(3)数据智能搜索。活动、活动的参与者、发生时间、活动涉及的对象等都可以作为查询条件进行数据的查询。

(4)数据质量管理。依据业务模型中特性值重要性的设定,对入库数据的完整性进行评价,以提高数据可用性。

(5)数据资料整合。通过数据存储元数据(某个活动的数据存在哪个库里),对数据进行整合并以业务模型的形式统一浏览或下载,满足生产、科研的需要。

(6)全面工作协同。依据活动之间的关系和活动参与角色与现有各种工作流系统进行集成,实现整个油田勘探开发的工作协同。

3.2.6 业务智能化统一管理

当业务模型发生变化,通过投影规则可以迅速分析影响的面,并给出合理化的修改建议,辅助系统管理员、数据库管理员及时做出应对。例如:一个活动涉及的对象特性发生变化时,影响到数据模型、功能模型、异构交换模型;一个特性计量单位发生变化时,影响到数据模型、异构交换模型等。对于这些变化,可由计算机自动处理,也可以将影响分析结果交给系统管理员来处理。

4 结束语

以业务为主导的公共数据集成/交换模型不仅用于现行数据模型体系下实现异构和复杂数据模型之间的投影、数据集成/交换,实现数据集成/交换关系的自动维护和管理,而且在数据资源整合、数据知识化管理、应用系统迁移等方面都有着广泛的应用前景。以业务为主导的公共数据集成/交换模型对业务的系统、完整、多维度描述,对业务关联关系的广泛定义及语义功能,为数据的知识化管理建立基础;应用公共数据集成/交换模型可实现基于业务逻辑的情境驱动网构化协同工作一体化应用体系建设;基于公共数据集成/交换模型的应用系统向异构数据库体系迁移时,可通过定义异构数据库与公共数据集成/交换模型的关系整体迁移,大大减少系统迁移工程量;采用业务建模标准、规范和流程建立公共数据集成/交换模型,还可促进业务人员更加深入地参与到信息系统的开发过程中,降低由于软件工程师对业务需求及业务流程理解的偏差对软件开发质量的影响。

公共数据集成/交换模型是对现行数据模型体系的补充和完善。公共数据集成/交换模型可以仅仅是一个逻辑关系,通过这个关系能更有效地集成油田的信息资源,为数据的知识化管理创造基础条件;也可以是一个描述业务和存储数据的实体,取决于油田对数据库整体架构性能的总体需求和实施成本。

主要参考文献

[1]中华人民共和国国家质量监督检疫总局.GB/T18391.1-2009 信息技术 元数据注册系统(MDR)第1部分:框架[S].2009.

[2]中华人民共和国国家质量监督检疫总局.GB/T18391.2-2009 信息技术 元数据注册(MDR)第2部分:分类[S].2009.

[3]中华人民共和国国家质量监督检疫总局.GB/T18391.3-2009 信息技术 元数据注册系统(MDR) 第3 部分:注册系统元模型与基本属性[S].2009.

[4]中华人民共和国国家质量监督检疫总局.GB/T18391.4-2009 信息技术 元数据注册系统(MDR) 第4部分:数据定义的形成[S].2009.

[5]中华人民共和国国家质量监督检疫总局.GB/T18391.5-2009 信息技术 元数据注册系统(MDR) 第5部分:命名和标识原则[S].2009.

[6]中华人民共和国国家质量监督检疫总局.GB/T18391.6-2009 信息技术 元数据注册系统(MDR) 第6部分:注册[S].2009.

[7]中国地质调查局.DD2006-05 地质信息元数据标准[S].2006.

[8]中国石油天然气股份有限公司.Q/SY 38.2-2010 石油天然气勘探信息管理规程 第2部分:静态数据表结构[S].2010.

猜你喜欢
数据集成计算机应用
网络信息安全技术管理背景下计算机应用研讨
高职计算机应用教学改革研究与实践
诠释CFC精髓的大数据时代医学案例
关于应用计算机辅助艺术设计有关问题研究
计算机应用的发展现状和发展趋势探讨
中职计算机应用课程教学改革与反思
成本与制造数据集成分析
基于Biztalk的异构医疗信息系统数据集成研究
信息系统集成与数据集成策略研究
XML数据交换技术在中医智能化诊断数据集成中的应用