徐 鹏 高健祎 陈 溯 张旭光
(1.中国海洋石油集团有限公司信息技术中心;2.中国海洋石油集团有限公司科技信息部)
近年来,国际原油价格剧烈波动,数字化转型成为国内外大型石油企业应对能源行业转型变革、促进自身业务发展的重要手段。壳牌、康菲石油公司等国外大型石油企业正在加快实施数字化转型策略,充分利用大数据、云计算、物联网、人工智能等数字技术改变生产组织模式、经营管理方式,进一步降低生产运营成本,提升企业的核心竞争力。
数据是数字化转型的基础,数据质量关系企业数字化转型成败,数据管理一直是油气企业信息化建设的重要内容。在油田信息化建设早期,各业务部门分散建设专业数据库进行数据管理,主要用于记录特定专业、特定业务的运行过程信息。随着业务和技术的发展,分散独立的专业数据库形成了一个个数据孤岛,无法满足油田跨专业数据查询的需求。一体化数据中心是在专业数据库基础上,按照勘探开发一体化模型,重新整合、建立的标准化数据库,通过集中统一的数据服务支撑不同专业的应用需求。近年来,大数据、人工智能等新兴数字技术日益成熟,智能油田建设对半结构化数据、非结构化数据的应用需求日益增多,数据湖逐步成为油气企业数据管理的重要手段[1]。
1989年成立的公共石油数据模型协会(Public Petroleum Data Model Association)提出了 PPDM 石油数据模型标准。PPDM数据模型采用面向对象设计,并采用严格的命名约定,涵盖业务分析、数据库表、列、类别和代码等[2]。PPDM数据模型可以根据业务需求变化而不断升级扩展,其3.9版本已包含2688张数据表、71171个数据项[3]。
由BP、雪佛龙、埃尔夫、美孚、挪威国家石油公司等发起成立的石油开发软件协会(Petrotechnical Open Software Corporation)提出了勘探开发中心数据模型标准POSC Epicentre。该数据模型标准采用面向对象设计,建立了以“对象—活动—关联—特性”为核心思想的数据模型,反映了石油勘探开发各业务关系及技术关系[4]。POSC数据模型标准是一个统一的、可扩充的模型标准,定义了大约1500个勘探开发技术领域的对象语义[5]。
壳牌公司将所有地下数据(特别是生产现场实时数据)汇聚到勘探开发数据湖中,实现了上游智能应用与地球物理、地质等核心专业软件的高度融合[6]。康菲石油公司构建了一个包含生产、运营、研究等方面的综合数据平台(IDW),有助于提高生产井正常运行时间、缩短钻井周期、优化完井设计,帮助工程师加深对地下储层的认识,采用IDW可平均节省业务人员80%的数据准备时间,可将更多精力用于数据分析工作[7]。
中国石油天然气集团有限公司(简称中国石油)按照“两统一、一通用”的总体路线建设上游业务统一数据库和统一技术平台——勘探开发梦想云,以统一数据库和统一技术平台为基础,管理多类型海量数据,建立起支撑勘探开发全过程的协同研究工作环境。截至目前,勘探开发梦想云已管理48万口井、600个油气藏、7000个地震工区、4万座站库;横跨60多年的数据资产、涵盖6大领域、15个专业,数据量共计1.7PB;实现上游业务核心数据全面入湖共享,形成了国内最大的勘探开发数据湖[8]。中国石油长庆油田公司自主研发了企业级科研环境平台——数字化油气藏研究与决策支持系统(RDMS),采用油气藏数据链整合集成了油田开发建设40余年来形成的钻井、录井、测井、试油气、分析化验、油气生产、动态监测等18类专业数据库, 新建了地质图件、生产支撑、方案设计等五大类研究成果库[9]。
中国石油化工集团有限公司(简称中国石化)以POSC Epicentre为基本框架,结合集团勘探开发全业务进行优化和扩展,形成了中国石化勘探开发一体化数据模型 SPDM(Sinopec Data Model)[10-11];建立了覆盖13大专业源头数据的源点总库,通过一体化设计消除数据冗余和重复存储,将原有专业库中3.4万余个数据项减至1.6万余个。
从国内外油气田企业的实践来看,将原来分散独立的勘探开发数据进行集中统一的管理,提升数据质量和共享水平,已经成为行业领先企业的共同选择。
中国海洋石油集团有限公司(简称中国海油)的数据管理工作起步较早,但长期处于分散建设状态。勘探、开发、生产等各业务领域形成大量的数据资产都分散存储在各油田公司或服务公司,存在数据标准不一、重复录入、共享困难等突出问题。勘探开发数据在采集、存储、使用过程中,缺乏规范统一、可持续的资产化管理,是导致数据质量不佳、价值难发挥的根本原因。数据管理仅依靠信息系统建设无法完成,需要形成全方位、全过程的勘探开发数据资产管理体系,才能保证数据质量。
全方位是指标准体系、管控体系、支撑平台3个方面,三者相辅相成。标准体系指制定覆盖勘探、开发、钻完井、工程全流程的统一标准。管控体系指建立数据管理的组织机构,制定数据管理的制度和流程,明确数据资产归属和相关方权责。支撑平台指建立企业级数据平台,提供集成、统一、共享的基础环境,支撑数据标准和管控流程落地。
全过程包括数据采集、存储、使用3个阶段。在采集阶段,业务部门负责将数据采集操作纳入业务流程,建立数据质量的检查考核机制,落实到具体岗位。信息化部门统筹业务部门需求,建立数据采集标准,明确数据格式、精度、量纲等规范性要求,实现数据及时、准确、完整地进入数据平台。在存储阶段,信息化部门按照数据模型,建立数据存储标准,明确数据关联,消除数据冗余;根据数据的重要性建立分级分类的数据存储、备份机制;按照数据存储标准和管控要求,建设数据存储能力,形成数据资产目录,实现数据统一归集、高效存取和安全可信。在使用阶段,信息化部门统筹共享和安全需求,建立数据使用的申请、审批流程,明确各方责任和义务;按照业务需求和数据标准格式来建设数据服务能力,实现查询、下载、同步、加载等服务功能,为业务应用系统提供高效、快捷、规范的数据服务。
标准体系、管控体系和支撑平台贯穿数据采集、存储、使用的3个阶段,形成全方位、全过程的数据资产化管理体系。
2011年以来,中国海油开展勘探开发一体化数据中心建设(A2项目),按照统一的数据标准整合各专业历史数据,完成了16个专业库1.02亿条历史数据的清理和迁移,完成了1062万条历史数据的补充采集,建成了地质油藏数据服务共享平台,实现了公司地质油藏数据资产的统一管理(图1)。
2.2.1 标准体系方面
A2形成了一套成熟、完整、可扩展的数据标准编制方法,围绕业务模型、逻辑模型、物理模型开展数据标准体系建设。
业务模型是对勘探开发业务流程的建模。通过全面梳理勘探开发的业务情况,将地质油藏相关业务划分为物化探、井筒工程、综合研究、油气田生产和分析化验5个业务领域,按业务类别和业务阶段划分为50个一级业务、140个次级业务、3740余个最小业务功能单元(业务活动)。对具体业务活动,采用6W(岗位Who、时间When、地点Where、活动内容How、业务对象Which、产生结果What)描述,业务活动划分流程及描述内容见图2。将每一个业务活动涉及的数据项进行定义,包括数据类型、精度、量纲、非空等标准项的约束,形成一套完整的勘探开发一体化业务模型。
图1 A2系统总体功能架构
图2 业务活动划分及描述内容示意图
逻辑模型是为了便于用户访问和使用,提高数据查询效率,面向实体对象进行建模(图3)。A2参考行业通用的POSC模型标准,构建一套面向对象的逻辑模型,按照活动、对象、属性建立完整的数据关系,形成了油气田四维(三维空间及时间)的数字孪生体。可以从时间、对象、属性对孪生体进行切片分析。按照时间,可以了解整个油气田随时间推移的变化趋势;按照对象,如一口井,可以查看从钻井设计、建井、完井、钻后评价到投产或废弃的全生命周期的业务情况;按照属性,可以了解高产井的分布等情况。
图3 勘探开发核心业务对象逻辑模型示意图
物理模型定义了数据在不同类型数据库中的存储结构,是业务模型及逻辑模型在具体数据库环境下的投影结果,用于存储有关数据的来源、说明、与其他数据的关系、用途和格式等信息。
2.2.2 管控体系方面
A2从梳理数据源头出发,明确采集职责、流程和规范,依托定制化采集工具,全面开展历史数据资源补充采集工作(图4)。制定了2000余个数据集的补充采集模板和采集流程、8000余项数据质检规则,补充采集1062万条未管理数据。
图4 数据采集及审核流程
通过A2项目实施,初步建成了地质油藏数据的质量考核机制,定期对各单位数据齐全性、准确性、及时性情况进行考核,保证数据质量(图5)。
经过A2项目梳理,形成了包含各业务领域的数据资产编目,既方便业务人员了解有哪些数据可用,又让数据管理人员掌握公司的数据资产情况,确定需要补充建设的数据内容。在此基础上,A2实现了数据分级分类管理,按照数据类型建立对应的数据存储及备份机制;规范了数据使用权限管理流程,实现了按照业务、数据集、业务对象的精准授权。
2.2.3 支撑平台方面
模型驱动是A2系统建设的核心理念,将业务模型、质检规则等业务元数据,与采集规范、考核制度等管理元数据,以及逻辑模型、物理模型、映射数据等技术元数据结合起来,利用元数据管理工具,实现模型与系统联动。业务模型随着业务持续发展而产生变更,在此过程中,系统工具通过建立元数据关联关系,自动识别受模型变更影响的功能模块,并实现零代码维护的元数据升级工作(图6)。
图5 数据质量考核结果
图6 A2模型驱动的设计思路
A2实现了面向不同应用场景的4种数据服务方式。一是面向第三方专业软件的数据支持服务,可与Petrel等石油专业软件进行数据交互;二是面向持续性库对库的数据推送,可以提供ETL数据交换服务,实现与历史数据库数据交换过程的实时监控;三是面向不同主题的集市投影服务,可以根据业务需求投影建库,为新建应用系统统一提供数据标准、模型支持和数据推送;四是面向对象模型的SDK服务引擎以及外端驱动的Rest数据调用接口,可支持综合报表类型的数据分析。
中国海油的A2系统实现了跨专业数据的集中展示和共享应用,业务人员可以按照不同维度的批量打包、数据下载,减少了80%的数据搜集和编排工作量,有效提高了工作效率。A2还可以为新建应用系统提供统一的数据服务,减少新建项目30%~50%的工作量和投资费用。目前,A2已经为10余个新建应用系统提供了一站式数据支持服务,有效降低了系统的建设成本。
随着智能油气田建设的不断深入,跨专业协同的工作需求不断增多,业务人员对“一站式”数据服务需求不断增强,现有的数据资产化管理水平与中国海油数字化转型、智能化发展的发展要求仍有一定差距,需要从以下3个方面进行改进。
一是在现有基础上,坚持A2建模的方法论,扩展实时数据、地面工程数据相关标准,实现勘探开发地下及地面业务流程的全面融合,构建完整的勘探开发一体化数据标准体系。
二是借鉴中国石化勘探开发业务协同平台(EPBP)的建设经验[12],在业务部门和IT部门的共同努力下,全面启动勘探开发数据库治理工作,将数据采集职责落实到具体岗位,固化到业务流程,推广数据质量考核机制,从源头做好数据资产化管理。
三是坚持模型驱动建设理念,在A2系统基础上,开展勘探开发数据湖平台建设,扩展所支持的数据类型,全面启动勘探开发数据治理工作,构建支撑业务智能分析(Business Intelligence,BI)、人工智能分析(Artificial Intelligence,AI)的大数据服务能力。