基于油气田企业的数据治理方法研究

2023-03-03 05:43邓红梅DENGHongmei姚卫华YAOWeihua焦扬JIAOYang武璠WUFan
价值工程 2023年5期
关键词:油气田数据管理能力

邓红梅 DENG Hong-mei;姚卫华 YAO Wei-hua;焦扬 JIAO Yang;武璠 WU Fan

(长庆油田勘探开发研究院,西安 710018)

0 引言

当前全球数据正在以前所未有的速度增长,IDC曾发布报告称,到2025年,全球数据圈预计将增长至175ZB。机器学习、AI等依赖数据质量的人工智能技术持续火热,全球数字化转型浪潮也在全面推进,如何在这样一个数据大爆发的时代夺得先机,充分把握数字红利,成为各类企业面临的一个重要课题。

伴随着油田的快速发展和信息技术的进步,企业信息化建设先后经历了专业数据库建设、数字化油气田建设、智能化油气田探索三个阶段,历经20余年,产生了海量的勘探开发数据资源,如何将油气田企业沉淀的数据资源转变为数据资产,提升企业数据治理能力具有奠基意义。

何为数据治理?目前业界并没有对其概念的统一标准定义,我们可以这么认为,数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程,通过数据治理实现企业数据的标准化、提高数据质量、提升业务处理的效率,为数据分析提供准确的数据支撑,赋能业务,助力企业实现数字化转型,为企业创造价值。

1 油气田企业数据管理问题分析

现阶段,国内大部分油气田的井口已基本覆盖物联网系统,能够对于开采过程中的实时数据实现自动采集。但是,由于油气行业具有生产环节链条较长、涉及专业较多、各类数据分散存储的特点,由多个独立系统之间难以进行数据共享产生的“数据孤岛”现象依旧较为多见。

纵观油气行业数据管理现状,存在的问题大同小异,主要表现在以下方面:对数据治理不够重视,缺乏系统和深入的理解,且信心不足,在资源投入方面有所顾虑;数据管理制度尚不健全,未建立专门的数据管理岗位,缺乏数据安全、数据共享等领域的标准规范;各级部门职责分工和工作边界尚不清晰,未建立有效的工作机制;技术部门与业务部门以及不同的部门之间融合程度不够,沟通不充分;数据冗余多、数据应用效率低、相关信息系统落标不彻底;数据获取智能化程度低,大部分数据还是通过手工填报,数据口径、标准不统一;大量在用数据未定义可信数据源,存在一数多源、多点采集的问题。

因此,各油气田企业对数据资产普遍利用程度不高,海量数据价值尚未充分挖掘,不具备多样性特征的大数据较难反映问题特征,使得后续的人工智能等技术在油气勘探开发领域难以落地。同时,海量数据中包含大量冗余和无效的信息,这些信息的存储反而造成了资源浪费,影响到整个系统的运营效率。

2 数据管理能力评估

全国信息技术标准化技术委员会于2018年3月15日发布国家标准《数据管理能力成熟度评估模型GB/T 36073-2018》,将数据管理能力成熟度评估模型分为八个一级能力域(图1)。

图1 DCMM数据管理能力成熟度评估模型

各类企业可以根据数据管理现状,设计符合本企业特点的数据能力评价模型。本企业也是根据数据管理蓝图框架,参考业界成熟度数据管理评估模型(DCMM),设计了覆盖现阶段数据治理关注点的数据能力评价模型,由十大能力域构成(图2)。

图2 企业数据能力评价模型

通过对本企业开展数据管理能力评价,掌握本企业数据管理能力成熟度阶段,为数据治理解决方案提供依据。

3 数据治理解决方案

在DAMA数据管理知识体系指南中(图3),数据治理位于数据管理“车轮图”的正中央,是数据架构、数据建模、数据存储、数据安全、数据质量、元数据管理、主数据管理等10大数据管理领域的总纲,为各项数据管理活动提供总体指导策略。

图3 DAMA-DMBOK2.0数据管理车轮图

数据治理解决方案应适用于解决在前期数据管理能力评价中凸显的问题,通过数据治理解决方案的实施,为企业数据质量提供持续保障,帮助企业构建数据资产体系,实现数据价值的最大化,最终完成企业数字化转型。

通过油气田企业在数据治理工作的开展,总结出在数据治理解决方案中四个关键环节,包括体系规划、顶层设计、资源盘点、工具平台。

3.1 数据治理体系规划

数据管理各项工作庞杂,如何体系化地开展工作?实际在第一步企业数据管理能力评估的过程中,我们就可以掌握各大能力域的管理现状,基本可以更有针对性地进行数据治理总体规划。

无论是国际数据管理协会(DAMA)数据治理框架还是DCMM数据治理体系框架(图4),企业都无法照搬,而应在法律法规、国家标准、行业标准的框架下,根据企业自身的特点作出调整。组织制度、数据安全、数据标准、数据治理、数据共享等都需要通过专项的方式进行深入建设,支持业务发展,实现数据价值。

图4 企业数据治理体系规划

3.2 数据治理顶层设计

数据治理要定战略、定制度、建组织,这是顶层策略,并不是简单的组建一个临时团队,也不仅仅意味着有了专业的人就能做专业的事,而是要建立一个能足够支撑企业数据业务化的完整体系,包括组织体系、管理体系、执行体系、技术体系等方面。这每一项都牵一发而动全身,都需要高层领导的大力支持和推动,业务部门和技术部门的紧密协同。

数据治理的顶层设计必须在数据治理工作开展前做好,通常企业数据现状有两种:一种是“零建设”,就是数据还在各个源头上没有采集,或者计划准备实施源头采集;另外一种是在建设中采取多期次、多厂商、多技术、多方法等多元化建设方式,这样的建设方式产生了数据“孤岛”和“碎片化”的问题。

上述两种情况需要用不同的办法来治理,其中“零建设”的数据基本上不需要治理,但需要用数据治理的思想和机理去建设,实现数据“正常化”。第二种是必须进行数据治理的,油气田企业数据建设也是这样一种现状,这就需要企业在开展数据治理工作前全面做好顶层设计。顶层设计的关键是将源头数据与业务流程搞清楚,然后形成数据流,完全掌握了数据“从哪来、到哪去”和数据的“采、存、管、用”的规律,给予自顶向下的设计。在数据治理中必须逐步地执行顶层设计的措施,在规划的过程中需要有明确的目标,因为数据治理中有其不同的阶段和领域,需要对每一个小的环节都要建立好要落实的目标,最终逐一实现。

3.3 数据治理资源盘点

数据治理的第一步是必须掌握数据现状,需要对自身的数据资源和应用情况进行盘点,要确保数据符合业务需求,就需要人工逐条、逐字段地定义数据标准、核实数据质量,最终完成数据治理现状分析。

数据资产划分:根据行业标准和特点对于数据资源进行分类,将数据资源划分为公开、内部、敏感等不同的敏感等级。

数据关系及定义盘点:梳理主数据及定义范围以及数据所有人,梳理指标数据及使用部门和使用人,梳理数据字典以及通用数据定义。

数据标准梳理:对于业务数据按照主体、参考、交易、统计进行分类,并梳理出数据的技术标准和业务标准。结合数据标准、关系、定义的梳理,补充和整理完整的数据字典。

数据应用评估:评估数据应用的范围及引用数据的系统,按照领域和场景梳理数据应用范围;根据企业所在行业和业务范围,梳理相应的国家、国际上对应的数据法律法规要求,并制定数据合规方案;根据企业对于数据使用等级、安全级别梳理数据脱敏的要求和规范,根据数据被业务系统调用的情况,制定数据引用热度管理方法和基于热度来调整数据资产的方法。

3.4 数据治理工具平台

数据治理平台的搭建基本都是“因人而异”的,不同的企业对于搭建数据治理平台的需求及各业务模块的重视程度都不一样,也有一定程度的轻重缓急。这里建议结合数据管理能力评价情况进行数据治理平台功能设计,不外乎包括数据质量管理、数据标准管理、数据安全管理、数据模型工具、元数据管理、主数据管理等功能模块。

数据治理平台涉及面广,体系庞大而又复杂,想要完全依靠自身力量搭建这样一个平台基本上是很难的。目前市面上有许多数据治理的工具平台,但都不能直接照搬应用,可以选择一个在业界有口皆碑的工具,借鉴已成功运用落地的行业解决方案,则会在最短的时间内完成治理目标,达到事半功倍的效果。

4 总结

我们所说的数据治理项目不是为治理数据而构建,而是与大数据平台、数据分析挖掘等项目相结合,通过提高数据质量、控制数据安全性,使数据发挥最大效益。通过数据治理工作的开展,数据变得可信且易于理解,并能有效地支撑业务人员的决策分析工作。越来越多的人员转变为“数据专家”,工作方式也随之改变,但是它并不是一个一蹴而就的事情。

数据治理是一个螺旋上升模型,需要不断的迭代和优化,需要进行长效的持续运营,要将其变成企业的一种机制、一种文化、一种习惯,而油气田企业数据治理每一次迭代优化都推动数字技术与油气产业深度融合。

猜你喜欢
油气田数据管理能力
油气田工程造价控制要点及其管理模式
消防安全四个能力
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
大数据统计在碳酸盐岩油气田开发中的应用
大兴学习之风 提升履职能力
你的换位思考能力如何