杨梦露
(中法渤海地质服务有限公司,北京 100010)
近年来,党和国家对数据发展高度重视,中央全面深化改革委员会第二十六次会议指出,加快构建以数据为关键要素的数字经济。2023 年3 月,国家能源局发布《关于加快推进能源数字化智能化发展的若干意见》,强调释放能源数据要素价值潜力,推动能源数据分类分级管理与共享应用。数据作为新型生产要素,被称为数字经济时代的“石油”,已成为一个国家重要的基础性、战略性资源。当前,各大油气企业正在加快推进数字化转型智能化发展,数字化转型的核心是利用新兴数字技术改造业务流程和管理模式[1],其关键能力在于数据采集和数据分析,因此数据治理是企业实现数字化转型的关键基础和重大挑战。
近年来,国际大型油气公司相继推出勘探开发一体化智能化协同平台,推动地质、物探、测井、钻井、修井、储运等各业务领域的数据信息共享。斯伦贝谢公司于2017 年推出公司内部统一的数据平台DELFI 勘探开发认知环境平台,整合并支持各类软件应用程序,存储全部历史数据资料,实现全部业务的数字化转换[2]。哈里伯顿公司在云平台上部署了DecisionSpace 365 勘探开发云平台,通过集成物联网、云计算和大数据技术,实现油田现场各种数据流的实时捕捉、处理和传输的无缝对接[3]。此外,2019 年起斯伦贝谢、壳牌、埃克森美孚等国际油气公司还积极加入“开放地下数据空间”,将数据与应用程序分离,借助微软、IBM 等数字化技术公司的力量,打造一个油气行业开放、基于标准的数据平台[4]。中国石油于2018 年发布了中国石油勘探开发梦想云平台并不断升级,已发展成为全球油气行业规模最大、业务覆盖最全的工业互联网平台[5]。该平台以“两统一、一通用”(统一数据湖、统一技术平台、通用应用和标准规范体系)为核心,构建了“一湖、一云、一平台、一门户”,创新研发由主湖和区域湖构成的连环数据湖架构,实现分布式存储、分层次治理、海量数据高效访问[6],建成上游集成统一的数据湖,形成了强大的数据中台能力[7],完成60 余年勘探开发数据全面入湖,数据总量达10 PB,有效消除数据和信息孤岛,推动上游业务数据资源向数据资产转变[5]。
国内油气企业的信息化建设起步于20 世纪90 年代初期,从最初各类勘探开发业务纸质资料的电子化录入,经历单机应用、分散数据库建设、统一数据库建设和集成应用4 个阶段,已经基本跨过数字油田初级阶段,正在向数字化智能化阶段迈进[2]。经过长期信息化建设,各油气企业都沉淀了PB 级的数据资源,且数据增量相当可观。与此同时,数据资源分散和共享困难等问题也给油气企业数字化转型带来不小的挑战,各油气企业迫切需要开展集团级的数据治理工作,推动海量的数据资产真正释放价值。
当前,国内油气企业已纷纷自上而下启动了集团级的数据治理。中国石油、中国石化和中国海油数据治理工作均对数据管理组织体系进行了完善,明确了归口管理和实施部门,中国石化和中国海油均成立了数据治理委员会,中国石油和中国海油分别成立了数据管理中心、勘探开发数据资源中心;3 家单位均对数据资产开展了全面梳理,编制或发布了数据治理顶层设计、数据管理技术规范、数据标准,并明确了相关制度流程;3 家单位均以统一的技术平台作为数据治理的平台支撑,中国石油构建了包含总部数据库、各专业领域数据库的统一数据湖体系,中国石化构建了集团级、板块级、企业级数据资源中心和统一数据中台,中国海油已建立包含数据治理工具、数据湖和数据中台的基础数据平台;3 家单位已经不同程度地开展了勘探开发、经营管理等领域数据治理的实践,取得了阶段性成果。
目前,国内一些油气企业数据治理工作普遍面临业务链长、业务活动复杂,信息系统数量庞大,数据量多、分散且标准不统一,数据共享不充分等痛难点问题。
以中国海油为例,在上游业务层面,海洋油气勘探开发业务链长,包含从勘探发现到油田废弃的全生命周期,涉及勘探、开发、钻完井、工程、生产5 大专业的千余项业务活动,以及10 多个业务部门和二级单位,地下、井筒、地面等设备设施关系复杂;各专业历史数据存量巨大且类型繁多,包含各类图表、报告和模型等,在传统的组织运营模式下,各业务板块间的融合协同难度较大。
在生产信息化层面,中国海油在勘探开发领域拥有80 余个数据库,各数据库间数据标准不统一,业务含义不一致,且在数据治理方面没有成熟的模型、标准及经验。拥有200 余个勘探开发应用系统,部分应用功能重复,系统间未实现互通,上游领域的数据孤岛和系统烟囱现象较为明显,进一步导致各业务板块的专业数据、管理流程和组织系统无法畅通流转。
在经营管理层面,中国海油主要靠手工填报管理数据,所建设的各层级管理系统数量众多且较为分散,各管理系统的数据口径不一致、质量难以保障、共享难度大,数据横向未集成、纵向难穿透,导致各类经营管理数据的价值难以发挥。
中国石油数据按业务领域分为经营管理、勘探生产、炼油化工、成品油销售、天然气销售等12 类,累计管理各类数据量达到27 PB。中国石油以数据资源目录梳理作为数据治理主要抓手,驱动数据标准、主数据、数据架构、数据质量等持续完善提升,依托制度保障、标准规范、组织保障的“三个保障”,以数据治理平台和公共数据编码平台共同构成的技术平台为支撑,建立数据治理体系架构,开展数据架构、数据共享、数据质量、数据安全、主数据和维度数据等六项核心活动。
中国石油采取“统筹推动、分步实施、以点带面、多维支撑”策略,分为夯实基础、全面深化、持续运营三个阶段推动数据治理,目前处于全面深化阶段。持续完善数据管理组织体系,明确由集团数字和信息化部作为数据归口管理部门,成立数据管理中心负责数据管理的实施工作;发布数据管理与技术规范,以及公共数据的编码、生产运行数据和经营管理数据标准三大类数据标准;加快构建包括制度流程、组织保障、数据全生命周期安全等在内的数据安全体系;建设数据治理平台,统一管理数据架构、数据地图和数据开发,推动形成数据生产者、使用者、管理者多主体协同数据治理机制;建设包含总部数据库,以及油气和新能源、炼化和新材料、支持和服务、资本和金融等各专业领域数据库的统一数据湖体系;积极推动经营分析、供应链优化、财会监督等领域的大数据平台示范应用,持续提升多源数据汇聚能力、海量数据存储能力、高性能计算能力、多维智能分析能力;推动建立经营管理、生产管理、公共数据三个主题域的全局数据资源目录;总结经验逐步形成数据治理方法论,制定数据治理实施指导手册,明确数据架构、质量、共享和安全等方面的流程规范,进一步强化数据治理的标准化、专业化和体系化水平[8]。
中国石化于2021 年确立了信息化发展“数据+平台+应用”新模式,成立中国石化数据治理委员会,建立了业务域“域长”负责制新机制[9]。近年来,大力推进全集团数据治理工作,全面梳理数据资产,完成数据治理体系设计并规范数据应用流程,制定了“数据资源目录+数据标准+数据质量”三大具体工作部署,初步建立数据服务运行体系,构建“统一标准、统一流程、统一授权”的集团级、板块级、企业级数据资源中心和统一数据中台[10]。
在生产领域,以中原油田普光分公司、西北油田采油三厂为试点,取得了“一湖、一平台、一应用集群”的建设成果,开发数据处理、加载、传输配套功能,推动数据全量、完整、规范入湖,实现了数据资产统一管控和融合利用[11]。
在经营管理领域,于2020 年上线统一的经营管理大数据服务平台,并持续推广应用,接入430 多个源系统,形成数据模型6.7 万个,发布数据资产3.5 万个[10],形成了炼化业财融合、财务价格分析、客户服务分析、集团生产运营等一批典型数据应用[12],加快推动海量数据转化为新生产力。
作为中国最大的海上油气生产运营商,中国海油加快推进数字化转型和智能化发展,“十三五”时期,就全面推广实施了勘探开发一体化数据中心,着力推进数据湖平台和实时数据库建设,为“智能油田”建设奠定了数据基础。近年来,中国海油积极应对数据采集、存储、管理和应用难题,探索开展勘探开发和经营管理数据治理,取得了明显成效,有力提高数据质量,促进数据共享和价值发挥。
2020 年,中国海油发布《智能油田顶层设计纲要》,提出了智能油田的数据架构,要求以数据资产化管理为目标,建立数据管理的组织机构,制定制度和流程,明确相关方的职责,制定覆盖数据采集、存储、使用全过程的统一标准,建立公司统一数据平台,对勘探开发数据进行全方位、全过程的规范化管理,建成智能油田数据湖,支撑数据价值的实现。2022 年,发布《数字化转型行动计划实施方案》,部署强化数据治理、推进数据共享、释放数据价值三项重点任务,加快激活数据要素潜能;编制《数据治理顶层设计方案》,形成“一个愿景、四项目标、四项能力、六项保障、一个平台”数据治理体系框架。
中国海油数据治理工作以集团基础数据平台为支撑,立足“采、存、管、用”数据生命周期,针对集团油气勘探开发、专业技术服务、天然气及发电、炼化及销售、金融服务五大主要业务板块的数据,通过数据治理实现业务标准化,形成高质量、安全有序、高效共享的数据资产,并通过持续的数据运营,更好地赋能业务。
2022 年11 月,成立由集团董事长任主任的中国海油数据治理委员会,统筹推动生产和经营管理专项数据治理工作,在各分公司成立数字化室。根据集团业务和管理现状,将数据治理工作划分为生产、经营管理两类15 个业务域,如图1 所示,其中生产类包括勘探开发、新能源、油田服务、海洋工程建设、能源技术服务、天然气与发电、炼油化工、化学、销售贸易9 个业务域,经营管理类包括人力资源、财务资金、物资供应链、规划计划、法务、审计6 个业务域;建立数据治理责任人制度,总部各相关部门、各相关单位主要负责人为本业务域数据治理责任人。
图1 中国海油数据治理工作业务域划分
3.2.1 中国海油勘探开发数据治理组织机构
2021 年7 月,中国海油依托研究总院成立首家公司级专业数据资源管理单位—中海油勘探开发数据资源中心,统一管理上游勘探开发业务数据;2022 年5 月,成立上游生产领域数据治理工作协调领导小组,统筹推进勘探开发数据治理工作。积极构建总部部门深度主导、研究总院总体支撑、分公司全面落实、专业公司服务保障的自上而下全员参与的勘探开发数据治理组织体系;成立数据治理标准技术委员会,强化总体技术把控;成立数据治理源头采集暨示范督导组,自下而上开展源头监督。
3.2.2 中国海油经营管理数据治理组织机构
2023 年1 月,在中国海油数据治理委员会下成立中国海油经营管理数据治理专项工作组织,统筹推进6 个业务域的经营管理数据治理工作;设有专项工作领导小组和管理组,以及1 个技术支持组和6 个业务组,由中国海油财务共享服务中心和信息技术中心承担技术支持组职责,响应各业务组需求并提供技术支持,由各业务组负责搭建本业务域数据治理组织,开展本业务域数据治理工作;明确数据治理职责划分,强调总部各相关部门是落实集团经营管理数据治理工作的责任主体,各所属单位是本单位经营管理数据治理的责任主体。
中国海油于2020 年启动勘探开发数据治理,按照“价值导向、以用促治,业务驱动、统一管控,源头治理、采用分离”的治理思路,扎实推进数据整合和应用整合两项核心任务,经过3 年多的治理工作,在前期已完成数据标准规范建设、主数据治理、试点应用整合与存量数据入湖的基础上,总体已进入深化阶段。建立完整的勘探开发数据标准体系,勘探开发专业已完成阶段性存量数据清洗入湖工作,建立勘探开发源头采集系统和工具,真正做到数据采集源头唯一、数据标准统一、数据质量可信、数据应用共享;建立两套勘探开发业务集成应用系统,并结合统一专业应用系统的建设,初步实现业务管理一体化;为智能油田建设提供统一的勘探开发数据标准及一体化服务,全面支撑了秦皇岛32-6 智能油田等3 个智能油田试点项目对数据的需求,已实现阶段性建设目标。
3.3.1 中国海油勘探开发数据治理工作原则
(1)价值导向、以用促治
面向公司增储上产、降本增效和管理提升等需求,以数据治理为基础,构建协同研究平台、智能油田和业财一体化等研究、生产和管理三类数字化转型示范场景;以价值驱动,明确源头数据采集、历史数据迁移,以及勘探、开发、钻采、工程专业应用整合等治理任务,系统提升治理能力,实现以用促治、以湖养用。
(2)业务驱动、统一管控
按照谁牵头业务谁主导、谁产生数据谁负责的原则,明确各专业和各组织的数据治理责任,构建业务驱动、IT 统筹的治理组织;明确统一规划、统一设计、统一建设、统一标准、统一管理的“五个统一”原则,保障全集团的信息化战略与规划整体统一并推动落地,加强集团统一管控。
(3)采用分离、源头治理
将数据与应用分离,应用系统数据由数据湖统一管理,将采集与应用分离,避免数据仅在专业内循环;按照统一的标准产生数据,并强化数据质量控制,确保数据源头唯一、标准统一、口径统一,提高入湖数据质量。
3.3.2 中国海油勘探开发数据治理工作成效
(1)建立数据标准和管理制度,夯实数据全面治理基础
中国海油于2020 年初步完成物化探、井筒工程、综合研究、油气田生产、分析化验、海洋与地面工程6 大业务域数据标准制定。2021 年进一步健全数据标准规范,发布勘探开发业务数据标准和数据管理制度,为后续全面治理奠定坚实的基础。2023 年持续健全完善数据管理制度体系,建立完整的勘探开发数据标准体系,形成物化探、测录试等16 册勘探开发业务数据标准,覆盖勘探开发全周期主要业务;发布勘探开发数据源头采集审查、数据治理考核等相关的制度体系文件,并进一步落实业务和数据管理“一岗双责”,切实推动业务与数据深度融合。
(2)搭建企业级勘探开发数据湖平台,组建勘探开发数据资源中心
中国海油于2020 年启动勘探开发数据湖平台建设,平台为秦皇岛32-6 智能油田,通过数据湖平台为秦皇岛32-6 智能油田,以及东方、白云和中联生产操控中心等项目提供统一数据服务,已完成数据湖一期建设,正式启动数据湖二期建设,初步建立数据湖平台运营运维体系。2021 年依托研究总院成立了中海油勘探开发数据资源中心,作为数据治理的技术支持和技术管理单位,推动实现数据标准统一、历史主数据入湖和源头采集,通过数据湖整合数千口井所采集的各专业累计60 余万亿字节数据资源,实现源头化、资产化、一体化、统一化、平台化管理,并具备云化数据服务、中心化数据分析等能力,为智能油田建设提供统一数据支持。
(3)强化数据源头采集,着力清洗数据入湖
中国海油明确业务数据源头,推动业务数据源头采集常态化,已基本完成勘探、开发等5 个专业历史数据迁移和源头采集,进一步清洗数据,实现上亿条数据入湖,通过以用促建、建用结合的方式有力保障数据的高可用性。
(4)推动应用系统整合,打造数据治理示范油田
中国海油于2022 年起采用试点先行方式创新开展勘探开发应用整合,确保整合改造的技术路线可靠。2023 年正式将应用整合作为勘探开发数据治理主要任务之一,加快整合各专业现有系统,每个专业仅保留1~2 个系统;加快建设“深海一号”等数据治理示范油气田,将数据湖作为示范油气田数据源,业务应用产生的成果数据也及时回存到数据湖,促进湖内数据在核心业务中的流转和应用,助力数据湖价值充分发挥。
中国海油围绕“提质增效、决策支持、风险防控、模式转型”的经营管理数据治理目标,坚持“标准引领、业务驱动、速赢试点、以用促治、边推边用”的原则,以集团基础数据平台为支撑,采用“系统思维、问题导向,供给侧驱动、需求侧牵引”的工作方法,努力实现数据可知、可视、可控、可预测,助力中国海油管理变革和业务创新。
3.4.1 强化供给侧驱动和需求侧牵引
在供给侧以数据资产目录为抓手,基础数据平台为支撑,ERP 系统各域数据为核心,数据确权确责为牵引,数据治理考核为契机,驱动数据管理和数据运营两类核心任务,沿着“采、存、管、用”的数据生命周期进行落地。在需求侧选取即时可见的先导项目,以需求为牵引,通过以“用”促治,努力穿透谁负责、怎么管、存在哪、从哪采4 大问题,针对未穿透的问题,及时分析原因,明确责任主体并制定改进方案,通过改进方案的实施牵引经营管理数据治理目标实现。
3.4.2 建设集团统一的基础数据平台
加快构建集团统一的数据治理、数据分析、数据共享及主数据管理平台,通过数据治理工具对数据资产目录、架构、标准、质量、元数据、主数据等进行集中管理,由数据湖汇聚内外部储存的数据,利用数据中台整合处理储存数据并支持数据计算加工,最终实现对集团数据资产的统一管理,构建集团数据资产全局视图,支撑集团经营管理类数据管理和数据运营落地。
3.4.3 中国海油经营管理数据治理进展情况
中国海油于2022 年启动勘探开发数据治理,相关工作目前仍处于初级阶段,选定了集团两家内部单位作为试点,推动打通“人、财、物”问题,已完成经营管理各业务域数据资产盘点,形成数据资产目录,厘清ERP 系统数据家底,建立数据标准,统一主数据编码,编制数据确权确责管理办法,为后续治理工作打下坚实基础。
数据治理没有捷径,尤需久久为功。中国海油将进一步强化数据治理顶层设计,持续深化勘探开发数据治理,高效推进经营管理数据治理,加快建立数据资产运营体制机制,做好跨专业、跨单位、跨系统的协同治理,构建数据有序流通和安全共享共用的机制,不断提升数据湖的总体支持能力,努力实现业务数据化、数据资产化、资产价值化,使数据真正赋能公司生产经营管理业务。