大型信息系统建设中质量管理体系的应用与实践

2015-02-19 06:55许增魁刘景义王铁成王学军
石油工业技术监督 2015年11期
关键词:入库结构化测井

马 涛,许增魁,刘景义,王铁成,王学军

中国石油东方地球物理公司信息技术中心 (北京 100007)

勘探与生产技术数据管理系统(A1)是中国石油信息技术总体规划中的重点信息系统,经过近10年的持续建设与运维,建成了中国石油有史以来统一的勘探与生产技术数据管理系统和基于勘探开发一体化数据模型(EPDM)标准的、最大的勘探开发一体化数据库,管理着物探、钻井、录井、测井、试油/试采、样品实验、地质油藏、油气生产等领域的海量数据资产,支持勘探开发一体化项目研究与应用。

EPDM模型标准的形成经历了由借鉴、扩展、应用到完善与提升等过程。参照国际或企业标准,以物探、地质、钻井、录井、测井、分析化验等石油行业及企业专业技术标准为依据,在汇总上游信息系统建设需求的基础上,由业务专家按照业务流程逐一梳理、分析每个业务节点的数据来源和数据应用,首先形成业务流程控制下的各领域专业技术数据规范,以此为基础,进一步分类、聚合、抽象,按照业务实体逻辑,形成数据关联关系,构建出勘探开发一体化数据模型,满足信息系统建设过程中数据采集和数据存储的应用要求。2010年,中国石油发布勘探开发一体化数据模型标准(EPDM)1.0版本,推动了上游信息系统建设与应用。

与规范及标准的发展相配套,A1系统建设项目组在系统建设中高度重视数据质量,始终坚守“数据质量是信息系统生命”的指导原则,通过“参照”、“实践”、“固化”等方法和过程,在中国石油统建信息系统建设中率先将ISO 9001质量管理体系应用于A1系统建设与运维中,形成了A1系统数据质量管理体系,取得了较好的应用效果。

1 大型信息系统建设中存在的主要数据质量问题

大型信息系统一般具有用户多、应用范围广、数据规模大、数据增长速度快、数据质量要求高等特点。其中,数据质量是保障信息系统建设效果的核心基础,甚至决定着信息系统的生命。

数据质量通常包括以下主要要素:①规范性;②完整性;③准确性;④一致性;⑤时效性等。数据的生命周期通常包括:产生,传输,加工、分析或处理,应用,存储与保存,交换,废弃等环节。在各环节中要保持数据的质量不变或提升,这是对信息系统建设的基本要求。

数据质量在数据的生命周期中会受到来自历史、标准变化、技术方面、保存条件、业务变化等不同因素的影响。不同历史时期数据质量要求不同,不同版本标准对数据质量的要求不同,不同时期的技术能力取得的数据质量不同,存储介质老化等对数据质量的影响,老数据不能满足业务提升的要求等。数据质量问题可以归结为以下几个方面:

1)数据不规范。不同时期获取的数据在命名、归类、记录格式等方面与现行标准存在差异,造成数据不规范。

2)数据不完整。数据、数据项或数据属性部分缺失,不能完整表达数据或业务含义。

3)数据不准确。数据中存在异常或错误。

4)数据不一致。同类数据未遵循统一的规范,相互关联的数据出现不同的表达。

5)数据不及时。数据从产生到应用的时间过长,造成数据使用价值降低。

上述5个方面的问题是信息系统建设中普遍存在的重点问题。将以A1系统为例,探讨大型信息系统中数据质量管理解决方案和方法。

2 解决方案

A1系统覆盖领域多、专业面广,涉及业务环节多,且其数据中包含着有关地下油气资源状况的重要信息,是油气勘探开发业务的核心资产。因此,研究与A1系统相配套的数据质量管理解决方案和方法具有重要意义。

在A1系统建设中,引入了ISO 9001质量管理体系方法论,通过“参照”、“实践”、“固化”等方法与过程,结合A1系统数据特点及其数据质量控制的要求,提出了A1系统数据质量控制解决方案和方法,形成了“质量管理体系+组织与制度+规范与技术”三位一体的质量管理与控制工作模式。

2.1 数据质量管理体系

A1系统质量管理体系包括:质量控制方针、目标、原则、管理机制、质量控制流程、标准规范、数据质控方法(技术)等。

2.1.1 质量控制方针与目标

A1系统数据质量管理与控制的方针是:质量为本、服务至上、满足要求、持续改进;总体目标是:确保数据的规范性、完整性、准确性、一致性和及时性。

1)数据规范性要求:数据要符合A1系统现行的技术标准、数据规范。

2)数据完整性要求:数据要完整覆盖和表达相关的业务范围、数据类型、数据项、数据属性等。

3)数据准确性要求:数据表达的物理含义准确,内容、范围正确,数据关联正确。

4)数据一致性要求:数据在业务之间、类型之间、数据之间具有一致性,同类数据在命名、格式、坐标系、单位制等方面具有一致性。

5)数据及时性要求:数据在汇交、审核、入库、服务、应用等方面满足业务对数据需求的时效性。

A1系统数据质量管理与控制的目标见表1。

2.1.2 质量控制原则

质量控制原则是整个质控体系的基础,在A1系统数据搜集、整理、质量控制过程中,遵循的基本原则是:尊重原始数据、补齐缺失信息、改正错误信息、确保数据可靠。

2.1.3 质量控制管理机制

在A1系统数据质量管理体系建设中,结合数据质量控制流程,建立了质量管理组织机构,制定了数据质量控制相关人员的岗位责任,形成了多级质量检查、控制与跟踪机制。

质量管理组织机构分为建设阶段和运维阶段组织机构,建设阶段组织由A1系统实施组、质检组、专家审核组构成,运维阶段由技术支持中心和油田三级运维组构成,形成了体系控制、立体防范、全员负责、重点检查、全程跟踪、持续改进的数据质量控制与检查机制。具体过程包括:操作员自检、操作员互检、质管员抽检、管理员复检、专家审核以及质量巡检等,每个过程要做到检查有目标、修改有依据、过程有记录、责任可追溯。

表1 A1系统数据质量管理与控制的目标

2.1.4 质量控制流程

根据A1系统数据生命周期的特点和相关质量管理标准和规范,制定了A1系统数据质量控制基本流程。该流程涵盖了数据的收集/接收、数据规格化或规范化整理、数据质量检查修正、专家审核与确认、数据加载入库、数据下载验证等过程,以及数据操作员自检与互检、质量管理员抽检、数据管理员(或项目经理)复检、油田业务专家审核、质量检查组巡检等数据质量控制环节。在实际工作中,针对A1系统数据来源于不同专业业务的情况,制定了不同专业数据的质量控制流程和流程中的质量控制关键点。

2.1.5 标准规范

标准规范涉及A1系统数据质量管理体系实施的技术依据、操作指南和管理办法,形成了相关的技术标准、操作规范、管理办法/规范[1]。

2.1.6 数据质量控制技术

在A1系统数据质量管理体系中,将数据质量控制的方法、流程、跟踪机制等通过数据质控软件固化下来,通过数据质控软件支撑数据质控技术的实现,以提高数据质控效率和数据质控水平。在A1系统数据质量管理体系建设中,通过研究数据质量管理方法,结合相关专业数据的特点,研发了能够满足A1系统数据质控需要的数据质控软件[2]。A1系统数据质控软件的研发,是落实“质量管理体系+组织与制度+规范与技术”三位一体的质量管理与控制工作模式的技术保障。

2.2 组织与制度保障

在A1系统建设与运维阶段,尽管组织管理机构及名称不同,但落实到数据质量管理体系保障方面的制度、岗位设置和岗位职责不变。

建设阶段,由项目建设指导委员会、项目经理部、标准化组、数据组、主数据库组、项目数据库组等构成;运维阶段,由勘探与生产信息系统专家中心、A1系统支持中心、油气田公司A1系统运维组构成。

数据质量管理体系中明确的相应岗位及质量管理责任包括:

1)数据操作员:负责数据的收集、整理、质量控制、入库、下载检查等,按照“谁整理,谁负责”的原则,对所操作的数据质量进行自检和交叉互检,保持和提高了数据的完整性、准确性和一致性,填写各项操作记录,自检与互检率100%。

2)数据质检员:负责对所有入库数据的复检,根据数据操作记录及数据的关联关系,完成对入库数据的完整性、准确性和一致性方面的检查,填写质检记录,复检率100%。

3)数据管理员:根据任务总体要求,负责数据工作规划、任务分解与分配;负责对入库数据的抽检,根据质检记录、数据操作记录及数据的关联关系,完成对入库数据的完整性、准确性和一致性方面的检查,填写抽检记录,抽检率不低于60%。

4)业务专家审查:由客户(油田)组织各业务方面的专家,组成专家组,负责对数据质量控制过程进行业务指导,对入库数据的规范性、完整性、一致性进行最终审核,填写审核记录,审核率100%。

5)数据质量巡检:由业务与数据管理方面的专家组成,负责记录填写的规范性、业务描述的准确性以及数据质量进行检查和关联验证,填写巡检记录,巡检率不低于40%;必要时编写巡检报告,对巡检中发现的重大问题,向油田主管领导及部门汇报,并组织整改。

2.3 数据质量控制方法

2.3.1 数据质量控制方法研究

数据质量控制是使数据在采集、存储、传输和使用中满足相关质量要求的工艺过程。在A1系统数据质量控制方法研究中,参照了Informatica提出的数据质量控制六步法:

步骤一:探查数据内容、结构和异常;

步骤二:建立数据质量度量并明确目标;

步骤三:设计和实施数据质量业务规则;

步骤四:将数据质量规则构建到数据集成过程之中;

步骤五:检查异常并完善规则;

步骤六:对照目标,监测数据质量。

借鉴上述方法,详细分析了A1系统数据质量管理对象(数据内容),结合相关标准规范和质量金字塔思想,提出A1系统数据质量控制策略与方法。

1)A1系统数据特点。A1系统数据质量管理对象(数据内容)涵盖了勘探与生产业务的11个专业领域,即:物探、钻井、录井、测井、测试、试油试采、样品实验、井下作业、地质油藏、油气生产、综合研究等。这些领域的数据可以归结为结构化数据和非结构化数据两大类型。对非结构化数据,主要根据其自身的特点、技术规范及标准,结合A1系统数据规范,研制相应的质量控制方法和技术。对结构化数据,主要根据EPDM标准,结合各油田的业务特点及需求,制定相应的质量控制策略、方案和规则,满足个性化需求。A1系统数据分类见表2。

表2 A1系统数据分类

由表2可以看出,物探、测井、研究成果等数据,其常用记录格式也较多,不尽统一。

2)A1系统数据质量控制策略与方法。参照了Informatica的数据质量控制六步法,结合A1系统数据质量管理体系要求,提出了A1系统数据质量控制策略与方法(图1)。该方法的主要思想是:基于业务规则和相关技术标准,建立质量与管理规则库,以规则约束的方式实施A1系统数据入库前、入库中和入库后3阶段的质量控制工作,并分别生成质量报告、监测报告、质量公报,以达到数据质量控制的要求。

图1 A1系统数据质量控制策略与方法示意图

在A1系统数据质量控制中,应用了A1系统非结构化与结构化数据质控技术以及相应的数据质控软件(工具)[3]。这些数据质控技术和软件在A1系统建设中研究、发展并加以完善,成为A1系统的重要组成部分。

2.3.2 非结构化数据质控技术

由于A1系统中的非结构化数据在数据内容、关联信息、执行标准、文件格式等方面都与其所属学科或专业领域密切相关,因此,在A1系统建设中,针对不同学科或专业领域的非结构化数据分别研制了相应的数据质控技术。下面,仅以地震、测井、成果文档数据为例介绍非结构化数据质控技术。

2.3.2.1 地震数据质控技术

地震数据的质量控制过程主要包括:磁带转储或格式转换、质量控制、关联匹配、数据校验等,其质量需遵循GB/T 19001-2008/ISO 9001:2008质量管理体系,符合国际、国内行业相关标准规范和A1系统地震数据入库标准。

1)地震叠前及原始数据。地震叠前及原始数据对象包括:野外测量成果、电子班报SPS(+)、静校正数据、地表调查成果、叠前/原始数据体等。

质控的内容包括:测量成果、电子班报、静校正数据、地表调查结果、EBCDIC头、二进制头、FID、单炮数据记录等。

首先需要对数据进行规范化处理,即进行数据格式转换,使得入库数据满足A1系统数据标准要求(SEG-Y、SEG-D)。数据质控软件能够支持SEGY、SEG-D、SEG-A/B/C、GRISYS等格式数据的输入。地震叠前及原始数据质控流程见图2,主要过程包括:野外/叠前地震数据收集转录、数据入库前质控、数据加载入库等。

图2 地震叠前及原始数据质控流程

2)地震叠后数据。地震叠后数据对象包括:处理后测量成果、处理成果数据体、速度数据、炮道关系数据等。

数据质控内容包括:处理后测量成果、叠加/偏移速度数据、EBCDIC头、二进制头、道头数据、道数据等。

首先需要对数据进行规范化处理,即进行数据格式转换,使得入库数据满足A1系统数据标准要求(SEG-Y)。数据质控软件能够支持SEG-Y、CGG、CODE-4、GRISYS等格式数据的输入。

地震叠后数据质控流程见图3,主要过程包括:打开SEGY文件、命名一致性质控、EBCDIC记录质控、采样数据质控、道头记录质控等,包含了90个关键质控点。

3)地震辅助数据质控方法。地震辅助数据主要包括:测量数据、电子班报或静校正、表层调查数据,其质量控制对象包括:二维测量数据、三维网格、SPS(+)班报数据、静校正数据、表层调查数据。

二维测量数据质控内容包括:解析测量数据或静校正数据,抽取桩号及对应坐标信息,检查桩号、CMP号的连续性及对应的X、Y坐标值是否异常,测线图形位置的浏览。

三维网格质控内容包括:对网格边长、道间距、线间距、工区内角进行质量检查以及网格图形浏览。SPS(+)班报数据质控内容包括:对单个/批量文件处理,定制头信息、图形展式以及编辑数据。

静校正数据质控内容包括:检查桩号及对应坐标信息的连续性、对应性。

图3 地震叠后数据质控流程及关键质控点示例

表层调查数据质控内容包括:检查坐标信息的正确性、连续性及表层速度的值域范围等。

4)地震数据匹配与校验。对于地震数据加载,要对关联数据进行匹配和验证,基本思路是:对地震数据加载中的各项数据进行匹配检查和校验检查,并满足以下要求。

原始数据:要求野外测量、SPS、FID、PAR、SEGD/Y数据齐全,信息及对应关系正确。

叠前数据:要求测量成果、FID、PAR、SEG-D/Y数据齐全,信息及对应关系正确。

叠后数据:要求测量成果、炮道关系、SEG-Y处理成果数据、速度数据、处理报告等数据齐全、信息及对应关系正确。

5)地震数据质控软件。地震数据质控软件包括:地震数据体转储及格式转换软件、地震数据体质量控制软件、地震辅助数据质量控制软件、地震速度数据质量控制软件。

地震数据体转储及格式转换软件(RTSDS)主要支持地震数据转储及格式转换;支持从磁盘、磁带、数据库等多种媒体介质读取不同格式的数据,同时对其解析;支持输出多种数据格式并存放在磁盘、磁带以及数据库中。

地震数据体质量控制软件(SDQCS)主要支持磁带转储、地震数据查看、地震数据检查与质量控制、地震剖面查看与检查等。SDQCS还支持对SEG-Y格式的VSP数据文件的批量自动检查。

地震辅助数据质量控制软件(SADS)主要支持2D/3D地震SPS、静校正、测量成果、炮道关系等辅助数据的格式转换、质量控制、测线位置图显示等质量控制功能。

地震速度数据质量控制软件(SVFC)主要支持对地震叠加、偏移速度数据文件进行解析、格式转换、质量控制,输出STATOIL H2格式。

2.3.2.2 测井数据质控技术

A1系统测井数据质控的数据对象主要是常规测井、地层倾角测井、成像测井等,数据质控主要内容包括测井数据解析、格式转换、质量控制等过程。

对于国内油田情况,数据解析需覆盖ASCII、CLS、DLIS、LAS、LIS、WIS、XTF、716 等格式,并对这些格式的变种具有适应性。

测井数据质控点主要包括测井基础数据和测井曲线。其中,测井基础数据质控内容需覆盖井名、坐标(经纬度)、钻/完井日期、井筒名、井筒类型、总深度、深度参考、补心海拔等。

在测井数据质量控制中,研制了测井数据质量控制软件(WDQCS),主要功能包括:数据解析、批量转储、重采样处理、井信息抽取、数据浏览、数据展示、质量控制、数据输出等(图4)。

2.3.2.3 成果文档质控技术

对于成果文档,主要质控内容包括:文档数据的整理、创建索引信息、关联关系检查等。在成果文档质控过程中,研制了成果文档数据质量控制软件(SACGS),主要功能包括:对文档、图件、物理实体类数据进行信息抽取、编辑、生成符合A1系统要求的COPEX或XML格式的索引,并进行文档关联关系检查。

2.3.3 结构化数据质控技术

1)结构化数据质量控制方法。在A1系统中,结构化数据主要包括符合EPDM标准的钻井、录井、测井、试油试采、测试、分析化验、井下作业、油气生产、地质油藏等领域的数据。

A1系统结构化数据质控的基本思想是,首先建立结构化数据质量检查规则,然后应用这些规则对结构化数据进行入库前、入库中和入库后的质量检查。

图4 测井数据质量控制软件功能架构

结构化数据质量检查规则,要结合油田的具体业务进行定义,检查内容包括:数据的非空性、唯一性、大于(等于)或小于(等于)预定的值域范围、正则表达式、单调递增(减)、差异对比、实体关系等特性或要求。

2)结构化数据质量控制技术。在A1系统结构化数据质控中,研制了结构化数据质量扫描系统(WDBQCS),主要功能是支持对结构化数据的质量检查、质量扫描、生成质量报告及质量公报等功能。结构化数据质控过程主要包括:配置数据源、定制方案、定制业务规则、数据扫描、数据展示与生成质量报告/质量公报。图5展示了大港油田的一个质量公报案例。

3 应用情况与效果

随着A1系统建设的持续和A1系统应用的不断深化,A1系统数据质量管理体系也在应用中得到不断完善并发挥着越来越大的作用。

A1系统数据质量管理体系的应用覆盖了A1系统建设与运维阶段以及中国石油A1系统部署的14家油气田公司。

图5 大港油田质量公报案例

A1系统遵循的标准、规范不断完善,已经编制、发布和推行了包括EPDM数据模型在内的10类相关技术标准、13类A1系统建设与运维的操作规范(规程)、10项A1系统数据管理办法[4]。

A1系统数据质量管理体系及质控技术不断发展与提升,配套的数据质控软件支持非结构化数据质控和结构化数据质控,在各油气田均取得良好的应用效果。华北油田遵循A1系统数据质量管理体系[5],推进了数据整理、质控和入库过程中的数据质量管理工作,2012年,华北油田先后组织了3轮次数据检查,对数据质控的自检、互检、复检、抽检、审核、抽检等过程进行复核检查,数据抽查率达60%,数据差错率低于万分之一,为油田勘探开发科研生产提供了可靠的数据支持。

4 结论

2006年和2010年,A1系统数据质量管理体系作为中油瑞飞公司质量管理体系建设的试点和升级,分别通过了 ISO 9000:2001 和 ISO 9001:2008 认证,对形成和固化A1系统数据建设 “质量管理体系+组织与制度+规范与技术”三位一体的质量管理与控制模式,全面提升A1系统数据质量,深化A1系统数据应用,起到了良好推动作用。

目前,A1系统管理了油气田公司近590TB地震勘探成果数据、23万口测井数据、28万口井井筒数据,累计为2 100个勘探开发研究项目提供了高效、优质的数据服务,大大缩短了研究人员收集数据的时间,有效提高了研究效率。基于A1系统,大部分油气田成立了勘探开发数据中心,实现了对勘探开发数据资产的正常化、有序化管理。

[1]刘景义,张晖,赵伟涛,等.中国石油A1A2系统数据质量管理体系建设实践[J].信息技术与信息化,2011(3):61-66.

[2]马涛,王学军,王铁成,等.A1辅助软件系统[J].石油科技论坛,2011(1):52-54.

[3]李铁柱,韩文娜,王铁成.VSP数据管理质量控制方法探讨[J].中国信息界,2012(10):41-43.

[4]陈哲,徐庆,范德军.大港油田勘探开发信息化数据质控体系建设的实践[J].中国科技信息,2013(15):80-81.

[5]孙韵.A1系统数据建设与应用技术研究[J].中国信息界,2011(11):56-58.

猜你喜欢
入库结构化测井
本期广告索引
重磅!广东省“三旧”改造标图入库标准正式发布!
促进知识结构化的主题式复习初探
中国食品品牌库入库企业信息公示②
八扇区水泥胶结测井仪刻度及测井数据处理
中国食品品牌库入库企业信息公示①
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
身临其境探究竟 主动思考完任务——《仓储与配送实务》入库作业之“入库订单处理”教学案例
基于测井响应评价煤岩结构特征