基于数据分析的圈闭含油气性评价参数体系构建∗

2023-10-20 08:23文必龙
计算机与数字工程 2023年7期
关键词:气性含油灰色

文必龙 王 琰

(东北石油大学计算机与信息技术学院 大庆 163318)

1 引言

圈闭评价工作是在分析圈闭地质特征的基础上,以油气成藏理论为指导,以油气勘探数据库为依托,开展圈闭地质地质有效性、资源量规模、经济效益等方面的分析评价及综合优选,从而选取最有利圈闭作为钻探目标的一系列综合地质评价工作[1]。圈闭含油气性评价的主要目的是评价圈闭的含油气性及圈闭的优劣程度。评价参数的选择对圈闭含油气性评价结果有重要影响。确定评价参数的方法有多种,大多是基于专家经验,如果不采取科学有效的方法进行筛选分析,可能会因为人为主观因素影响产生误差,特别是难以保证各评价参数之间的相互独立性,出现参数重复或不全面的情况,难以保证参数体系的科学性[2]。

评价参数的科学确定是做好评价工作的基础和关键,为了使所确定的评价参数既全面又相互独立,本文通过数据分析方法,基于圈闭地质特征数据,从两个方面选取评价参数,确定评价参数体系。一方面,利用灰色关联分析,度量各评价参数与评价结果之间的关联程度,保证各参数对评价结果关联程度大;另一方面,通过评价参数之间的相关性矩阵分析,筛选出相互独立的评价参数,保证各评价参数之间相互独立。

2 圈闭含油气性评价及其影响因素

圈闭含油气性是指圈闭在油气成藏系统中具备的成藏条件的优劣,由圈闭所处地质环境中的多种地质因素共同决定,主要反映在两个方面:1)圈闭含油气形成的最基本地质条件,包括圈闭特征条件、烃源条件、储层条件、盖层条件以及保存条件等;2)圈闭含油气形成的要素匹配关系,包括盖层形成期与烃源大量排烃期的匹配关系和圈闭形成期与油气大规模运移期的匹配关系[3~4]。油气勘探研究表明,良好的烃源条件、有利的生储盖组合以及有效的圈闭间的配合是增大圈闭含油气性的基本条件[5]。

目前采用的含油气性评价方法大部分都是定性评价或半定量评价方法。这些方法大致可以分为两种类型,一类方法以知识为驱动,经典评价方法包括地质风险概率法[6]、模糊数学评判法[7~8]等,主要是利用专家知识和经验来确定圈闭含油气性评价的主要因素及权重,受到各种人为因素的影响较多,具有一定的主观性;另一类方法以数据为驱动,根据油气勘探过程中获得的研究成果和数据,通过数据挖掘或统计分析等方法得到圈闭含油气性的评价结果,例如多元回归分析法[9]、支持向量机方法[10]、人工神经网络方法[11]等,这类方法的评价结果相对客观,但对数据样本的要求较高。由于油气勘探过程复杂、圈闭相关成果数据获取周期长,且各区域的地质条件各不相同,数据资料的充实程度存在差异,导致有些评价方法的实践效果大打折扣。基于现有的圈闭含油气性评价方法中评价参数选择的不足,本文基于数据驱动方法,以圈闭地质特征数据为基础,分析各评价参数数据之间的相关性及关联关系,构建圈闭含油气性评价的参数体系。

3 圈闭含油气性评价参数体系构建的思路与基础

3.1 研究思路

1)收集整理研究区内油气勘探相关的文档、数据库等资料,分析并提取与圈闭成藏条件有关的地质参数;

2)基于油气成藏基本理论,初步建立圈闭含油气性评价参数体系;

3)对评价参数进行关联分析和相关性分析,从两个方面筛选出关键评价参数,最终确定圈闭含油气性评价参数体系。一方面,利用相关性分析方法筛除相关性较大的评价参数,避免重复评价参数对评价结果的影响;另一方面,利用灰色关联分析方法筛选出与评价结果相关性较大的重要参数。

3.2 相关理论基础

3.2.1 相关性分析

相关性分析是量化不同因素间变动状况一致程度的方法。如果两个变量的变化方向相同则是正相关关系;反之则二者是负相关关系[12~13]。相关系数是用以反映样本参数之间相关关系密切程度的统计指标。计算公式如下:

其中,r 为相关系数;cov(X,Y)为X 与Y 的协方差,var(X)和var(Y)分别为X 和Y 的方差。相关系数r的取值范围为[-1,1],r的绝对值越大,则表明相关程度越高。

3.2.2 灰色关联分析

灰色关联分析是邓聚龙教授提出的灰色系统理论[14]的重要内容之一,基于灰色关联度理论,是确定指标对系统主行为的贡献测度或各指标间的影响程度的方法[15]。基于灰色关联分析原理和圈闭含油气性评价的影响因素,具体分析步骤[16]如下:

1)确定分析序列。确定反映系统行为特征的参考序列和影响系统行为的比较序列。以评价结果为参考序列X0={X0(1),X0(2),X0(3),…};特征参数为比较序列Xi={Xi(1),Xi(2),Xi(3),…}(i=1,2,…)。

姑妈说杨律师在凌州的律师界挺有名气的,和你姑父认识好多年了,他会对这事负责的。玉敏道了谢。两人穿好衣服,从洗浴中心出来,天快黑了。玉敏钻进姑妈的奥迪,回到了姑妈家。玉敏在姑妈家里看了看,没看出什么迹象。又朝姑妈卧室的床头柜瞄了瞄,也很正常,没什么乱象。玉敏放心了,和姑妈道别。姑妈说吃了饭回去吧,玉敏说不了,小虫在家等她呢。

2)初始序列无量纲化。由于系统中各因素列的数据可能量纲不同,不便于比较或者比较结果有误差,因此要进行行数据无量纲化处理,数据预处理后得到序列Xi'={Xi'(1),Xi'(2),Xi'(3),…}(i=1,2,…)。

3)计算关联系数。对于所有的i=1,2,3,…,Xi和X0的关联系数计算公式如下:

其中,ρ为分辨系数,ρ∊(0,1),通常取ρ=0.5。

4)计算关联度。求取关联系数的平均值,作为比较序列与参考序列间关联程度的数量表示,关联度ri公式如下:

4 圈闭含油气性参数体系构建过程

4.1 圈闭地质特征数据获取

数据是数学模型分析计算的基础,圈闭含油气性评价的科学性,首先取决于数据的完整性和正确性。根据石油天然气行业标准SY/T5520—2019 圈闭评价技术规范,圈闭评价资料主要来源于油气勘探过程中获得的地质、地震、钻井、录井、测井、分析化验等资料[17]。在研究过程中,搜集整理了工区内现有的油气勘探相关文档资料,整理与圈闭含油气性评价相关的地质特征数据。通过收集整理,含油气性评价的数据主要有以下几类:

1)定量型:即数值型数据,可以用连续值或离散值表示。如圈闭面积、储层厚度等都是定量型的数据,反映出圈闭的各项地质特征。

2)定性型:也称为类别型数据,通常用文本字符串或离散值表示。如圈闭类型、储层岩性等,反映圈闭各项地质特征的类别,可按照一定的规则转换为有序型数值。

4.2 评价参数体系的初选

表1 圈闭含油气性评价初始化参数体系

4.3 圈闭含油气性评价参数体系的优化

4.3.1 定性特征变量的转换

圈闭地质特征数据中,有一部分特征变量是定性特征变量,都是离散值且没有顺序,具有特定的有限类别。定类变量数据无法直接进行数学运算,因此需要建立定性特征与定量特征之间的映射和转换关系,将定性特征转换为可以参与计算的数值。基于实际的圈闭含油气性评价工作中采用的方法,本文实验采用一种标签编码的方法,将每个类别映射到从1 到N 的的某个具体数值(N 为特征的类别数)。

4.3.2 数据预处理

由于各圈闭地质参数的实际意义不同,导致初始序列数据量纲不同,因此需要进行标准化处理,通过数学变换消除量纲的影响。本文实验中采用z-score 标准化方法,经过处理的数据均值为0,标准差为1。

4.3.3 参数的优选

1)相关性分析

对参数层的27 项参数进行相关性分析,得出每个参数间的相关系数矩阵。由于圈闭地质特征数据大部分为离散数据,本文实验中采用Spearman相关系数计算评价参数之间的相关程度。在筛选评价参数时,参数间的独立性越大越好,根据已有研究[20],实验中采取的相关性筛选准则为:定义相关系数0.9以上(包括0.9)的评价参数为重复参数,可以删除其中一个参数。相关性分析筛选结果如表2所示。

表2 相关性分析筛选结果

2)灰色关联分析

在通过相关性分析筛除了3 项相关性高的参数的基础上,对剩余的24 项参数进行灰色关联分析,以筛选出对评价结果贡献大的关键参数。设定圈闭含油气性等级为参考序列,圈闭各地质特征参数为比较序列。根据灰色关联度的计算方法,计算参数与评价结果的关联度,按照关联度大小进行排序结果为:(C14,C27,C6,C1,C11,C18,C17,C26,C10,C21,C19,C24,C23,C2,C5,C16,C15,C20,C13,C9,C3,C8,C4,C22)。筛选出灰色关联度小于0.6 的评价参数,说明这些评价参数对评价结果的贡献较小,属于次要指标。经过灰色关联分析筛选,埋深(C4)和盖层岩性(C17)的关联度小于0.6,进行筛除。经过相关性分析和灰色关联分析,最终确定的圈闭含油气性评价参数体系共5大项22小项。

5 结语

采用相关性分析和灰色关联分析相结合的方法构建并优化了圈闭含油气性评价参数体系。其中,利用相关性分析方法筛除了相关性较高的参数,保证了各评价参数之间的相互独立性;通过灰色关联分析方法进一步筛选出对评价结果贡献性大的评价参数,确保评价参数体系的各项参数对评价结果有显著影响。

猜你喜欢
气性含油灰色
浅灰色的小猪
OBS技术在南海北部白云深水区储层含气性识别中的应用
灰色时代
她、它的灰色时髦观
BAF组合工艺处理含油废水研究进展
感觉
酸调质—氧化降解法提高含油污泥的沉降性能
浅议山西煤层气储层特征及含气性
铁路含油污泥焚烧的特性
低渗透岩石声学特征及在含气性预测中的应用