施冬,张春生,施斌全
(1.长江大学地球科学学院,湖北 荆州 434023;2.中国石化胜利油田钻井工艺研究院,山东 东营 257017)
低电阻率油层主要是指油层电阻率小于或接近其围岩电阻率或邻近水层电阻率,含油饱和度一般小于50%的油层。采用常规测井解释方法进行低电阻率油层的识别时,由于其在电性上所表现的特殊性,常常会出现油水层误判的问题。同时,在评价过程中,通常都是根据所研究的油田特征选取不同的判别指标进行油水层的识别,而这些判别指标的选择存在较大的经验性[1]。
粗糙集Rough Set(RS)理论是Z.Pawlak教授在1982年提出的一种完全数据驱动的多指标综合评价方法[2]。它可分析不完整的数据,找出数据间的关系,从而提取有价值的属性。该方法克服了以往评价参数选择的主观性,但也存在容错和推广能力相对较弱、只处理量化数据等问题。而灰色系统恰恰具有相对较强的容错和推广能力,但存在不能选择条件属性组合等缺点。因此,将粗糙集与灰色系统相结合解决低电阻率油层评价问题具有较强的互补性,可以获得很好的判别效果。由此,本文提出了基于粗糙集和灰色关联相结合的方法识别该类储层。
粗糙集理论[3-5]是一种研究不精确或不确定性知识的数学工具。属性约简就是在保持分类能力不变的前提下,通过对知识的约简获得分类的规则,以便人们做出快速而准确的决策。
定义1:信息系统S=(U,A),其中,U={x1,x2,…,xn}为论域,是所有样本的集合;A是有限属性集,分为条件属性集P(反映对象特征)和决策属性集Q(反映对象类别),即A=P∪Q,P∩Q=Φ。
定义2:当2个不同的对象由相同的属性描述时,这2个对象在该系统中被归于同一类,它们的关系称之为不可分辨关系(indiscernibility relation),即对于任一属性子集P⊆A,如果对象xi,xj∈U,∀r∈P,当且仅当f(xi,r)=f(xj,r)时,xi与xj是不可分辨的,简记为ind(P)。
定义3:给定论域U,对于每个子集X⊆U和一个等价关系R∈ind(S),定义2个子集
分别称它们为X的R下近似集和上近似集。POSR(X)=称为X的R正域。
定义4:令R为一等价关系,且r∈R,若有ind(R)=ind(R-r),则称r为R 中可省略的;否则,称r为R中不可省略的。P中所有不可省略关系的集合,称为P的核,记作CORE(P)。即
CORE(P)=∩red(P),其中red(P)是P 的所有简化族。
定义5:知识的依赖性可形式化地定义如下:令S=(U,R)为一知识库,且P,Q⊂R,k=γp(Q)=称知识Q是k度依赖于知识P的(0≤k≤1),记作P⇒kQ。系数k或γp(Q)可看作Q和P间的依赖度。
定义6:根据粗糙集理论属性重要度的概念,定义指标a在指标体系中的重要性为
式中,P为条件属性的集合;Q决策属性的集合。
指标r的权重为
式中,ωa为指标a的权重;i为指标集合P 中的指标。
粗糙集重要性算法步骤见图1。
图1 属性重要性算法步骤
首先利用相对正域求出信息系统的核,然后,以属性的依赖度定义属性的重要度,选择重要度大的属性加入约简集,直到满足终止条件为止,假设依赖度阈值为ε。
灰色系统理论认为,任何随机过程都是在一定幅值范围和一定时域内变化的。对于油、气、水层,油、气、水层的各类特征参数均不是确定值,而是在一定范围内变化,即为灰数。由它们的界限值组成的信息系统,数据离散、杂乱,包含了多种影响因素,对此很难作出定量描述,但它们作为灰色信息系统来讲是一个整体,是有序的[6-7]。
依据有效厚度标准的结果列出油层、油水层、水层、干层等的评价数据列X0,根据上述Rough set简化后得到被比较数据列Xi和相应的权值数据列T,表示为
式中,i=1,2,…,N,N为油水层的分类总数。若将储层分为油层、水层和油水层,则N=3;n为评价参数的个数。若评价标准有地层电阻增大率、可动水饱和度、电阻率等3个参数,则n=3。
关联性实质上是曲线间几何形状的差别,因此将曲线间插值的大小作为关联程度的衡量尺度。采用层点标准指标绝对值的极值加权组合放大技术计算灰色关联系数
式中,|X0(k)-Xi(k)|=Δi(k),k=1,2,…,n,i=1,2,…,N;Pi(k)为X0与Xi在k 点(参数)的关联系数;Δi(k)为第k点X0与Xi的标准指标绝对差;为标准指标两级最小差|X0(k)-Xi(k)|为标准指标两级最大差;T(k)为第k点的权值;A为灰色分辨系数,一般在0.5~1之内选取,通常取0.5。
可以得到关联系数序列
由于关联系数较多,信息过于分散,不便于比较优选。为此采用综合归一技术,将各个判别类型的关联系数集中为一个值,一般采用求平均值的方法。关联度的一般表达式为
式中,Pi为灰色多元加权归一系数的行矩阵。
得到关联度序列
最后,利用矩阵作数据列处理,根据最大隶属度原则
式中,Pmax为灰色多元加权归一系数行矩阵最大隶属值,相对应的油水层类型就是样品点的评价结果。
用于储层含油性评价的定量参数很多,在这些参数中如何选取在储层含油性评价中起关键作用的评价参数是油气层评价的关键。应用粗糙集理论的属性重要性判断方法,将储层的采样点作为研究对象,各测井曲线和储层参数作为对象的属性,测井值及参数值作为属性值,对样本点的含油性判断作为决策属性;通过对多个采样点的研究可以判断测井的响应值在含油性判断中哪些是重要的,以及重要曲线的相对重要程度,删除多余信息。再利用灰色关联方法对含油性作出判断。基于粗糙集油气层灰色评价的过程见图2。
图2 基于粗糙集的低电阻率油层灰色识别过程
首先对输入数据的特征属性进行预处理,然后利用粗糙集理论属性重要性方法对预处理后的多个属性进行约简,消除冗余,再采用灰色关联法对约简后的属性样本进行判别分类,实现对低电阻率油层的识别。
(1)低电阻率油层识别参数的选取。低电阻率油层的识别是利用多种对低电阻率储层敏感的测井参数进行判别的过程。
(2)测井曲线的预处理。在测井的过程中,由于测量环境和测井仪器刻度会给测井数据带来误差。为了消除或减少这些误差,须对测井数据进行归一化处理,其实质是消除量纲的影响。数学表达式为
式中,X为测井响应值;Xmin为测井响应最小值;Xmax为测井响应最大值;X′为归一化处理后的响应值。
(3)建立低电阻率油层识别系统。以储层采样点作为研究对象的数据集合U,以测井曲线为识别特征集(对象属性),以储层含油性为识别结果集(结果属性),以处理过的测井响应值为属性值集,建立低电阻率油层识别系统。
(4)属性重要性判断、属性约简。应用粗糙集理论对各评价属性的重要性进行判断,得出重要属性的最少组合,同时得到各个属性的相对重要性。
(5)构造评价矩阵,进行含油性灰色评价。通过上述方法得到的最优属性组合作为灰色评价的评价参数列,构造评价矩阵R。应用灰色系统理论对属性选择后的储层进行含油性评价。
选取了某油田18口有测试资料的井共计30个小层进行实证研究。
通过对研究区低电阻率油层及水层的测井参数统计,选择了5个影响该地区低电阻率油层识别的初始评价参数(见表1)[8],分别为地层电阻率(Rt)、可动水饱和度(Swm)、泥质含量(Vsh)、孔隙度(φ)和电阻增大率I(电阻率指数)。把这30个样本集合以U={1,2,…,30}表示,将这5个初始评价参数作为样本集合U 上的特征属性P,P={Rt、Swm、Vsh、φ、I},记为 P={a,b,c,d,e}。
表1 初始评价的原始数据
针对该研究区的特点,将这18口井的所有样本数据进行预处理,以减少因各属性量纲不一致对结果的影响。
根据测试资料的分析,归纳出该地区储层的含油性评价标准(见表2)。储层含油性类型主要有油层、油水层、水层3种,即决策属性Q有3个,Q={qi},i=1,2,3。
表2 含油性评价标准
以储层采样点作为研究对象的数据集合U,以所选择的特征参数:地层电阻率、可动水饱和度、泥质含量、孔隙度、电阻增大率作为识别特征集(对象属性),即P={a,b,c,d,e}为条件属性集;以储层含油性为识别结果集(决策属性),Q={f}为决策属性集,该集合中只有一个决策属性。条件属性集中均为定量数据,故可根据该地区含油性评价标准将它们划分为相应的水平,建立低电阻率油层识别系统。
运用粗糙集重要性方法进行属性约简。表3为条件重要性方法处理的结果。表3中σP(Q′)表示各条件属性子集Q′的重要性。由表3的属性重要性可以看出,就单个条件属性而言,可动水饱和度b对低电阻率层的油水层类型f的影响最大,电阻增大率e的影响次之,地层电阻率a第3,泥质含量c第4,孔隙度d影响最小;同时考虑2个条件属性,则{b,e}对油水层类型f 的影响最大,{c,d}的影响最小;就3个条件属性来讲,{a,b,e}对油水层类型f的影响最大,{a,c,d}的影响最小;对4个属性而言,{a,b,c,e}对油水层类型f的影响最大,{a,c,d,e}的影响最小。经粗糙集约简后测井属性参数由原来的5个约简为3个:地层电阻率(Rt)、可动水饱和度(Swm)和电阻增大率(I)。
表3 条件属性子集的重要性
选取了研究区的18口井,其中试油结果为纯油层的9口井共17个小层,试油结果为油水同层的5口井共7个小层,4口井6个小层的测试结果为水层。利用上述方法处理这些井,并通过与测试结果比较表明(见表4),用该方法识别低电阻率油层具有较高的识别率。该方法不仅消除了多个评价信息间的信息重叠,通过降维大大提高了运算速度;同时将粗糙集和灰色关联法结合,利用其互补性在低电阻率油层的识别中取得了较好的评价结果。
表4 低电阻率油层评价效果对比
(1)通过对粗糙集和灰色关联方法的分析,提出了基于粗糙集的低电阻率油层灰色识别方法。
(2)利用粗糙集的属性约简降低了灰色关联输入评价参数矩阵的维数,减小了识别过程的计算复杂性,利用灰色关联方法识别低电阻率油层得到了较高的效果。
(3)实验结果表明,基于粗糙集和灰色系统方法在油水层识别中具有更好的分类能力。
[1]中国石油勘探与生产公司.低电阻率油气藏测井识别评价方法与技术[M].北京:石油工业出版社,2006.
[2]黄广龙.基于粗糙集理论的多因素数据分析[J].浙江大学学报:自然科学版,2000,35(5):23-26.
[3]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2004.
[4]汪杭军,张广群.粗糙集属性约简算法的实现与应用[J].计算机工程与设计,2007,28(4):777-779.
[5]Richard Jensen,Qiang Shen.Semantics-preserving Dimensionality Reduction:Rough and Fuzzy-rough-based Approaches[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(1):1457-1471.
[6]宋子齐,谭成仟.灰色理论油气储层评价[M].北京:石油工业出版社,1995:3-26.
[7]施冬.油气层灰色综合地理信息系统GlS评价方法研究[J].测井技术,2005,29(1):30-32.
[8]施冬,张春生,郭甲世.灰色综合评判法在低电阻率油气层中的应用[J].地球物理学进展,1998,13(1):73-78.