基于相序的多点地质统计学相建模方法及其应用

2023-02-06 05:33王鸣川段太忠
石油与天然气地质 2023年1期
关键词:沉积权重网格

王鸣川,段太忠

(中国石化 石油勘探开发研究院,北京 102206)

复杂油气藏(包括非常规油气藏)开发将是油气行业的一种常态,而油气藏建模是复杂油气藏开发的一项基础且关键的工作[1-3]。油气藏建模主要包括构造建模和属性建模两个部分[4],构造建模主要解决层序界面和断层的建模难题,属性建模则主要解决相及其控制的孔隙度、渗透率和饱和度的建模。相建模是油气藏属性建模的关键,目前的方法仍有较大的提升空间。

传统的两点地质统计相建模方法,如序贯指示模拟(SIS),以只能同时表征两点之间相关性的变差函数为工具,为常规油气藏的相建模提供了有效的途径,其在理论和应用上均比较成熟和完善[5]。该方法可以建立统计意义上非常“完美”的模型,但由于该方法的基础是变差函数,算法本身难以融入地质学家的地质认识[6]。基于目标的相建模方法在建立相模型时,能够设定各相的参数和空间分布规则,在一定程度上可以融入地质学家的地质认识,但相的参数化比较困难,特别是复杂储层的相空间分布规则很难定量设定,因此该方法只能适用于空间分布规律清晰且容易参数化的油气藏的相建模。基于像元和训练图像的多点地质统计建模方法,采用序贯模拟的方式,通过训练图像融入地质学家的地质认识,并对复杂储层的相的空间分布规则进行量化描述,综合了传统两点地质统计相建模方法和基于目标的相建模方法的优点,成为复杂油气藏相建模的一种有效的方法[5,7-10]。鉴于多点地质统计学建模方法的优势,该方法自提出便受到国内外学者的重视,对多点地质统计学建模方法的研究也十分火热[11-21]。多点地质统计学建模方法的研究已从传统的迭代类方法快速发展到基于概率模拟和基于相似度模拟的阶段[5]。基于相似度的多点地质统计建模方法均以一定维度的数据模板为载体,对比其承载的数据事件与相应训练图型的相似度,而其相似度的判据,源于图像识别领域的几何距离[12-13,22-24],或在一定程度上考虑储层相展布形态的矢量距离[25-26]。上述相似度判据能够在一定程度上解决多点地质统计学建模相似度对比的难题,但在相似度对比时对储层相的沉积学意义考虑还有不足。

本文从相的沉积学意义出发,考虑目前所开发油气藏的复杂性,即强非均质性,通过动态数据模板和句法模式识别技术,采用动态规划方法对比数据事件与训练图型所承载的相序列的相似度,形成了一种新的基于相序的多点地质统计学相建模方法。

1 算法原理

1.1 相序相似度的定义

相序为沉积相、岩相或岩石物理相等具有地质意义的“相”的自然垂向序列,一般用字母符号串或数字序列来表示,如SSABCBEDFG 或912325467。在沉积学意义上,相序不仅包含每个相在垂向上的顺序,还包括每个相的厚度、颗粒大小和矿物含量等[27-28],但在相建模过程中,通过网格划分、相的划分和相代码的设置,可以将相序简化为相代码在垂向上的顺序,即在建模中相序代表了相的地质意义。

两个具有地质含义的相序,相互之间的差异用相似度来表示,故相似度的定义对相序的定量比较至关重要。在数学上,相似度采用两个相序之间的距离来度量,而相序之间的距离,可看作是字符串之间的距离。编辑距离算法是对比相似字符串的有力手段,以相似字符串之间转换所用的最少字符操作数来计量,允许的编辑操作分为3 种:添加、删除和替换,即通过这3 种操作,可以让一个相序变得与另外一个相序相同,从而得到两个相序之间的距离。例如,相序“ACD”与相序“ABCD”,通过在“ACD”的“A”与“C”之间添加字符“B”,即可将相序“ACD”变成相序“ABCD”;相序“ABCD”与相序“ABC”,通过删除相序“ABCD”的最后一个字符,即可将相序“ABCD”变成相序“ABC”;相序“ABBD”与相序“ABCD”,通过将相序“ABBD”的第二个字符“B”替换成“C”,即可将相序“ABBD”变成相序“ABCD”。若采用数学的方法表示2 个相序之间的差别,可定义相序的集合为Ω,相序之间的变换函数设为T,那么对于任意相序X(X∈Ω,x1,x2∈X),3 种操作可表示为

①添加(TI):x1x2→TIx1ax2;

②删除(TD):x1ax2→TDx1x2;

③替换(TS):x1ax2→TSx1bx2。

其中,字符a,b∈Ω。

1.2 相序相似度的计算

根据相序相似度的定义,相序之间的距离可以用编辑距离进行定量计算。以字符串A1={a1a2a3}和A2={a2a4a5}为例,通过删除、替换和添加操作可将A1转换成A2:

式中:TD(a1)a2a3表示对字符串A1执行删除字符a1操作;TS(a3,a4)a2a4表示对字符串{a2a3}中字符a3执行替换成字符a4操作;TI(a5)a2a4a5表示对字符串{a2a4}执行添加字符a5操作。

其相似度(距离)可用数学方式表示为:

式中:dL(A1,A2)表示A1和A2两个字符串的相似度(编辑 距离),无量纲;TD(a1)表示删除字符a1所产生的距离,无量纲;TS(a3,a4)表示字符a4替换字符a3所产生的距离,无量纲;TI(a5)表示添加字符a5所产生的距离,无量纲。

若不考虑相的权重和操作的权重,那么A1与A2的相似度等于其转换操作数,即:dL(A1,A2)=3。

一般情况下,多点地质统计学建模网格和训练图像中的相序长度远大于字符串A1和A2的长度,其相似度(距离)计算较(1)式和(2)式复杂。假设两个相序X={Xi,i≤m}和Y={Yj,j≤n},若不考虑相序中各相的权重与不同操作的权重,认为各相的权重和各操作的权重均为1,对相序的相似度进行计算时存在以下几种情况:

①当Xi=Yj时,dL(Xi,Yj)=dL(Xi-1,Yj-1);

②当Xi≠Yj时,根据对相序进行替换、添加或删除操作的情况,dL(Xi,Yj)=dL(Xi-1,Yj-1)+1,或dL(Xi,Yj)=dL(Xi-1,Yj)+1,或dL(Xi,Yj)=dL(Xi,Yj-1)+1;

③当m=0或n=0时,dL(Xi,Yj)=i或j。

由此,得到相序相似度计算时各相和操作权重为1时的动态规划方程:

式中:i,j为自然数,表示相序的元素。

以相序X={CADBBDB}和相序Y={CBCACCDA}为例,不考虑相的权重和操作权重,根据距离求解规则,可以得到如下距离计算矩阵图(图1),其中右上角的值,即为两个相序的相似度值:dL(X,Y)=6。

图1 相似度计算矩阵Fig.1 Similarity calculation matrix

上述相序相似度计算时,为便于理解和展示,未考虑相序中各相的权重和各操作的权重,在多点地质统计学建模过程中,根据实际需要,有时会考虑各个相的权重和各操作的权重。以相序A1={a1a2a3}和相序A2={a2a4a5}为例,通过式(1)的操作,使相序A1与A2相等,若只考虑操作的权重,令TD=TI=1,TS=2,那么通过式(2)可以计算得到相序A1和A2的相似度为:

若只考虑各相的权重,令a1=1,a3=a4=2,a5=3,那么可以计算得到相序A1和A2的相似度为:

若同时考虑操作和相的权重,操作的权重和相的权重与上述权重值一致,那么可以计算得到相序A1和A2的相似度为:

根据上述分析,若同时考虑相的权重和操作的权重,可以推导得到更为一般的相序相似度计算的动态规划方程:

式中:i,j为自然数,表示相序的元素。

以相序X={ACB}和相序Y={ABCD}为例,综合考虑相的权重和操作权重,根据相序相似度动态规划求解方法,可以得到如下距离计算矩阵图(图2),其中右上角最小的值,即为两个相序的相似度值:

高等学校在新增固定资产、在建工程、无形资产时并未让高等学校受益,按照权责发生制原则,高等学校不能登记费用和净资产增加,只需要登记资产增加,借记“固定资产”“无形资产”“在建工程”等科目,贷记“财政拨款收入”“零余额账户用款额度”“应付账款”“银行存款”等科目。固定资产和无形资产只有持有使用过程才会让高等学校受益,因此高等学校必须按《政府会计制度》规定在使用年限内,对应提折旧的固定资产按月计提折旧,在使用年限内按月对使用年限有限的无形资产进行摊销,借记 “业务活动费用”“单位管理费用”“经营费用”“加工物品”“在建工程”等科目,贷记 “固定资产累计折旧”“无形资产累计摊销”。

图2 考虑权重的相似度计算矩阵Fig.2 Similarity calculation matrix considering weight

1.3 动态数据模板

数据模板是影响多点地质统计学建模效果的一个重要因素,为改善早期单一固定数据模板的模拟效果,多尺度数据模板逐步在多点地质统计学建模中被采用[15,29]。但无论是单一固定的数据模板,还是多尺度数据模板,在模拟过程中都难以考虑条件数据的分布特征,无法灵活利用条件数据(图3)。如设置数据模板3 × 3,采用单一固定的数据模板,图3a 和3c 中难以最大化利用所有条件数据,即使采用多尺度数据模板,图3b和3d中也难以最大化利用所有条件数据,而且容易造成前期条件数据不足而后期条件数据过多的弊端,整合地质数据信息的能力不足。

图3 不同数据模板整合条件数据的能力Fig.3 Ability to integrate conditional data with different data templates

针对上述数据模板的不足,结合相序对比的需要,设计出一种平面上可根据条件数据分布变化、纵向上包含所有相序的动态数据模板。例如,设定动态数据模板的搜索网格为5 × 5,条件数为4,在图4a中进行搜索,就可以得到图4b 所示的数据事件。在使用动态数据模板的多点地质统计学相模拟过程中,设定搜索网格形状(如正方形)和条件点数(如3),动态模板以最小的尺寸3 × 3进行搜索(图4c),无法达到条件点数要求,搜索网格自动扩大到5 × 5,达到条件点数要求后,以当前的搜索数据模板在训练图像中进行图型搜索;当模拟进行到一定程度,已模拟点逐渐增多(相当于条件点数增多),3 × 3 的搜索网格即可达到设定的条件点数要求(图4d),动态数据模板将自动缩小为3 × 3的正方形搜索模板,并以此数据模板在训练图像中进行图型搜索。

图4 动态数据模板工作原理Fig.4 Working principle of variable data template

2 算法的模拟过程

基于相序的多点地质统计学相建模算法,考虑了相序相似度的沉积学意义,相似度计算时进行垂向全序列对比,并采用与全序列对比相配套的动态数据模板,实现了从地质含义出发的建模,建立了一种全新的多点地质统计学建模框架。该方法与其它多点地质统计学建模方法相比,具有3 个主要的特色:①随机路径只需遍历模拟网格顶层的未模拟网格,无需遍历整个三维模拟网格;②采用与相序全序列相似度对比相配套的动态数据模板,能够适应不同模拟时期条件数据的变化,更好地整合不同尺度的地质信息;③以垂向全段的相序动态规划距离作为数据事件与训练图型的相似度判据,将地质含义融于相似度对比过程中,提出了一种全新的相似度对比方法,实现了沉积学与多点地质统计学的有效结合。

基于相序的多点地质统计学相建模算法采用序贯模拟方法,在模拟网格顶层遍历所有未模拟网格并生成一个模拟模型。对已建立的模拟网格,具体的模拟步骤如下:①输入井数据和训练图像,并分配井数据至模拟网格中的最近网格;②确定数据模板形状和条件点个数;③定义随机模拟路径;④采用步骤②设定的数据模板形状与条件点个数扫描模拟网格,确定数据模板的维度和数据事件;⑤采用步骤④的数据模板遍历训练图像,确定对应的训练图型;⑥计算数据事件与训练图型的相似度,并用最相似的训练图型对应点处的相序列对数据事件待估点处进行赋值;⑦循环重复步骤④到步骤⑥直至随机路径中所有待模拟点都被模拟,输出模拟实现。

3 理想模型测试

3.1 二维模型测试

采用二元的河道沉积二维剖面作为训练图像(图5),网格规模为200 × 1 × 45,网格单元大小为10 m × 10 m× 10 m。在训练图像中随机确定5 口井的位置,并抽提出5 口井的相数据。数据模板形状为长方形,条件点数为2。一般情况下,在地质建模应用中,不同的相和不同的操作对建模同等重要。因此,采用最一般的权重设置,添加、删除和替换的权重相同,不同相的权重相同。与目前商业化的多点地质统计学相建模算法Snesim 对比测试,Snesim 方法的数据模板大小为10 × 1 × 3,多尺度网格级数为3。测试结果显示,Snesim 方法虽然总体上能够重现井和训练图像所反映的地质信息,但出现明显的零散相分布,个别地方与井所反映的地质信息不符(图5b);与Snesim方法相比,基于相序的多点地质统计学方法在已知数据的约束下,不仅井上数据吻合较好,而且能够很好地再现训练图像所展示的沉积相特征(图5c)。

图5 二维剖面训练图像与模拟结果Fig.5 2D training image and simulation results

3.2 三维模型测试

三维模型测试以一个河道沉积的地质体作为训练图像(图6a,b),网格规模为69 × 69 × 39,网格单元大小为10 m × 10 m × 10 m。在训练图像中确定7口井的位置,并提取7 口井的相数据。数据模板形状为正方形,条件点数分别设为3和4进行两次模拟。采用与二维模型测试相同的权重设置,添加、删除和替换的权重相同,不同相的权重相同。

三维模型测试结果显示,对于稀井网工区,条件点个数越多,整体的模拟效果越好。条件点数为4 时的模拟效果(图6e,f)较条件点数为3 时的模拟效果好(图6c,d)。在测试过程中发现,条件点数为4时,该方法已经能够较好地反映井和训练图像的地质信息,继续增加条件点个数,对模拟效果的提升并不明显,但却会大幅增加模拟时长。在Core i5,2.8 Hz CPU 和16 G RAM 的计算条件下,条件点数为3,4和5时,其模拟时长分别为180,230 和300 s,以条件点数3 的计算时间为基数,每增加1 个条件点,计算时长增幅分别为27.8 %和30.4 %。而且在模拟前期,条件点个数越多,数据模板越能整合更多的条件信息,相应也会增加模拟时长。

图6 三维训练图像与模拟结果Fig.6 3D training images and simulation results

4 应用实例

塔河X区位于塔里木盆地东北坳陷区沙雅隆起阿克库勒凸起南部,为一套三叠系三角洲砂岩与湖泊相泥岩互层沉积。研究区三叠系储层属于低幅断背斜圈闭,物源方向为北东向。

4.1 训练图像

在区域构造演化、古地貌和沉积体系等研究的基础上,综合应用井震资料和岩心资料,对影响沉积模拟的3 个主控因素——可容空间、物源供应和沉积搬运进行研究,量化主控因素的变化规律。

在研究沉积模拟主控因素变化规律的基础上,以沉积概念模式为指导,参考井震沉积相分布规律,对研究区的沉积相发育进行数值模拟。通过对影响沉积模拟的各参数进行敏感性分析,确定各参数的影响程度,并与已有数据进行对比,优化各模拟参数,得到反映研究区沉积规律的最佳三维沉积正演模型(图7),作为研究区多点地质统计学建模的训练图像。

图7 沉积正演模型Fig.7 Sedimentary forward model

4.2 储层建模效果对比

研究区长7 750 m,宽4 700 m,储层厚度为50 m,目前有32口注采井(图8a)。根据研究区井的分布和构造展布特征,模拟的网格规模为155 × 94 × 40=582 800,网格单元大小为50.00 m × 50.00 m × 1.25 m。采用本文方法进行多点地质统计学相建模时,首先对作为训练图像的沉积正演模型进行适当处理,使训练图像的网格规模与模拟网格的网格规模相同,数据模板为正方形,条件点数分别设为3和4。

从训练图像反映的沉积特征来看,研究区发育三角洲沉积,大致可以分为3 个期次:研究区底部从东北部开始,主要发育水上分流河道;接着湖平面上升,全区主要发育水下分流河道;后期湖平面进一步上升,研究区西南部主要发育席状砂和河口坝。不同条件点下塔河X 区的三角洲沉积相模拟结果显示(图8),沉积相模型不仅较好地反映了井的地质信息,而且宏观上准确地重现了训练图像所反映的沉积规律。从不同条件点的模拟结果来看,4条件点的模拟效果较3条件点的好。4 条件点模拟的沉积相模型,与抽稀井的沉积相序分布符合率较高(图9),不同相的分布规律与井所反映的宏观规律也非常吻合(图10)。

图8 塔河X区三角洲沉积储层模拟结果Fig.8 Simulation results of delta sedimentary reservoir in the Tahe X area

图9 塔河X区抽稀井沉积相对比Fig.9 Comparison of sedimentary facies between simulation results and well data in the Tahe X area

图10 塔河X区沉积相模型与井变差函数对比Fig.10 Comparison of variogram between simulation results and well data in the Tahe X area

5 结论

1)相序承载了储层的沉积规律,以相序相似度作为多点地质统计学建模的相似度判据,通过句法模式识别和动态规划方法,从训练图像中匹配与数据事件最相似的图型,进行多点地质统计学相建模,将储层沉积规律融于相似度判据中,提出了基于相序的多点地质统计学相建模新方法。

2)理论模型测试表明,通过相序相似度对比和动态数据模板,基于相序的多点地质统计学相建模方法能够很好地模拟出相的沉积规律和横向展布规律。在沉积正演模拟建立训练图像的基础上,采用本文方法建立了塔河X区三角洲沉积储层的相模型。该方法所建立的相模型较好地反映了三角洲沉积环境的沉积特征,提高了多点地质统计学相建模的精度,为复杂储层建模提供了一种新的实用方法。

3)新方法在保持传统多点地质统计学建模方法横向上模拟精度较好的优势下,着眼于相序相似度的对比和待模拟网格相序的选取。针对复杂油气藏相建模,可在两方面进一步进行研究:①多类型数据,如通过加入地震等软数据约束,使新方法更加精确地模拟更加复杂的沉积相序,得到更加符合地质规律的地质模型;②建立相序库,在本文方法的框架下,通过数据驱动,建立考虑沉积意义条件下基于数据驱动的多点地质统计学建模方法。

致谢:感谢中国石化石油勘探开发研究院赵磊博士和贺婷婷博士提供应用实例的基础数据。

猜你喜欢
沉积权重网格
用全等三角形破解网格题
权重常思“浮名轻”
反射的椭圆随机偏微分方程的网格逼近
《沉积与特提斯地质》征稿简则
为党督政勤履职 代民行权重担当
《沉积与特提斯地质》征稿简则
重叠网格装配中的一种改进ADT搜索方法
基于曲面展开的自由曲面网格划分
基于局部权重k-近质心近邻算法