柳庄小雪,郑民,于京都,张蔚,易庆
中国石油勘探开发研究院
石油运聚系数是石油运聚成藏效率的表征参数,也是石油资源成因法评价中的关键参数,一般用百分数来表示石油聚集量(或资源量)与供烃源岩生油量之比[1]。运聚系数大小受运聚方式决定,并直接影响运聚规模,是石油聚集量、区域石油富集程度的基本判断。因此,石油运聚系数是石油地质评价与资源评价相关联的一项关键参数,该参数的准确求取,对成因法评价中由石油生成量最终确定资源量起到了决定性作用[2]。
为了能够客观评价并准确求取运聚系数,多位学者曾先后尝试采用多因素综合评价法、多元线性回归统计法、层次分析法等方法计算运聚系数的合理取值[3-9]。前人的研究提供了较好的研究思路,并在特定盆地中取得了较好的应用效果,但受制于研究目标的局限性、计算方法的线性缺陷,使得运聚系数研究成果在我国主要含油气盆地范围的应用受到限制。
运聚系数的定量分析与油气勘探程度有较大关系。低勘探程度区,由于所需的基础参数欠缺,难以开展定量研究,通常采用地质类比法或专家打分法进行综合计算,其结果准确性不高。高勘探程度区,由于油气藏分布规律清楚,运聚系数的定量研究较为方便。宋国奇[3]采用多因素综合法,结合福克-沃德法,计算济阳坳陷东营凹陷石油运聚系数。祝厚勤等[4]利用层次分析法建立苏北盆地高邮凹陷油气运聚单元,定量评价油气成藏体系,计算石油运聚系数。从前人的研究结果来看,一方面其研究区域相对局限在某一特定凹陷,另一方面其评价目标主要以早期的中浅层油气藏为主,对于从全国范围了解石油运聚的特征与规律,并指导深层石油运聚效率研究的作用仍较为局限。
石油运聚系数是在成因上受生、储、盖、运、圈、保等多项地质要素综合影响的参数,在独立系统范围内具有较强的统计规律[10]。回归分析法主要通过建立统计学模型,分析各主控因素影响运聚系数的方式,定量寻找运聚系数与主控因素之间的关系,减少人为干扰,降低误差。柳广弟等[5]基于统计学基础,利于线性回归分析建立了石油运聚系数与烃源岩年龄、烃源岩成熟度、圈闭发育程度及上覆地层不整合个数的预测模型;刘成林等[11]在大量统计分析的基础上,建立了天然气运聚系数与烃源岩年龄、有机碳含量、成藏关键时刻、盖层厚度、盖层埋深、不整合个数、储层年龄间的关系模型;吕一兵等[12]基于BP 神经网络建立了石油运聚系数与烃源岩年龄、烃源岩成熟度、区域不整合个数与圈闭面积系数之间的预测模型;张蔚等[13]利用回归分析,建立了我国低勘探程度盆地油气运聚系数与主要生烃时间、有效储层百分比、圈闭面积系数以及区域不整合个数的统计模型。基于统计学的多元线性回归分析方法,可以用其反映运聚系数受各主控参数的影响,对运聚系数进行相对可靠的取值运算。
利用模型预测石油运聚系数时,模型预测精度主要受两方面关键要素的影响:一是模型可靠性直接受到建模时选用的地质参数及其取值准确程度的影响;二是建模方法本身是否具有合理的地质意义与数学原理。整体来看,现有模型的应用主要有以下3个难点:
(1)建模参数“取不到”
对石油运聚系数取值具有显著影响的部分参数在勘探生产实践中无法通过直接测试获得。如运移距离,源控论指出石油以环形分布于生油凹陷周围或邻近的上下地层中,储层距离油源越近,即运移距离越小,石油运聚效率越高,相应运聚系数越大,石油聚集量越大。但由于石油运移路径是微观的、复杂的,并遭到后期地质作用改造,无法客观测取。此外,部分参数对运聚系数的影响是定性的,在地质参数定量化表征的预测模型中无法直接应用,如供烃流线类型、输导体系类型等。
(2)建模参数“取不准”
受现有技术或评价区现今地质条件的限制,部分参数难以准确取值,例如有效烃源岩残留烃量。烃源岩生成的油气只有在满足自身储集能力后才能以游离相排出,烃源岩生烃量一定的情况下,烃源岩残留烃规模,就决定了排出烃规模与聚集烃量,从而影响运聚系数的取值。但是,受深层取样困难、残留烃损失等原因导致残留烃量测不准,从而使得用于建模时预测精度降低。
微课视频的内容要强调理论知识的重难点,对实践部分要强调过程、注重细节;在平台建设方面构建学习平台并上传学习资源;在知识储备方面,熟悉教学内容,预测可能出现的问题;在策略制定方面,教师制定教学策略,对教师的知识储备能力要求较高。
(3)预测模型“算不准”
基于上述2点原因,现有模型建立时,不得不舍弃部分与运聚系数具有密切关系的地质参数,或选用的地质参数取值误差较大,这导致建立的模型无法准确反映选用的地质参数与运聚系数之间的定量关系,使模型失去普遍代表性,造成预测结果不准确。并且,现有模型或以单一盆地建模,或以全国盆地为整体建模,前者应用范围局限,后者预测的针对性较低,这也使得现有模型的应用效果并不理想。另外,建模选用的数学方法是否适宜,也会影响到预测模型的精度。由于地质参数与运聚系数的关系复杂,前人多数采用的简单线性回归拟合的效果并不理想,更无法实现全国整体性、区域独立性的研究,也无法实现从中浅层向深层超深层的转换、从常规向非常规的转换。当前最为现实的做法是在普遍接受的简单线性模型基础上建立多元非线性回归模型,使预测模型更为精确,适用范围更为广泛。
应用模型预测运聚系数本质上是借助数学工具对地质理论思想的定量表征,其前提是必须满足地质解释的合理性。部分已有模型虽然能够求取一个运聚系数,但模型地质解释的合理性仍有待进一步完善;而且建模主要依靠中浅层刻度区数据,对于深层评价的适用性不高。因此,本文通过对我国东部、西部大量中浅层及深层刻度区数据进行统计分析,建立石油运聚系数与各主控地质参数相关性的预测模型,可用于快速、准确地求取我国各区域中浅层及深层的石油运聚系数。
石油运聚系数与相关的各项地质参数的非线性特征突出,无法应用多元线性回归或简单的二元非线性回归建立预测模型。本次预测模型的建立,采用构建目标函数的思路进行分析,在构建目标函数的过程中,首先确立原则并从多种地质条件中优选出影响运聚系数的主控因素,利用各主控因素构建目标函数大致结构,并基于回归建模原理细化目标函数模型;最后根据非线性迭代算法理论,分别针对我国东部、西部地区运聚系数进行迭代运算,最终建立多元非线性回归方程预测模型[14-15]。
2.2.1 主控因素优选原则
石油运聚系数受到多种地质因素交叉复合影响。通过逐个单独拟合烃源岩(图1a,1b)、储层(图1c,1d)、盖层(图1e,1f)等相关地质参数与石油运聚系数的相关关系发现,单个参数难以显著控制运聚系数的取值。因此,在对运聚系数进行定量计算时,需要在与烃源岩条件、保存条件、储层因素和充注因素等有关的几十项基础地质参数中,优选出对运聚系数有直观影响,且取值便捷的主控地质参数,然后对优选的主控参数进行组合分析。
在优选主控地质因素时,主要依据以下4 项原则:①所选地质参数代表性好,地质意义明确;②所选的地质参数与运聚系数相关性相对清晰,可以客观反映二者之间的数学关系;③所选参数易于获取,获取时方便快捷,应用时能够广泛适用;④取值客观,人为主观干扰程度相对低。综合考虑以上原则及实际情况,选取渤海湾、松辽、依舒地堑—方正断陷、鄂尔多斯、三塘湖、吐哈等共计6个盆地54 个刻度区的解剖成果,筛选出对油气运聚系数起主控作用的4 项基础地质参数:烃源岩年龄、储层年龄、盖层之上不整合个数、供烃流线类型。
图1 石油运聚系数与相关单参数拟合对比关系图Fig.1 Crossplots of oil migration and accumulation coefficients and related single parameter
2.2.2 主控因素定量参数
烃源岩年龄是控制油气运聚的一项重要条件。石油大量生成的时刻决定了石油从生成到距今所经历的时间长短。通常情况下,烃源岩年龄越大,表明其主要生烃时间距今越久远,那么在一段长时间的地质历史时期,石油散失的可能性就越大。当地层中石油保存量减少时,其运聚系数通常降低。
储层年龄是另一个影响石油运聚系数的重要因素。储层年龄越老,石油成藏后距今所经历的时代越久,经历后期改造活动的概率增加,构造运动发生的可能性越高。在长期构造破坏的条件下,石油贮存的稳定性会受到影响。储层年龄越大,其成岩演化程度就越高,孔隙度将逐渐减小,不利于油气汇聚。因此在一个盆地中,储层年龄越大,石油运聚系数越小。
从保存条件上考虑石油运聚系数受到的影响,盖层之上不整合个数直观地表示了油藏所经历的构造运动的次数。在一个盆地中,不整合个数越多,油藏所经历的后期改造越频繁,被破坏的可能性就增加。因此,不整合个数越多,油气运聚系数越小。
2.2.3 主控因素定性标准化参数
供烃流线类型体现了石油运聚系数受充注因素的影响。供烃流线类型包括汇聚流、平行流、发散流和线性流,直观地反映了供烃效率。供烃时油气越集中,石油运聚效率越大,如汇聚流运聚系数较大;反之,供烃越发散,石油分散范围越广,越不易聚集,如发散流和线性流,运聚系数降低。将汇聚流、平行流、发散流和线性流分别赋值为4、3、2、1,以此量化供烃流线类型,对石油运聚系数进行定量计算。
2.3.1 建立研究参数基础
基于参数优选研究,依托54 个刻度区解剖结果,建立与运聚系数相关的地质参数集合,构造上包含了前陆、断陷、克拉通等多种成盆构造动力学类型;层系上涵盖了从新生界古近系至古生界寒武系的相对完整的年代地层序列,将其作为多因素非线性预测模型建立的数据基础(表1)。
表1 我国主要盆地刻度区石油运聚系数与相关地质参数表Table 1 Oil migration and accumulation coefficients and related geological parameters of calibration plays in the major basins of China
表1 我国主要盆地刻度区石油运聚系数与相关地质参数表(续表)Table 1 Oil migration and accumulation coefficients and related geological parameters of calibration plays in the major basins of China (continued)
2.3.2 引入“中间参数”
在预测模型建立过程中,进一步引入源储年龄差及储源年龄比两项“中间参数”。对于源储年龄差,取其绝对值,该值越大,表明烃源岩与储层之间相距的地质年代越远,则造成油气藏破坏改造的地质事件发生的可能性更高,因此该差值的绝对值被认为与运聚系数呈现一定的负相关特征(图2)。
图2 源储年龄参数与运聚系数交会图Fig.2 Crossplots of source-reservoir age parameters and oil migration accumulation coefficients
另一方面,储源年龄比在预测模型建立过程中起到对源储年龄差的调节作用。考虑到当烃源岩、储层之间的年龄差值相同,而烃源岩与储层相对年轻时,其地质年龄之比也相对较低,表现为演化时间相对较短,在运聚及保存过程中遭受地质改造或破坏事件作用、发生烃类散失的概率相对较低。因此该比值被认为与运聚系数呈一定的负相关关系(图3)。
2.3.3 分区建立多元非线性预测模型
运聚系数与相关的各项地质条件参数的非线性特征突出,应用简单的二元非线性回归及多元线性回归均无法有效地建立预测模型。而在地质参数多且各参数间相互关联性难以明确的非线性建模条件下,如最小二乘法、logistic 回归、逐步回归等方法的适用性受限,因此本次预测模型研究采用了构建目标函数的思路进行分析。
图3 源储年龄差绝对值、储源年龄比与烃源岩年龄关系图Fig.3 Crossplots of absolute value of source-reservoir age difference,the age ratio of reservoir to source rock and the source age
首先,建立目标函数大致结构。根据源储年龄差绝对值与运聚系数所呈现的近对数—近幂函数特征的负相关关系,并考虑到储层年龄与烃源岩年龄之比的地质意义,因此模型中包含了基于两项中间参数的指数及幂函数结构。又由于烃源岩年龄与储层年龄分别与有机质演化程度、储层有效性等评价指标相关,因此在预测模型中还应将源、储年龄视为独立参数考虑。此外,其他两项研究参数“盖层之上不整合个数”和“供烃流线类型”为离散赋值式的评价指标,其与石油的运聚成藏具有较强的相关性,因此也应该做为预测模型的一部分体现。由此构建了目标函数的大致结构,如公式(1):
其次,基于回归建模原理来细化目标函数建模。由于无法通过对预测模型各部分的独立结果进行简单相加构建有效的预测模型,因此经过多次尝试,并根据非线性迭代算法的相关理论,分别针对我国东部与西部运聚系数进行迭代计算。最终,我国东部、西部地区石油运聚系数预测模型分别在50次及24 次迭代后,残差平方和趋于收敛,表明预测模型结构合理有效,利用回归方程构建的预测模型在一定程度上揭示了基础地质参数对运聚系数的影响方式,可以用于关键参数的预测。我国东部、西部地区石油运聚系数的预测模型分别如公式(2)、公式(3):
式中,y为石油运聚系数,%;x1为烃源岩年龄,Ma;x2为储层年龄,Ma;x3为盖层之上不整合个数;x4为供烃流线类型,汇聚流赋值为4,平行流赋值为3,发散流赋值为2,线性流赋值为1。
为检验所建立预测模型的预测精度,分别选取我国东部、西部盆地部分中浅层及深层刻度区相关地质参数的数据,利用预测模型计算其石油运聚系数,并将预测结果与所选用刻度区解剖结果中的实际运聚系数进行交会分析(图4)。
图4 东部、西部盆地模型预测结果与实际运聚系数交会图Fig.4 Crossplots of predictive values and actual values of oil migration and accumulation coefficients in eastern and western basins of China
通过检验来看,东部盆地模型预测精度R2为0.86(图4a),西部盆地模型预测精度R2为0.84(图4b),模型的平均预测精度达到0.85,说明预测值与实际值的吻合程度高,预测精度较高。同时,分别开展东部、西部盆地预测模型应用结果与实际运聚系数的回归标准化残差分析(图5),东部盆地的预测模型应用结果与实际运聚系数的回归标准化残差较为均匀地分布在基准线的两侧(图5a);用于西部盆地验证的刻度区数据较少,但其回归标准化残差仍具有沿基准线均匀分布的趋势(图5b)。这说明模型的预测效果较为稳定。综上所述,本次研究建立的模型预测精度较高、预测效果较稳定,可有效地预测我国各区域中浅层及深层石油运聚系数。
图5 东部、西部盆地预测模型应用结果与实际运聚系数残差分析图Fig.5 Residual analysis charts of predictive results and actual values of oil migration and accumulation coefficients in eastern and western basins of China
(1)石油运聚系数是石油运聚成藏效率的表征参数,也是石油资源成因法评价中的关键参数。通过多元非线性回归分析建立石油运聚系数预测模型,可以减少人为影响因素,较为准确地对我国主要盆地的石油运聚系数进行定量求取,从而计算石油资源量。这是目前计算运聚系数较有效的途径。
(2)综合分析我国6 个盆地54 个刻度区,石油运聚系数主要与烃源岩年龄、储层年龄、盖层之上不整合个数、供烃流线类型、源储年龄差绝对值以及储源年龄比这6 项主控地质参数有较好的相关关系。
(3)区分东部偏裂谷型盆地、西部偏克拉通型盆地所属刻度区解剖成果,利用多元非线性回归分析方程分别建立东部、西部盆地石油运聚系数预测模型,预测结果与刻度区解剖的实际运聚系数较为接近,预测精度高达85%,预测效果良好。