基于多元统计分析的油-源对比
——以渤海湾盆地渤东凹陷为例

2022-09-14 05:35郭喜浩徐昉昊黄晓波梁浩然李长志李智超
石油与天然气地质 2022年5期
关键词:烃源比值类别

郭喜浩,徐昉昊,黄晓波,江 涛,梁浩然,李长志,李智超

[1.成都理工大学油气藏地质及开发工程国家重点实验室,四川 成都 610059;2.中海石油(中国)有限公司天津分公司,天津 300459]

油-源对比是油气地球化学研究的重要内容之一,同时也是油气成藏研究的基础[1]。目前油-源对比常用的方法主要为生物标志化合物参数的二维或三维交会图法,但其涉及的生物标志物参数较少,无法同时考虑3个以上参数的影响,因此难免会存在一定的局限性,使油-源对比结果具有不确定性[2]。多元统计分析是一种高效的数据处理方法,可以同时考虑多个生物标志化合物参数的影响[3],从而使得油-源对比结果更具可靠性。早在20世纪80年代,多元统计分析就被应用于油气地球化学领域,主要包括聚类分析(HCA)、主成分分析(PCA)以及线性判别分析(LDA)[2]。Jürgen Rullktter等通过对某示例盆地原油的芳烃参数进行聚类分析,成功将原油划分为3类油族[4];Øygard等通过分析北海油田Brent,Cook,Statfjord和Trias构造原油的芳烃参数,使用主成分分析法确定了3类不同的原油类别[5];Zumberge等通过对全球216个原油样品的萜烷参数进行判别分析,成功将原油划分成5类[6]。值得注意的是,聚类分析主要依靠人为设定的相似性距离来确定分类,主观性较强,是一种相对比较粗糙的油-源对比方法。相比之下,主成分分析和线性判别分析在油-源对比中的应用效果更好。然而,上述多元统计方法在同一案例的对比应用和各自的适用性及优缺点尚没有学者进行专门的研究分析。

渤海湾盆地是中国东部的第二大产油盆地[3],原油产量占全国总产量的近三分之一[7]。渤东凹陷位于渤海湾盆地渤中坳陷东部的渤海区域,是渤海海域重要的油气勘探区[8]。近年来,随着勘探程度的不断提高,渤东凹陷已经发现了多个含油气构造[9],油气显示十分活跃,呈现出良好的勘探前景。渤东凹陷发育了沙河街组三段(沙三段)、沙一段-沙二段以及东营组三段等多套烃源岩[10],为油气成藏提供了充足的烃源基础,但同时给油-源对比带来了很大困难,表现出异常复杂的油气成藏特征。厘清原油的来源是进行油气成藏分析的前提,对下步成藏主控因素分析以及有利勘探方向预测具有重要意义。鉴于此,基于GC-MS(色谱-质谱)测试得到的各系列生物标志化合物参数,本文分析对比了主成分分析以及线性判别分析在渤东凹陷油-源对比研究中的应用效果,探索了各类方法的适用性,并结合实际地质情况予以改进,成功揭示了不同构造的油气来源,为渤东凹陷下一步的油气勘探提供技术指导。

1 区域地质背景

渤海湾盆地是位于中国东部沿海的大型新生代沉积盆地[11-12],面积约20×104km2。渤东凹陷位于渤海海域渤中坳陷东部,四周被多个凸起和隆起所包围,包括胶辽隆起、庙西北凸起、庙西南凸起、渤南低凸起以及渤东低凸起,北接辽东凹陷,西邻渤中凹陷(图1),总面积约3 850 km2。渤海湾盆地的两条大型走滑断裂带——北西西向张蓬断裂带和北北东向郯庐走滑断裂带在研究区交汇发育[13],其中郯庐走滑断裂带贯穿全区,形成了以北北东向和北东向为主的断裂体系,同时使得渤东凹陷整体走向呈北北东向,内部发育了多个次级洼陷。

图1 渤海湾盆地渤东凹陷构造单元特征及地层综合柱状图Fig.1 Location,structural units and comprehensive stratigraphic column of the Bodong Sag,Bohai Bay Basin

新生代渤东凹陷的构造-沉积演化可划分为2个主要阶段,即裂陷阶段(65.0~24.6 Ma)和拗陷阶段(24.6 Ma)[2]。裂陷阶段的沉积序列自下而上包括古近系孔店组(Ek)、沙河街组(Es)和东营组(Ed),以湖泊相和陆相三角洲沉积为主[14]。一般认为,在古近纪裂陷期发育了多套优质烃源岩,主要包括东三段(Ed3)、沙一段-沙二段(Es1-2)和沙三段(Es3)[15-16],这3套烃源岩分布面积较广,有机质丰度较高,均具有一定的生烃潜力,其中沙三段和沙一段-沙二段烃源岩以Ⅰ-Ⅱ1型干酪根为主,东三段烃源岩以Ⅱ1-Ⅲ型干酪根为主[17]。拗陷阶段的沉积序列自下而上包括新近系馆陶组(Ng)和明化镇组(Nm)以及第四系平原组(Qp),其中新近系以湖泊相和浅水三角洲相沉积为主[18],第四系以河流相沉积为主[19]。

2 样品与实验

2.1 样品概况

为比较不同烃源岩层段的生物标志化合物特征差异,此次研究分别从渤东凹陷东三段、沙一段、沙二段和沙三段共取了34个泥岩样品。另外,从渤东凹陷LD28,LD32,LD34等7个构造共取了28个原油样品,用来研究不同构造原油的来源。

2.2 气相色谱-质谱分析

本次气相GC-MS分析在中国海洋石油总公司天津分公司实验室中心进行。具体步骤为:先将泥岩样品清洗后磨成粉末,经氯仿/甲醇(87∶13)进行索氏抽提72 h,并采用柱层析的方法将抽提物和原油样品分离为饱和烃、芳香烃和胶质等族组分;然后使用HP6890GC/5973MSD仪器对提取物和原油样品的饱和烃组分进行气相色谱-质谱分析,仪器配备HP-5MS石英毛细管柱(30 m×0.25 mm×25µm),以氦气作为载气。升温程序设置为50℃停留2 min,然后以20℃/min升 温 至100℃,之 后 以3℃/min升 温 至310℃,停留16.5 min。质谱仪在全扫描和选择离子扫描两种模式下操作,根据保留时间和峰型特征识别化合物,并由单个化合物的峰面积计算生物标志化合物比率。

3 多元统计方法对比与选择

油-源对比的前提条件是存在多套烃源岩且具有各自明显的特征[2],因此,油-源对比方法的选择首先应考虑其是否能根据各类生物标志化合物参数有效区分各套烃源岩。此次研究分别探讨多元统计分析中主成分分析、Fisher线性判别分析以及Bayes线性判别分析等方法在渤东凹陷油源对比中的适用性。

前人在进行渤东凹陷临近区域的油-源对比中发现,4-MSI(4-甲基甾烷/∑C29甾烷)、ETR[ETR=(C28甾烷+C29甾烷)/(C28甾烷+C29甾烷+Ts)]、Gam/C30H(伽马蜡烷/C30藿烷)、C19TT/C23TT(C19三环萜烷/C23三环萜烷)、C21TT/C23TT(C21三环萜烷/C23三环萜烷)、TT/C30H(三环萜烷/C30藿烷)、C23TT/C30H(C23三环萜烷/C30藿烷)、Gam/C24Tet(伽马蜡烷/C24四环萜烷)和Gam/C31H(S+R)[伽马蜡烷/C31藿烷(S+R)]等9个生物标志化合物参数可以有效反映各套烃源岩之间的母质来源和沉积环境差异[20-23],鉴于此,此次研究采用这些参数进行多元统计分析。渤东凹陷烃源岩的主要生物标志化合物参数特征如表1所示。

表1 渤东凹陷烃源岩生物标志化合物参数Table 1 Biomarker parameters of source rock samples from the Bodong Sag

3.1 主成分分析

主成分分析是一种用于特征提取和线性降维的无监督学习方法,能够通过线性变换将多元数据集转换为一组不相关的、最大限度反映原始数据集大部分信息的新变量[24-26],称为“主成分”,其常被应用在油气地球化学相关研究中[27-28]。

为了检验主成分分析的适用性,此次研究首先对不同层位烃源岩样品的生物标志化合物数据集进行了主成分分析。在实际应用中,通常认为特征值大于1的主成分最有用,并且当主成分的累计贡献率超过85.00%时,便能反映原始数据的大部分信息[29]。因此,此次研究提取了前3个主成分(PC1,PC2和PC3)来进行油-源对比,这3个主成分均满足特征值大于1并且累积贡献率达86.17%(图2),可以充分表征渤东凹陷不同层位烃源岩样品的地球化学特征。基于主成分分析的因子得分图表明(图3),东三段和沙三段烃源岩样品得到了有效分离,效果较为明显,但沙一段-沙二段烃源岩样品分布较为分散,与东三段和沙三段烃源岩样品间的相关性较强,区分效果差,因此主成分分析无法适用于渤东凹陷后续的油-源对比。

图2 渤东凹陷烃源岩样品各主成分特征值与累积贡献率Fig.2 Eigenvalues and cumulative contribution rates of principal components in the source rocks from the Bodong Sag

图3 渤东凹陷烃源岩样品主成分分析的因子得分图Fig.3 Factor score diagram for principal component analysis of source rock samples taken from the Bodong Sag

3.2 Fisher线性判别分析

Fisher线性判别分析是一种有监督型的线性降维方法[30],其基本原理是:利用Fisher准则找到最佳的投影方向,使得投影后的样品在组间具有最大的差异,在组内具有最小的差异[31],从而达到样品类别最佳的分离效果。相比之下,主成分分析没有考虑样品类别之间的差异,因此Fisher线性判别分析更适用于分类[2]。Fisher线性判别分析的基本思想是:根据一系列已知类别的样品集作为训练集来建立判别函数模型,再利用得到的判别函数模型来判别未知的样品[32]。

此次研究将渤东凹陷34个烃源岩样品的生物标志化合物数据集作为训练集,同时将东三段、沙一段-沙二段和沙三段烃源岩作为分组变量,利用IBM SPSS Statistics软件进行Fisher线性判别分析,得到2个典型判别函数。通过绘制典型判别函数的组质心图(图4),发现东三段、沙一段-沙二段和沙三段烃源岩样品被有效分离,各组烃源岩之间的界限较为明显,说明基于Fisher线性判别分析的烃源岩分类判别效果明显优于主成分分析法。此外,为检查判别函数模型的可靠性,对烃源岩样品进行了总体验证(即用所有烃源岩样品数据得到的判别函数模型对每一个烃源岩样品进行验证)。经计算,总体验证正确率为85.3%(表2),表明该判别函数模型具有一定的可靠性,可以应用于研究区的油-源对比。

表2 渤东凹陷烃源岩样品Fisher线性判别分析和Bayes线性判别分析的总体验证结果Table 2 Overall verification results of Fisher and Bayes linear discriminant analyses for the source rock samples from the Bodong Sag

图4 基于Fisher线性判别分析的渤东凹陷烃源岩样品典型判别函数组质心图Fig.4 Group centroid map of typical discriminant function based on Fisher linear discriminant analysis for the source rock samples from the Bodong Sag

3.3 Bayes线性判别分析

Bayes线性判别分析同样也是一种有效的分类工具,通过Bayes准则,建立判别函数模型并计算每个样品的分类概率,以最大分类概率预测样品的类别,并使得判别分类具有最小的错判率[33]。

利用IBM SPSS Statistics软件对渤东凹陷烃源岩样品的生物标志化合物数据集进行Bayes线性判别分析,建立了分类判别模型,该模型的总体验证正确率可达88.2%(表2),可靠性高。将Bayes线性判别分析得到的分类概率绘制成三元图(图5),同样可以看出,东三段、沙一段-沙二段和沙三段烃源岩样品得到了有效分离,这表明Bayes判别模型可以用于研究区的油-源对比。

图5 渤东凹陷烃源岩样品分类概率三元图Fig.5 Ternary diagram of classification probability of source rock samples from the Bodong Sag

4 油源判别标准的建立及判别结果

上述研究论证了Fisher线性判别分析和Bayes线性判别分析均能适用于渤东凹陷的油-源对比,下步将同时采用这两种方法进行油源判别并对比分析其判别效果。

基于渤东凹陷烃源岩样品的生物标志化合物数据集,Fisher线性判别分析得到了如下两个典型判别函数:

将渤东凹陷不同构造的原油样品生物标志化合物参数代入典型判别函数得到点坐标(F1,F2),然后计算并比较该点与各套烃源岩组质心之间的距离,并取距离最短的作为判别分类。基于Fisher线性判别分析,渤东凹陷原油样品的判别结果如表3所示。

基于渤东凹陷烃源岩样品的生物标志化合物数据集,Bayes线性判别分析得到了如下3个分类判别函数:

同样将渤东凹陷不同构造原油的生物标志化合物参数代入上述的分类判别函数分别进行计算,并比较函数值的大小,若Y1值最大,则认为油样来源于东三段烃源岩;若Y2值最大,则认为油样来源于沙一段-沙二段烃源岩;若Y3值最大,则认为油样来源于沙三段烃源岩。此外还可以通过计算分类概率来判别类别,哪一类的分类概率最大则判别为哪一类,两种判别方法得到的判别结果均一致。基于Bayes线性判别分析,渤东凹陷原油样品的判别结果如表3所示。

表3 渤东凹陷烃源岩样品Fisher判别模型与Bayes判别模型的判别结果Table 3 Classification results based on the Fisher and Bayes discriminant models for the source rock samples from the Bodong Sag

对比这两种线性判别分析得出的结果,可知除LD32-A井2 388 m深度的样品外,基于Fisher判别分析和Bayes判别分析得到的油样分类结果均一致。值得注意的是:基于Bayes判别模型可知,LD32-A井2 388 m深度原油样品来源于东三段烃源岩的分类概率为0.42,来源于沙一段-沙二段烃源岩的分类概率为0.52,两种类别的分类概率均较大,说明该原油样品应同时具有东三段和沙一段-沙二段烃源岩的贡献,但该模型只以最大分类概率作为判别分类标准。不管是Fisher判别模型还是Bayes判别模型,模型给出的判别分类结果都是单一油源,无法判断多油源混合情况。

为改善线性判别分析在渤东凹陷油-源对比的应用效果,考虑到Bayes判别分析辨别烃源岩的准确率更高,此次研究以Bayes判别模型为例,基于分类概率的概念,对判别模型的判别准则进行了改进,使其可以适用于多源混合情况下的油源对比分析研究。改进的判别准则如下:

1)若样品类别1的分类概率≥50%,且类别2和类别3的分类概率均≤25%时,则将该样品判别为类别1。

2)若样品类别1和类别2的分类概率均>25%,且类别3的分类概率≤25%时,则将该样品判别为类别1和类别2的混合。

3)若样品类别1、类别2和类别3的分类概率均>25%,则将该样品判别为类别1、类别2和类别3的混合。

基于上述改进的判别准则可以将分类概率三元图划分为7个大区(图6),分别为Ⅰ区(Ed3区)、Ⅱ区(Es1-2区)、Ⅲ区(Es3区)、Ⅳ区(Ed3与Es1-2双混源区)、Ⅴ区(Es1-2和Es3双混源区)、Ⅵ区(Es3与Es1-2双混源区)以及Ⅶ区(Ed3,Es1-2与Es3三混源区)。渤东凹陷的原油样品主要位于Ⅰ区、Ⅱ区、Ⅲ区和Ⅳ区,因此可以将油样划分为4类油族,即油族A、油族B、油族C和油族D。油族A包括LD32-B井、PL9-A井、PL9-B井、LK8-A井的所有油样以及LK9-A井的馆陶组-明化镇组下段油样(表3),油源判别结果为东三段烃源岩;油族B包括LK9-B井和PL3-A井的油样,油源判别结果为沙一段-沙二段烃源岩;油族C包括LD28-A井和LD34-B井的油样、LK9-A井沙河街组的油样以及LD32-A井的部分油样,油源判别结果为沙三段烃源岩;油族D包括LD34-A井和LD34-C井的油样以及LD32-A井的部分油样,油源判别结果为东三段与沙一段-沙二段烃源岩。

图6 渤东凹陷油样分类概率三元图Fig.6 Ternary diagram of classification probability of oil samples from the Bodong Sag

5 油源判别结果

为检验油源判别结果是否具有地质意义,通过多元统计分析所使用的主要生物标志化合物参数,对不同层位烃源岩和各油族的地球化学特征进行了详细的分析,并根据构造等资料分析了原油充注过程。

5.1 地球化学分析

5.1.1 烃源岩地球化学特征

在渤海湾盆地的分子地球化学研究中,伽马蜡烷指数(Gam/C30H)和长链三环萜烷指数ETR常被用于指示地层沉积时期的水体盐度,Gam/C30H高值和ETR高值均代表沉积环境盐碱度高[34-35]。也有学者使用Gam/C31H(S+R)和Gam/C24Tet来衡量沉积水体的盐度[22,24],比值越大代表沉积水体盐度越高。渤东凹陷东三段烃源岩的Gam/C30H,ETR,Gam/C31H(S+R)和Gam/C24Tet平均值明显低于沙一段-沙二段和沙三段烃源岩(图7a—d),表明东三段烃源岩沉积于水体盐度较低的淡水湖泊环境,而沙一段-沙二段和沙三段烃源岩沉积于水体盐度较高的碱性湖泊环境。

萜烷可以反映沉积环境以及母质来源[20],通常认为C23三环萜烷优势指示丰富的藻类贡献,而C19三环萜烷或C21三环萜烷优势则指示高的陆源有机质输入[36],因此C19TT/C23TT比值或C21TT/C23TT比值可反映母质来源,比值越高代表陆源有机质输入越多。渤东凹陷东三段烃源岩具有很高的C19TT/C23TT比值和较高的C21TT/C23TT比值(图7e,f),表明陆源有机质输入量大;沙一段-沙二段烃源岩具有较低的C19TT/C23TT比值和稍低的C21TT/C23TT比值,表明陆源有机质输入较少;沙三段烃源岩的C19TT/C23TT比值和C21TT/C23TT比值最少,表明陆源有机质输入相对前两者更少。此外,TT/C30H比值和C23TT/C30H比值也是重要的母源参数,可用于比较细菌或藻类与原核生物的相对贡献[37]。渤东凹陷东三段烃源岩具有非常低的TT/C30H比值和C23TT/C30H比值(图7g,h),表明菌藻类贡献小;沙一段-沙二段烃源岩具有较低-较高的TT/C30H比值和C23TT/C30H比值,表明菌藻类贡献中等;沙三段烃源岩具有高的TT/C30H比值和C23TT/C30H比值,表明菌藻类贡献大。

图7 渤东凹陷各烃源岩和油族的生物标志化合物参数箱状图Fig.7 Box plots of biomarker parameters for the source rocks and oil families from the Bodong Sag

甾烷同样可以反映母质来源,在渤海湾盆地常使用4-MSI来指示丰富的沟鞭藻贡献[23]。渤东凹陷从东三段到沙三段,4-MSI值逐渐升高,表明沟鞭藻的生源贡献逐渐增大(图7i)。

5.1.2 原油地球化学特征

油族A具有最低的Gam/C30H比值、最低的ETR值、最低的Gam/C24Tet比值、最低的Gam/C31H(S+R)比值、最高的C19TT/C23TT比值、最高的C21TT/C23TT比值、较低的C23TT/C30H比值和较低的4-MSI值(图7),反映烃源岩沉积于淡水湖泊环境,陆源有机质输入很多而沟鞭藻贡献较小,与东三段烃源岩具有良好的相关性,吻合度较高。

油族B表现出最高的Gam/C30H比值、较高的ETR值、较高的Gam/C24Tet比值、较高的Gam/C31H(S+R)比值、较低的C19TT/C23TT比值、较低的C21TT/C23TT比值、较低的C23TT/C30H比值和较低的4-MSI值(图7),反映烃源岩沉积于碱性湖泊环境,陆源有机质输入少,沟鞭藻贡献均较小,与沙一段-沙二段烃源岩具有良好的相关性,吻合度较高。

油族C整体上表现出较高的Gam/C30H比值、最高的ETR值、最高的Gam/C24Tet比值、较高的Gam/C31H(S+R)比值、较低的C19TT/C23TT比值、最低的C21TT/C23TT比值、较高的C23TT/C30H比值和最高的4-MSI值(图7),反映烃源岩沉积于碱性湖泊,陆源有机质输入很少而沟鞭藻贡献很大,这与沙三段烃源岩具有良好的相关性,吻合度较高。

油族D整体上表现出较低-较高的Gam/C30H比值、较低-较高的ETR值、较低-较高的Gam/C24Tet比值、低-高的Gam/C31H(S+R)比值、较低-较高的C19TT/C23TT比值、中等的C21TT/C23TT比值、中等的C23TT/C30H比值和较低的4-MSI值(图7),反映烃源岩沉积水体盐度变化大,陆源有机质输入变化范围也较大,但沟鞭藻的贡献很小。这说明油组D为来自沙一段-沙二段和东三段烃源岩的混源油,吻合度较高。

5.2 原油充注分析

为佐证此次油源判别的准确性,专门对油源较为复杂的典型构造进行原油充注过程分析。LD34-B井原油来源于沙三段烃源岩,该井临近沙三段烃源灶(图8),由此推测为近源成藏模式,为附近的沙三段烃源岩生成的原油沿断裂垂向运移至古近系储层并聚集成藏。

图8 渤东凹陷北部构造带油气成藏立体图Fig.8 Stereogram of hydrocarbon accumulation model in the northern part of the Bodong Sag

LD32-A井位于3套烃源岩的烃源灶之上,具有优越的物质基础。油源判别结果显示,馆陶组上段原油(深度2 388 m)为来自东三段与沙一段-沙二段烃源岩的混源油,馆陶组下段-东二上亚段原油(深度2 662~2 917 m)来源于沙三段烃源岩,这与油源断裂的发育情况相吻合。馆陶组上段的油源断裂仅断至沙一段-沙二段烃源岩,没有沟通沙三段烃源岩,导致上部原油没有沙三段烃源岩的贡献;而馆陶组下段-东二上亚段的油源断裂断至沙三段烃源岩,有利于沙三段烃源岩生成的原油沿断裂垂向运移并聚集成藏。当然东三段和沙一段-沙二段烃源岩也可能具有一定的贡献,但贡献率较低。

LK9-A井、LD34-A井以及LD34-C井均远离烃源灶,因此推测这3口井均为远源成藏。油源判别结果显示,LK9-A井新近系储层原油来源于东三段烃源岩,推测为东三段烃源岩生成的原油经断裂-T2不整合面复合输导体系长距离运移后在新近系聚集成藏;而古近系储层原油来源于沙三段烃源岩,推测为沙三段烃源岩生成的原油经断裂-T5不整合面复合输导体系长距离运移后在古近系成藏。LD34-A井和LD34-C井的原油均为来自东三段与沙一段-沙二段烃源岩的混源油,推测为洼陷区域的东三段和沙一段-沙二段烃源岩生成的原油发生长距离运移并聚集成藏。

6 结论

1)主成分分析法不能有效地区分渤东凹陷东三段、沙一段-沙二段以及东三段主力烃源岩,而线性判别分析可以实现不同层位烃源岩间的准确分离,可以用于渤东凹陷的油-源对比研究。

2)渤东凹陷东三段烃源岩沉积于相对富氧的淡水湖泊环境,陆源有机质输入多而沟鞭藻贡献小;沙一段-沙二段烃源岩沉积于相对缺氧的碱性湖泊环境,陆源有机质输入少且沟鞭藻贡献均较小;沙三段烃源岩沉积于相对缺氧的碱性湖泊环境,陆源有机质输入较少而沟鞭藻贡献大。

3)Fisher判别分析和Bayes判别分析均不能判别实际中存在的混源油情况,为此在Bayes判别模型的基础上对判别准则进行了优化,将分类概率三元图划分为7大区,并成功识别出渤东凹陷存在的4类油族:油族A来源于东三段烃源岩;油族B来源于沙一段-沙二段烃源岩;油族C来源于沙三段烃源岩;油族D来源于东三段和沙一段-沙二段烃源岩。这4类油族的地球化学特征与对应烃源岩是相吻合的,同时典型构造的原油充注分析也佐证了此次油源判别结果的正确性。

猜你喜欢
烃源比值类别
黄河口凹陷烃源岩有机地球化学特征分析
二连盆地伊和乌苏凹陷烃源岩地球化学特征与生烃潜力
川东北地区陆相烃源岩评价
论陶瓷刻划花艺术类别与特征
一起去图书馆吧
也谈极值点偏移问题破解策略
物理中的比值定义法
平均功率与瞬时功率的比较与应用
陆相成熟烃源岩区连通砂体对油气运移的控制作用
选相纸 打照片