应用PCA和多元非线性回归快速预测储层敏感性

2018-04-07 18:14王沛欧阳传湘陈宏生陈向军
断块油气田 2018年2期
关键词:降维黏土敏感性

王沛 ,欧阳传湘 ,陈宏生 ,陈向军

(1.长江大学石油工程学院,湖北 武汉 430100;2.中国石化石油工程技术研究院,北京 100101)

0 引言

敏感性研究是分析储层损害机理的前提,能为钻井液、完井液的优化设计提供重要依据,对于制定系统的油气层保护技术方案也具有重要意义。敏感性实验是敏感性分析的常用方法,该方法所需岩心数量大,耗时久,岩心钻取切割与烘干过程中易受损害,造成实验结果误差大[1-2]。

近年来发展了许多预测储层敏感性的新方法[3],如模式识别法、回归分析法、神经网络法等。这些方法可通过一定量的样本数据预测储层敏感性,耗时短,并节省大量的人力物力。模式识别法是把敏感性与特征已知的样品按敏感性数值分不同等级,分别建立各等级样品的隶属函数,通过计算预测对象与均值样本的距离,预测储层的敏感性[4-6]。该方法原理简单,操作方便,无人为因素干扰,结果客观,但只能预测储层损害等级,精度低。回归分析法是根据已有样本建立数学模型,定量预测未知储层敏感性[7-9]。该方法原理简单,预测速度快,但模型选择易受人为因素影响,准确率低,泛化能力弱。神经网络法模拟人脑,自动提供复杂的非线性函数,依据样本数据建立模型,定量预测储层敏感性,预测精度高[10-13]。但该算法程序复杂,泛化能力弱,收敛速度慢,限制了它的广泛使用。

本文在分析现有储层敏感性预测方法的基础上,结合前人研究的成果,提出了一种耦合PCA与多元非线性回归分析预测储层敏感性的新方法,并通过精度检验提高其泛化能力。经拟合发现,该方法预测速度快,准确率高。

1 基本原理

首先对样本进行PCA降维处理,降维后得到的特征彼此之间相互独立,不存在线性相关的关系,便于探索特征值与预测值之间的数学关系;再用最小二乘法对各组样本数据综合分析,找出特征值与预测值之间的数学模型;最后用检验样本对模型进行精度检验。

1.1 PCA降维

PCA是一种对数据进行降维的数学方法,该方法把数据投射到样本散布最开的正交向量上,使投射平均均方误差尽可能小。使用投影的方式压缩数据,最大程度保存了原有数据信息,不舍弃任何特征。且该方法在计算过程中无需人为干预,计算结果只与数据本身相关。

PCA处理不但能减少每组样本的特征个数,而且确保这些特征相互独立,使样本规律更清晰,便于回归模型的挑选,并加快算法速度。

PCA降维的步骤为:

1)建立原始样本矩阵。

式中:X0为原始样本矩阵。

该样本共有n条数据、p个影响因素。

2)对原始数据进行标准化处理。

3)计算样本相关系数矩阵。假设进行数据标准化处理的样本矩阵为X,则X的相关系数矩阵为

式中:rij为矩阵X中第i列方差与第j列方差的协方差;R为矩阵X的相关系数矩阵。

4)计算相关系数矩阵的特征值和相应的特征向量,得到特征值 λ=(λ1,λ2,…,λp),特征向量 ai=(a1,a2,…,ap)。

5)根据影响因素累积贡献大小选择前k个因素。计算累积贡献率的公式为

式中:λi为矩阵R的特征值;η为累积贡献率。

通常,当累积贡献率达到85%以上时,即认为前k个影响因素已包含数据的原始信息。前k个特征向量组成的矩阵U,即样本降维矩阵。

式中:U为样本降维矩阵。

6)利用式(6),将p个影响因素降维成k个影响因素,即:

式中:X′为降维后的样本矩阵。

1.2 多元非线性回归

回归分析是对具有相关关系的2个或2个以上变量数量变化的一般关系进行测定,它主要是研究变量之间的相互关系,建立变量之间的经验公式,以便达到预测或控制的目的[8-9]。

多元非线性回归就是寻找能表示特征值x1,x2,…,xn和预测值yi之间的非线性函数关系式:

式中:yi为预测值;x1,x2,…,xn为特征值。

通过最小二乘法可求得模型中相应的参数。

1.3 二者结合预测储层敏感性

PCA能解决因多重共线问题导致的解空间不稳定性问题,除去噪声使数据更易显示其内在规律,但它不能明确特征向量与预测值之间的具体关系。

回归分析能明确特征向量与预测值之间的数学关系模型[9],得到敏感性损害程度的具体数值,但模型的选取受人为因素干扰较大。当选取的模型不适当时,预测结果可能与实际相差较大。且模型选定后,参数固定导致其泛化能力弱。

首先,利用PCA对样本降维、去噪,使其规律更明显;其次,采用回归分析法寻找合适的模型,定量预测储层敏感性;最后,检验模型预测精度,若精度低于85%,重新挑选训练样本重复前2步建立新模型,即可解决回归分析因受人为干预影响造成的误差与泛化能力差的问题。

2 盐敏预测模型的建立

盐敏是指当含盐度不同于地层水矿化度的流体进入储层时,引起黏土矿物的物理和化学变化,堵塞孔喉而造成渗透率下降的现象[1,14]。当高于地层水矿化度的工作液滤液进入油气层后,可能引起黏土的收缩、失稳、脱落;当低于地层水矿化度的工作液滤液进入油气层后,则可能引起黏土的膨胀和分散。黏土矿物质量分数是影响储层盐敏大小的重要因素[15]。

塔里木油田轮古井区三叠系油藏具有异常丰富的黏土矿物[16-17],其中以高岭石、伊利石、伊/蒙混层、绿泥石为主。该井区的矿物成分以石英和岩屑为主,长石次之。碳酸盐胶结物主要是方解石与白云石。

根据塔里木油田储层敏感性与储层物性、岩石结构、孔隙结构、岩石矿物组成及地层流体的密切关系[18],收集薄片、粒度、压汞、扫描电镜等实验资料,并结合大量相关文献资料,确定14个影响储层敏感性的主要特征参数:伊/蒙混层质量分数、伊利石质量分数、高岭石质量分数、绿泥石质量分数、黏土矿物质量分数、石英质量分数、钾长石质量分数、斜长石质量分数、方解石质量分数、黄铁矿质量分数、菱铁矿质量分数、白云石质量分数、气测渗透率与孔隙度。

首先,利用Python对90个样本进行PCA分析,通过奇异值分解求得的降维矩阵U为

其次,由式(7)将14维的特征向量降低为8维(以第1组数据变换为例):

再次,对敏感性已知的储层样本中的80%的训练数据进行回归分析,根据最小二乘法建立定量反映储层敏感性与8个特征的预测模型:

式中:y 为储层盐敏损害指数;x1,x2,…,x8为储层盐敏损害程度的影响因素;a为回归参数。

最后,通过样本中20%的数据进行精度检验,若精度低于85%,重新选择训练数据重复前2步,构建新的预测模型。

图1为所有样本数据的新方法预测结果。由图1可知,盐敏损害指数为0.2~0.9的样本预测结果较好,高于0.9或低于0.2的误差较大,因为该数据段样本较少,规律不明显。统计量0.87,说明该程序可快速、准确预测储层的敏感性,样本量越多,预测误差越小。

图1 塔里木油田轮古井区盐敏损害指数预测与实测结果

由表1可知,新方法准确率的平均值为95.7%,神经网络法准确率的平均值为94.9%,直接回归法准确率的平均值为86.4%。新方法与直接回归法相比,可大幅度提高预测值的准确率。与神经网络法相比,两者预测精准性相近,但神经网络法原理复杂,收敛速度慢,新方法可大大提高预测速度。

表1 塔里木油田轮古井区盐敏损害指数预测值与实际值结果对比

3 结论

1)利用耦合PCA与多元非线性回归的算法建立了预测储层敏感性的新模型,在塔里木油田试验后发现预测准确率的平均值在95%以上。

2)利用PCA方法投影降维,保证样本的最小损失;利用模型中的精度检验环节,增加其泛化能力:因此,新模型能快速、准确地预测储层敏感性。

3)新模型预测准确率与样本量有关。样本量较少时,预测结果误差较大。

[1]单华生,周锋德.伊通盆地鹿乡断陷低渗储层敏感性机理分析及分布预测[J].地球科学,2012,37(4):719-727.

[2]何永宏.鄂尔多斯盆地姬塬油田长8储层敏感性研究[J].断块油气田,2014,21(1): 87-91.

[3]李海斌.计算机技术在储层敏感性预测中的应用[J].计算机光盘软件与应用,2012(3):12-12.

[4]蒋官澄,王晓军,吴雄军,等.模式识别在储层敏感性预测中的应用[J].油气地质与采收率,2010,17(5):61-64.

[5]刘子雄,李敬松,黄子俊,等.利用模式识别方法预测低渗气井压裂产能[J].断块油气田,2015,22(4):505-507.

[6]王清华.改进的灰色模型在储层敏感性预测中的应用[J].钻井液与完井液,2008,25(4):31-33.

[7]范雯.逐步回归分析方法在储层参数预测中的应用[J].西安科技大学学报,2014,34(3):350-355.

[8]唐杰,林志扬,莫莉.多项式回归与一致性研究:应用及分析[J].心理学报,2011,43(12):1454-1461.

[9]张洁,陈文,康晓娜,等.玻璃微珠目数与砂床特征的回归分析模型[J].断块油气田,2015,22(2):270-272.

[10]江厚顺,孟宝锋,孙珀,等.基于Matlab下神经网络技术预测储层敏感性[J].西部探矿工程,2007,19(9):68-69.

[11]吴雄军,蒋官澄,赵琳,等.径向基神经网络优化及在储层敏感性定量预测中的应用[J].油气地质与采收率,2012,19(1):107-110.

[12]叶正荣,樊世忠,杨普华.综合运用BP网络和优化算法建立储层敏感性预测模型[J].钻井液与完井液,2000,17(3):9-13.

[13]夏文鹤,潘硕,孟英峰,等.基于音频信号的气体钻井返出岩屑量监测方法研究[J].石油钻探技术,2017,45(3):121-126.

[14]吴小斌,王志峰,崔智林,等.镇北地区超低渗储层敏感性评价及机理探讨[J].断块油气田,2013,20(2): 196-200.

[15]康毅力,罗平亚.黏土矿物对砂岩储层损害的影响:回顾与展望[J].钻井液与完井液,2000,17(5):36-40.

[16]贾进华,申银民.塔里木盆地东河砂岩段准层序组特征及岩相古地理与砂体分布[J].石油学报,2017,38(2):135-149.

[17]欧阳传湘,邓志颖,张伟.轮古7井区三叠系砂岩储层黏土矿物特征及敏感性损害研究[J].岩性油气藏,2011,23(5):111-114.

[18]原宏壮,孙建孟,肖承文,等.塔北地区储层敏感性综合预测[J].油气地质与采收率,2006,13(5):53-55.

猜你喜欢
降维黏土敏感性
混动成为降维打击的实力 东风风神皓极
不一般的黏土插画
降维打击
黏土多肉植物
报纸“黏土”等
钇对Mg-Zn-Y-Zr合金热裂敏感性影响
AH70DB钢焊接热影响区组织及其冷裂敏感性
一种改进的稀疏保持投影算法在高光谱数据降维中的应用
如何培养和提高新闻敏感性
微小RNA与食管癌放射敏感性的相关研究