基于PCA-NB方法的煤层气井压后产量预测研究

2020-01-14 06:44李忠城杨晨曦张云鹏汪若璇
特种油气藏 2019年6期
关键词:煤层气朴素贝叶斯

孔 鹏,李忠城,杨晨曦,张云鹏,汪若璇

(1.西南石油大学,四川 成都 610500; 2.中联煤层气有限责任公司晋城分公司,山西 晋城 048000; 3.中联煤层气有限责任公司,北京 100016; 4.中海油能源发展股份有限公司工程技术分公司,天津 300452)

0 引 言

截至 2017 年年底,中国已发现包括沁水,川南等在内的20余个煤层气田,累计探明煤层气地质储量为6 345×108m3[1]。水力压裂是实现煤层气有效开发的重要技术手段之一[2]。柿庄南区块煤层气储量丰富,勘探开发潜力大,但由于煤储层普遍具备低压、低渗、低饱和特征,同时受地质构造和工程施工方面的影响,目前部分排采井产量较低[3-6]。因此,建立煤层气井产量预测方法有利于煤层气井压裂前选井选层以及压裂施工参数的优化,从而提高煤层气井的产量。

传统煤层气井产量预测方法主要有数值模拟、数理统计、无因次产能图版法、物质平衡法等方法[7-11],重点集中在数学模型的建立和求解,注重选取参数及各参数与产能之间的关系。随着数据挖掘技术的发展,最近邻算法、层次分析法、BP神经网络方法以及支持向量机方法[12-15]广泛应用在石油及天然气产量预测当中。而最近邻算法计算量大;层次分析法定性的成分过多,导致结果主观性过强;BP神经网络所需要的目标函数非常复杂,导致计算速度慢;支持向量机方法对大规模样本适应性差且在多分类预测中存在困难。因此,提出基于主成分分析-朴素贝叶斯方法的煤层气井压裂后产量预测模型。朴素贝叶斯算法广泛应用在煤与瓦斯突出预测、档案管理及分类、医疗卫生中[16-19],具有坚实的数学基础、稳定的分类及预测效率[20]。不仅可以运用到大型数据库中,而且能同时处理多分类任务,方法简单、速度快,但该方法做出了特征独立的假设,对于一些相关性较强的参数会造成误差,因此,采取主成分分析法[21-22]提取相互独立的主成分,之后利用朴素贝叶斯模型对煤层气产量进行预测。

1 PCA-NB模型的建立

1.1 主成分分析(PCA)模型的建立

设有n个煤层气井样本,每口井包含p个指标,将原始数据写成矩阵形式。

(1) 原始数据标准化。

(1)

利用标准差标准化方法将数据标准化,将各个变量划定在(0,1)范围内,且服从正态分布。其中, 为各个指标数据标准化后的值。

(2) 建立变量相关系数矩阵。

R=(rij)pp

(2)

(3) 求R的特征根λ1、λ2…λp,使其满足λ1≥λ2≥…λp≥0;并求得特征值对应的单位特征向量a1、a2…ap。

(3)

(4) 计算主成分贡献率Cλi及累计贡献率 ∑Cλi。

(4)

(5)

取累计贡献率大于85%时的特征值λ1、λ2…λm对应的第1、第2、第m(m

(5) 写出主成分。

Fi=ai1X1+ai2X2+…aipXp(i=1,2,…,m)

(6)

1.2 朴素贝叶斯(NB)模型的建立

给定n个训练数据集(X,Y),将训练集中每个样本的指标通过主成分分析法化为m个主成分,即F=(F1,F2…Fm)。Y集合即类集合,包含了q个产量类别,即Y=(y1,y2…yq)。朴素贝叶斯方法的思想是,有一口待预测的井,判断这口井属于哪种产量类别的概率大,则该井预测的产量就属于该类别。具体方法如下:

(1) 计算先验概率P(yq)。所谓先验概率是指训练集中各个产量类别出现的概率,也就是每个产量类别的样本数与总训练样本数的比值。

(2) 计算条件概率P(F|yq)。条件概率为每一产量类别下每一主成分出现的概率,表达式为:

P(F|yq)=P(F1,F2,…Fm|yq)

(7)

朴素贝叶斯算法对条件概率分布做出了独立性的假设,即指标F1,F2,…Fm之间相互独立,前文计算所得的主成分满足了指标相互独立的假设,因此,条件概率公式可以写成:

(8)

(3) 计算后验概率P(yq|F)及最大后验概率。后验概率为待预测井主成分确定的情况下,该井属于某一产量类别的概率,即:

(9)

将式(8)带入式(9)可得,

(10)

最大后验概率表示待预测井在每个产量类别中出现概率的最大值,则该井预测的产量属于取最大概率时的产量类别。

(11)

2 实例应用

以山西沁水盆地东南部某区块煤层气井为例。目标区3号煤层埋深为450~1 380 m,平均为890 m;煤层厚度为4~7 m,平均为6 m;煤层含气量为3.11~21.51 m3/t,平均为12.02 m3/t。区块面积为763.206 km2,完钻井1 671口,投产井1 013口,平均单井产量为350 m3/d,不产气井或者低产气井较多,选取223口井(T1—T223)作为PCA-NB产量预测的训练样本,30口井作为预测的验证样本。

建立煤层气产量影响指标对煤层气产量的预测至关重要,选取含气量、含气饱和度、储层压力、临储比、储层压力梯度、渗透率、煤层厚度作为影响压裂后产量的地质因素;平均砂比、每米加砂强度、最大施工排量、前置液量占压裂液量的百分比(前置液比)作为影响压裂后产量的压裂施工因素;其他因素包括煤层井径扩大率、压裂液浸泡时间(表1)。煤层井径扩大,会使钻井液进入煤层从而损害储层,并且影响后期压裂施工及产气[23-25];压裂液不能及时返排会对储层造成伤害,从而影响采气效果[26-27]。

表1 基础数据

认为累计贡献率达到85%以上的主成分基本涵盖了因素的主要信息,利用式(5)计算累计贡献率并提取主成分。 13个指标的主成分特征值及累计贡献率如表2所示,第8个主成分时累计贡献率

表2 各主成分贡献率

为87%,因此提取前8个成分为主成分。每个主成分的贡献率代表了该主成分所包含的13个评价指标中所含信息大小。

根据式(3)计算特征向量,并提取8个主成分的所对应特征向量,即主成分中13个指标的系数(表3),每个指标系数在不同主成分中值不同,因此,每个主成分反映的信息不同。

根据8个主成分的系数,其表达式为:

(12)

表3 主成分系数

将训练样本的各指标值带入主成分表达式,建立朴素贝叶斯训练数据库。利用建立的朴素贝叶斯模型对223口井的预测效果进行训练,再利用30口井进行测试,其中产能划分类型和稳定产气峰值对应情况如表4所示,将煤层气井的稳定产气

表4 产能划分类型

峰值从低产到高产划分为5个等级。

根据提取的8个主成分表达式,将每口井的13个指标转化为8个主成分的值,稳定产气峰值依据表4的产能划分标准转化为产能类型,形成朴素贝叶斯训练数据库如表5所示。

根据建立的朴素贝叶斯训练数据库进行训练以及对30口井进行预测,利用主成分-朴素贝叶斯模型对产量预测的准确率达到了84.1%,其准确率高于基于主成分分析法的64.8%和朴素贝叶斯方法的76.4%以及神经网络预测方法的73.5%的准确率,说明该方法的准确性。

表5 朴素贝叶斯训练数据库

3 结 论

(1) 煤层气产量预测对于煤层气储层压裂选井选层,压裂施工参数优化以及经济评价具有重要意义,选取恰当准确的方法至关重要,实例表明,建立的主成分分析-朴素贝叶斯方法简便易行,预测准确率高。

(2) 产量预测选取的参数对预测结果会产生一定影响,参数的选取应遵循系统性、科学性、可选性等原则,文中选取的参数综合考虑了储层地质因素和工程因素,参数获取方便,且能全面反映煤层气产量影响因素。

(3) 增加各个产量类别的样本量能够提高模型的训练精度,从而提高预测结果的准确率,模型建立应因地制宜,不同研究区块需重新训练样本。

猜你喜欢
煤层气朴素贝叶斯
隔离朴素
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
朴素的安慰(组诗)
他是那样“笨拙”和朴素——30多年后,我们为什么还需要读路遥?
2019年《中国煤层气》征订单
沁南某区煤层气低效井增产技术研究
煤层气吸附-解吸机理再认识
煤层气输气管道最优化方法研究
最神奇最朴素的两本书