基于GPR-DE模型的CO2-原油体系最小混相压力研究

2021-06-02 10:24侯智玮官志锐杨兴超
油气地质与采收率 2021年3期
关键词:精确度组分原油

侯智玮,刘 勇,叶 锋,官志锐,石 丹,杨兴超

(中国石油辽河油田分公司勘探开发研究院,辽宁盘锦 124010)

CO2混相驱替的成功与否,在很大程度上取决于CO2与原油达到混相所需的最小混相压力(MMP)。目前测定最小混相压力的方法主要有实验方法和理论方法,实验方法主要有细管实验法[1]、上升气泡仪法[2]、蒸汽密度法[3]、界面张力法[4]、多级混相接触方法、溶胀/萃取实验方法等,其实验过程繁琐,费时费力,且实验费用昂贵,比如构建一套完整的上升气泡仪器需要15 000 美元,而构建一套完整的细管实验仪器则大概需要40 000美元[5]。理论方法主要包含经验公式法、图版法、状态方程法、数值模拟方法、智能优化算法等。其中,经验公式法和图版法是根据某一特定油藏或特定的流体性质而得到的,适用范围较窄,精确度较差;状态方程法在计算最小混相压力时,需要根据油藏的具体特性计算出混相函数,而要确定具体混相函数比较复杂和困难;数值模拟方法要以大量的实验数据为基础,进行PVT 数据拟合,建立数值模型,最后确定最小混相压力,整个过程耗时比较长。

近年来,随着智能优化算法在油藏工程领域的广泛应用,许多学者尝试利用该算法来预测CO2-原油体系最小混相压力,其具有良好的鲁棒性、快速性和精确性,能够对输入自变量与输出变量之间的复杂关系进行建模。目前中外学者主要利用人工神经网络[6]、遗传算法[7]、交替条件期望[8]、最小二乘支持向量机方法[9]、基因表达编程[10]及混合类算法[11-13]构建预测模型。目前最小混相压力预测模型主要存在以下缺点:①模型大都是基于有限的数据点开发的,精确度差。②所使用的热力学参数和油藏流体参数取值范围有限。③模型预测的相关性不能准确地描述最小混相压力随输入参数变化的趋势。如根据实验数据,最小混相压力随着油藏温度的升高而增大,然而一些预测模型未能体现出这种关系。

为解决目前模型中数据点过少和模型精确度太低的问题,提出基于高斯过程回归(GPR)和差分进化算法(DE)的GPR-DE 模型来预测CO2-原油体系最小混相压力。

1 模型建立

1.1 数据采集和分析

通常模型或相关参数的适用性、可靠性和准确性与所使用基础数据的全面性和有效性有关。本次采用的数据库,比以往文献中数据更多,各项数据的取值范围也更广,主要包括油藏温度、注入气体中不同组分的组成、原油中C5+组分的分子质量(MWC5+)、原油中挥发组分与中间组分的比值、注入气体的临界温度和最小混相压力等,其实验数据主要来源于中外35个油田,据此总结了各项参数取值范围(表1)。

表1 不同参数的取值范围Table1 Value range of different parameters

1.2 模型基本原理

1.2.1 高斯过程回归

GPR 是基于贝叶斯学习和统计理论发展起来的一种机器学习方法,在处理高维数和非线性等复杂回归问题时具有较大优势[14-15],主要包括以下步骤。

第一步,预测过程。假设训练数据集为D=。f(xi)用来描述输入变量的随机过程。GPR 由均值函数m(x)和协方差函数k(x,x′)确定,因此,GPR可以定义为:

一般情况下,GPR模型可以表示为:

由于,ε∼N(0,),因此(4)式可变为:

依据贝叶斯原理,在测试数据集D*=[(X*,y*)]可以得到训练数据输出和测试数据输出的高斯分布为:

在训练数据集和测试数据集确定后,可以计算出预测值的后验概率分布为:

第二步,训练过程。协方差核函数是对称正定函数,常用的协方差核函数为平方指数函数:

通过建立训练样本的负对数似然函数计算超参数的初始值,并对每一项求偏导,再利用优化算法对偏导最小化得到超参数的最优解:

求得最优超参数后,利用(8)和(9)式可求得测试数据对应的预测值均值和方差,最终高斯过程回归的关系式如下:

1.2.2 差分进化算法

DE 算法是由RAINER 等于1997 年在遗传算法等进化思想的基础上提出的,用于求解多维空间中的整体最优解[16]。由于该算法具有寻优能力强、收敛速度快、鲁棒性强等特点[17],因而被广泛应用在数据挖掘、模式识别、油气田开发等各个领域。差分进化算法主要包括以下步骤。

第一步,种群初始化操作。在N维可行解空间随机生成初始种群。

第二步,变异操作。从初始种群中随机选取3个个体进行变异操作,得到变异后的种群:

第三步,交叉操作。将变异种群和初始种群交叉操作,得到交叉后的种群:

第四步,选择操作。基于贪婪选择方法,从初始种群和变异种群中选择适应度更高的个体进入下一代。当变异个体的适应度优于时,变异个体取代原个体,反之放弃变异个体,保留原个体,得到选择后的个体:

第五步,参数选择。差分进化算法的控制参数主要是种群规模、缩放因子和交叉概率,算法的性能很大程度上取决于控制参数的取值。

1.3 构建模型

构建模型的过程主要包括:第一步,确定输入和输出变量。输入变量包括油藏温度、原油中C5+组分的分子质量、原油中挥发组分(C1和N2)/中间组分(C2—C5,H2S 和CO2)、注入气体的临界温度和CO2-原油体系最小混相压力实验数据,输出变量包括CO2-原油体系最小混相压力预测值。第二步,训练和测试样本的选取。为建立准确可靠的模型,将模型所用数据集随机分为两个不同的样本,作为训练样本和测试样本。其中训练样本包含大约80%的数据点(约260 个数据点),用于模型开发和学习CO2-原油体系最小混相压力的物理规律。测试样本包括剩余20%的数据点(大约65个数据点),用于评估模型的准确性和有效性。第三步,建立CO2-原油体系最小混相压力模型。GPR-DE 模型在编程软件MATLAB 环境下实现,其中DE 用来优化GPR 中的超参数,使模型精确度更好,构建模型的流程如图1所示。

图1 GPR-DE模型流程Fig.1 Flow chart of GPR-DE model

2 结果与讨论

2.1 GPR-DE模型预测结果

由于样本量过大,从预测结果中选取了15组代表性数据进行分析。由表2 可知,模型预测结果与实验数据接近,为更加准确评价模型的误差,利用统计误差分析和图形误差分析来评价GPR-DE 模型预测精确度。

表2 GPR-DE模型部分预测结果Table2 Partial prediction results of GPR-DE model

2.1.1 统计误差分析

为了综合评价GPR-DE 模型预测结果的准确性和精确度,对模型预测结果的平均绝对相对误差、平均相对误差、均方根误差、标准差、平方相关系数等误差参数进行了综合误差研究。其表达式分别为:

其中:

分析各项误差参数,结果表明,平均绝对相对误差的大小最有说服力,平均绝对相对误差越小,模型的精确度越高。GPR-DE 模型计算的平均绝对相对误差为2.060%,标准差为0.053 2,平均相对误差为-0.183%,均方根误差为0.655。

2.1.2 图形误差分析

将GPR-DE 模型预测的最小混相压力与实验获得的最小混相压力交会(图2),数据点在45°线(X=Y)附近集中分布,证明其精确度较高。另外,还可以用模型的相关系数平方(R2)来表示,其值越大,模型精确度越高。由图2可以看出,R2为0.984 7,证明GPR-DE 模型精确度较高。预测结果数据点在0°线附近集中(图3),也证明GPR-DE 模型精确度较高。

图2 GRE-DE模型数据交会图Fig.2 Data crossplot of GRE-DE model

图3 GRE-DE模型结果相对误差Fig.3 Relative error of GRE-DE model results

2.2 与现有模型的对比

2.2.1 统计误差对比

现有预测模型多数仅能预测纯CO2-原油体系最小混相压力,而本文提出的GPR-DE 模型既可以预测纯CO2-原油体系最小混相压力,还能预测非纯CO2-原油体系最小混相压力。为证明其精确度,对比部分文献模型预测结果的统计误差。由表3可以看出,ANFIS-PSO,ANFIS-GA 提出的模型精确度较高。GLASO 和KAMARI 提出的模型精确度低。本文提出的GPR-DE 模型的平均绝对相对误差为2.060%,平均相对误差为-0.183%,均方根误差为0.655,整体上来看误差小。因此,本文提出的GPRDE模型精确度高于其他模型。

表3 不同模型预测结果的统计误差对比Table3 Comparison between statistical errors in prediction results of different models

2.2.2 图形误差对比

分别绘制GPR-DE模型、ANFIS-PSO模型及YELLIG,SHOKIR和LEE提出的模型预测结果交会图,并对比其相关系数平方。由图2和图4—图7可看出,本文提出的GPR-DE模型的相关系数平方(R2为0.984 7)最大,证明GPR-DE模型的精确度较高。

图4 ANFIS-PSO模型结果交会图Fig.4 Crossplot of ANFIS-PSO model results

2.3 参数敏感性分析

为验证模型的有效性和可靠性,需要证明模型预测结果与实验数据随各变量的变化趋势是一致的。分析油藏温度、原油中C5+组分的分子质量、挥发组分/中间组分和注入气体临界温度4 个输入参数的敏感性。

由图8—图11 可看出,模型预测结果与实验数据呈较好的一致性。模型预测的最小混相压力随着油藏温度、原油中C5+组分的分子质量、挥发组分/中间组分的增大而增大,随着注入气体临界温度的增大而降低,证明本文提出的GPR-DE模型可靠。

图5 YELLIG模型结果交会图Fig.5 Crossplot of YELLIG model results

图6 SHOKIR模型结果交会图Fig.6 Crossplot of SHOKIR model results

图7 LEE模型结果交会图Fig.7 Crossplot of LEE model results

图8 最小混相压力随油藏温度的变化Fig.8 Relationship between minimum miscibility pressure and reservoir temperature

图9 最小混相压力随MWC5+的变化Fig.9 Relationship between minimum miscibility pressure and MWC5+

图10 最小混相压力随挥发组分/中间组分的变化Fig.10 Relationship between minimum miscibility pressure and volatile components/intermediate components

图11 最小混相压力随注入气体的临界温度的变化Fig.11 Relationship between minimum miscibility pressure and critical temperature

3 结论

利用统计误差和图形误差评价GPR-DE 模型的精确度,并与现有模型的预测结果进行了对比。结果表明,GPR-DE 模型预测最小混相压力精确度最高,平均绝对相对误差仅为2.060%,在现有模型中误差最低。通过分析参数敏感性、统计误差和图形误差,验证了模型的有效性和可靠性。GPR-DE模型具有容易实现、精确度高、收敛速度快、鲁棒性强、使用范围广等优点,不仅可以用于预测CO2-原油体系最小混相压力,还可以预测其他气体和原油体系最小混相压力,为最小混相压力的预测提供了一个简单、便捷、精确度高的新方法。

符号解释

averageMMPpred——模型预测值的平均值,MPa;

AAPRE——平均绝对相对误差百分比,%;

APRE——平均相对误差百分比,%;

cov(y*)——测试数据x*对应预测值y*的方差;

C——噪声观测矢量;

CR——交叉概率;

D——训练数据集;

DE——差分进化算法;

Ei——相对误差百分比,%;

E[f(x)]——期望函数;

F——缩放因子;

f(x)——高斯过程回归函数;

GP——高斯过程;

GPR——高斯过程回归;

In——n维单位矩阵;

i,j——个体的第i,j个分量;

k(x,x')——协方差函数;

k(x*,x*)——测试点x*本身的协方差;

K(X,X)——n阶对称正定的协方差矩阵;

K(X,x*)——训练数据X与测试数据x*之间的n维列向量;

l——方差尺度;

L(θ)——负对数似然函数;

m(x)——均值函数;

MMP——最小混相压力,MPa;

MMPiexp——第i组最小混相压力实验数据,MPa;

MMPipred——第i组最小混相压力预测值,MPa;

MWC5+——原油中C5+组分的分子质量,g/mol;

N——构建模型数据个数,取值为325;

Np——种群规模;

randn(i)——1,2,…,N之间的随机量;

rand(j)——[0,1]之间的随机数;

R2——相关系数平方;

RMSE——均方根误差;

SD——标准差;

t——种群代数;

xi——D中第i个输入变量;

x*——测试数据X*中的测试点;

X——训练数据;

X*——测试数据;

y——训练数据X对应的输出;

yi——D中第i个输出结果;

y*——测试点x*对应的预测值;

α——估计参数;

θ——模型的超参数;

θi——模型的第i个超参数;

ε——服从高斯分布的噪声;

猜你喜欢
精确度组分原油
近红外定标法分析黏/锦/氨三组分纤维含量
气体组分对低热值气体MILD燃烧性质的影响
煤的族组分基本特性研究
放缩法在递推数列中的再探究
数形结合
大数据是“原油”,不是“汽油”
近似数1.8和1.80相同吗