卢异,胡浩 ,成亚斌,夏国朝,任光文
1.中国石油大港油田勘探开发研究院,天津滨海新区300280
2.中海福陆重工有限公司,广东珠海519090
3.中国石油大港油田公司资源评价处,天津滨海新区300280
随着数值模拟理论的不断完善以及计算机技术的快速发展,油气藏数值模拟逐渐由人工历史拟合向自动历史拟合发展[1-7],由传统的单模型预测向多模型预测改进[8-11]。多模型自动历史拟合主要分为两个部分:多初始模型的建立与挑选以及多模型的自动历史拟合。由于所建立的地质模型即使经过历史拟合,也仅能说明模型计算结果和已知的历史动态基本一致,无法保证能反映地下储层的真实分布,同时也无法保证对未来的预测准确。而采用多个特征各异却又符合历史动态的模型同时进行预测,提供一个未来生产情况的参考区间而非参考值,将更能够降低开发风险。
实际油藏建模中,即使经过粗化,大型油藏模型的网格数量仍可达数十万以上,数据量庞大,导致模型后期处理以及自动历史拟合效率低下,因此,需要对模型数据进行降维[12-14]。主成分分析(Principal Component Analysis,PCA)[15]是由Hotelling[16]提出的数据降维方法,通过对原始变量的相关矩阵或协方差矩阵结构的研究,将多个随机变量转换为少数几个新的随机变量(同时保留原始变量绝大部分特征信息),从而达到降维目的。
设随机实现样本为M={m1,m2,···,mNr},其中,mi表示第i个实现的参数向量,Nr则是实现个数。
根据最优重建准则,PCA 目标函数为
式中:
降维矩阵和原始参数向量相乘可将模型的参数向量由Nm维转化为n维(通常Nm≫n),样本矩阵M和单个实现数据向量m的降维可由式(4)计算
式中:
多个地质模型经过聚类,将属性相近的地质模型归并成一类,可以减少用于历史拟合的模型数量,本次采用K 中心点聚类方法进行聚类[17],主要原理如下:
设数据集合X中有f条a维数据,每条数据xq为一个对象。当e个初始中心点对象随机或按照一定依据选定后,将剩余的f−e个非中心点划分为e个组,分组的规则是将非中心点对象化归到离它最近的中心点。准确地说:如果Oq是一个非代表对象,Ow是一个代表对象(中心点),并且Oq与Ow的距离d(Oq,Ow)是Oq与所有中心点距离最近的,则称Oq属于Ow所代表的簇。两个对象的距离为
式(5)表示的是曼哈顿距离,根据不同情况可以选择欧氏距离等其他形式的距离。
初始中心点确定并划分好簇后,随后每一步随机使用一个非中心点对象Or替换现有中心点对象Ow,提高聚类质量。为了确保中心点Ow能够被Or很好地替代,在每一次替换时需要考虑4种情况。
对于所有f−e个非代表对象Oq,一次替代所造成的总代价为
式中:
若Ct小于0,则认为本次替换可以提高聚类质量,认可本次替换,反之则拒绝替换。
常规K 中心点聚类时间复杂度很高,最多需要e(f−e)2次计算判断,尤其对初始中心点的选择异常敏感。基于领域的K 中心点算法[18]通过对中心点设定邻域半径,选取相互距离较远的e个处于样本分布密集区域的数据作为K 中心点算法的初始聚类中心,即可以在初期找到佳中心点或到达最佳中心点附近,减少中心点替换次数,又能避免初始中心点处于同一簇造成重复计算。
数据对象的邻域半径R定义为
对于任意数据对象xw,以xw为中心,半径为R的圆形区域内的数据对象称为数据对象xw的邻域,用δw表示。
在邻域的限制下,K 中心点聚类效率得到显著提高。
在自动历史拟合研究中,需要将参数表示为向量的形式。如同时对孔隙度、渗透率、饱和度、相对渗透率和水体参数进行调整,则油藏参数组成的控制变量h可表示为
为了得到统一的历史数据格式,即每项数据在每个时间点都有数值,对应时间步测量则为测量值,没有测量也必须填写任意值,通常为0。
近年来,基于贝叶斯理论目标函数[11]被广泛用于自动历史拟合领域,不仅可以考虑动态历史和模型响应之间的偏差,同时可以充分利用随机实现中的先验信息,使得拟合后的模型更为符合实际地质统计规律。
目标函数的表达式为
将式(5)代入式(10),通过PCA 进行变换可得模型降维后目标函数式(11),可有效减少求解的计算量。
SPSA 算法[19]可以一次同时扰动所有控制变量,每次迭代仅需扰动两次即可求取随机梯度,随机梯度的期望为真实梯度,且恒为上山方向,在解决多变量的历史拟合问题时,效率高且收敛速度快。
本次在SPSA 算法的基础上,为了使随机梯度更接近真实梯度,提高算法稳定性,采用在每个迭代步中求取多个随机梯度,以其均值作为搜索方式
目前普遍认可实际油藏相邻网格的参数存在一定的相关性,参数场中相邻网格之间为渐变关系,引入控制变量协方差矩阵来指导生成扰动向量[20-21]
多模型历史拟合完整流程如图1所示,主要包括5个步骤。
图1 多模型历史拟合完整流程Fig.1 Process of multi-model history matching
(1)整理静态地质资料和动态观测数据,依据静态资料使用随机模拟建立多个实现;
(2)使用PCA 算法对模型数据进行降维;
(3)使用改进的K 中心点聚类算法挑选指定数量的随机实现作为初始模型;
(4)设定SPSA 算法参数,对所有初始模型进行自动历史拟合;
(5)使用拟合后的模型进行动态预测,评价开发不确定性。
以反五点井网模型为例,工区面积为1000m×1000m,网格划分为25×25×1=625个,网格尺寸为40 m×40m×20m,包含1口注水井(I)和4口采油井(A、B、C 和D 井)。研究区储层参数如表1 所示,5口井的物性参数见表2。
表1 储层参数Tab.1Properties of reservoir
表2 井的物性参数Tab.2 Physical properties of five wells
依据5口井的地质资料,使用序贯高斯模拟随机生成701组孔隙度、渗透率和净毛比的模型。选择其中一组作为参考模型,将其进行数值模拟运算后的生产数据作为油藏历史数据。
图2为参考模型的孔隙度、渗透率及净毛比的空间分布。该模型共模拟7200d,前6000d 作为历史数据,用于历史拟合,将后1200d 假设为未来真实动态,用于和经历史拟合确定后的模型参数预测结果做对比,分析预测的不确定性。
模型中的4口采油井采用定液量的方式生产,产油量变化如图3所示。从图3中可以看出,4口井的稳产时间不同,D 井的稳产时间最长、B 井的稳产时间最短。
图3 参考模型生产井产油量曲线Fig.3 Oil productionrate of four production wellssimulated by reference geologic model
使用PCA 算法对700个随机实现进行降维,每个实现包含孔隙度、渗透率和净毛比3类共625×3=1875个数据,经降维计算,前221个主成分即可表达原始数据90%以上的特征信息。由此每个实现的参数数据可由1875维降至221维。主成分数据对总样本数据的特征贡献率如图4所示。降维后的模型数据量大大减少,可以明显减少聚类计算量以及拟合阶段需要调整的参数数量。
图4 主成分特征贡献率Fig.4 Contribution rateof principal component
使用改进的K 中心点聚类算法,在降维后的数据中挑选出5个实现作为初始模型,初始模型的渗透率分布如图5所示,观察可知,5个初始模型的渗透率分布具有明显差别,各初始模型能很好地代表一类实现,能够更广泛地包含储层物性的分布。
图55 个初始模型的渗透率参数场Fig.5 Permeability distributionof five initial models
本例中仅考虑孔隙度、渗透率和净毛比3类变量对历史拟合的影响;经敏感性分析,发现渗透率对拟合效果产生较大影响,孔隙度和净毛比影响可以忽略,且自动历史拟合迭代超过30次后,目标函数已趋于收敛。
将渗透率作为拟合参数,设定最大扰动次数为30次。其余参数设置为:随机梯度个数为3,增益系数为10(增益系数是期望迭代次数的1/10或者更少),初始扰动幅度为0.6,初始搜索步长为0.3。历史拟合后的模型渗透率分布如图6所示,生产井A历史拟合前后的产油量对比见图7。
图6 拟合后的渗透率模型Fig.6 Permeability distribution after history matching
图7 不同初始模型下A 井产油量对比Fig.7 Contrast of oil productionrate of Well A simulated by five initial geologic models
由图7可以看出,A 井经过生产历史拟合后,5个模型的产油量与历史数据的符合率显著提高,表明拟合效果较好。同时,从图6可以看出,尽管各模型的渗透率分布存在差异,但都能获得相似的生产历史拟合效果,这也反映出生产历史拟合存在多解性,即多个地质模型的分布可以达到较为相似的生产效果。
另外,从A 井6 000~7 200 d 的生产预测结果可以看出,使用任何一个经历史拟合后的模型预测A井的未来产量,都与A 井真实产量存在一定差异,但A 井的真实产量包含在5个模型预测的产量范围内(图7)。这表明,使用单一模型预测的生产效果不佳,而采用多个模型预测的生产效果接近真实情况,因此,在今后的油藏数值模拟中,有必要采用多个模型进行生产效果预测。
(1)地质模型经过PCA 降维,可以保留地质模型中大部分特征的信息,并大大降低参数维度,减少聚类计算量,提高拟合效率。
(2)提出了利用改进K 中心点聚类方法为基础的初始模型挑选方法,使挑选出的模型具有很好的代表性,更广泛地反映储层的可能分布状况。
(3)在自动历史拟合中将基于贝叶斯理论的目标函数和PCA 算法相结合,提高了目标函数的计算效率。
(4)以理想反五点井网模型为研究对象,进行模型降维、聚类挑选及自动历史拟合的完整流程,验证了多模型自动历史拟合的可行性,实例中的整体动态数据的匹配度有明显提高,效果显著。