编译:张卓 姚淑影 (西南石油大学研究生部)
审校:叶仲斌 舒政 施雷庭 (油气藏地质与开发工程国家重点实验室·西南石油大学)
煤层气藏人工神经网络专家系统的研发与测试
编译:张卓 姚淑影 (西南石油大学研究生部)
审校:叶仲斌 舒政 施雷庭 (油气藏地质与开发工程国家重点实验室·西南石油大学)
油藏模拟器可有效地预测油气藏的生产动态,具有很好的准确性。但是,在油气藏开发的初期阶段,对储集层物性和生产参数的认识有很大程度的不确定性。而专家系统就像一个筛选工具一样能够用较低的成本和较少的时间模拟油气藏的动态。本文所描述的专家系统是一种预测煤层气藏生产动态的工具,其作用与数值模拟器相类似。专家系统借助于大量的数据而得到训练,对于给定的煤层气藏能够预测大约10年的气和水的生产剖面。同时,模型的其他输出还包括:累积产气量、累积产水量、期望的峰值气产量、达到峰值产量的时间以及煤层气藏废弃时间。本研究还涉及到逆向专家系统的研发,它能够从所期望的煤层气藏方案中筛选出最佳的生产方案。而常规油藏模拟器只有对大量的方案进行研究之后才能提出最佳的设计方案。逆向专家系统能够有效地解决最优化问题。
煤层气藏 人工神经网络 数值模型 逆向专家系统 生产动态预测
在油气藏开发的初期,在确定油藏参数方面具有很大的不确定性。这时,就需要研发一种能够考虑可能的储集层物性和设计参数的组合来预测生产动态的筛选工具。通过用这些参数在物理上的合理组合去训练人工神经网络,就有可能得到一种简单且成本合理的工具来模拟特定时期的煤层气藏的生产动态。
在建立神经网络模型的过程中,影响产气量的大部分重要参数都作为输入参数。模型输入参数分为两类:储集层物性参数和生产设计参数。用于此研究的神经模拟法涉及到结合硬件计算和软件计算程序。通过利用PSU COALCOMP模拟器和大量的数据样本来训练及测试专家系统工具箱的有效性。PSU COALCOMP是 Manik和 Ertekin两人于2002年开发的一个三维组分煤层气藏模拟器。
人工神经网络 (ANN)是根据生物神经系统功能的原理而建立的计算模型。它建立在以下的假设之上:通过大量的简单处理单元 (节点)之间的相互作用之后,获得一定水平的智能。从数学角度讲,当人工神经网络有输入数据集时,网络会产生各个输入参数的权重,进而产生输出结果,这个过程被称为网络学习过程。通过调整节点之间的权重提高了神经网络的学习能力 (Mohaghegh等人,1994)。神经网络最重要的特征是它的适应性。让神经网络接受足够的样本训练,它们就能够通过调整神经元之间的权重进行学习。
一个专家系统基本由下述部分组成。一是知识库,它一般包括人类专家给出的数据,同时还包括数据收集以及将数据转化成计算机能够识别的形式;二是推理机,即根据知识库中包含的规律和实际情况所编写的计算机程序以及用户和计算机进行交流的用户界面。借助于大量数据库的训练,研发的专家系统得到充分训练,它就有能力针对特定特征的煤层气藏提供大约10年的气和水的生产剖面。
有必要准备对煤层气藏生产有重大影响的参数清单。在煤层气藏中,源岩和储集岩相同。因此,气的生产剖面和运移机理与常规气藏不同。输入参数分为两大类。储集层物性,神经网络通过这些物性数据在其预测模型中输出结果。储集层物性参数见表1。
储集层物性不能人为控制,但某些工程参数可以人为控制。并且,合理调整工程参数可以调高产量。一些工程参数以及它们在模型中应用时的变化范围示于表2。
只考虑这些数据的极值情况就可能得出218种参数组合,这些参数组合输入到数值模型,产生训练数据。但我们的目标是利用物理上合理的组合来开发模拟程序,并且这些组合能够有效地帮助我们定义问题。在已有的专家知识和实际生产方案的基础上,可以得出不同的输入组合,这样就可以减少模拟程序运行的次数到刚好所需要的值。
表1 用于训练专家系统的储集层物性范围
表2 用于训练专家系统的设计参数范围
一旦模拟程序运行完毕,就可以将数据提供给人工神经网络。它的高效预测能力和概括能力取决于许多因素。现在还没有较好的准则来确保预测的准确性。网络结构这个术语指的是所使用的网络类型、隐层和神经元的数量、网络内部各层之间数据传递的函数、训练函数,以及其他用户可以测试的一些影响因素。在油藏工程应用过程中的概括问题方面,前馈反向传播网络是人工神经网络中最常用的。在本研究中一直用此网络训练所有的模型。
研究中,在完成最终的通用模型之前研发了几个中间模型。本文给出了两个主要中间模型:
◇对于一个特定的油气藏,井的设计参数变化的模型;
◇井的设计参数不变,储集层物性变化的煤层气藏模型。
构建网络时,有两个重要的问题需要特别注意。一是网络欠训练,经常发生在训练环节将要结束时,这会导致网络的概括能力较差;二是过度训练,在网络开始记忆所给数据时可能发生。
该模型的所有预测结果只适用于储集层物性不变,而井的设计参数变化的储集层。研究了两种不同的情况:渗透率各向同性系统和各向异性系统。各向同性情况下,生成模拟数据对神经网络进行训练的储集层物性示于表3。
表3 井设计参数改变的模型中运用的储集层物性 (均质的)
用来训练网络的储集层生产剖面 (q,日产气量)是时间的指数函数:
不同情况下的系数作为输出数据给出,同时网络也得到了训练。这个工作模型总共有130个数据样本,其中80个用于训练,30个用于有效性检验,20个用于测试。最初尝试的网络包含一个隐性层,12个神经元。神经元的数量,根据输入数据的数量、输出数据的数量以及用来训练网络的数据样本的数量粗略确定。当隐层神经元的数量大于16时,就会降低网络预测的准确性。作为停止准则的一个部分,最大运行次数增加到2000次。但是增加合法性错误的运行次数设置为200次即可接受。在相同网络结构的条件下,具有激励传递函数的网络表现更好。这种网络的样本结果见表4。
用渗透率各向异性的储集层物性参数去训练同一个网络。储集层物性见表5。在这种情况下,这种用函数拟合产气量曲线,并预测系数的方法行不通。取而代之的是,收集由数值模拟运行得出的不同时间的产气量,并作为输出数据去训练网络。
尽管这种方法会扩大输出矩阵的规模,但它能更有效地预测产气量。当一个通用模型被研发出来之后,对于相似结构的网络不管给定什么样的储集层物性组合都很有可能预测出产气量。共准备了100个模拟程序,60个用于训练,20个用于有效性校验,20个用于测试。经过不断地摸索,发现训练网络所需的隐性神经元个数在15~18之间。这时再将不同的储集层排采井网输入网络,统一X方向和Y方向上的网格量纲。这种模型的输出结果见表6。
表4 在储集层物性不变的模型中人工神经网络预测值与数值模拟值对比
表5 井设计参数改变的模型中运用的储集层物性 (非均质的)
表6 在同一储集层物性条件下人工神经网络预测值与数值模拟值对比
储集层物性参数的改变会影响系统的非线性程度,并且期待这种非线性程度受到高度重视。因为储集层物性并不为生产者所控制,并且影响产气量的每个储集层物性参数的重要性又是准备合适的数据样本必不可少的。所研究的所有模拟运行都是在固定的操作条件下进行的,操作条件概括于表7。
表7 储集层物性改变的模型中所用井设计参数
测量了15个不同时间段的产气量,并将其作为输出。由于网络越来越复杂,不太可能针对所有情况都得到相同水平的准确性。最初,在保持其他参数不变的情况下,只考虑了5个重要参数 (渗透率、原始煤层气藏压力、吸附压力、吸附量和吸附时间)。如果输入数据中包含原始含水饱和度,将会给系统带来更复杂的非线性关系。而像煤密度、煤层气藏温度和Correy相关系数那样的参数对生产剖面没有太大的影响。要想建立一个起作用的神经网络模型,100个模拟程序是不够的,还需更多。
当网络结构中包含一个有60个神经元的隐层时,人工神经网络就能输出最佳的结果。网络结构中,吸附能力的单位以 SCF/ton(1 SCF/ton=2.8316×10-5m3/kg)表示,而不是以1b·mol(气)/ton(煤)表示。吸附时间常数的单位是以天表示,而不是以秒表示。输入数据中还包括X方向和Y方向上的渗透率之比。注意,这些网络获取一些非线性关系之类的学习能力,是通过对其背后的数学方程和物理模型粗略的理解之后得出来的。从这个模型中输出的样本结果见表8。
表8 在储集层物性设计参数不变的条件下人工神经网络预测值与数值模拟值对比
一旦储集层物性确定,工程师将决定操作参数。针对有潜力的煤层气藏,这种模型能够像数值模型那样预测其生产剖面,从而预测产量。它还应该具有预测产水量的作用,因为在现有生产条件下,系统排水时间在确定经济开采煤层气藏方面起着重要的作用。最初准备了200个模拟程序来得到每个参数在输出结果中所占的权重。
当气井是水平井时,井放在 Y方向上,因为这时X方向被假定为高渗透率方向。与前面的模型相似,在关联权重分析的基础上,最初只考虑了9个重要参数 (表9),而其他输入参数保持不变。当简化的模型开始工作时,将这9个重要参数逐一输入网络。
表9 研发通用模型的初始输入的重要参数
当这些输入参数中原始含水饱和度变化时,遇到了一些问题:
◇网络不能准确预测峰值产气量以及其出现的时间。
◇在一些定期的产气量预测过程中出现了严重的波动。大部分出现这种情况的煤层气藏都包含了以下因素的组合:高裂缝渗透率 (>500 mD)、高原始含水饱和度或过早废弃时间。
这种模型被分为两部分。在第一部分中,在峰值产气量作为输出结果之前,先计算10个等距分布的时间点的产气量,使网络得到训练;在第二部分中,相似的训练,在峰值出现后计算产气量。当对预测结果相当满意时,将这两个模型合并成一个模型。据观察,产生预测结果严重波动的主要原因是网络训练的循环次数不够。
网络不能预测峰值附近的产气量是一个有待解决的非常具有挑战性的难题。一方面,在高裂缝渗透率的煤层中,气体产生太快,以至于峰值产气量在第20或第30天就出现了。另一方面,对于低孔、低渗的煤层气藏,气体释放速度太慢,峰值产气量出现的时间很晚,如一年或更久。最终的工作模型包括2个隐层,各自包括65个和30个神经元。模型结构见图1。
当模型应用于水平井时,模型输出的产气量、产水量预测样本如图2所示。
确定最优并不是一件容易的任务。正如下面所介绍的一样,将专家知识和人工神经网络系统结合起来,采取一种务实的态度就能实现最优化。在这个逆向模型中,实现井底生产压力预测和涵盖煤层气藏5年内所期望采出气量百分比的井模拟的可能性已经得到了证实。同样又研究了2个不同的模型:一个适用于水平井;另一个适用于直井。除了包含5年末的采收率之外,逆向模型的输入数据与前向传播模型相同,而井底流压和由表皮系数大小所决定的增产措施水平作为预测的输出结果。
图2 应用于水平井的通用模型对产气量和产水量预测
函数关系包括井底流压和裂缝渗透率的比值、井底流压和采收率的比值、井底流压和储集层厚度的比值、井底流压和原始含水饱和度的比值,这些函数关系与其他数据一起输出。在逆向模型的应用过程中,问题的解决方法不是唯一的,只是由于预测值与模拟结果不一致,这种解决方法不能同时丢弃。使逆向模型更有效的最好方法是,将从神经网络预测出的井底流压和表皮系数输入到针对此煤层气藏的数值模型中,然后对比数值模拟得到的5年末的采收率和输入到神经网络中的5年末的采收率。当逆向模型用于水平井和直井时,从模型中得到的预测样本和采收率对比分别见图3、图4。
(1)借助于大量的煤层气藏知识和误差反传算法,成功研发和测试了一种以神经模拟方法为基础、能够预测煤层气藏生产动态的筛选工具。
图4 逆向模型用于垂直井时的采收率对比
(2)这种模型的能力已经拓展到预测产水量。因为需要去除的水量以及达到此目的所需的时间是影响煤层气藏开采的经济学评价的一个重要因素。
(3)所选取的运行模拟器并训练网络的输入数据组合应该覆盖较宽的范围。同时,所有的组合应该在实践中可行并且能够代表实际煤层气藏。
(4)在具有高原始含水饱和度和高裂缝渗透率的煤层气藏中,人工神经网络对其峰值产量的预测并不总是准确的。
(5)随机地选取和测试样本,对于建立网络的可靠性以及确保模型的预测能力不仅仅局限于代表煤层气藏共性的样本数据来说,是必要的。
10.3969/j.issn.1002-641X.2010.3.001
资料来源于美国《SPE 119935》
2008-12-31)