任永良 秦 健 许彦飞 高 胜 李 杰 杨厚麟
(东北石油大学机械科学与工程学院)
油田开发进入中后期,需要通过向地层注水来保持地层压力,提高油井产液量,同时通过注水驱油提高产油量。 但在某些低渗透区块或由于地层污染结垢、储层孔喉细小且强亲水、注入水水质不合格等情况下会导致该区块水井注入压力显著高于周边注水井的注水压力,在正常注水压力下无法达到地质配注量情况, 称为欠注井。通常情况下,欠注井数和注水量占整个注水井数和注水总量的比例不超过10%。 为了满足这部分欠注井配注需求,需要通过提高整个注水管网压强使其满足欠注井注水压力,也就是供水管网运营中的“就高不就低”原则。 但这种方法会使整个注水系统效率降低,单耗上升,导致能源浪费。 为此,需要在分析欠注井形成原因的基础上提出解决办法,分压注水是一种解决地层结构复杂区块欠注井注水问题的较好措施[1],它是将原来一套注水管网分成高、低压两套管网,分别向欠注高压井和普通注水井供水,原有的普通管网维持较低压强供水,满足大部分普通井注水需求;新建一套高压管网向欠注井供水。 为此,根据欠注井群的地理位置分布,运用聚类算法来确定增压站站址选择并确定每个增压站的设计规模,目的是满足铺设管道距离最短,投资费用最低。
聚类分析又称群分析,它是研究分类问题的一种多元统计分析[2]。所谓类,就是指相似元素的集合,要将相似元素聚为一类,通常选取元素的许多共同指标,然后通过分析元素的指标值来分辨元素间的差距,从而达到分类的目的。 在同一簇内的数据对象相似度比较高,而在不同簇中的数据对象相互间的相异度比较高,所研究的对象数据相互之间的相似程度的衡量指标是根据对象数据的相关属性来确定的,最普遍且常用的衡量指标是所研究数据彼此间的距离的远近,所研究数据之间的距离越大说明数据彼此相似度越低,反之则相似度越高。 聚类的目的是最大程度地使得在同一类的数据元素间的相似度高,类间的数据元素之间的相似度小。
K均值聚类算法是一种动态的快速聚类法,应用最为广泛[3]。 算法的思想是假定样本集中的全体样本可分为C类, 并选定C个初始聚类中心,然后根据最小距离原则将每个样本分配到某一类中,之后不断迭代计算各类的聚类中心,并依据新的聚类中心调整聚类情况,直到迭代收敛或聚类中心不再改变,聚类分析示意图如图1所示。
图1 聚类分析示意图
K均值聚类算法最后将总样本集G划分为C个子集:G1,G2,…,GC,满足以下条件:
使Je最小的聚类是误差平方和准则下的最优结果。
K均值算法由于是随机选取初始化聚类中心,故容易收敛于局部最小,因此对于数据分散不规律的数据集使用聚类算法时应对其进行改进以防止陷入局部最优,改进的重点目标在于初始聚类中心点的选择[4,5]。 改进算法的描述为:先在密度最大的数据集中选出一点作为第1个初始聚类中心, 再选取距离第1个聚类中心最远的数据点作为第2个初始聚类中心,然后选取距离第1个和第2个初始聚类中心最远的数据点作为第3个初始聚类中心,以此类推,选择出所需的全部初始聚类中心,再进行聚类计算,将会很好地改善聚类效果。
通常情况下聚类中心个数是未知的,通过不断的尝试才能得到较好的聚类数目,这对于使用者来说很不方便,一般采用轮廓系数法[6]和簇内离差平方和拐点法[7](手肘法)来确定聚类中心的个数。 最常用的方法是轮廓系数法,轮廓系数是反映聚类效果好坏的一种评价方式,轮廓系数越接近1,说明聚类越好;轮廓系数接近-1,则表明聚类不合理,故使用轮廓系数法时选择该系数最大值对应的k值即为最佳的聚类中心个数。
油田注水系统管网一般是由注水站、 配水间、注水井和连接管线组成,属于变量众多的大型复杂网络模型[8],常用的形式有环状、树状和星型管网模型。 对于欠注井群实施增压注水,从经济性和管理角度考虑,首先要解决增压站站址选择问题,其次要考虑增压站与欠注井之间的拓扑关系。 由于欠注井相对常规井来说,数量少、注水量小且地域分散,最经济有效的拓扑连接就是采用星式结构,即:一个增压站直接连接若干欠注井, 中间不用配水间和其他连接装置, 如图2所示。 因此,对站址的选择就归结为一类拓扑优化问题,即:如何规划增压站的数量、位置及每个站连接的注水井数量以保证整体管线铺设最短、建设投资费用最低的问题。
图2 欠注井增压站拓扑连接关系图
站、井间的优化布局,是在满足井正常配注的前提条件下使得管线最短,设计变量为欠注井与增压站的隶属关系和增压站的位置。
其中,m为增压站的数量;n为欠注井的数量;δij表示第i口欠注井到第j个增压站的连接关系,0表示未连接,1表示有连接;xi、yi为第i口欠注井的位置坐标;xj、yj为第j个增压站的位置坐标;U为欠注井位置坐标集合;Uj为增压站的位置坐标集合。式(3)、(4)为站、井隶属关系唯一性约束,保证了每一欠注井隶只能属于某一增压站;式(5)为增压站位置约束,保证增压站布置在可行域内。
上述优化问题是一个涉及离散变量、连续变量的大型非线性优化问题, 该问题是布局-分配问题的扩充,已经被证明为NP难问题[9]。 笔者尝试利用机器学习中的聚类算法对其进行求解,最后得出管网布局图。 具体步骤如下:
a.确定相关变量,以欠注井的位置坐标(xi,yi)为聚类指标变量,以增压站的位置坐标(xj,yj)为聚类中心,以增压站的个数为聚类中心个数k;
b.利用轮廓系数法或手肘法确定聚类中心的个数;
c.初始化聚类中心,随机选取一个欠注井的坐标作为第1个聚类中心,选取距离第1个聚类中心最远的欠注井坐标作为第2个聚类中心, 然后选取距离第1个聚类中心和第2个聚类中心最远的欠注井坐标作为第3个聚类中心, 以此类推选出k个聚类中心;
d.开始聚类计算,计算每口井到每个聚类中心的欧氏距离,根据距离最小原则将欠注井划分到相应的聚类中心;
e.更新聚类中心,以每一类下井坐标平均值作为新聚类中心按步骤d重新计算, 直至聚类中心不再改变时终止计算。 对于井站间的隶属关系和增压站的位置约束在算法中自动得到满足。
增压站是油田增压注水系统的动力源,它是增压区注水系统能否正常工作的前提,因此需要合理设定增压站的服务能力[10]。 增压站的设计流量应大于所辖欠注井群的配注流量之和,增压站的设计压力应大于所辖欠注井中地质油压与沿程阻力损失之和的最大值:
式中 Cw——粗糙系数;
Dij——第i个欠注井与第j个增压站相连的管径,m;
lij——第i个欠注井与第j个增压站相连的管长,m;
mj——第j个增压站所连注水井数;
pej——第j个增压站的设计压力,MPa;
pyi——第i个欠注井的地层油压,MPa;
qej——第j个增压站的设计排量,m3/h;
qi——第i个欠注井的注水量,m3/s;
qpi——增压站j所连的第i个欠注井的配注流量,m3/h;
Δhij——第i个欠注井与第j个增压站之间的管道沿程阻力损失,m。
增压站与欠注井之间的拓扑连接关系和增压站的服务能力确定之后,需要将增压站连接到改造后的低压管网上,在注水系统中由于注水干线上能量损失较小,因此将增压站连接在注水干线上。
在油田注水系统中相邻井排间的注水压力差异不大,因此相邻注水干线上的压力差异就会较小。 以图3来加以说明,低压区注水干线1和2压力相差较小,故在接入增压站时将以连接管线最短为原则,对于增压站2,在其附近有且仅有一条注水干线,故只能连接到注水干线1上,连接点为C点;对于增压站1,在其附近有两条注水干线,因此需要计算出增压站距离两条注水干线之间的距离并从中选取最小的一个作为连接干线,连接点为A点或B点。 关于连接点,能够使用原有节点尽量减少新设节点, 如增压站2的最佳连接节点为C点,若是C点和D点距离较近亦可连接到D点。
图3 增压站与低压注水管网的连接方式图
注水系统总的能耗分布如图4所示, 主要包括电机损耗、注水泵损耗、泵管压差损耗、管网损耗 和 井 口 节 流 损 耗 等[11~13],欠 注 井 增 压 改 造 措 施是通过将高压欠注井从注水管网中分离出来组成增压管网,使原有注水管网的工作压力大幅降低,从而降低大部分注水井的井口节流损失和部分管网损失来提高系统总的效率。
图4 注水系统能流模型图
注水系统效率公式:
式中 ηe——拖动注水泵的电机平均效率,%;
ηn——注水管网(从泵出口到注水井口)运行效率,%;
ηp——注水泵平均运行效率,%。通常情况下选用效率较高的泵进行注水生产,故所选各泵的电机效率与注水泵效率差别不大,可以认为各泵在此方面是相等的,如此一来,影响注水系统效率的因素就是管网运行效率,想要提高注水系统的效率就是要提高管网运行效率(降低管网中的能量损耗)。
注水管网运行效率公式为:
式中 m——注水泵数;
n——总注水井数;
pi——第i口井注水压力,MPa;
poi——第i台注水泵出口压力,MPa;
qi——第i口井注水量,m3/h;
qoi——第i台注水泵出口流量,m3/h。
为计算方便泵出口压力,记各泵出口压力平均值为po,流量取系统总流量,记作q。 故式(9)可表示为:
实施增压注水措施后管网效率为:
对注水系统而言有:
增压前后管网效率差值Δη=ηzn-ηn>0;故通过增压注水可以降低管网损耗提高注水系统的效率。
某大型油田普通注水管网有注水井2 190口,近年来由于部分注水井(压力需求较高)注水困难等问题,开井数量逐年减少,注水量下降了2.35万立方米。 目前,该注水管网为满足高注入压力井需求提高了注水系统整体压力,管网日注水量6.76×104m3/d,注水单耗446.11 kW·h/m3,平均泵压16.65 MPa,平均管压16.26 MPa,平均井口油压10.78 MPa,管网效率52.5%,注水井油压绝大部分低于13 MPa,高于14 MPa的井只有22口。 由此可见, 该注水系统为了满足部分高压井注水压力,将整个注水管网压力提高,导致在阀组上尤其是井口节流阀组的能耗损失过大。 为了降低注水能耗损失,对原注水系统实施整体降压,降压后有22口注水井处于欠注状态, 其分布如图5中红色所示。 为此,考虑对其进行分压改造,将欠注井群单独组为一套增压管网,合理布设增压站,满足投资成本最低的目标。
图5 油田注水系统管网图
欠注井增压布局设计如下。 利用Python软件根据轮廓系数法确定增压站的个数,依据轮廓系数使用原则轮廓系数越接近1, 表明聚类效果越好,如图6所示,横坐标为聚类中心个数,纵坐标为轮廓系数,当轮廓系数最大时对应的聚类中心个数(k)为5,故在此欠注井区应建5座增压站。 欠注井位置坐标为已知值,以增压站位置坐标为变量,以站、井隶属关系和增压站位置可行域为约束, 使用聚类算法进行目标函数数学模型求解,得出最短铺设管线时的增压站位置信息和井、站隶属关系,根据此信息进行管网布局。 聚类结果图如图7所示,最终增压注水管网布局图如图8所示。
图6 轮廓系数法示意图
图7 聚类结果示意图
图8 增压注水管网布局图
增压站服务能力设定。 增压站流量:因各欠注井的注水量是已知的, 故各增压站的服务流量应大于等于该站所辖各注水井的总注水量。 据此可得增压站1最小日出口流量为150 m3/d;增压站2最小日出口流量为120 m3/d; 增压站3最小日出口流量为225 m3/d;增压站4最小日出口流量为97 m3/d;增压站5最小日出口流量为140 m3/d。 增压站压力:各欠注井的配注压力已知,各增压站的服务压力应大于该站所辖各井压力与各井和该增压站相连接管线的压力损失(此处计算管线损失时取管径为60 mm)之和的最大值。 依次可得增压站1的最小服务压力为14.37 MPa; 增压站2的最小服务压力为14.21 MPa; 增压站3的最小服务压力为14.52 MPa; 增压站4 的最小服务压力为14.71 MPa;增压站5的最小服务压力为14.31 MPa。
根据管线最短原则将增压站连接到改造后的低压注水管网干线上。 经计算得出目标函数最小值为12 393.5 m。 增压站基本信息见表1。
表1 增压站信息表
增压注水节能降耗分析。 原注水管网实施整体降压局部增压后,整体管网压力降低0.7 MPa,管网效率53.8%, 与原管网相比提升了1.3%, 注水单耗5.82 kW·h/m3, 与原管网相比下降了0.29 kW·h/m3,日节电量2.01×104kW·h,年节电量7.3×106kW·h,按照工业用电费用0.7 元/kW·h, 则日节省费用1.4×104元,年节省费用5.1×106元。
大型油田注水系统是一套包含几千注水井、覆盖上百平方千米地域的多源非线性复杂管网系统,由于所处地质状况不同,注水井的注水压力各不相同,为满足所有注水井注水需求,注水管网压强必须满足注水压力最高注水井需求,导致管网压力偏高,低压井井口存在较大的节流损失而使管网效率降低。 而降低管网压力又会使高压井达不到配注要求,导致欠注并影响油田产液量。 采取分压、增压措施是提高注水系统管网效率及解决欠注问题的有效措施。 对于地域分散的欠注井采取简易的单井增压方法较为合理;而对于地域分布较为聚集的欠注井群,设置增压站可以降低投资成本和管理成本。 文中论述的基于聚类算法的油田注水系统欠注井群增压设计是针对地域分布较为聚集的欠注井群提出的一种设计方案,以铺设管线最短为目标解决增压站的选址、规模及欠注井群的拓扑连接关系等关键性问题,为油田注水系统节能降耗改造提供了一种技术参考。