基于K均值聚类方法的抽油机井系统能耗分析

2016-10-14 15:09王辉萍檀朝东任桂山刘萍杨若谷
数码设计 2016年2期
关键词:耗电量抽油机油井

王辉萍,檀朝东*,任桂山,刘萍,杨若谷



基于K均值聚类方法的抽油机井系统能耗分析

王辉萍1,檀朝东1*,任桂山2,刘萍3,杨若谷3

(1.中国石油大学(北京)石油工程学院,北京昌平102249;2.中石油大港油田采油工艺研究院,天津滨海新区,300280;3 北京雅丹石油技术开发有限公司北京昌平102200)

在智慧油田的助力下,大多数油田已基本实现了油田生产数据的自动化采集,然而这些数量巨大、维度高的数据信息并未得到有效利用。本文将K均值聚类分析方法应用到抽油机井能耗数据分析中,进行了能耗数据异常识别和油井能耗分类的工作。在分析过程中,分别选取单项、多项能耗指标对抽油机井进行自动分类,以高效地寻找高能耗油井,进而有针对性地对这些油井进行措施调整。

K均值聚类;抽油机井;能耗指标;数据预处理

引言

在油田开发中,抽油机井因其结构简单、适应性强、技术成熟等优势,在各大油田得到了广泛应用。然而其在采油过程中系统效率低下,能量损失严重,如今已超越注水系统成为油田最大的耗能用户。如何提高抽油机井系统效率、降低开采能耗,是降低油田生产成本、提高经济效益的关键。

在油井能耗分析方面,传统方法主要是从理论分析和经验分析两方面展开研究的,理论分析方法是基于石油工程的业务模型[1],对抽油机井能耗的影响因素进行研究,经验分析则是根据现场人员在油井日常管理中的经验对油井进行调参、检泵、洗井等措施来降低生产能耗。但两者都存在着一定的局限性。前者模型求解复杂困难,在实际现场生产中应用较少,后者主观性强、可靠性低。

面对传统分析方法的不足,智慧油田的建设为解决抽油机井能耗问题提供了新思路。当前,各大油田基本实现了抽油机井系统数据的自动化采集,这些数据涵盖了自地层、设备运行到原油生产等各个方面,记录了油井生产的全过程[2]。在处理分析这些数据时,数据挖掘技术展现出了其独特的优势,该技术能够对油田生产的海量数据进行分析,挖掘出数据中隐藏的有价值信息[3],揭示出抽油井系统中众多参数之间的相互关系。

要降低抽油机井的能耗,首先要找到能耗高的油井,目前大多油田将吨液百米耗电量作为能耗指标,根据现场经验对油井能耗进行高、中、低的划分。实际上,由于油田各个区块的地层条件、流体特性不尽相同,各区块的油井能耗特点也会有差异,很难制定统一的能耗标准对油井能耗分类。因此,采用吨液百米耗电量这一指标人为地对油井耗能划分范围,未必能找出真正耗能高的井组,有的油井在采取措施后甚至还会出现能耗升高的情况。

作为经典的数据挖掘方法,K均值聚类方法是一种无监督的学习方法,已经在客户细分、图像分割等领域得到了广泛应用[4]。其从数据自身特性出发,根据数据样本之间的相近相似关系对数据样本进行分类,体现的是样本数据本身的特性。因此,本文基于抽油机井能耗数据,运用K均值聚类分析方法对油井进行自动分类,并分析了各类油井产液量与能耗之间的关系。此外,在对数据进行预处理时,利用该方法对离散点敏感的特性进行了异常值识别和剔除,以保证分析数据的质量。

1 抽油机井能耗模型

抽油机井的整体能耗情况主要用吨液百米耗电量这一指标表示,而整个抽油机井系统的能量一部分用于举升井下液体之外,剩下的主要是抽油机井系统各个部分的能量损耗。这些能量损耗主要包括电机功率损耗、传动系统功率损耗、抽油杆功率损耗、抽油管摩阻损耗、抽油泵功率损耗等五大部分。由抽油机井的采集数据可以计算得各个能耗指标值,进而建立基于K均值聚类分析的油井能耗模型,是进行油井能耗数据特征分析的关键。

1.1 抽油机井系统的能耗指标

抽油机井的工作过程,就是一个能量不断传递和转化的过程[5]。地面电机通过皮带、减速箱传到曲柄,带动曲柄做低速旋转,将电能转化为机械能,接着通过四连杆机构实现驴头的上下往复运动,驴头连接光杆、抽油杆柱直达井下,带动抽油泵柱塞排出吸入液体。这其中每个环节都不可避免地存在着能量损耗,主要包括:电机功率损耗、传动系统功率损耗、抽油杆功率损耗、抽油管摩阻损耗、抽油泵功率损耗[6]等。抽油机井整体的能耗用吨液百米耗电量这一参数表征。

(1)电机功率损耗

(2)

(3)

式中:P输入—电机输入功率,kW;P轴—电机轴功率,kW;Pn—电机额定功率,kW;In—电机额定电流,kW;U—电机实际运行电压,V;I—电机实际运行电流,A;I0—电机在额定电压时的空载电流,A;cosφ—功率因数。

(2)传动系统功率损耗(皮带、减速箱、连杆损耗的总和)

(6)

式中:P光杆—光杆功率,kW;A—示功图载荷线包围的面积,cm2;n—冲次,min-1;s—光杆冲程,m;l—示长度,mm;C—动力仪力比,N/mm。

(3)抽油杆功率损耗

(8)

(9)

式中:P泵—泵功率,由井下功图计算得出;P有效—有效功率;H动—动液面深度,m;P油,P套—油压,套压,MPa。

(4)油管摩阻损耗

(11)

(5)抽油泵功率损耗

(6)吨液百米耗电量

(13)

抽油机井的采集数据主要包括基础数据和生产数据,基础数据主要有油管直径、泵径、含水率、原油粘度、原油饱和度等,生产数据包括泵深、动液面深度、油压、套压、电机运行参数、日产液量、井下功图数据、冲程、冲次等数据,由已知的油井的采集数据和公式(1-13),能够计算出抽油机井的各个能耗指标值,以便进一步对油井数据做分析。

1.2 基于K均值聚类分析的能耗模型

K均值聚类是著名的划分聚类分割方法。该方法将各个聚类子集的所有样本数据的平均值作为每个类(聚类子集)的中心点,通过计算各个样本与聚类中心之间的距离,将样本点归入到最近的类中,并不断迭代至收敛,从而实现样本分类。运用K均值聚类方法对抽油机井进行能耗分析,主要包含以下几个步骤:特征参数选取、数据预处理、K均值聚类、分析结果优选、数据特征分析。

(1)特征参数选取

为了考察在选用单个能耗指标与多个能耗指标作为特征参数对油井聚类的影响,分别选取了吨液百米耗电量和上述六项油井综合能耗指标进行分析。

(2)数据预处理

首先根据抽油机井的采集数据,结合公式计算六个能耗指标值,接着对这些能耗指标进行标准化处理,以减小聚类过程中各参数的取值范围对结果的影响。标准化处理的表达式见公式(14):

其中,a为样本的某一属性值,a’为标准化后的值,min(a)为所有样本中这一属性的最小值,max(a)为所有样本中这一属性的最大值。这里的样本就是参与分析的所有抽油机井。

由于在采集油井数据时,可能会因为环境干扰、测量仪器故障导致数据偏离正常值范围,出现数据异常,因此在分析前要对数据中的异常值进行剔除。利用K均值算法对离散点敏感的特点来识别异常值。具体做法是仅选择一个参数进行聚类,若聚出的某一类中仅有个别油井,则很有可能就是异常数据导致。

(3)K均值聚类

对数据预处理过后就可以对油井能耗数据进行聚类,其基本步骤[7]如下:

1) 设定油井数据的聚类数量,即K值;

2) 在油井中随机选择K个油井数据作为初始聚类中心,分别计算各个其他油井样本到这K个聚类中心的距离,并根据最小距离将这些油井归入相应的类中;

3) 对得到的各聚类子集中的所有油井数据求平均,即为新的聚类中心;

4) 重复2、3步骤,直至聚类中心不再变化。

(4)分析结果优选

由于在K均值聚类分析中,初始聚类中心是在所有样本井中的随机选取的,不同的初始中心有可能会导致不同的收敛结果,聚类结果会陷入局部最优[8],因而选用误差平方和准则函数E作为聚类性能的评价指标[9]。该函数可用来衡量聚类收敛后各样本与其对应的聚类中心的总距离,E值越小,说明样本点集合与中心的距离越近,聚类效果越好。

假设通过K均值聚类分析,已经将N口油井数据样本点xi(i=1,2,…,n)聚成K类,每类都是油井数据的集合,分别用表示,j=1,2,…,k,每类油井的聚类中心用表示,j=1,2,…,k,则误差平方和准则函数为:

(5)油井能耗特征分析

在两次聚类结果的基础上,分别对三类油井的能耗指标取平均值,将抽油机井分为高能耗井、中等能耗井和低能耗井,并比较单指标与多指标油井能耗聚类的特征。

2 应用

本文运用K均值聚类对华北油田某采油厂186口抽油机井能耗数据进行了特征分析。首先对数据进行了指标计算、标准化处理、异常值剔除等预处理工作,然后分别选取吨液百米耗电量单个指标和电机功率损耗、传动系统功率损耗、抽油杆功率损耗、抽油管摩阻损耗、抽油泵功率损耗、吨液百米耗电量这六项综合能耗指标作为特征参数,根据数据自身的特性对油井分类,以比较特征参数不同时聚类的结果差异。最后选取吨液百米耗电量、系统效率及日产液量三个参数进行聚类,以分析三者之间的相互关系。

2.1 异常值识别

在对油井分类之前,首先对各个能耗指标进行了单个参数聚类以剔除异常值。下面仅以传动功系统率损耗异常值识别为例来说明具体的分析过程。

选取所有抽油机井2015年1月1日的传动系统功率损耗数据,其中部分油井数据见表1,将油井分为3类。

表1 抽油机井传动系统功率损耗部分数据

经过数次K均值聚类分析后,分析结果基本一致,聚成的三类中所含油井数量分别为2,10,174,各类的传动系统功率损耗平均值分别为1904.36,17.92和1.80,见表2。其中第一类的传动功率损耗值已大大超过了正常范围,因此需将这两口井的数据删除,同时应及时查明数据异常原因,保证采集数据的质量。

表2 传动系统功率损耗聚类分析结果

2.2 油井能耗特征分析

经过数据预处理,筛选出171条合理的抽油机井生产数据,选取上述六项综合能耗指标将油井聚为3类,数次聚类分析的结果见表3。

表3 六项综合能耗指标聚类结果优选

结合误差平方和准则函数,选择E值最小的油井分类结果即第6次聚类结果,三类油井数量分别为82,39,50,其各类能耗指标的平均值见表4。

表4 六项综合能耗指标聚类分析结果

对六项综合能耗指标进行聚类后发现,大部分的油井能耗中等水平,第2类油井的总体能耗较高与其他两类,可划分为高能耗井,并且在这类井中,传动功率功率损耗值较其他损耗比重大。

当仅选择吨液百米耗电量进行K均值聚类分析时,分成的三类油井的结果见表5。

表5 单项能耗指标聚类分析结果

由表5可知,3类油井的吨液百米耗电量差异较大,第3类油井的能耗值远高于其他两类油井,属于高能耗井。

比较两次聚类的结果可以发现,在对油井按能耗数据进行分类时,选取单个指标和能耗综合指标进行聚类,分成的三类中每类包含的油井数量、平均能耗大小都有很大差异,因此,在寻找能耗高的油井时,仅从单个指标进行分类是不全面的。

为了探究油井吨液百米耗电量、系统效率、日产液量三者之间的关系,将这三个量作为特征参数,将油井分为三类,经过结果优选,三类所含油井数分别为9,58和104。各类参数平均值见表6。

表6 油井能耗主要因素聚类分析

可见,油井的系统效率主要分布在15%-55%之间,吨液百米耗电量在2-13kw·h/(t·100m)之间。其中,第3类油井能耗、系统效率正常,占所有油井的60%,第一类井属于高能耗井。从总体上看,吨液百米耗电量高的油井系统效率较低,这也与油田的实际情况相符合,而在这些系统效率低的油井中,油井的产液量也很低。因此,可考虑适当提高第1类油井的产液量以降低油井能耗情况,并通过后续油井能耗变化来验证结果的准确性。

3 结论

本文结合大量的抽油机井的能耗数据,运用K均值聚类分析方法对抽油机井能耗数据进行分析,主要得到以下结论。

(1)K均值聚类可以有效地识别油井能耗中的异常值,从而提高分析数据的质量;

(2)在对油井能耗进行聚类时,选取单项能耗指标与多项能耗指标进行分析的结果差异很大,仅近选择单项能耗指标不能全面地分析油井的整体能耗特征;

(3)K均值聚类适用于对油井的能耗进行定性的分析,若要进一步分析影响能耗的主要因素,还需在此基础上运用其他方法进行分析。

[1] Ming Ming Xing,Shimin Dong.A New Simulation Model for a Beam-Pumping System Applied in Energy Saving and Resource Consumption Reduction[J].SPE173190,2015.

[2] 檀朝东,张恒汝,马永忠,等. 油气生产大数据挖掘系统的研究及应用[J]. 数码设计,2016,5(1):49-52.

[3] 檀朝东,陈见成,刘志海,等. 大数据挖掘技术在石油工程的应用前景展望[J]. 中国石油和化工,2015,01:49-51.

[4] R J Kuo,L M Ho,C M Hu.Cluster Analysis in Industrial Market Segementation Through Artificial Neural Network[J].Computers and Industrial Engineering,2002,42(2):391-399.

[5] 樊文杰. 抽油机井能耗公式的建立与测试[J]. 油气田地面工程,2001,06:8-10.

[6] 郭小哲,刘跃忠,孙宝龙,等. 抽油机井系统效率方案优选及因素分析[J]. 钻采工艺,2008,03:92-96.

[7] 樊宁. K均值聚类算法在银行客户细分中的研究[J]. 计算机仿真,2011,03:369-372.

[8] 刘长骞. K均值算法改进及在网络入侵检测中的应用[J]. 计算机仿真,2011,03:190-193.

[9] 卓金武.Matlab在数学建模中的应用(第二版)[M].北京: 北京航空航天大学出版社,2014.9.

Energy Consumption Analysis of Rod Pumping Well System Based on K-Means Clustering

WANG Huiping1, TAN Chaodong1*,REN Guishan2, LIU Ping3, YANG Ruogu3

(1.College of Petroleum Engineering, China University of Petroleum, Beijing 102249, China 2. Beijing Yadan Petroleum Technology Development Co., Ltd, Beijing 102200, China)

With the help of intellectual oil field infrastructure, production data are now collected automatically in the majority of oil fields. However, the data with large volume and high dimension have not been effectively utilized. In this paper, K-means clustering is applied to analyze energy consumption data for the rod pumping system. The tasks include abnormal data identification and well clustering. During the analyzing process, both single and multiple energy consumption indicators are selected for clustering. In this way, wells with huge energy consumption are found efficiently. This study builds the foundation for well energy consumption saving .

K-means clustering; rod pumping wells; energy consumption indicators; data preprocessing

1672-9129(2016)02-0064-05

TP 3

A

2016-09-15;

2016-09-28。

王辉萍(1991-),女,江苏东台,硕士研究生,主要研究方向:采油工程、数据挖掘;檀朝东(1968-),男,安徽望江,副研究员,博士,主要研究方向:石油工程、物联网教学及科研;任桂山(1972-),男,高级工程师,主要研究方向:油田自动化;刘萍(1991-),女,湖北钟祥,高级工程师,主要研究方向:石油工程大数据挖掘;杨若谷(1980-),男,北京,高级工程师,主要研究方向:油气生产物联网、油气生产大数据挖掘及采油技术。

(*通信作者电子邮箱:tantcd@126.com)

猜你喜欢
耗电量抽油机油井
抽油机井泵效影响因素的确定方法*
电冰箱耗电量线性插值法的研究
空气源热泵供暖期耗电量计算
被忽略的“耗电大户”
新型油井水泥消泡剂的研制
一种油井水泥用抗分散絮凝剂
沁水盆地南部煤层气井抽油机偏磨防治分析
基于MATLAB的抽油机减速器优化设计
C-640系列抽油机游梁的组对及焊接变形控制
节能灯不能频繁开关