李学贵,许少华,李 娜
(1.东北石油大学 计算机与信息技术学院,大庆 163318;2.山东科技大学 信息科学与工程学院,青岛 266590;3.大庆油田化工有限责任公司 东昊分公司,大庆 163312)
数字信号处理
基于支持向量机和粒子群优化的油层开采状态识别
李学贵1,许少华2,李 娜3
(1.东北石油大学 计算机与信息技术学院,大庆 163318;2.山东科技大学 信息科学与工程学院,青岛 266590;3.大庆油田化工有限责任公司 东昊分公司,大庆 163312)
针对开发小层生产状态评价问题,基于油井套损检测信号和储层岩性、物性、生产动态等动静态数据,提出了一种支持向量机和粒子群优化相结合的判别算法,较大提高了对多学科信息的综合能力和判别的准确性。
支持向量机;粒子群优化;开采状态识别
油管受到腐蚀、外力等作用,就会引起套管的损坏,影响油层的注水效果和油水产量,破坏油层的开采状态。油水井的套管损坏给油田正常勘探开发生产带来很大的危害,不仅造成经济损失,而且影响开发效果。大庆油田自投入开发以来至目前共计发现套损井近2万口,占到开发总井数的15.3%,每年以1200口的速度递增[1,2]。套损井的存在严重制约了油田正常生产,已经成为了制约油田稳产的难题。其危害在于:1)油井由于套损出现了大量的报废和停产,严重影响了产量;2)增加了大量的修井成本;3)破坏了开发小层的注采平衡关系,影响了地层压力和地质情况,又诱发新的套损。
目前,许多科研人员也对套损成因机理做了大量的研究,较多的研究都是从力学角度出发,设定边界条件,进行有限元模拟,定性研究套损情况,但是由于地质情况的复杂性及相关数据的不完备性造成了研究的局限性,很多力学参数特别是动态参数是估算而来,很难给出一个定性或者是定量的结论,研究区域以及研究领域的差异性很难用一种通用的机理来进行套损成因描述。近年来,许多学者考虑将神经网络等智能方法应用到套损预测,但是神经网络的结构设计过于依赖经验,支持向量机[3,4]基于结构风险最小化原则,泛化能力更优于神经网络,模型参数设置也更简单,被广泛应用油田勘探开发汇总[5~10]。为此将支持向量机应用油水井的套管损坏问题,实现油层开发状态识别,具有比较重要的实用价值。
基于支持向量机的套管损坏识别模型在套损数据的特征空间中寻找最优分类超平面,构建全局最优的套损分类器。SVM就是通过某种事先选择的非线性映射将输入向量映射到一个高维特征空间,在这个特征空间中构造最优分类超平面。
支持向量分类机的核函数受核函数参数σ影响,求解问题的关键转化为在最优核函数下寻找最优的惩罚因子C和核函数参数σ,以使得正确分类率最大。因此,以C和σ为对象在不同核函数类型下,C和σ在一定范围内取值,对于选定的C和σ,计算此组C和σ下训练集验证分类准确率,最终取得训练集验证分类准确率最高的那组C和σ作为最佳的参数。惩罚系数C与核参数σ选择过程实际上是一个优化搜索过程,采用优化算法就可以不必遍历所有参数点,也能找到全局最优解。针对支持向量机参数优化问题,采用粒子群优化算法对SVM参数寻优。
图1 支持向量机套管损坏识别算法流程
粒子群优化算法主要设置最大进化次数、种群大小,自身因子和全局因子,惯性因子等参数。由于优化SVM的主要目的在于获得更高的分类正确率,因此采用训练集进行CV意义下分类准确率Vacc作为粒子群优化算法的适应度函数,基于粒子群优化算法的SVM参数寻优算法描述如下:
Step 1:设置粒子群优化算法参数,最大进化次数、种群大小,自身因子和全局因子,惯性因子等参数,定义适应度函数Vacc;
Step 2:根据当前粒子位置,计算适应度函数;
Step 3:根据适应度函数值确定当前最优解;
Step 4:判断是否满足迭代终止条件,满足条件转到Step 6,不满足Step 5;
Step 5:更新粒子速度,根据粒子速度更新位置,进化步数t=t+1,转到Step 2;
Step 6:迭代结束,输出迄今为止的最优解S。
对于套损指标相关分析模型,选出对套损类型影响较大的套损指标因变量,采用的相似系数度量方法为夹角余弦和相关系数。
2.1 夹角余弦
指标Xi的n次观测值(x1i,x2i,…,xni)可以看成n维空间向量,则Xi和Xj的夹角αij的余弦称为两向量的相似系数,记为:
图2 PSO优化SVM参数算法流程
当指标Xi和指标Xj平行时,其夹角αij=0,夹角余弦Cij(1)=1,说明这两个指标向量完全相似,相似度100%;当指标Xi和指标Xj正交时,夹角αij =π2,夹角余弦Cij(1)=0,说明这两个向量不相关,相似度为0。
2.2 相关系数
相关系数是用以反映指标之间相关关系密切程度的统计指标,指标Xi和指标Xj的相关系数常用rij表示,记为Cij(2),即:
当Cij(2)=1时,表示两变量线性相关,一般Cij(2)≤1。
油层开采状态识别数据采用S开发区某区块小层数据进行资料处理,该区块压裂井数多、压裂层段多、压裂方式全,是典型的套损井较多的区块。选取区块中的15口产生套损油井的共301个小层的静态数据构成数据集,另取该区块7口井的共141个小层数据组成测试样本集,套损类型包括错断、变形。计算油层数据指标与套损类型的相关系数值,计算结果如表1所示,根据相关系数计算结果判断套损数据指标对不同对于套损类型的影响进行分析后,选取套损深度、二类砂岩顶深、二类砂岩厚度、砂岩顶深、砂岩厚度、有效顶深、有效厚度、有效厚度累计、孔隙度、渗透率、岩性11个数据指标作为识别的输入指标数据。
表1 套损数据指标与套损类别的相关系数结果
箱线图(Boxplot)是一种描述数据分布的统计图,利用它可以从视觉的角度来观察变量值的分布情况,对指标数据进行绘制箱线图,如图3所示。
图3 套损数据指标箱线图
将11种通过相关分析选择的数据指标和套损类型绘制样本数据散点图,分别绘制12张二维散点图展示数据分布情况,如图4所示。
基于粒子群算法的支持向量机参数寻优模型,最大迭代次数设置为100,种群数量设置10,惩罚因子C的范围取[0,10],核参数σ取值范围[0,10],迭代次数与适应度变化曲线如图5所示。
图4 套损数据指标散点图
【】【】
图5 粒子群算法进化迭代适应度曲线
仿真实验采用遗传算法参数寻优方法作为参比模型,支持向量机的核函数分别三种核函数:线性核函数、径向基(RBF)核函数和Sigmoid核函数。不同算法和三种核函数的套管损坏类型识别结果如表2所示。
表2 套损识别的识别率比较
从表2仿真实验结果可以看出,采用粒子群优化算法对SVM参数进行寻优的分类准确率上也优于遗传算法,得到了较好的效果,为解决油层开采状态识别问题提供了一种较为有效的方法。
针对基于机采井套损检测数据的开发小层生产状况诊断分析问题,建立了基于粒子群优化的支持向量机诊断分析模型,可较好解决实际油田开发评价研究中的小样本建模问题,提高预测模型和诊断分析模型的泛化能力。将PSO-SVM用于基于油田生产过程数据的开发指标预测和基于套管井损检测数据的开发小层生产状况分析问题,取得了良好的应用结果。
[1] 陆蔚刚,李自平,刘建忠,陈淑华,刘海龙.油田套损信息管理系统存在的问题及对策[J].大庆石油地质与开发,2006,25(6):79-81.
[2] 张斌然,张红滨,解玉锋,等.大庆油田套损井综合管理平台的构建[J].中外能源,2014,19(6).
[3] Vapnik VN.The Nature of Statistical Learning Theory[M].Neural Networks IEEE Transactions on,1995,10(5):988-999.
[4] Scholkopf B,Smola A J,Williamson R C.New support vector machines[J].Neural Computation,2000,12(5):1207-1245.
[5] 石广仁.支持向量机在裂缝预测及含气性评价应用中的优越性[J].石油勘探与开发,2008,35(5):588-594.
[6] 乐友喜,刘雯林.应用支持向量机方法预测聚合物驱参数[J].石油勘探与开发,2004,31(3):122-124.
[7] 于代国,孙建孟,王焕增,陈伟中,李召成,张振成.测井识别岩性新方法-支持向量机方法[J].大庆石油地质与开发,2005,24(5):93-95.
[8] 杨斌,匡立春,孙中春,施泽进.一种用于测井油气层综合识别的支持向量机方法[J].测井技术,2005,29(6):511-514.
[9] 袁士宝,蒋海岩,鲍丙生,陶军.基于支持向量机的火烧油层效果预测[J].石油勘探与开发,2007,34(1):104-107.
[10] 石广仁.支持向量机在多地质因素分析中的应用[J].石油学报,2008,29(2):195-198.
Production condition evaluation of development layer based on support vector machine and particle swarm optimization
LI Xue-gui1, XU Shao-Hua2, LI Na3
TP183
A
1009-0134(2017)04-0008-04
2016-12-19
国家自然科学基金(61170132);中国石油科技创新基金(2010D-5006-0302)
李学贵(1982 -),男,山东临沂人,讲师,博士研究生,研究方向为神经网络和数据挖掘。