油田开采智能评价有用规则提取方法

2016-09-07 05:48宋盛瑶任伟建康朝海刘玉敏
东北石油大学学报 2016年3期
关键词:离群覆盖度采收率

于 镝, 宋盛瑶, 任伟建, 康朝海, 刘玉敏

( 东北石油大学 电气信息工程学院,黑龙江 大庆 163318 )



油田开采智能评价有用规则提取方法

于镝, 宋盛瑶, 任伟建, 康朝海, 刘玉敏

( 东北石油大学 电气信息工程学院,黑龙江 大庆163318 )

基于油田开采智能评价的有用规则是通过专家问卷调查产生的,受专家选择和实践检验的难度,以及某些专家经验规则可能与实际数据不一致影响而具有明显的局限性。采用基于区间Ⅱ型模糊集合的语言摘要方法,从油田开采数据库中产生IF-THEN规则,并根据真实度、覆盖度、可靠度和离群度等4个质量测度提取油田开采评价有用规则;进而基于平行坐标法及GUI界面建立可视化逻辑规则群。应用结果表明:该方法节省专家的时间,有助于在经验与实际数据不一致基础上完善专家经验规则。

区间Ⅱ型模糊集合; 语言摘要; 规则提取; 智能评价; 可视化; 逻辑规则群; 油田开采

0 引言

通过油田开采效果评价,确定影响油田开采效果的规律和主控因素、制订合理的油田开发调整措施,是提高油田采收率的核心内容。对于复杂的非均质油藏动态系统,采用理论、实验和数值模拟等方法,研究油田开采效果并通过现场实践验证,存在很大局限性。专家经验分析是一种重要和广泛使用的油田开采效果评价方法,它将油藏视为一个连续脉冲响应的系统,将油田生产动态近似看成由输入信号(注水量)产生输出信号(产量)的过程,由基于采出井产量和注入井注水量之间的相关性可以估计注采关系[1-2]。

在油田开采智能评价时,需将一些油田专家经验包含在评价规则中,规则可从专家调查问卷中挖掘。由于存在专家选择和实践检验的难度,以及某些专家经验规则可能与实际数据不一致问题,专家调查问卷产生有用规则的方法具有明显的局限性,如评价油田开采效果的核心指标是原油采收率,而原油采收率取决于波及系数和洗油效率。其中,波及系数的影响因素包括油层非均质性、流度比、原油黏度及注采关系等;洗油效率的影响因素是岩石渗透率、原油黏度、岩石润湿性和毛管数[3-5]。这些影响因素受油田地质条件、层系井网部署和开采方式影响,即不同油田、不同层系影响开采效果的规律不同、主控因素也有差异。另外,这些影响因素之间还存在不同程度的相互作用问题,专家难以从中提炼有用规则。在油田开采效果评价时,涉及大量注采井的地质信息、注采信息和开发调整信息,油藏非均质性及开采过程中油水分布和压力不断变化使油藏动态系统开采规律变得非常复杂,而流度比、原油黏度和毛管数等因素之间还存在相互作用,采用传统专家经验方法进行油田开采效果评价时,面临“海量油田数据和微量有用信息”的问题[6-8]。同时,专家调查词语的意思存在不确定性,油田采集的产量等数据存在测量噪声,语言和数据的不确定性导致隶属度函数的不确定性[9]。

Ⅱ型模糊集合[10]是传统Ⅰ型模糊集合的扩展,其本质是模糊集合中隶属度的再次模糊化表示,可更好地解决语言歧义和数据噪声问题。词计算方法是从自然语言中抽取词和命题并进行计算的一种方法[11],与模糊集合理论有紧密联系。Zadeh L A提出词计算概念,指出不同人对词的含义的理解具有差异性[12];Mendel J M认为词计算需要采用Ⅱ型模糊集合[13],并在词计算基础上提出感知计算机的概念[14];王飞跃应用词计算进行语言动力学研究,通过词计算有效地利用语言层次的动态信息,解决复杂系统的建模、分析、控制和评估问题[15];莫红运用区间Ⅱ型模糊集扩展原理,将常规数值函数转化为对应的区间Ⅱ型模糊函数,并给出相应的词计算方法与算法[16]。

笔者提出油田开采智能评价方案,利用基于区间Ⅱ型模糊集合的语言摘要方法[17-18],从油田开采评价数据中提取有用规则信息,应用数据可视化技术建立可视化逻辑规则群,提供更丰富和易理解的规则信息。

1 理论基础

1.1Ⅱ型模糊集合

(1)

图1 区间Ⅱ型模糊集合示意Fig.1 Schematic diagram of IT2-FS

(2)

(3)

1.2词计算

Mendel J M提出感知计算机包括编码器、词计算引擎和解码器三个要素,其输入和输出为词语[13],其结构见图2。由图2可知,首先由编码器把词编码成IT2-FS,然后用词计算引擎得到推理输出IT2-FS,最后由解码器把IT2-FS还原为“词”的形式。其中词计算引擎的主要思想是首先采用语言摘要方法提炼有用规则,然后采用基于激活区间的感知推理方法进行近似感知推理计算。

图2 感知计算机结构Fig.2 The structure of appreciable computer

2 评价方案

受复杂的油藏环境和海量的油田数据影响,现有地质研究与动态分析方法难度大、效率低。将油田开采评价数据与油藏工程师的专家经验结合,并根据基于Ⅱ型模糊集合的词计算思想构建油田开采评价方法。首先,采用区间法把与油层非均质性、注采关系、原油黏度、岩石渗透率、岩石润湿性、毛管数和采收率相关的“描述词语”编码成IT2-FS集合;然后,基于语言摘要方法和专家验证提取有用的规则库,设计感知推理机并得到推理输出IT2-FS;第三,通过解码将IT2-FS还原为“词”的形式,并给出建议输出;最后,经过专家验证得到有用规则,并用于油田开采评价。油田开采智能评价整体方案见图3,其重点是要解决油田开采智能评价过程中基于油田开采数据的有用规则提取问题。

图3 油田开发智能评价方案示意Fig.3 Intelligent evaluation program of oilfield development

3 语言摘要规则

3.1数据描述

(4)

如某一水驱油田开采评价数据库有392个区块的自动模型(M=392),即Y={模型1,模型2,…模型392}。每个模型都有7个属性(N=7),并且V={油层非均质性,注采关系,原油黏度,岩石渗透率,岩石润湿性,毛管数,采收率}。油层非均质性的范围是0~1,其定义域为X1=(0,1]。

3.2提炼方法

给定油田开采评价数据库,可以确定规则前件描述的变量为影响采收率的6个因素,规则后件描述的变量为采收率。考虑与之相关的5个描述词语:“很强”、“强”、“中等”、“弱”和“很弱”,应用区间法[19]得到与之对应的区间Ⅱ型模糊集合,这些词与其不确定域组成一个编码簿,便于词计算中的语言摘要、感知推理和解码操作,可以构造所有可能的规则组合。

对于多规则前件和单规则后件的IF-THEN规则形式为

(5)

(6)

定义平均联合基数为

(7)

为了方便计算,用平均联合基数定义真实度T:

(8)

(2)覆盖度C表示规则的广泛性。它描述是否有足够的数据支撑某条规则。覆盖度与真实度相互独立,因为具有高覆盖度的规则并不代表具有高的真实度。覆盖度表示为

(9)

(3)可靠度R表示规则的可靠程度。当且仅当一条规则具有很高的真实度时,该规则才是可靠的,即大多数的数据既满足规则前件又具有规则后件描述的行为,同时又具有充分的覆盖度,即该规则有足够的数据描述。可靠度表示为

R=min(T,C)。

(10)

(4)离群度O表示规则的独特性。独特性意味一条规则只描述异常情况且未所预料。一条异常规则的充分覆盖度必须非常小,即该规则只描述非常少的数据;然而,覆盖度并不足以确定离群规则,同时应该考虑其真实度。一个离群规则必须满足准则:1)真实度必须是很小或很大;2)充分覆盖程度必须很小。找出一个离群规则的目的是帮助人们确定并研究可能的离群数据,所以需要从离群规则中排除真实度T=0的规则,因为该规则不描述任何数据。离群度表示为

(11)

由离群规则的第一个准则要求,max(T,1-T)将接近0的小T或者接近1的大T变换成[0,1]的大数;并且由离群规则的第二个准则限制C必须小,所以由min(max(T,1-T),1-C)进一步限制。某条规则的离群度O越接近1,它为离群规则的可能性越大。

4 可视化逻辑规则群应用

应用平行坐标法,基于油田开采评价数据库,通过MATLAB软件的GUI界面建立可视化模糊逻辑规则群。GUI界面由4部分组成,右上部分显示规则的真实度、覆盖度、可靠度和离群度的值,根据质量测度的等级排序可以判断受关注规则的真实性、普遍性、可靠性和独特性。左上部分显示4个质量测度进行优先等级排序时对应的规则。中间区域显示当前选中的规则中各个变量对应的区间,以及与规则相关或不相关的规则逻辑,蓝色代表支持当前规则,绿色区域代表当前规则覆盖的区域,红色代表违背当前规则,黑色代表与当前规则不相关。界面下方显示规则前件和后件变量对应的不确定域。

4.1两规则前件和单规则后件情况

当考虑与采收率相关的两个影响因素对采收率的影响时,共产生1.875×103条规则。选取其中最具代表性的4组界面进行描述(见图4)。

以真实度为主时的界面见图4(a),当前规则为“当注采关系强且渗透率高时,则采收率低”,只有一种情况符合规则,并且当前规则不符合油田生产实际,规则只描述很少的离群情况,不能单纯应用真实度质量测度衡量规则是否有用。

以覆盖度为主时的界面见图4(b),当前规则为“当注采关系弱且非均质性弱时,则采收率很低”,有些情况符合规则,但也有些情况与之相悖,并且当前规则不符合油田生产实际,所以也不能单纯应用覆盖度质量测度衡量规则是否有用。

以可靠度为主的界面见图4(c),当前规则为“若渗透率小且毛管数小,则采收率很低”。当前规则具有高的真实度和充分的覆盖度,并且符合油田生产实际,因此可由可靠度质量测度评价当前规则有用。

以离群度为主的界面见图4(d),当前规则为“若注采关系适中且渗透率适中,则采收率很低”,只有一种情况符合规则,可视当前规则为离群规则。

图4 两规则前件和单规则后件可视化逻辑规则群应用界面Fig.4 Interface visual logic rules groups application of two former rule members and one after rule members

综上所述,不能单纯地通过真实度或覆盖度评价一个规则是否实用,而通过可靠度可以判断最可靠、最具有代表性的规则,且通过离群度可以分析和确定离群规则和离群数据。

4.2三规则前件和单规则后件情况

当考虑与采收率相关的两个影响因素对采收率的影响时,共产生12.500×103条规则。借助4个质量测度和可视化逻辑规则群,通过专家验证形成感知推理初始规则库。选取其中最具代表性的4组界面(见图5),采用4个质量测度衡量规则的不同特性。此外,可以改变规则前件的个数,得到更复杂的规则;然后通过质量测度衡量和专家验证,得到相应的有用规则。

图5 三规则前件和单规则后件可视化逻辑规则群应用界面Fig.5 Interface of visual logic rules groups application three former rule members and one after rule members

5 结论

(1)应用基于Ⅱ型模糊集合的语言摘要方法,得到油田开采智能评价中有用规则信息。首先,从油田开采评价数据库中提取多前件、单后件的IF-THEN规则,并基于4个质量测度进行规则评价;然后,基于平行坐标方法和MATLAB软件的GUI界面,建立可视化模糊逻辑规则群;最后,通过专家验证得到有用规则。

(2)该油田开采智能评价有用规则提取方法可以考虑任意的多规则前件规则问题,也可以通过改变规则前件变量的个数,得到所有可能的规则,再根据质量测度进行计算,进而给出有用规则。

(3)经过专家验证的有用规则构成评价感知推理的初始规则库,为油田开采智能评价奠定评价基础。

[1]Liu F, Mendal J M, Nejad A M. Forecasting injector producer relationships from production and injection rates using an extended Kalman filter [J]. SPE Journal, 2009,14(4):653-644.

[2]于镝,霍凤财,张雯,等.多注多采条件下水驱油藏区域影响估计方法[J].东北石油大学学报,2015,39(2):102-107.

Yu Di, Huo Fengcai, Zhang Wen, et al. Estimation of the regional impact on multi-injectors and multi-producers of water-flooded reserviors [J]. Journal of Northeast Petroleum University, 2015,39(2):102-107.

[3]岳湘安,王尤富,王克亮.提高石油采收率基础[M].北京: 石油工业出版社,2007:88-90.

Yue Xiangan, Wang Youfu, Wang Keliang. Fundamentals on enhanced oil recovery [M]. Beijing: Petroleum Industry Press, 2007:88-90.

[4]钟立国,张守军,鲁笛,等.空气辅助蒸汽吞吐采油机理[J].东北石油大学学报,2015,39(2):108-115.

Zhong Liguo, Zhang Shoujun, Lu Di, et al. Research on EOR principles of air-assisted CSS [J]. Journal of Northeast Petroleum University, 2015,39(2):108-115.

[5]苑登御,侯吉瑞,宋兆杰,等.塔河油田缝洞型碳酸盐岩油藏注水方式优选及注气提高采收率实验[J].东北石油大学学报,2015,39(6):102-110.

Yuan Dengyu, Hou Jirui, Song Zhaojie, et al. Optimization of water injection methods and flooding for EOR in Tahe fractures-vuggy carbonate reservoir [J]. Journal of Northeast Petroleum University, 2015,39(6):102-110.

[6]陈德春,李静,颜晓.基于数据挖掘的油气开采决策支持技术[J].油气地质与采收率,2009,16(2):67-69.

Chen Dechun, Li Jing, Yan Xiao. Support technology of oil and gas development strategic decision based on data mining methods [J]. Petroleum Geology and Recovery Efficiency, 2009,16(2):67-69.

[7]张继风.水驱油田开发效果评价方法综述及发展趋势[J].岩石油气藏,2012,24(3):118-122.

Zhang Jifeng. Evaluation methods of development effect for water drive oilfield and development trend [J]. Lithologic Reserviors, 2012,24(3):118-122.

[8]赵金海,杨传书.专家决策支持系统在石油工业中的应用与发展展望[J].中外能源,2010,15(11):40-45.

Zhao Jinhai, Yang Chuanshu. The application and prospect of IDSS in petroleum industry [J]. Sinoglobal Energy, 2010,15(11):40-45.

[9]Mendel J M. Type-2 Fuzzy Sets: Some questions and answers [C]. IEEE Neural Networks Society Newsletter, 2003:10-13.

[10]Zadeh L A. The concept of a linguistic variable and its application to approximate reasoning [J]. Information Sciences, 1975,8(1):199-249.

[11]Zadeh L A. From computing with numbers to computing with words from manipulation of measurements to manipulation of perceptions [J]. IEEE Transactions on Circuits and Systems Ⅰ: Fundamental Theory and Applications, 1999,46(1):105-119.

[12]Mendel J M. Computing with words, when words can mean different things to different people [C]. Rochester: Proceedings of the International ICSC Symposium on Fuzzy Logic and Applications, 1999:158-164.

[13]Mendel J M. The perceptual computer: An architecture for computing with words [C]. Melbourne: Proceedings of the IEEE International Conference on Fuzzy Systems, 2001:35-38.

[14]Mendel J M. Perceptual reasoning for perceptual computing [J]. IEEE Transactions on Fuzzy Systems, 2008,16(6):1550-1564.

[15]王飞跃.词计算和语言动力学系统的基本问题和研究[J].自动化学报,2005,31(6):844-852.

Wang Feiyue. Fundamental issues in research of computing with words and linguistic dynamic system[J]. Acta Automatica Sinica,2005,31(6):844-852.

[16]莫红,王飞跃,肖志权,等.基于区间二型模糊集合的语言动力系统稳定性[J].自动化学报, 2011, 37(8):1018-1024.

Mo Hong, Wang Feiyue, Xiao Zhiquan, et al. Stabilities of linguistic dynamic system based on interval type-2 fuzzy sets [J]. Acta Automatica Sinica, 2011,37(8):1018-1024.

[17]Wu Dongrui, Mendel J M. Linguistic summarization using IF-THEN rules and interval type-2 fuzzy sets [J]. IEEE Transactions on Fuzzy Systems, 2011,19(1):136-151.

[18]Kacprzyk J, Zadrozny S. Linguistic summarization of the contents of web server logs via the orderd weighted averaging(OWA) operators [J]. Fuzzy Sets and Systems, 2016,285:182-198.

[19]Yu Di, Liu Furui, Ren Weijian. Encoding words for intelligent evaluation of injection-production wells pattern based on enhanced interval approach [C]. Guilin: Proceedings of 12th World Congress on Intelligent Control and Automation, 2016.

2016-01-26;编辑:张兆虹

国家青年科学基金项目(51404074);中国石油科技创新基金研究项目(2012D-5006-0205)

于镝(1977-),女,博士,副教授,主要从事模糊控制和智能评价方面的研究。

10.3969/j.issn.2095-4107.2016.03.014

TP391

A

2095-4107(2016)03-0111-07

猜你喜欢
离群覆盖度采收率
呼和浩特市和林格尔县植被覆盖度变化遥感监测
一种基于邻域粒度熵的离群点检测算法
《油气地质与采收率》征稿简则
基于NDVI的晋州市植被覆盖信息提取
《油气地质与采收率》征稿简则
《油气地质与采收率》第六届编委会
《油气地质与采收率》征稿简则
辽宁省地表蒸散发及其受植被覆盖度影响研究
低覆盖度CO分子在Ni(110)面的吸附研究
一种相似度剪枝的离群点检测算法