人工智能在油气压裂增产中的研究现状与展望

2022-10-21 11:18李根生中国工程院院士田守嶒廖勤拙王天宇宋先知
钻采工艺 2022年4期
关键词:智能算法神经网络裂缝

盛 茂, 李根生(中国工程院院士), 田守嶒, 廖勤拙, 王天宇, 宋先知

油气资源与探测国家重点实验室·中国石油大学(北京)

0 引言

人工智能作为引领新一轮科技革命和产业变革的战略性通用技术,被世界各国重视并大力发展,在我国已上升到国家战略高度,研究意义重大。在人工智能国家战略目标的时代背景下,智能化已成为我国油气能源领域技术创新的主攻方向之一[1]。通过人工智能技术与油气业务深度融合,利用智能算法从石油勘探开发海量数据中挖掘规律,实现全流程智能调控和智能优化,逐步成为油气人工智能创新发展范式[1- 5]

压裂增产作为石油勘探开发重点研究领域,早在20世纪90年代就试图与人工智能技术深入融合,萌生形成了压裂人工智能研究方向,率先应用在压裂设计优化中并取得了初步成效,然而受限于当时数据质量、算力和智能算法的先进性,未能实现规模应用[6]。近年来,以大数据、机器学习、超强算力为基础的新一代人工智能技术蓬勃兴起[7- 8],压裂人工智能重获新生,正在经历井喷式发展,被应用于压裂设计优化、施工过程管控、压裂返排控制。然而部分关键基础理论与核心技术尚待突破,应用场景设计仍需统筹规划,特别是如何融合压裂多源跨尺度数据并有效提取特征、怎样实现机理—数据联合驱动、如何解决模型可解释性差等共性难题亟需开展系统深入的理论与技术研究。

本文在总结国内外压裂人工智能发展历程与研究现状的基础上,剖析了压裂人工智能发展面临的难题与挑战,展望了压裂人工智能研究的主攻方向,并给出了典型应用场景的设计建议,以期为压裂人工智能理论与技术更好更快的发展提供借鉴。

1 压裂人工智能发展历程与研究现状

1.1 压裂人工智能发展历程

压裂人工智能的内涵丰富,仍未形成统一的定义。笔者认为其是在人工智能理论框架下,构建地质—地球物理—钻完井—压裂—生产全链接数据仓库,利用机器学习、深度学习和强化学习等智能算法,以“高质量均衡造缝、安全压裂”为目标,综合应用于压裂设计、施工管控、返排控制等压裂增产全流程,实现压裂设计“全局优化”、压裂施工“无人/少人值守”、压裂返排“自主控制”,大幅降低人员劳动强度和事故风险、提升储层改造投入产出比。压裂人工智能发展历程可划分为三个阶段。

(1)思想萌芽阶段(1990年~2000年)。早在20世纪90年代,国内外学者几乎同时萌生了压裂人工智能思想,尝试将模糊逻辑、自动逻辑推理等早期智能算法用于压裂设计优化,由此开辟了基于数据驱动优化压裂设计的新途径。其中,1989年,李宾元[9]率先建立了基于模糊数学理论的压裂选井选层模型;1993年,Holditch等[10]研制了基于自动逻辑推理的压裂专家系统。此后BP神经网络、灰色关联分析、遗传算法等智能算法被应用于压裂选井选层、产能预测及参数优化并取得初步成效[11- 13]。但受限于当时数据质量、算力和智能算法的先进性,特别是所用神经网络层次少(仅3~5层)且样本数量有限,数据过拟合问题突出,客观上制约了模型预测精度,未能规模应用。

(2)初步发展阶段(2000年~2015年)。该阶段机器学习算法性能不断提升,一定程度解决了数据过拟合问题,模型预测精度得到改善[14- 16]。与此同时,非常规页岩油气资源规模开发,由此积累了海量数据并构建形成大数据仓库,为提高机器学习训练效果奠定了数据基础。通过大数据深度挖掘优化压裂设计的理念被油气行业接受,在北美Bakken、Eagle Ford和中国涪陵等页岩油气田应用并取得一定成效[17- 18]。

(3)快速发展阶段(2016年后)。该阶段随着新一代智能算法与超强算力的蓬勃兴起,压裂人工智能开启井喷式发展。此时机器学习不再单纯依赖数据驱动,而是寻求数据与机理联合驱动,进一步提升模型合理性和预测精度,为单井产能和最终采收率预测、完井参数优化等提供了有力支撑[19- 21]。2018年后,以深层神经网络为代表的深度学习逐步应用于压裂增产中的时序数据处理[22- 23],将应用场景从压裂设计优化拓展到施工过程管控和压裂返排调控。但总体仍处于解决单个具体的场景应用问题,未达到工业级应用所要求的全流程、贯通式的优化和闭环调控。

1.2 压裂人工智能应用研究现状

压裂人工智能发展至今,已在压裂设计、施工管控、返排控制等方面进行了有益尝试和研究,特别在压裂设计智能优化、施工过程工况诊断与风险预警、压裂返排优化控制等方面取得了一定的进展和应用效果。

1.2.1 压裂设计智能优化

压裂设计智能优化是基于地质—工程大数据,利用智能算法优化压裂工艺参数和完井参数,达到高质量均衡造缝和大幅增产的目的,主要体现在产能预测与完井参数优化和压裂布缝参数优选等方面。

在压裂产能预测与完井参数优化方面,基本思想是建立地质、工程参数与产能的映射关系,采用最优化算法获得完井最优参数组合,目前研究聚焦在如何提高模型预测精度上。Wang等[24]对比发现长短期记忆神经网络算法可有效预测页岩气压裂井产能,在测试集数据中获得了较高预测精度,但在现场应用中仍需提高精度。为提高模型预测精度,部分学者研究了多模型组合和数据—机理联合驱动的方式。Yang等[25]基于循环神经网络和多层感知机的组合方式建立了煤层气压裂井产能预测模型,基于本构机理和数值模型构建数据集,对神经网络模型施加物理约束。董银涛等[26]基于XGBoost算法建立了压裂井产能预测模型,通过改进损失函数引入物理约束,将预测误差从11.68%降低至9.68%。周济民等[27]将BP神经网络和长短记忆神经网络组合应用,同时在损失函数中嵌入Arps经验模型,将模型平均预测误差由19.66%降低至7.61%。但是目前体现储层物性的数据来源主要依赖近井筒测井数据,缺乏远井储层和裂缝等信息数据,亟需融入地震解释、微地震监测等远井特征数据。

在压裂布缝参数优选方面,有监督和无监督聚类算法被用于区分水平井段岩石力学性质的差异性,同时考虑缝间应力干扰作用,优选岩石力学性质相近的井段布置裂缝,达到裂缝均衡起裂与扩展的目的。Palmer[28]利用声波和微电阻率测井判断岩石力学强度和天然裂缝分布密度,利用模糊C-Means无监督聚类算法沿井筒聚类。Tran等[29]综合利用钻头破岩数据和测井数据反映岩石力学性质差异性,建立了基于有监督聚类算法的水平井段岩石强度差异性评价模型,优化了水平段轨迹和压裂布缝位置。Drill2Frac公司[30- 31]通过计算钻头破岩所需的机械比能,采用无监督聚类算法,实现了储层可压性评价和布缝位置优选,在北美6个页岩气盆地开展108口井现场应用,结果表明优化井产量同比邻井提高约27%,增产效果显著。

1.2.2 压裂工况智能诊断与风险预警

近年来,以深层神经网络为代表的深度学习逐步应用在施工过程工况智能诊断与风险预警。主要利用地面或井下实时监测数据,结合专家经验标签形成训练数据集,通过建立循环神经网络和分类算法诊断各类复杂工况和预警潜在施工风险。

在压裂工况诊断方面,以哈里伯顿公司Smart Fleet智能压裂系统[32]为代表,综合运用光纤监测、井下微地震、压力计等多源实时数据和智能算法,实现了压裂射孔簇均衡起裂、裂缝扩展可视化和泵注参数实时调控,在北美二叠系盆地应用,单井产量平均增产20%。Ramirez等[33]结合分类算法、泵压曲线变化特征和专家经验标签,实现了压裂作业起始与终止时刻的识别,在验证集上识别精度达90%。Shen等[22]建立了基于卷积神经网络和U-Net架构深度学习的压裂工况实时诊断模型,实现了压裂作业起始与终止时刻、桥塞坐封、压裂分阶段工况的自动标注、模型训练和工况自主诊断,通过混淆矩阵评价模型,准确度达95%。同时,信号小波变换作为一种重要的时序数据特征提取方法,在压裂裂缝闭合压力判识和裂缝扩展事件诊断方面起到了积极作用。Unal等[34]、Eltaleb等[35]基于小压测试DFIT数据,采用小波离散变换分解细节信号,联合能量谱密度判别裂缝闭合压力及其时间,与传统G函数分析方法相比,验证了该方法可获得更加准确的裂缝闭合压力值。Mohamed等[36]利用小波变换方法,将从施工泵压数据提取的能量信息与裂缝扩展物理过程相关联,定量表征单位时间内裂缝扩展事件数,为实时诊断裂缝扩展信息提供了重要手段。

在压裂风险预警方面,砂堵风险预警研究进展突出。2017年,方博涛[37]建立了压裂砂堵风险预警BP神经网络模型,选取12个特征参数作为神经网络输入参数,对比Nolte-Smith图版砂堵判识方法可超前1.5 min预警。2020年,Sun等[38]通过搭建卷积神经网络和长短记忆神经网络融合动静态数据特征,采用反斜率法判别砂堵特征数据,实现了砂堵实时诊断。Hu等[39]提出了泵压超前预测和砂堵风险超前预警的方法思路,通过建立整合滑动平均自回归模型和经验规则约束,实现了砂堵风险超前37 s预警。2021年,Hou等[40]提出了砂堵概率表征参数,建立了基于循环神经网络的砂堵概率预测模型,实现压裂过程中砂堵风险概率的实时评估。套管变形风险实时诊断研究开始起步。2020年,Hoffman等[41]基于专家经验形成的套管变形异常压力显示标签数据集,采用随机森林算法建立分类模型,用于诊断套管变形引起的异常压力事件,获得套管变形概率,为套管变形风险实时诊断提供了一种新的解决方案。目前仍缺乏风险预警后如何调控参数规避风险的强化学习模型研究。

1.2.3 压裂返排智能优化

压裂返排工艺与参数优化将直接影响压裂增产效果。基本思想是基于返排生产动态数据和地质工程静态数据,利用智能算法优化返排压差与流量等工作制度,实现控制支撑剂回流量和优化压裂液返排率。

Zhou等[42]通过大数据分析Marcellus页岩631口井的井位、完井数据、压裂工艺和生产数据,研究了压裂液返排与完井属性和地质环境之间的相关性,发现影响返排水采收率的重要因素包括压裂段数、水平段长度、垂向深度等。Fu等[43]研究了Anadarko盆地7口致密油气压裂井返排数据,发现总注入水量、总射孔间隔、压裂簇的数量是关键设计参数。Maity和Ciezobka[44]基于K近邻、贝叶斯分类器和支持向量机等智能算法,建立了识别支撑剂颗粒位置和支撑剂分类的工作流,并在Permian盆地现场应用。Niu等[45]利用早期返排数据预测最终可采储量,对比发现支持向量机是最优算法。Guo等[46]研究了威远页岩气区块214口水平井特征返排系数与地质、工程参数的相关性,建立了一种用于预测页岩气水平井返排曲线的机器学习方法。郭建成[47]基于四川龙马溪组页岩储层250口井的地质和工程数据,建立了基于BP神经网络的压裂液返排率预测模型,以此确定返排率的最优区间。刘可等[48]结合相关性分析和主成分分析,建立了压裂井产能与其影响因素的支持向量机模型,并交叉验证优选最优返排率。目前仍缺乏以多目标协同优化为基础的返排工作制度实时控制研究。

综述表明,前人在压裂人工智能单项技术、算法提升、模型预测精度等方面取得了一定研究进展,但总体处于从学术型研究向工业级应用的过渡阶段,仍需发展压裂全流程、贯通式的优化和闭环调控。

2 压裂人工智能关键理论问题

为达到压裂人工智能工业级应用水平,实现高质量数据集构建与建模,全流程、贯通式优化和闭环调控,仍面临小样本少标签数据问题、数据驱动与机理模型深度融合问题、模型可解释性差等关键理论问题。

2.1 小样本少标签数据问题制约模型预测精度

深度学习模型已在油气井压裂产能预测、参数优化等任务中取得了长足进步,但其成功应用很大程度上依赖于大量训练数据,对于小样本数据的训练容易出现过拟合现象[49]。在数据规模上,油田数据库难以像商业数据库迅速扩充;而且在实际压裂场景中存在多种数据类型,某些类型只有少量样本或少量标签,难以收集到较为准确的大量数据。因此,油田数据样本有限且存在多个维度,数据部分缺失且齐整性较差,不能直接套用基于大规模数据的数据挖掘方法进行研究。

2.2 数据驱动与压裂机理模型有待深度融合

数据驱动与机理模型融合是人工智能发展的热点之一[7]。在压裂流固耦合理论研究中,前人积累了大量领域知识和机理模型,通常以表征参数之间的数学关系来表示。当涉及到多尺度、多场耦合等问题时,因为输入与输出之间的映射关系过于复杂,探索机理模型将变得极其困难。此时,如果有足够多的数据和标签,可以通过数据驱动的机器学习建立起所需的映射关系和模型。但这种单纯通过数据驱动学习得到的模型往往忽视了物理过程的内在机理,可能给出不符合常理的预测结果。因此,发展物理机理与数据驱动相结合的模型方法,是压裂人工智能研究的发展趋势和必然选择。近年来,关于融合数据驱动与机理模型的研究引起了学界的广泛兴趣,尤其是在科学计算领域,比如物理信息神经网络方法[50]。尽管如此,压裂增产机理复杂,同时压裂效果难以直接观测,如何将数据驱动与压裂机理模型深度融合,仍然是一个极富挑战的问题。

2.3 人工智能模型可解释性问题有待突破

油气压裂增产属于典型的高投入、高风险作业,这对模型决策判断的可靠性要求很高。因而,压裂人工智能必须突破模型的可解释性,使得人工智能系统的行为更透明、易懂、可信。模型可解释性问题也是人工智能理论所面临的共性核心问题[7],目前可解释性建模方法包括知识发现和知识嵌入等。知识发现是指从数据中挖掘具有物理含义的控制方程,重点在于确定控制方程结构和系数,有望用于建立裂缝扩展和油气产出过程的力学控制方程,可针对不同储层特征和压裂方式建立个性化控制方程。知识嵌入是将领域知识整合到数据驱动模型中,创建具有物理常识的模型,并创建机器学习模型的过程。知识发现和知识嵌入相结合,可望为模型提供更丰富的信息,提高模型的准确性和鲁棒性,并减少数据需求,为联合压裂专家经验和机理模型提供重要的方法基础。

3 压裂人工智能研究的主攻方向

针对上述关键理论问题,从高质量数据构建、小样本数据深度挖掘、可解释性智能算法和压裂闭环调控方法等方面提出未来主攻方向。

3.1 压裂增产数据治理与特征工程研究

数据治理与特征工程是控制数据质量的两个重要方面。压裂增产数据具有跨学科、跨时空尺度、数据类型多样等突出特点,亟需解决多源异构数据融合治理问题,构建以压裂为中心的地质—地球物理—钻完井—压裂—生产全链接数据仓库。同时,影响压裂增产效果的因素繁多,叠加上小样本少标签数据问题,使得主成分分析中难以区分高权重参数,亟需解决压裂增产弱关联数据的特征工程问题,形成高质量的标签数据。

3.2 小样本学习场景下的压裂数据深度挖掘

受限于油田数据的小样本问题,常见的机器学习和深度学习模型都易产生过拟合现象,因此亟需研究数据增强和迁移学习等小样本学习方法,提高模型的泛化性能和预测精度[49]。数据增强方法借助辅助数据或辅助信息对原有小样本数据进行数据扩充和特征增强,可分为基于无标签数据、基于数据合成和基于特征增强的三种方法。通过迁移学习方法将压裂领域的传统方法和专家经验嵌入到机器学习模型中。

3.3 基于知识嵌入和知识发现的可解释性压裂智能算法研究

可解释性人工智能方法对了解压裂智能算法的优缺点和评估其风险具有重要意义。压裂机理的复杂性使得常规模型方法普遍缺乏决策逻辑的透明度和计算结果的可解释性,特别是围绕压裂产能优化、裂缝诊断与效果评价等方向的探索,亟需针对压裂增产应用场景开展压裂可解释性人工智能理论研究,具体包括裂缝扩展流固耦合过程的知识嵌入大数据模型、裂缝扩展流固耦合机理的符号回归与知识发现、水力压裂复杂非线性产能评价智能表征等。

3.4 基于强化学习的压裂参数动态优化与风险预警闭环调控方法研究

压裂改造是一个极其复杂的地面装备—井筒—裂缝间多参数耦合问题,常规压裂监测技术能够实现压裂泵注实时监测和初步风险预警,但无法满足压裂泵注实时控制和实时优化调整,地面—井下传感数据与智能算法有待深入融合,亟需建立压裂多参数全局优化与风险控制理论,开展基于深度强化学习的压裂参数动态优化与风险预警调控研究。

4 压裂人工智能应用场景设计建议

合理设计应用场景是实现压裂人工智能工业化应用的重要环节。围绕高质量造缝和安全压裂的目标需求,综合考虑数据质量、算法适用性和算力等因素,建议构建如图1所示的三类压裂人工智能应用场景。

图1 压裂人工智能应用场景示意图

4.1 压裂设计智能优化应用场景

压裂设计质量决定压裂井产能和经济效益。基于特征工程明确影响压裂井产能的特征参数;利用机器学习算法,建立地质和工程等特征参数与压裂井产能的映射关系;以产能或经济效益最大化、压裂作业安全等为目标,利用寻优算法建立压裂设计参数多目标协同优化模型,实现压裂设计关键参数多目标协同优化。

4.2 压裂施工过程闭环调控应用场景

过程闭环调控是实现压裂施工“无人/少人值守”的重要前提。融合地面参数采集、井筒光纤监测、井间微地震定位等物联网数据,为工况智能诊断与风险调控提供标签数据基础。以深度学习和强化学习理论为基础,利用循环神经网络获取时序数据特征,实现压裂工序、桥塞坐封、暂堵封隔等井筒复杂工况诊断和砂堵、套管变形、井间压窜、地面设备故障等风险预警;建立专家奖惩决策机制和协同控制算法,实现压裂参数动态优化与风险预警实时调控,最终构建智能压裂泵注实时控制系统,大幅提升裂缝均衡扩展和高效支撑,同时降低设备故障与工程风险。

4.3 压裂返排实时优化控制应用场景

压裂返排实时参数优化与控制是大幅提高压裂效果的重要保障。采用深度神经网络算法,联合裂缝闭合支撑力学分析、压裂液回流动力和阻力分析等物理机理,构建数据—机理联合驱动的裂缝闭合与压裂液返排预测模型;采用主成分分析、机器学习、最优化算法等大数据智能分析方法,评估不同地层参数、裂缝几何形态参数、支撑剂参数和返排工程参数对压裂液返排率和支撑剂回流量的影响,明确返排主控因素;采用深度强化学习算法,以降低支撑剂回流量同时提高压裂液返排率为目标,进行多目标协同优化,实时控制调整不同返排制度,以期实现裂缝高质量支撑、最大化累计产量和经济效益。

5 结束语

(1)压裂人工智能是油气行业智能化发展的核心技术之一,反映了一个国家的油气科技发展水平。压裂人工智能总体处于从学术型研究向工业级应用的过渡阶段,部分关键基础理论与核心技术尚待突破,亟需制定我国压裂智能化发展规划与技术路线,系统开展压裂人工智能理论与技术研究。

(2)压裂人工智能技术涉及大数据、人工智能、物联网等关键基础理论与技术,有必要推进多学科交叉,加强油气压裂增产与前沿理论及技术的跨界融合。同时加强协同创新,搭建产学研用合作平台,完善人才培养和团队建设机制,进一步推动压裂人工智能技术的快速发展,为复杂油气资源高效勘探开发提供关键技术支撑。

猜你喜欢
智能算法神经网络裂缝
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
地球的裂缝
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
裂缝性储层水力裂缝扩展规律数值模拟研究
裂缝
改进的多目标快速群搜索算法的应用
烟草香级智能集成分类方法
基于Robocode的智能机器人的设计与实现