张黎,吕芬,尚凯,徐勤琪,周怀来,王丹荔
1.中国石化西北油田分公司勘探开发研究院,新疆 乌鲁木齐 830011 2.成都理工大学地球物理学院,四川 成都 610059
近年来,随着科学技术的迅猛发展,人工智能和机器学习技术在各个学科得到了广泛应用,前人将其引入地震领域,比如协助解决地震解释等方面的问题。文献[1]针对单参数的神经网络无法充分识别小断层的问题,提出了多参数的BP神经网络;文献[2]基于分形技术提取地震数据分维参数,训练出识别断层效率与精度更高的BP神经网络模型;文献[3]将相干属性、频率及曲率等属性结合起来,选取部分属性用于训练可以对地震数据进行断层识别的多层感知器神经网络(muti-layer perception,MLP);文献[4]提出了基于多属性的支持向量机(support vector machines, SVM)断裂识别流程;文献[5]针对断层特征不明显、断层识别精度低的问题,提出了可以提高地震数据采样率的生成对抗网络(generative adversarial networks ,GAN),该方法大大提高了断层识别精度。
卷积神经网络(convolutional neural network, CNN)最初是由生物视觉系统领域专家提出,因其具有局部感知、权值共享及优越的自主学习能力等特点得到各领域学者的广泛关注,在图像处理和计算机视觉领域引发了一股研究热潮。在地球物理专业领域,国内外学者针对实际勘探中断层识别精度不够的问题,提出基于CNN的断层自动识别方法并将其应用到实际工区中,提高了断层识别的精度和效率。文献[6]提出较常规CNN识别断层效果更好的多层感知的CNN模型,在训练过程中加入经过噪声衰减和倾角转向后提取的地震属性,应用效果显著;文献[7]从速度模型入手,在对CNN进行训练时加入样式不同的断层地震数据,这些地震数据由速度模型提取而来,由此训练出的CNN可进行断层自动识别;文献[8]研究出可扩展的CNN平台,与其他平台相比,该平台能更好地完成断层识别等工作;文献[9]提出先用CNN识别断裂,再构造各向异性高斯函数用于预测裂缝倾角和方位角延伸;文献[10]用基于断层骨架化所识别的数据作为标签集来训练CNN,与直接用骨架化地震相干自动提取识别裂缝的方法相比,该方法的分辨率更高、效果更好。文献[11]提出了基于三维半密度CNN的方法,该方法可以对断层进行自动识别;文献[12]使用合成数据集训练端到CNN端进行三维地震断层识别;文献[13]在对神经网络模型训练方面,提出使用90万个合成地震数据来对CNN模型进行训练,实际结果表明,该方法较常规方法能更好地预测断层的走向和倾角;文献[14]针对断层的自动解释方面问题,提出了一种深度CNN,可以更高效完成断层的自动解释工作。从相关研究成果中可以发现,尽管CNN在断层自动识别方面已经得到了很好的应用,但依然存在很多问题:在模型训练时,往往需要大量准确的断层样本,而实际数据很难满足,合成断层数据与实际断层存在差异且断层类型单一,训练模型在高信噪的测试数据上表现良好,应用于复杂地震数据时往往表现不佳[15-20]。传统CNN的缺点是存储开销很大,计算效率低下,同时像素块大小限制了感知区域的大小,而全卷积神经网络可以克服这些缺点,它从抽象特征中恢复每个像素所属类别,即从图像级别的分类进一步延伸到像素级别分类。特别是对于断层识别而言,全卷积神经网络拥有卷积层、池化层等特殊结构,可以直接通过学习输入与输出之间的映射关系来实现断层自动识别,具有很好的非线性表达及泛化能力,相较于其他人工智能方法,兼具较高的效率与精度。
为提高实际地震数据断层识别的效率及准确性,笔者提出了一种基于全卷积神经网络的走滑断裂识别方法:首先对比U-Net与SegNet这2种全卷积神经网络的断裂识别效果,优选训练网络;然后利用构造导向滤波方法对实际地震数据进行断层增强处理,目的是进一步清晰地刻画断层,同时提高地震资料的信噪比,使网络更加容易学习到实际断裂的特征。
在实际地震资料解释中通常依靠解释者的经验判别断层,耗时耗力且主观性强。CNN可完成断层自动识别,但面临的首要问题就是训练集与相应断层标签的制作。此外,要有充足的数据及准确的断层标签样本供模型训练才能提高断层自动识别的精度。在实际勘探过程中,由于没有大量可靠的地震数据用于训练,故需要通过算法来自动合成大量的地震记录,根据文献[12]所述,三维断层数据合成流程为:①生成三维水平反射率模型(见图1(a));②添加褶皱、断层(见图1(b));③将模型与雷克子波进行褶积获得合成地震记录(见图1(c));④添加随机噪声(见图1(d));⑤快速断层标注(见图1(e))。
图1 合成地震记录制作方法(据文献[12])
通过调整不同的参数,最终生成400组三维合成地震数据和断层标签数据(训练数据集)用于模型训练,并随机生成了40组三维地震数据和断层标签用于模型验证,每个样本数据的大小均为128×128×128,部分样本如图2所示。
图2 部分三维合成地震记录及断层标签
U-Net和SegNet是2种常用的全卷积神经网络,其中,U-Net是一个常用的图像分割网络,该网络结构呈“U”型对称且采用跳跃连接的方式(见图3),这种连接方式使解码过程拼接编码过程对称层的特征向量,融合各尺度有效特征,即结合低层、高层特征图中的特征,避免了计算误差且提高了分割精度[21,22]。SegNet是一个主要用于解决端到端的二分类和多分类问题的核心分割引擎(见图4),主要原理为:记录编码器网络池化时最大值的位置,解码器网络反池化时将输入值赋给记录位置,其他位置值置零[23]。这种方法保留了图元原始轮廓细节,图像分割效果更好。同时,SegNet做语义分割时通常在末端加入CRF模块(conditional random fields,条件随机场)做后续处理,旨在进一步精修边缘的分割结果。
图3 U-Net网络结构图
图4 SegNet网络结构图
经过多次调参,将Relu函数和Sigmoid函数作为激活函数。Relu函数具有稀疏表达能力良好、运算效率高等优点,能够有选择性地激活神经元,Sigmoid函数则应用于输出层控制概率值。由于训练数据模型有限,因此选取收敛快的Adam优化器且采用二元平衡交叉熵,度量指标设定为正确率。
将训练数据集以10∶1∶1的比例划分为训练集、验证集和测试集,对应的样本数分别为400、40和40,因训练数据较小,考虑到过拟合现象的可能性,将定型周期设置成45,学习率为1×10-4,batch size设为1,每次训练后都保存网络模型,并且每轮训练后都进行精度和损失测试,U-Net、SegNet训练的精度和损失值曲线如图5所示,经45个epoch后,2个网络训练和验证的准确率分别提高到97.3%、97.7%左右,并且训练和验证的损失分别收敛至6%、5%左右。
图5 U-Net、SegNet训练的精度和损失变化曲线
为验证该网络的可靠性,在合成的三维数据上进行了测试,并将测试结果与常用的断裂检测方法进行对比(见图6),从验证结果中可以看出,图6(c)相干只识别出部分断裂,受同相轴和噪声干扰比较大,断层断点不够清晰;图6(d)蚂蚁体基本可以识别出断裂,但结果不够准确,存在部分误识别;而图6(e)、(f)U-Net、SegNet的预测结果断裂连续性强,且位置准确,其中SegNet识别结果特别是黄色和蓝色箭头所示位置与断裂标签(见图5(b))一致性最高。对比U-net和SegNet网络训练参数和模型识别效果,笔者优选SegNet网络结构为实际断裂识别网络。该网络适用于解决小样本的简单分割问题,对于断层识别问题来说,其目的是学习少量数据,然后推广到具有少量标记的实际地震数据,故基于该网络结构的断裂识别,可用输入样本集S与最终断裂概率矩阵M之间的一个非线性映射表示为:
图6 常用断裂识别方法与模型识别对比
M=SNs(S,m)
式中:SNs(·)表示SegNet网络结构;m为SNs(·)的权重。
各向异性扩散滤波方法最先在图像处理领域有所应用,主要是采用线性算子对含噪图像进行滤波处理,但在降低噪声的同时也降低了边缘信息分辨率。构造导向滤波采用各向异性扩散补偿算法,只对平行于反射层方向做平滑,不做超出断层或者岩性边界的平滑操作,与其他滤波方法相比,该方法更能有效压制噪声、突出地震数据的断裂特征、保持边界信息,为之后的资料解释和断层识别工作奠定基础。
基于构造导向滤波的实际地震数据预处理流程如下:①定向性分析:利用梯度结构张量算法估算反射层的倾角、方位角;②边缘检测:确定反射可能终止的方向,即梯度结构张量的相干;③利用Kuwahara滤波器进行边缘保护性平滑。构造导向滤波是“各向异性扩散”滤波和Kuwahara滤波器的应用综合。
基于构造导向滤波的实际地震数据预处理效果图如图7所示,与原始地震剖面(见图7(a))相比,滤波后的地震剖面(见图7(c))比滤波前的剖面断裂更清晰,消除了部分“层断波不断”的现象,断裂处的横向分辨率(黄色圆圈处)明显提高,弱反射更易被识别。不难看出,滤波后地震数据在保证断裂清晰的情况下信噪比得到了明显提高,突出了断裂特征(红色箭头处),有利于用训练好的全卷积神经网络识别断裂。
图7 基于构造导向滤波的实际地震数据预处理效果图
识别走滑断裂技术流程如图8所示:将构造导向滤波后的实际三维叠后地震数据输入到优选并训练完成的SegNet全卷积神经网络模型中计算,直接预测形成对应的断层属性数据,运用三维地震属性融合显示技术,清晰展示断层的空间形态与空间展布规律,实现实际走滑断裂的自动识别。
塔河油田西南部托甫台地区位于库车县和沙雅县境内,构造位置处于塔里木盆地东北坳陷区沙雅隆起阿克库勒凸起西南倾没端,北东方向与塔河油田主体区毗邻,面积约200km2。该块三维地震数据为经过叠前深度偏移处理后的叠后数据,inline为1111条,crossline为933条,时间范围为2500到5500ms,采样间隔为4ms。
图9所示为该三维地震资料中一个xline的预测结果,图9(a)为托甫台原始地震数据体的一个剖面,蓝色线条指示目的层即T81层;图9(b)和图9(c)为常用识别方法相干算法和蚂蚁体预测结果,可以看到,相干体识别出断裂大概轮廓,但受地震数据的影响很大,断裂复杂程度越高,识别结果误差越大,背景噪声严重,蚂蚁体识别结果在剖面上连续性更差,误识别出很多小断裂;图9(d)为全卷积神经网络识别后的预测结果,断层错误识别的情况大大减少,断层形态更清晰,断层背景也更干净,该地震剖面经全卷积网络学习后,识别的大断层更为连续(图中黄色箭头所示),基本能指示出该地区走滑断裂的大概形态。
同时,对浅层小型断裂的识别结果进行放大,图9(e)~(h)所示为该测线黄色框局部放大图,可以发现,相干识别结果容易受地层倾角影响并且对低信噪比的地震数据比较敏感,故图9(e)中相邻小断裂基本难以分辨,形态十分模糊;而蚂蚁追踪在同相轴很连续的地方也误识别出很多小断裂,识别结果对实际生产中断裂解释工作的指导意义不大;全卷积神经网络识别出的小断裂形态最为清晰,特别是浅层发育的“Y”字型断裂,只有该方法可以将其识别出来。由此也进一步证明了全卷积神经网络对不同尺度断裂的识别结果都是最优的。
图9 常用断裂识别方法与卷积神经网络在单剖面中的识别结果对比
在单条测线上进行验证后,将各方法应用到托甫台的整块三维地震资料中,图10所示为该三维地震资料采用常规识别方法、全卷积神经网络学习的断层预测结果,图10(a)为原始三维地震数据体,图10(b)为用相干识别结果,相干基本能指示大断裂的位置和断裂基本展布形态,但连续性较差,且非断层区域干扰较多,沿层切片断裂模糊;图10(c)为蚂蚁追踪识别结果,其在相干的基础上又识别出许多杂乱的不连续的小断裂,识别出的断裂有效性较差,沿层切片断裂形态杂乱没有规律;图10(d)为采用全卷积神经网络识别结果,与上面2种属性相比,大断层的清晰度提高,断裂边缘被刻画出来,断裂形态展布变得清晰,断层识别的准确率大大提高。
图10 常用断裂识别方法与全卷积神经网络在实际三维地震数据中的识别结果对比
为进一步检验断裂识别的准确性,还开展了研究区断裂体系识别的平面预测研究。图11(a)为沿目的层位原始振幅切片;图11(b)为相干属性沿层切片,断裂连续性较差;图11(c)为蚂蚁体沿层切片,虽然识别出的断裂相比相干连续性有所提升,但识别出许多不存在的小断裂,故小断裂识别结果难以作为参考;图11(d)为全卷积神经网络识别结果沿层切片,准确性有所提高,可以识别断层的空间结构以及其弯曲度,断层形态和展布更为清晰,大断层连续性更好,并且相比相干识别结果,部分小断裂也被识别出来(图中蓝色箭头所示),断层识别的精度有了很大提高。
图11 常用断裂识别方法与全卷积神经网络沿T81层切片的识别结果对比
1)利用全卷积神经网络结合构造导向滤波方法实现了对走滑断裂的识别。训练样本是神经网络识别断层的基础,首先合成大量断层样本并用于训练全卷积神经网络模型,然后利用构造导向滤波方法对实际地震数据进行断层增强处理,目的是进一步清晰地刻画断层,同时提高地震资料的信噪比,使网络更加容易学习到实际断裂的特征,提升网络性能、增强网络结构的泛化能力。
2)实际工区运用结果表明,全卷积神经网络能更准确地识别走滑断裂、提高抗噪性和分辨率,预测的断层连续性更好,该方法具有可行性和有效性。