赵久玉 蔡建超
收稿日期: 2023-05-17
基金项目:国家自然科学基金项目(42172159)
第一作者:赵久玉(1994-),男,博士研究生,研究方向为深度学习和数字岩心。E-mail:2020310039@student.cup.edu.cn。
通信作者:蔡建超(1981-),男,教授,博士,博士生导师,研究方向为储层微观表征與输运物理。E-mail:caijc@cup.edu.cn。
文章编号:1673-5005(2024)02-0118-08 doi:10.3969/j.issn.1673-5005.2024.02.013
摘要:图像分割是数字岩心技术的重要组成部分,深度学习为数字岩心图像分割提供了新方法。在优选的深度学习模型的基础上确定网络结构、训练数据量来平衡计算效率,进一步在不同类型的岩心数据集上讨论网络的泛化能力及其影响因素。结果表明:Unet、Segnet和Unet++网络中,Unet++网络可以在保证分割精度的同时具有最好的物性参数预测效果;Unet++网络在训练数据量和预测数据量为1∶1,网络结构设计2次采样的条件下,Unet++网络的分割精度可以达到98%;基于多类岩心训练的Unet++网络分割不同岩心图像的平均分割精度达95%,相较于岩心的类型,岩心图像的质量更能影响Unet++网络的识别效果。
关键词:数字岩心; 图像分割; 深度学习; Unet++; 泛化能力
中图分类号:TE 319 文献标志码:A
引用格式:赵久玉,蔡建超.基于Unet++网络的数字岩心图像分割泛化能力[J].中国石油大学学报(自然科学版),2024,48(2):118-125.
ZHAO Jiuyu, CAI Jianchao. Generalization ability analysis of digital rock image segmentation based on Unet++ network[J].Journal of China University of Petroleum(Edition of Natural Science),2024,48(2):118-125.
Generalization ability analysis of digital rock image
segmentation based on Unet++ network
ZHAO Jiuyu1,2, CAI Jianchao1,2
(1.National Key Laboratory of Petroleum Resources and Engineering, China University of Petroleum (Beijing), Beijing 102249, China;
2.College of Geosciences, China University of Petroleum (Beijing), Beijing 102249, China)
Abstract: Image segmentation is an important part of the digital rock technology, and development of deep learning provides a new method for digital rock image segmentation. In this study, the network structure and the amount of training data were determined based on optimized deep learning networks to balance the computational efficiency, and the generalization ability of the network and its influencing factors on different types of rock datasets were discussed. The results show that, among the Unet, Segnet and Unet++ networks, the Unet++ network is the best for the prediction of physical parameters while ensuring the segmentation accuracy. The segmentation accuracy of the Unet++ network can reach 98% under the condition that the amount ratio of the training data and the predicted data is 1∶1 and the network has two-time samplings. The average segmentation accuracy of different rock images segmented by the trained Unet++ network based on multi-type rocks can reach 95%. Compared with the rock type, the quality of the rock image is more important on the segmentation results of the Unet++ network.
Keywords: digital rock; image segmentation; deep learning; Unet++; generalization ability
近年来,数字岩心技术在油气资源勘探和开发过程中获得了广泛的应用,为获取岩心物性参数[1-2]、评价储层特性[3]、研究微观渗流机制[4]和模拟油藏生产动态等[5]提供了有力支撑。随着石油工业数字化转型要求的不断提升,数字岩心技术将获得更多的关注。数字岩心图像处理一般包括图像除噪、增强以及分割,图像分割准确性对于数字岩石物性和渗流模拟具有至关重要的意义[6]。图像分割方法[7-9]主要分为基于阈值、区域、边缘、聚类、图论、深度学习等6大类图像分割方法。近年来深度学习算法发展迅猛,已建立的深度学习图像分割模型超过100种[10]。在众多的深度学习图像分割模型中,Unet、Segent、Unet++等模型在数字岩心图像分割领域取得了较好的效果,可以实现铸体薄片图像中孔隙、石英、长石、岩屑、碳酸盐颗粒等10个组分[11]、页岩SEM图像中黏土矿物和非黏土矿物[12]的精确识别,以及对裂缝的提取[13]。Unet网络已成功在砂岩[14]、碳酸盐岩[15]、页岩[16]样品得到了应用。研究人员也对比了多种深度学习分割模型,有研究表明Unet++网络优于Unet网络[17],在Unet、Segnet、ResNet、UReSnet网络中,UReSnet网络的效果最佳[18- 19]。但以上研究训练数据和预测数据都来自于同一组岩心图片。Varfolomeev等[20]对比了阈值法、指示克里金算法、2D SegNet、2D U-net,3D U-net网络在5种砂岩样本组成的训练数据和预测数据的图像分割效果,讨论了模型的泛化能力,但是岩心的类型都是砂岩,岩心的类型单一。深度学习算法的在不同类型岩心数据组成的训练集和预测集上的效果及其影响因素研究较少。笔者首先基于砂岩数据,采用分割精度和绝对渗透率为指标优选Unet、Segnet和Unet++网络模型,在保证分割精度的基础上确定训练数据量和网络结构,深入讨论训练数据集岩心切片数量和岩心类型对深度学习模型的影响,明确影响模型泛化能力的因素。
1 数据及网络模型
1.1 数据集
选取了Berea砂岩[21]、Bentheimer砂岩[22]、Savonnieres碳酸盐岩[23]以及Eagle Ford页岩[24]共4类不同类型的数字岩心数据。Berea砂岩尺寸为1000×1000×1000像素,分辨率2.25 μm,孔隙度21.67%;Bentheimer砂巖尺寸为400×400×1311像素,分辨率7.0 μm,孔隙度18.37%;Savonnieres碳酸盐岩尺寸为1024×1024×1683像素,分辨率3.8 μm,孔隙度18.52%;Eagle Ford页岩尺寸为10873×5481像素,分辨率3.78 nm,孔隙度3.45%。将岩心灰度图像二值化分割为基质和孔隙两个组分,并裁剪为256×256像素用于训练和预测。选取的4类岩心灰度图像及二值化分割图像如图1所示,其中Eagle Ford页岩为二维SEM图像。
1.2 深度学习图像分割模型
1.2.1 Unet网络模型
在分类任务中,经典卷积神经网络的输出是单个类标签,但在视觉领域很多任务需要对图像的每一个像素分类,Ronneberger等[25]在前人的研究基础上对卷积网络结构进行了修改和扩展,提出了Unet网络模型,该网络具有对称的解码-编码结构,大大提高了像素级的分类效果。本文中编码器的卷积层中卷积核尺寸设置为3×3,步长为1,池化窗口尺寸为2×2,步长为2;解码器的上采样层选择的上采样倍数为2,卷积核也为3×3,步长为1,网络结构如图2所示。
1.2.2 Segnet网络模型
Badrinarayanan等[26]设计Segnet时采用了完全对称的编码器-解码器结构,同时考虑到卷积计算过程中特征图的信息损失,Segnet在编码器部分的最大池化操作时记录了最大值索引,然后利用最大池化索引信息对输入特征图进行放大,直接恢复最大特征值的空间位置,且该操作不需要进行学习,节约了计算成本,提升了边界的识别效果。Segnet网络结构如图3所示,网络由对称的5个卷积层组成的编码器网络和解码器网络、1个卷积层及Softmax分类层组成。其中卷积层卷积核为3×3,步长为1,最大池化窗口为2×2,步长为2。
1.2.3 Unet++网络模型
Unet网络采用同一层级跳跃连接的方式对特征进行融合,但是多次卷积和上采样会损失语义信息。Zhou等[27]提出的Unet++网络模型通过短连接和上下采样等操作,可以抓取不同层次的特征,间接融合了多个不同层次的特征,同时通过深度监督对模型进行剪枝操作,提升了模型的灵活度。Unet++网络结构如图4所示,编码器的卷积核为3×3,步长为1,最大池化窗口为2×2,步长为2;解码器部分上采样倍数为2,步长为2,卷积核为3×3,步长为1。
1.3 网络训练参数
3个网络模型都采用Adam优化算法对网络参数进行优化,学习率设置为0.001,一阶矩估计的指数衰减率β1为0.9,二阶矩估计的指数衰减率β2为0.999。输入图像为256×256的岩心灰度图像,输出孔隙-基质二值化结果,批大小为10,训练300次。
2 网络模型及参数优选
2.1 深度学习模型优选
将原始的Bentheimer(400×400×1311)数据集裁剪出4组256×256×1311像素,选取4000张数据训练,256张数据预测,训练过程如图5所示。可以看出Segnet、Unet和Unet++网络在训练50步后基本稳定,最终的分割精度都大于99%,训练误差小于0.05。尽管Unet++网络训练的分割精度最高,但是其训练误差最大。
预测集256张岩心图像的预测结果如图6所示,Segnet网络预测的结果可以清晰的看到错误的分类,分割精度为0.9531,Unet和Unet++网络的效果较好,分割精度分别为0.9949和0.9924。采用格子玻尔兹曼方法(LBM)计算了3种网络预测结果的绝对渗透率(格子单位)、预测集的孔隙度和分形维数,结果见表1。尽管Segnet网络的分割精度最差,但是计算的绝对渗透率与真实值在同一数量级,孔隙度和分形维数的相对误差都小于10%;Unet++网络模型的预测效果最好,孔隙度、分形维数和绝对渗透率的相对误差都小于1%;Unet次之,孔隙度、分形维数和绝对渗透率的平均相对误差约为1.1%。此外,在训练过程中,Unet++网络训练的分割精度最高但其训练误差最大,是因为模型的损失函数和结构较其他两个复杂,约束效果更好。此外Unet++网络模型通过短连接和深监督的方式,在处理数字岩心图像分割问题时具有更好的鲁棒性。
LBM方法计算绝对渗透率时获取孔隙空间的每一个点的格子速度,计算分割图像与预测图像格子速度的残差,其分布特征如图7所示。整体来说,3种模型预测的残差主要分布在以0为中心小范围内,其中Segnet网络的速度残差分布最广,Unet++次之,Unet最小。尽管Unet++网络的速度残差分布比Unet网络的广,但是其在格子速度为0小范围内的数量较多,所以抵消了分布范围对绝对渗透率的影响,最接近真实值。综合预测集的分割精度和绝对渗透率两个指标,Unet++网络应用于数字岩心图像分割的效果最优。
2.2 Unet++网络参数优选
Unet++网络在相同上采样和下采样次数的情况下比Unet具有更多的网络参数,因此具有较高的分割准确度和最准确的渗透率预测效果,同时该网络训练数据量约是预测数据的16倍,大量的训练数据进一步可以保证预测效果。
通过减少训练数据、枝剪Unet++网络层数来平衡模型分割精度及计算效率。当训练数据和预测数据量为256∶256时,在4次上采样和下采样其分割精度可以达到98.567%,相较于4000组数据下降了0.673%,但是仍高于Segent网络模型的分割精度,计算时间也大大减少。随着采样次数降低,在采样次数为2次后,准确率下降了0.1%,说明当训练数据和预测数据为1∶1、Unet++网络设计2次上采样和下采样时,能够在保证预测效果的情况下拥有最少的网络参数和较高的计算效率。
3 Unet++网络泛化能力
不同类型的岩心的孔隙具有不同的特征,Unet++网络在面对不同类型岩心数据时的鲁棒性值得探讨。基于得到的Unet++网络认识,通过对训练数据和测试数据组合,讨论数据集对Unet++网络的泛化能力。
首先将Bentheimer和Berea砂岩数据按照1∶1、1∶2、1∶3的比例组成256张训练数据,基于2次采样的Unet++网络预测Bentheimer砂岩256张图像分割效果,训练数据和测试数据数量及评价指标见表2。
随着Bentheimer砂岩占比逐渐减少,对Bentheimer预测集数据的预测孔隙度、分形维数和绝对渗透率变差,特别是在比例为1∶3时绝对渗透率的相对误差达到16.06%。真实图像与预测图像的残差图像可以直观地反映预测错误像素点的分布情况,如图8所示。从分割精度最小的图像分割结果及残差图可以看出,调整训练数据比例,网络对原始图像中的基质中深黑色的组分识别效果极差,同时识别错误的点大多数分布在孔隙和基质的边缘,多是将孔隙预测为基质,因此导致模拟的绝对渗透率相较于真实值偏低。总的来说,当训练数据是砂岩岩心时,模型的分割精度可以保持在98%以上,表明Unet++网络在砂岩数据集上具有良好的泛化能力。
分别选取Bentheimer砂岩、Berea砂岩、Savonnieres碳酸盐岩和Eagle Ford页岩各64张组成训练数据,预测以上4种岩心256张图像的分割结果见表3。相较于由砂岩数据组成的训练数据集,Bentheimer砂岩和Savonnieres碳酸盐岩预测数据的分割精度在加入碳酸盐岩和页岩数据后稳定在98%,没有较大的变化,Berea砂岩的分割精度相较于98%下降了4%,Eagle Ford页岩的分割精度下降了14%。
对比4种岩心分割精度最差的切片图像,同为砂岩的Bentheimer砂岩和Berea砂岩分割精度不同,主要是因为Berea砂岩原始的灰度图像相较于其他3种岩心整体偏暗,对比度较低,如图9所示,
从而导致将孔隙预测为基质的像素点,预测集渗透率偏小。然而盡管Savonnieres碳酸盐岩和Bentheimer砂岩属于不同类型的岩心,但是其CT图像的对
比度较高,因此Savonnieres碳酸盐岩预测集的分割精度能够达到98%。因此,训练适用于多类岩心CT扫描图像分割的Unet++网络具有一定的适用性,但训练集合和预测集图像的质量对模型预测结果有一定的影响,训练集和预测集可以采用算法提高图像的对比度,提高图像分割精度。
Eagle Ford页岩的分割精度最低是因为该数据为SEM图像,由于和CT扫描图像的原理有着本质的不同,该页岩灰度图像的孔隙附近有明显的阴影,导致Unet++的预测效果最差,因此在CT数据上训练的Unet++网络不可用于预测SEM扫描图像。
综上,岩心类型对Unet++网络的适用性影响不大,图像的质量更能影响模型的识别效果。
从表2和3可以看出,本文中训练的Unet++网络整体将基质和孔隙边缘的孔隙识别为基质,从而导致预测集的渗透率整体偏小。此外,所有分割精度平均可超过95%,但是部分数据预测集的渗透率与真实值的相对误差较大,说明以岩心图像的整体分割精度作为判别标准会造成较大的误差。
4 结 论
(1)以预测精确度、孔隙度、分形维数和渗透率为评判标准,Unet++网络的效果最好,Unet网络次之,Segnet网络最差。
(2)当训练数据量和预测数据量为1∶1时,Unet++网络设计2次采样操作可得较高的计算效率和分割精度。
(3)对于砂岩数据,Unet++网络分割精度可超过98%;基于多类岩心训练的Unet++网络预测不同岩心的平均分割精度可以超过95%。
(4)相较于岩心的类型,岩心图像的质量更能影响Unet++模型的识别效果。
参考文献:
[1] 孙海,姚军,张磊,等.基于孔隙结构的页岩渗透率计算方法[J].中国石油大学学报(自然科学版),2014,38(2):92-98.
SUN Hai, YAO Jun, ZHANG Lei, et al. A computing method of shale permeability based on pore structures[J]. Journal of China University of Petroleum(Edition of Natural Science), 2014,38(2):92-98.
[2] 田海涛,刘乐乐,夏宇轩,等.水合物赋存形式对石英砂电性特征影响的数值模拟研究[J].地球物理学报,2022,65(4):1439-1450.
TIAN Haitao, LIU Lele, XIA Yuxuan, et al. Numerical simulation study on the influence of hydrate morphology on the electrical properties of quartz sand[J]. Chinese Journal of Geophysics, 2022,65(4):1439-1450.
[3] 张琳,李拥军,缪华,等.数字岩心技术在二连油田阿尔凹陷储层评价中的应用[J].测井技术,2011,35(4):380-383.
ZHANG Lin, LI Yongjun, MIAO Hua, et al. Application of digital core technology to evaluating reservoir in Aer Sag of Erlian Oilfield[J]. Well Logging Technology, 2011,35(4):380-383.
[4] 熊润福.低渗透油藏水驱油机理及数字岩心分析方法应用研究[D].成都:西南石油大学,2019.
XIONG Runfu. Application of water flooding mechanism and digital core analysis method in low permeability reservoirs[D].Chengdu:Southwest Petroleum University, 2019.
[5] 姚军,赵秀才,衣艳静,等.数字岩心技术现状及展望[J].油气地质与采收率,2005,12(6):52-54.
YAO Jun, ZHAO Xiucai, YI Yanjing, et al. The current situation and prospect on digital core technology[J]. Petroleum Geology and Recovery Efficiency, 2005,12(6):52-54.
[6] WANG Haitao, WANG Li, LAI Fuqiang, et al. Investigation of image segmentation effect on the accuracy of reconstructed digital core models of coquina carbonate[J]. Applied Geophysics, 2020,17(4):501-512.
[7] 黄鹏,郑淇,梁超.图像分割方法综述[J].武汉大学学报(理学版),2020,66(6):519-531.
HUANG Peng, ZHENG Qi, LIANG Chao. Overview of image segmentation methods[J]. Journal of Wuhan University(Natural Science Edition), 2020,66(6):519-531.
[8] 鄭凯,李建胜.基于深度神经网络的图像语义分割综述[J].测绘与空间地理信息,2020,43(10):119-125.
ZHENG Kai, LI Jiansheng. An overview of lmage semantic segmentation based on deep learning[J]. Geomatics & Spatial Information Technology, 2020,43(10):119-125.
[9] 景庄伟,管海燕,彭代峰,等.基于深度神经网络的图像语义分割研究综述[J].计算机工程,2020,46(10):1-17.
JING Zhuangwei, GUAN Haiyan, PENG Daifeng, et al. Survey of research in lmage semantic segmentation based on deep neural network[J].Computer Engineering, 2020,46(10):1-17.
[10] MINAEE S, BOYKOV Y Y, PORIKLI F, et al. Image segmentation using deep learning: a survey[J]. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 2021,44(7):3523-3542.
[11] SAXENA N, DAY-STIRRAT R J, HOWS A, et al. Application of deep learning for semantic segmentation of sandstone thin sections[J]. Computers & Geosciences, 2021,152:104778.
[12] CHEN Z, LIU X, YANG J, et al. Deep learning-based method for SEM image segmentation in mineral characterization, an example from Duvernay shale samples in Western Canada Sedimentary Basin[J]. Computers & Geosciences, 2020,138:104450.
[13] REINHARDT M, JACOB A, SADEGHNEJAD S, et al. Benchmarking conventional and machine learning segmentation techniques for digital rock physics analysis of fractured rocks[J]. Environmental Earth Sciences, 2022,81(3):1-20.
[14] AR RUSHOOD I, ALQAHTANI N, WANG Y D, et al. Segmentation of X-ray images of rocks using deep learning[R]. SPE 201282-MS,2020.
[15] ALQAHTANI N J, NIU Y, WANG Y D, et al. Super-resolved segmentation of X-ray images of carbonate rocks using deep learning[J]. Transport in Porous Media, 2022:143,497-525.
[16] ASADI P, BECKINGHAM L E. Integrating machine/deep learning methods and filtering techniques for reliable mineral phase segmentation of 3D X-ray computed tomography images[J]. Energies, 2021,14(15):4595.
[17] WANG H, DALTON L, FAN M, et al. Deep-learning-based workflow for boundary and small target segmentation in digital rock images using UNet++ and IK-EBM[J]. Journal of Petroleum Science and Engineering, 2022,215:110596.
[18] WANG Y D, SHABANINEJAD M, ARMSTRONG R T, et al. Deep neural networks for improving physical accuracy of 2D and 3D multi-mineral segmentation of rock micro-CT images[J]. Applied Soft Computing, 2021,104:107185.
[19] ALQAHTANI N. Integrating deep learning into digital rock analysis workflow[D]. Sydney: University of New South Wales, 2021.
[20] VARFOLOMEEV I, YAKIMCHUK I, SAFONOV I. An application of deep neural networks for segmentation of microtomographic images of rock samples[J]. Computers, 2019,8(4):72.
[21] NEUMANN R F, BARSI-ANDREETA M, LUCAS-OLIVEIRA E, et al. High accuracy capillary network representation in digital rock reveals permeability scaling functions[J]. Scientific Reports, 2021,11(1):11370.
[22] RAMSTAD T, IDOWU N, NARDI C, et al. Relative permeability calculations from two-phase flow simulations directly on digital images of porous rocks[J]. Transport in Porous Media, 2012,94(2):487-504.
[23] BULTREYS T, STAPPEN J V, KOCK T D, et al. Investigating the relative permeability behavior of microporosity-rich carbonates and tight sandstones with multiscale pore network models[J]. Journal of Geophysical Research: Solid Earth, 2016,121(11):7929-7945.
[24] LANDRY C J, HART B S, PRODANOVI M. Comparison of wireline log and SEM image-based measurements of porosity in overburden shales[C/OL]. Unconventional Resources Technology Conference, 2020[2023-05-15].https://doi.org/10.15530/urtec-2020-3141.
[25] RONNEBERGER O, FISCHER P, BROX T. U-net: convolutional networks for biomedical image segmentation:International Conference on Medical Image Computing and Computer-assisted Intervention[C]. Cham: Springer, 2015.
[26] BADRINARAYANAN V, KENDALL A, CIPOLLA R. SegNet: a deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Trans Pattern Anal Mach Intell, 2017,39(12):2481-2495.
[27] ZHOU Z, SIDDIQUEE M M R, TAJBAKHSH N, et al. UNet++: a nested U-Net architecture for medical image segmentation[J]. Deep Learn Med Image Anal Multimodal Learn Clin Decis Support , 2018,11045:3-11.
(編辑 李志芬)