基于色彩空间和深度残差网络ResNet-50的复杂岩性油气藏岩石样本智能分类及识别

2023-11-04 02:26刘今子杜文颖董驰秦志清杨楠廖恩浩
科学技术与工程 2023年29期
关键词:类别残差岩石

刘今子, 杜文颖, 董驰, 秦志清, 杨楠, 廖恩浩

(1.东北石油大学数学与统计学院, 大庆 163318; 2.东北石油大学物理与电子工程学院, 大庆 163318;3.东北石油大学石油工程学院, 大庆 163318; 4.东北石油大学计算机与信息技术学院, 大庆 163318; 5.东北石油大学化学与化工学院, 大庆 163318; 6.东北石油大学电气信息工程学院, 大庆 163318)

岩石样本图像的分类识别是油气和矿产资源勘探的基础工作,对储量计算和地质建模极为重要。常用的传统分类方法,以重磁、测井、地震、遥感、电磁及薄片分析方法等方法为主,具有精度差、成本高、应用范围窄等缺点[1-5]。近年来,诸多学者研究以深度神经网络模型为代表的机器学习方法,应用于解决岩石样本图像的分类问题,克服了传统方法的主观性强、周期长、成本高等弊端,开展了大量的工作。

岩石样本图像的局部特征参数及其分布规律是岩石岩性类别的重要依据,主要包括:颜色、空间、形状等特征参数。其中,色彩空间作为颜色特征的基础参数,成为岩石数字图像分割的主要依赖参数。国内外研究者对此开展了研究工作,并取得一定的成果[6-13]。Yang等[6]利用阈值法降低颜色空间维数,并应用于彩色图像边缘检测。丁天怀等[7]、汤慧[8]利用多颜色空间融合作为图像特征提取的手段。张莹[9]基于多色彩空间,对切片图像进行阈值分割,利用二值图像数学形态学相关理论,对岩石图像中的孔隙进行精确识别。吴拥等[10]基于正交偏光序列图像的颗粒分割,利用红绿蓝(red-green-blue,RGB)多阈值分割算法对图像进行分割,提高了准确性。程国建等[11]将灰度图像分割应用于不同颜色空间的每个颜色分量上,并通过一定的方式进行组合,实现图像分割方法。王林林等[12]基于RGB色彩空间的彩色图像处理技术,对切片图像进行阈值分割,实现了花岗岩组成成分边界曲线识别与提取。

传统的机器学习分类算法,分别以无监督的K-means聚类和有监督的K-近邻(K-nearest neighbor,KNN)算法为典型代表,成为两大类方法。国内学者研究算法的有效性和应用性,并用于岩石图像分类问题的研究与实践[13-16]。朱连江等[13]基于轮廓系数进行聚类的有效性分析。梁淑蓉等[14]基于权重搜索树改进KNN的高维分类算法。郭超等[15]将图像形态学变换与色彩通道的标准算术值相结合,利用神经网络和支持向量机算法实现了岩石图像分类。刘烨等[16]基于铸体薄片图像颜色空间与形态学梯度的相关理论,应用支持向量机算法实现了岩石分类。

随着深度学习算法引入图像分类和识别领域,国内研究者基于岩石图像的多种特征,提取对应的特征参数,构建多层的深度神经网络结构,实现图像的快速分类[17-18]。胡祺[17]融合多维信息的岩石薄片图像,利用深度学习VGG16算法实现分类。金书季[18]基于深度学习的神经网络结构实现岩石图像的分类及图像特征可视化。

然而,常用的卷积神经网络模型普遍存在信息丢失、损耗等问题,外国研究者使用了跳跃连接作为深度残差网络(ResNet)内部的残差块,将输入信息绕道传到输出,确保岩石图像的局部特征在前向传播时受到特征重用,能够有效提高识别精度[19-20]。并且,外国研究者还研究深度残差网络能够有效解决随着网络层数的增加而出现的梯度消失或梯度爆炸问题,保证了系统的误差不会随着深度增加而增加[21-22]。Kai等[19]采用残差学习训练残差映射形成改进后的DnCNNs网络结构,进行图像去噪。Glorot等[20]研究训练深度前馈神经网络的困难,对比激活函数和初始化选择的效果。Bengio[21]验证学习梯度下降的长期依赖关系。Wang等[22]利用深度残差神经网络识别岩石图像的类别,并计算含油量。同时,国内学者也对ResNet残差网络的应用和实践进行了大量的研究工作[23-28]。张超群等[23]设计新的神经网络模型与ResNet 50、VGG 16算法进行对比,平均准确度为75.6%,优于ResNet 50和Vgg 16算法。王元东[24]提出了一种随机擦除数据增强算法,实现了对基于ResNet模型的图像分类方法的改进。徐胜军等[25]提出了一种基于多尺度特征融合空洞卷积ResNet模型用于遥感图像分类。刘晨等[26]基于ResNet-50网络模型和迁移学习的岩性识别与分类方法,首先使用预训练的ResNet-50残差网络进行特征提取,然后利用改进的分类模型进行训练,最后在测试集上进行岩性识别分类。刘丹晨[27]应用3种算法:ResNet-LSTM、EfficientNet-LSTM和NFNet-LSTM分别进行基于多标签图像分类的矿物识别。许振浩等[28]比较并验证ResNet算法对于岩石识别的稳定性和可靠性。

目前,深度学习的分类算法已经得到广泛应用。岩石样本图像具有明显的差异性特征,同类岩石样本也具有一定的色差,直接运用ResNet-50等神经网络算法进行岩石类型分类,训练集精度可以接近90%,但是验证集往往准确度85%左右,误差损失明显增大[23,26]。现结合色彩空间和深度残差网络的特征,提取岩石图像的RGB颜色特征,应用无监督K-means聚类算法进行颜色类别划分,再通过有监督精细KNN算法对颜色类别进行验证,然后对于不同颜色类别下的岩石样本,利用深度残差网络ResNet-50进行分类识别。

1 基于色彩空间的K-means聚类和特征提取

1.1 色彩空间

色彩空间是一种用坐标系来描述各类颜色的模型系统,通常由3个或4个颜色分量构成,色彩空间中的每个点均可看作由多个分量组合而成。常用的色彩空间以RGB(红色、绿色、蓝色)和HSV(色调、饱和度、明度)为主。

RGB色彩空间通过加法混色法来产生其他颜色,混合色定义为

C=rR+gG+bB

(1)

式(1)中:C为混合色,lm;R、G、B分别为红、蓝、绿3个颜色通道的量值,T;r、g、b分别为匹配时所需要RGB三基色的量值,取值范围0~1。

RGB色彩空间坐标系可由一个三维立方体表示,如图1所示。

图1 RGB色彩空间坐标系Fig.1 RGB color space coordinate system

1.2 基于图像RGB特征提取

复杂岩性油气藏的岩石图像数据集来源于2021年第九届“泰迪杯”数据挖掘挑战赛的B题(https://www.tipdm.org:10010/#/competition/1354705811842195456/question)。数据集的岩石类别,以浅灰色细砂岩、深灰色泥岩为主,以深灰色粉砂质泥岩、灰色泥质粉砂岩和灰黑色泥岩为次,含有少量的灰色细砂岩和黑色煤,共计7类315张岩石图像。岩石样本图像共计两种格式:一种是整张图像都是岩石,分辨率为4 096×3 000的BMG格式289张;另一种是背景边缘不是岩石信息,分辨率为2 448×2 048的JPG格式26张。不同类别岩石的典型图像,如图2所示。

图2 不同类别岩石的典型图像Fig.2 Typical images of different types of rock

不同类别的岩石样本图像数量并不相同,存在数据不均衡的现象。为避免神经网络训练过程中发生过拟合现象,利用图像分割、随机旋转和平移的方法,进行数据增强,见表1。图像分割选择3×3的方式,将1张图像切成9小张,见图3。BMP格式的图像直接分割,JPG格式切除边缘后,再进行分割。

表1 各类岩石图像数量

图3 图像切割Fig.3 Image segmentation

如图4所示,岩石图像RGB颜色属性特征值分布具有不同的离散分布特征,均近似服从瑞利分布,数值分布主要集中于[0,100]区间。所以,岩石图像的RGB颜色属性的分布特征可以选用像素点的RGB平均值、中位数和两个四分位数,共4种统计量来表征和描述图像的RGB颜色分布规律。每张岩石图像提取的RGB平均值、中位数和两个四分位数的属性值,如表2所示。

表2 岩石图像RGB特征数据(部分)

图4 典型岩石图像及相应的RGB颜色数值分布曲线Fig.4 Typical rock images and corresponding RGB color value distribution curves

1.3 基于图像RGB特征数据的K-means聚类

K-means聚类是将样本集合划分为由类似的样本组成多个类或簇的学习过程。算法步骤如下。

步骤1在n个样本集合X={x1,x2,…,xn}中,随机选择k个样本点{μ1,μ2,…,μk}作为初始中心。

步骤2分别计算每个样本xi与各聚类中心μj间的欧式距离d(i,j),将样本归类到与其最近的类中。

(2)

式(2)中:i=1,2,…,n;j=1,2,…,k。

步骤3根据类簇内的第i个样本第j个中心样本xij,重新计算出该j类簇的聚类中心。

(3)

步骤4计算第i个样本点的平方误差Ei。

(4)

步骤5重复多次执行步骤3~步骤5,直到所有的样本点的平方误差Et变化小于所设定的阈值。

|Et+1-Et|<δ

(5)

式(5)中:δ为迭代阈值。

引入轮廓系数S作为初始聚类中心,根据内聚度和分离度的组合及其加权,进行聚类效果评价。轮廓系数S的取值范围为[-1,1],取值越接近1,表明聚类效果越好。

假设样本集合中的样本xi被聚类到类簇Kj中,则该样本xi轮廓系数为

(6)

式(6)中:ai为样本xi与其同类簇其他样本间欧式距离的平均值;bi为样本xi与其最近的不同类簇中其他样本间欧氏距离的平均值。ai越小并且bi越大,则说明样本xi越倾向属于类簇Kj,而不属于其他类簇。

计算样本集合中所有样本点xi的轮廓系数的平均值,可得出聚类的整体轮廓系数为

(7)

式(7)中:Sk为聚成k类时的轮廓系数;Si为样本点xi的轮廓系数。Sk越接近1,则xi的聚类效果越好;Sk越接近-1,则xi的聚类效果越差。

根据表2中的数据,计算轮廓系数对K-means算法聚类效果进行评价,如图5所示。可以看出,当类别数目为3时,轮廓系数取得最大值。由此,基于岩石图像的RGB特征数据,数据集可以聚为3个颜色类别,其不同聚类结果的岩石数量,共计2 835张,如表3所示。

表3 基于图像RGB特征数据的K-means聚类结果

图5 轮廓系数Fig.5 Profile coefficient

1.4 基于KNN算法的聚类结果验证

KNN分类算法的核心思想是判断数据之间距离的大小,距离越近则表示两类数据之间的相似性越大。算法步骤如下。

步骤1输入初始化训练样本数据。

(8)

步骤2计算测试数据与各个训练数据之间的距离。

(9)

式(9)中:i=1,2,…,n。

步骤3对测试数据与各个训练数据之间的距离,由小到大进行排序。

步骤4计算距离最近的k个样本Xq=(x1,x2,…,xk)所组成的类别v出现的频率。

(10)

式(10)中:V为聚类类别数;f(xi)为xi分别属于各个类别的概率。当a=b时,δ(a,b)=1;否则δ(a,b)=0。

基于K-means聚类的类别结果,将岩石图像数据集划分为训练集(80%)和验证集(20%),运用KNN算法进行验证。如图6所示,KNN算法的综合分类精度为99%,不同类别的分类精确度分别为98.5%、100%和98.8%。所以,基于岩石图像RGB特征数据的分类结果具有可靠性和合理性,聚类结果准确可信。

TPR表示召回率、真阳性率,正样本总数占所有正样本总数的比例;FNR表示误识别率、假阳性率,预测错的正样本占全体正样本的比例

2 基于颜色类别的深度残差网络ResNet-50分类算法

2.1 ResNet-50网络基本结构

ResNet-50网络结构由输入模块、残差模块和输出模块组成,如图7所示。输入模块,包括conv(卷积层)和max pool(最大池化层),中间使用Relu激活函数和批归一化层。残差模块,包含Conv Block和IdentityBlock两种残差结构。其中,Conv Block输出的维度与输入的维度不同,可用于网络维度的改变;Identity Block输出的维度与输入的维度相同,通过串联加深网络。输出模块,将特征经过AvgPOOL平均池化层进行降采样,输入全连接层,由Softmax分类器输出对应的类别。网络结构描述参数如表4所示。

表4 ResNet-50网络结构描述参数

图7 ResNet-50网络结构描述图Fig.7 ResNet-50 network structure

2.2 超参数优选

2.2.1 输入层

起始层为输入层,将岩石图像进行数据化预处理。经过优化,将类型Ⅰ与Ⅱ的输入层大小调整为64×64×3,类型Ⅲ的输入层大小调整为256×256×3。

2.2.2 卷积层

卷积层通过建立局部相关进行特征提取,缓解了全连接带来的神经元数量迅速增加的问题。卷积的计算过程,如图8所示。ResNet-50神经网络所采用卷积核大小为7×7,在保证模型精度的前提下,一定程度上降低了计算量。

图8 卷积模块Fig.8 Convolution module

(11)

2.2.3 激活函数

Relu激活函数具有单侧抑制性,收敛速度快,计算复杂度低的特点。其定义式如下。

(12)

式(12)中:x为输入向量。

2.2.4 池化层

ResNet-50神经网络的池化方式为最大池化,即取滑动窗口内的最大元素作为输出,如图9所示。滑动窗口大小为3×3,步长为2,有效地增加传数据帧产生精确结果的概率,提高网络的可优化性。

图9 池化模块Fig.9 Pooling module

2.2.5 残差模块

残差模块指两个卷积层之间建立跳跃连接,使神经网络向训练精度较好的方向进行优化,增大了最大允许深度,同时未增加参数,保持计算复杂度在可控水平的范围内,解决了网络较深时产生梯度爆炸以及梯度消失的现象。如图10所示,x表示模块的输入,F(x)表示原目标函数,H(x)表示模块的输出,即H(x)=F(x)+x。残差模块通过跳跃连接传递信息,即使代入新的图像数据,依然可以避免网络退化的现象发生。

图10 残差模块Fig.10 Residual module

2.2.6 归一化层

批量归一化通过对数据重新进行标准化,使数据分布恢复到原始分布,提高网络泛化能力。

设每个batch的张量形状为(B,C,H,W),其中B为批量大小,C为进行批标准化的次数,H为输入图像的高度,W为输入图像的宽度。标准化过程公式如下。

(13)

(14)

(15)

2.2.7 全连接层

全连接层指目标空间的神经元与隐层特征空间的所有神经元相连,是隐层特征空间所有神经元的加权和,如图11所示。其作为最后一层,将学习到的样本特征,由隐层特征空间向目标空间做映射,进行分类。由表3可知,类型Ⅰ与Ⅱ的全连接层大小为5×1,类型Ⅲ的全连接层大小为7×1。

图11 全连接层Fig.11 Fully connected layer

2.2.8 Softmax分类器

(16)

式(16)中:softmax(si)为被分为第i类的概率;si为输入值x在第i类中的评分;N为总分类数。

2.2.9 准确度

(17)

式(17)中:TPii为将i类正确预测为i类的样本数;FPij(i≠j)为将i类错误预测为j类的样本数。

3 实验结果

数据集划分比例为训练集90%、验证集10%。基于不同颜色类型的岩石样本图像,应用ResNet-50算法进行识别,训练集准确度均高于91%,验证集准确度均高于84%,平均训练集精度为93.15%,平均验证集精度为88.21%,如表6所示。

表6 分类集准确度

4 结论

针对复杂岩性油气藏的岩石样本图像智能分类及识别问题,基于色彩空间提取岩石图像的RGB颜色特征数据,应用无监督K-means聚类算法,进行颜色类别聚类。然后,利用有监督精细KNN算法对颜色类别进行验证。最后,对于不同颜色类别下的岩石样本图像,应用深度残差网络ResNet-50算法进行分类识别,得到不同颜色类别岩石样本识别的平均训练集精度为93.15%,平均验证集精度为88.21%。同时,数据集拆分成3个类别进行分类识别,降低数据量和计算复杂度,训练时间较快。表明本方法可以有效地解决岩石图像智能分类问题。

猜你喜欢
类别残差岩石
基于双向GRU与残差拟合的车辆跟驰建模
第五章 岩石小专家
3深源岩石
基于残差学习的自适应无人机目标跟踪算法
一种叫做煤炭的岩石
海藻与岩石之间
基于递归残差网络的图像超分辨率重建
服务类别
平稳自相关过程的残差累积和控制图
论类别股东会