余晓露,李龙龙,蒋 宏,卢龙飞,杜崇娇
1.中国石化 油气成藏重点实验室,江苏 无锡 214126;2.中国石化 石油勘探开发研究院 无锡石油地质研究所,江苏 无锡 214126
碳酸盐岩主要由方解石和白云石等碳酸盐矿物组成,属于化学岩及生物化学岩类[1]。目前,全球已知的油气储量中有40%以上来自碳酸盐岩储层[2]。在不同的沉积环境以及成岩相带影响下,碳酸盐岩不同的矿物成分和组构形式造就了其岩相学和化学性质的复杂性,也使其在油气成藏过程中起着极为不同的作用[3]。因此,有必要对碳酸盐岩进行岩相学研究,通过分析碳酸盐岩的结构组分、构造、储集空间类型、成岩作用等特征,进而研究其在成藏中的作用。
传统的碳酸盐岩岩相学分析主要通过偏光显微镜对岩石薄片进行观察,在获得矿物组成、结构和构造特征等信息的基础上,解释沉积环境并推测复杂的沉积后蚀变历史。在观察过程中,除了协助矿物鉴定的染色法、协助定量估算的计数法以及阴极发光等技术[3]的综合运用之外,鉴定人员对薄片特征的描述和解释主要依赖于自身经验。因此,碳酸盐岩岩相学的定性和定量分析严重受限于鉴定人员的主观认知水平。
近年来,伴随着计算机和人工智能技术的快速发展,图像处理科学在诸如人脸识别、医学影像识别、自动驾驶等众多场景中都表现出良好的应用效果[4-7]。在地质学领域也涌现出大量对岩石薄片图像的分析应用。早期的研究多针对图像中的某种特定目标,采用数字图像处理方法来提取目标对象的特征。岩石薄片图像中的特定目标通常为某种类型的矿物,例如以玄武岩中的橄榄石斑晶为研究对象,利用增强、变换等图像处理方法获取其尺寸、形状等数据[8];或以砂岩中的石英碎屑为研究对象,利用多尺度分割方法将其与背景分离并计算含量、形态等特征[9]。除了矿物之外,目标对象也可以为图像中包含的其他特征,如采用二值化、去噪和腐蚀等图像处理方法对砂岩中的孔隙进行分割和计算[10],或利用去噪、分割等方法结合计算机图形学算法,识别喉道并计算孔喉属性[11]。
后期,随着深度学习受到越来越多研究人员的重视与关注,产生了大量有关薄片图像识别的研究,核心任务总体可定义为目标分类和目标分割两种。
目标分类是指根据图像中包含的语义信息,利用算法对图像类别进行区分。基础的分类任务是对岩石类别的划分,如利用不同岩石类别之间较大的差异,对岩石薄片图像进行建模与分类[12]。进阶的分类任务是对岩石图像中包含的某个子区域对象的划分,以矿物识别[13]和生物化石智能识别[14-15]为代表。针对某种具体的类别对象,可采用不同的模型,如将线性回归模型、树结构模型、神经网络模型等众多模型应用于矿物分类[13]。也可以从不同的角度或尺度对目标进行分类。以生物化石为例,有微米级尺度的对海绵、有孔虫、棘皮动物等生物碎屑的分类识别[14],也有纳米级尺度的对球状、管状、刺状微体化石的分类识别[15]。
目标分割是指将特定目标区域从图像中分割出来再进行识别。与目标分类相似,岩石薄片图像中的分割对象也多集中于某种具体的子区域对象。例如砂岩图像中的颗粒与孔隙[16],碳酸盐岩图像中的矿物与孔隙[17],鲕粒与生物化石[18]以及某些特殊的成岩现象或岩石组分[19]等。由于目标分割的难度整体高于目标分类,为了提升分割的准确率,一方面可以采用多个模型的实验来进行比较和择优,如利用离散卷积、人工神经网络和随机森林创建不同模型进行岩石薄片的分割和识别[18];另一方面也会设计一定的策略来提升模型性能,如通过语义特征、灰度特征和边界特征相合并的方法,对通用型卷积神经网络分割方法进行改进,以获得更好的砂岩图像颗粒分割结果[16]。
从不同图像处理方法的性能来看,传统的数字图像处理技术在输入—输出都以图像为特征的中-低级图像处理任务(如图像预处理、孔隙边缘检测)中具有更好的适用性和灵活性,而深度学习技术在以理解图像为目的的高级处理任务(如化石识别、矿物类型识别)中表现出更好的视觉认知能力。从研究对象来看,当前研究多专注于对岩石薄片图像中包含的一种或几种信息特征的处理(如矿物识别、化石识别),缺乏对于整张图像信息的全方位挖掘。事实上,专业岩矿鉴定人员在薄片尺度的岩相学分析是非常注重全面性和系统性的。在以岩石学、光性矿物学和结晶学为三端元的岩矿鉴定基础理论框架中,岩石学搭建岩石分类、成分、结构、构造等骨架性特征,光性矿物学综合各类矿物光性特征在偏光显微镜下的表现,结晶学则对矿物外部形态与内部结构(即现象与本质)之间的联系建立进一步的认识。因此,在偏光显微镜下对某一类岩石的描述、分类和命名过程中,从人眼到人脑,涉及信息提取和信息处理的神经回路是一个复杂的认知过程。如果将其降到二维并以图像处理技术来模拟整个过程,并不是一个简单的分类任务或图像处理任务可以解决的。
基于结构组构的岩类学研究将碳酸盐岩结构划分为4种类型:颗粒结构、生物骨架结构、晶粒结构和残余结构[1],不同类型碳酸盐岩的图像特征多种多样。颗粒结构中的亮晶颗粒灰岩前景(颗粒)与背景(亮晶胶结物)边界对比度高,图像特征统一,且矿物组成相对简单,是最适合进行像素级图像分析的类型。因此,本研究聚焦于碳酸盐岩中常作为油气储层的亮晶颗粒灰岩,构建了一套基于图像的岩相学分析框架。通过该框架建立起从薄片图像到岩石特征之间的映射关系,用于表示该类图像特征及其中的目标信息。并根据亮晶颗粒灰岩的图像特点设计了一系列相对合理有效的算法,对其中蕴含的特征信息进行提取。
亮晶颗粒灰岩主要由颗粒和亮晶胶结物两部分组成。颗粒机械沉积并形成骨架支撑,亮晶在粒间原始孔隙中以化学方式沉淀结晶并形成胶结物。粒径小于0.03 mm的灰泥杂基由于极易重结晶且含量相对少,本研究中作弱化处理。亮晶颗粒灰岩主要由方解石组成,且含量大于50%[20]。由于交代等成岩作用及机械混入作用的影响,其中还可能含有白云石、菱镁矿、菱铁矿等其他碳酸盐矿物,石膏、重晶石等非碳酸盐矿物,甚至石英、长石等陆源碎屑矿物。考虑其常见程度,对除交代成因白云石之外的其他矿物作弱化处理。
基于图像的亮晶颗粒灰岩岩相学分析框架,包含结构组分特征和矿物组分特征两部分。结构组分特征是指对基本组分——颗粒和亮晶胶结物的描述和表征;矿物组分特征是指对组成矿物的鉴定和统计(图1)。在结构组分特征部分,由于亮晶胶结物多由干净明亮的方解石晶体组成,图像特征趋于相似,具有成因意义且图像特征具明显差异的碳酸盐颗粒为研究的重点。首先,颗粒类型判识作为指示沉积环境、反映沉积旋回的重要标志以及岩石分类命名的关键依据,构成结构组分特征定性分析的基础;其次,颗粒含量统计及粒径、形状、接触关系等形态学数据,作为帮助推测沉积环境及成岩作用的辅助依据,构成结构组分特征定量分析的支撑。在矿物组分特征部分,通过对染色图像的分析,区分方解石与其他矿物,计算各自含量,实现对矿物组分的定性和定量表征。
图1 基于图像的亮晶颗粒灰岩岩相学分析框架
亮晶颗粒灰岩图像是岩石结构与矿物组分信息的物质载体,蕴含丰富的图像特征。以岩相学分析为目的,如何对目标图像设计合理的特征提取方法,并在此基础上理解其中蕴含的语义信息和挖掘有用的数据,是本研究的重点。
数字图像处理是指将图像信号转换为数字信号,并通过数学函数等对图像中的像素信息进行处理,如去噪增强、图像复原与重建、形态学处理等[21],具有再现性好、处理精度高、适用面广、灵活性高等优点。
深度学习则是近年来在图像识别领域有出色表现的主要研究方法,以卷积神经网络为代表,通过模拟人脑复杂的层次化认知规律使机器获得抽象概念的能力[22-23]。通常以原始数据作为输入,能够从大量训练数据中自动学习图像特征并完成指定的识别任务。
两种技术的区别在于数字图像处理不涉及对图像内容的理解,而深度学习使用计算机来模拟人类视觉,模拟的过程包括学习以及推理能力。因此,在亮晶颗粒灰岩图像分析即精细化表征的过程中,需要综合运用两种方法来提取岩相学分析框架中包含的有意义信息。
在亮晶颗粒灰岩图像的精细化表征过程中,深度学习主要用于结构组分特征中颗粒类型的识别。根据边缘和纹理特征,再综合考虑成因、常见程度等因素,亮晶颗粒灰岩中常见的碳酸盐岩颗粒可被划分为5种类型[1]:内碎屑、生物碎屑、包粒、球粒和团块(图2)。
颗粒类型识别属于典型的图像分类任务,基本流程分3个步骤:(1)制作碳酸盐岩颗粒数据集,并针对数据特征设计一定的处理和增强策略,为后续的卷积神经网络提取图像特征提供数据基础;(2)模型设计与训练,以ResNet50为例展示模型结构的设计,以及在实践中探索出的提升模型准确率的训练策略;(3)颗粒类型识别,基于训练好的模型对框选出的待测颗粒进行识别。
3.1.1 制作碳酸盐岩颗粒数据集
由岩矿鉴定专家筛选一批亮晶颗粒灰岩薄片图像,使用Labelme工具将其中特征典型的颗粒框选出来。按照指定的组分类型打上类别标签,然后将目标区域都提取为单个图像,便形成了颗粒分类数据集。由于本研究弱化了除交代成因白云石之外其他矿物的影响,主要组成矿物方解石和白云石的干涉色都统一呈现高级白,因此,可直接选用单偏光图像来制作数据集。
由于存在图像拍摄条件的差异,为了保证数据特征的统一性,可以通过归一化、去噪、增强等方式对图像进行预处理。为了提升数据的泛化性,可以通过裁剪、旋转、缩放和调换颜色通道等方法对数据集进行增强。以上图像预处理和数据增强策略均基于地质学专家对亮晶颗粒灰岩的鉴定经验得出,并在后续的实验中被证明有效。
本研究中制作的碳酸盐岩颗粒数据集总数为2 200张,按照0.8∶0.2的比例划分训练集和数据集。
3.1.2 模型设计与训练
通过对比ResNet、DenseNet、InceptionNet、MobileNet等经典的卷积神经网络模型(表1),发现识别准确率最高的为具有50层网络结构的ResNet模型。
表1 卷积神经网络各模型特征对比
对ResNet50的网络结构进行了改进(图3),模型的第一部分为卷积层、批标准化处理层和最大池化层,第二到第五部分为内含多个卷积层的残差块,在最后一个卷积层之后以全局平均池化层代替平均池化层,再连接全连接层,并在每个卷积层之后都连接ReLU神经元激活函数。模型主体部分残差块包含两种不同的结构单元,残差块Ⅰ为改变维度的卷积残差块(Convolutional block),输出维度相对于输入维度增加一倍;残差块Ⅱ为不改变维度的恒等残差块(Identity block),输出和输入维度一致。残差块内通过快捷连接来实现同等映射,避免了随着网络层数加深出现的学习退化现象,在保护信息完整性的同时能大大提升准确率,这也是残差网络的核心思想所在。模型中改进的CNN+GAP结构通过对卷积层输出特征空间信息的归纳来减少模型参数和计算成本,从而降低过拟合风险,同时提高泛化能力。
图3 改进的ResNet50卷积神经网络结构
ResNet50模型以分辨率224×224的输入图像为基准。经过用于特征提取的卷积层和用于特征处理的全局平均池化层之后,在全连接层实现与输出目标之间的映射,再经过Softmax分类器,将特征向量输出为计算出的每种颗粒类别的概率值。
在模型训练过程中需要设置一定的策略,将模型权重参数初始化为[0,1]区间的正态分布随机数,初始学习率设置为0.001,并采用了梯度下降策略。同时在全连接层添加Dropout操作以降低过拟合,以上策略经过实践验证均适用于碳酸盐岩颗粒识别任务。经过多次训练和调优之后,对于目前所划分的5个类别颗粒的综合识别准确率最高可达95%。
3.1.3 颗粒类型识别
将待测亮晶颗粒灰岩图像中的未知颗粒框选出来生成多个子图像,经过预处理之后送入训练好的模型。经过前向计算查找输出特征向量中的最大值,便为对应的颗粒识别结果。待所有颗粒的子图像识别完毕,即完成整张亮晶颗粒灰岩图像中的颗粒识别。
在亮晶颗粒灰岩图像的精细化表征过程中,数字图像处理主要用于获得结构组分特征中的颗粒含量和颗粒粒径、形状、接触方式等形态学数据,以及矿物组分特征中的矿物含量。具体可以归纳为3点:(1)基于去噪、增强等图像复原技术进行预处理,输出改进质量的图像;(2)基于阈值法进行图像分割,再结合数学形态学后处理提取颗粒区域,通过进一步计算输出颗粒含量及颗粒形态学数据;(3)基于对染色图像的色彩空间处理,计算并输出矿物含量。
3.2.1 图像预处理
通过适当的图像预处理改善图像质量,更有利于后续图像分割和处理。经过实验验证,双边滤波算法和自适应直方图均衡化算法[21]适合亮晶颗粒灰岩图像的预处理。基于双边滤波算法的图像去噪,在采样时不仅关注像素在空间距离上的关系,也兼顾像素之间的相似度[21],因此既能较好去除图像中细小的椒盐噪声,也能使颗粒边缘得到良好保存。基于自适应直方图均衡化算法的图像增强,通过计算图像的局部直方图和重新分布亮度来改变对比度[21],可以有效增强颗粒区域和背景区域的灰度差异。
3.2.2 图像分割与后处理
采用图像分割将颗粒从背景区域中分离出来,是后续定量计算的基础。图像阈值化分割是一种经典且应用广泛的传统图像分割方法。基本思想是利用前景和背景的灰度值特性差异,通过设置合适的阈值,将图像灰度划分为两个或多个灰度区间[21],因此,特别适用于亮晶颗粒灰岩这类目标和背景区域占据明显不同灰度范围的图像。其中,基于Ostu算法的最佳全局阈值处理以对整幅图像的执行计算为基础,采用了类间方差最大化思想。通过方差计算寻找到合适的灰度级别,对两个部分之间的方差取最大值给出最佳阈值[21],可以适应含有较多暗色颗粒的亮晶颗粒灰岩图像,并且计算效率也明显优于模糊聚类、神经网络等新兴图像分割算法。实际上,二值化处理的结果会直接影响后续对颗粒的分析,考虑到碳酸盐岩颗粒类型的多样性和边缘纹理特征的复杂性,二值化图像的阈值选择仍然需要经过大量的实验和探索。
经过Ostu算法分割的图像通常存在大量噪声,且颗粒区域与背景区域仍然相连接,边缘不够明显,因此,还需要结合一定的数学形态学算法对图像进行后处理,如腐蚀、膨胀、开操作和闭操作等。腐蚀和膨胀都是数学形态学的基本运算,属于以集合为基础的非线性操作。腐蚀的作用是缩小或细化二值图像中的组成部分以去除多余的毛刺,膨胀作为腐蚀的对偶运算,作用是通过增长或粗化二值图像中的组成部分以去除轻微的缺损。作为对偶操作,开操作一般能平滑图像中物体的轮廓,削弱狭窄的部分并去掉较细的突出物;闭操作除了平滑轮廓之外,通常会融合较窄的缺口,消除较小的孔洞并填补轮廓线中的断裂[21]。考虑到亮晶颗-粒灰岩图像中颗粒的差异性以及这类图像的特殊性,在具体的实施过程中,需要针对图像特征,综合运用多种数学形态学算法进行去噪平滑处理。
3.2.3 颗粒含量及形态学数据计算
经过对亮晶颗粒灰岩图像的一系列处理,将颗粒区域从原图中提取出来并细化之后,便需要设计合适的形态学处理方法,对颗粒含量及颗粒形态学数据进行进一步计算。
(1)颗粒含量
设置合适的阈值对亮晶颗粒灰岩图像进行二值化操作。完成一定的数学形态学处理之后,通过统计各颗粒区域所占的像素点个数,计算颗粒区域面积与图像总面积的比例,便可大致求得颗粒含量。
(1)
式中:Cp为颗粒含量,%;Sp为颗粒像素面积,μm2;St为总像素面积,μm2。
(2)颗粒形态学数据
亮晶颗粒灰岩图像在采集时一般会带有由显微镜标尺定标确定的比例尺。因此,利用图像识别方法计算颗粒形态学参数时,首先需要以比例尺作为基准换算出每个像素点代表的实际尺寸。
为了适应碳酸盐岩颗粒方向的随机性和外形一定程度上的不规则性,设计了最小外接圆法和最小外接矩形法两种方法,作为颗粒形态学参数计算的基础。其基本原理是利用最小外接圆或最小外接矩形把颗粒区域包含在内,并确定最小外接圆的直径或最小外接矩形的长短轴,然后根据不同颗粒的形状特点及其在图像中的位置特征,建立直径或长短轴数值与实际颗粒之间的对应关系,并获得颗粒的形态学数据。
对于碳酸盐岩颗粒粒径,鉴定人员通常对照显微镜目镜标尺进行测量。考虑到可应用性,建议在颗粒边缘提取的基础之上计算每个颗粒的最小外接圆或最小外接矩形,以最小外接圆的直径或最小外接矩形的长轴近似作为颗粒的粒径d。最小外接圆或最小外接矩形的选择则视具体的颗粒类型而定。
在薄片中估计颗粒形状,主要通过参考国家标准进行。虽然以往也有学者曾提出对颗粒圆度进行定量划分[24],但在实际鉴定中却多为简单的定性划分(圆/椭圆/次圆),且主要针对内碎屑、包粒等颗粒进行。
本研究对颗粒形状的估算设计了两种方案(图4):一种是使用颗粒最小外接矩形的长宽比P1,越接近1则认为颗粒形状越接近圆形;另一种是计算颗粒面积与颗粒最小外接圆面积的比值P2,越接近1则认为颗粒越接近圆形。如果根据统计得出整张图像不同形状颗粒的P1或P2范围,便可设置合适的阈值对颗粒形状进行进一步划分。
图4 颗粒形状确定方法示意
由亮晶胶结物将碳酸盐岩颗粒胶结起来是亮晶颗粒灰岩的典型特征。胶结类型划分为基底式、孔隙式、接触式[20],相应地,颗粒间接触方式划分为无接触、点接触、线接触。
交并比(IoU)通过候选框与原标注框的重合率,即交集与并集的比值来评价图像分割的准确率,在行业内有广泛应用[25]。本研究对交并比概念进行简化,通过计算颗粒外轮廓最小外接圆或最小外接矩形之间相交区域与相并区域面积的比值,来确定两个颗粒之间的接触方式。如果比值很小,则认为颗粒之间是点接触;如果比值很大,则认为颗粒之间是线接触,但阈值参数的设置需视具体图像而定。
3.2.4 染色图像HSV色彩空间处理
对已使用茜素红溶液染过色的亮晶颗粒灰岩图像(茜素红会使方解石呈现红色),基于HSV色彩空间提取红色区域并进行占比计算,便可完成简单的矿物定量。计算机中的色彩空间图像通常以R(Red)、G(Green)、B(Blue)三通道来描述,但这种颜色模型不太适用于对颜色的直观描述。基于人类视觉系统建立的HSV(Hue、Saturation、Value)模型,既可以感知图片的亮度和色调,又能够表达色彩的明暗程度,更适用于对彩色图像的直观、准确的描述[21]。
对染色图像的HSV色彩空间处理主要分三步进行:首先,将图像从RGB色彩空间转换到HSV色彩空间;其次,将HSV色彩空间图像进行可视化,并进行颜色量化处理,将颜色空间划分为若干个小的颜色区间;最后,结合一张或多张染色图像,-分析出红色在HSV色彩空间中对应的小区间范围,并统计颜色分布直方图,通过计算小区间内像素点的数量,即可求得被染为红色的方解石含量。
为了验证以上图像处理算法,并展现亮晶颗粒灰岩完整的岩相学分析框架,我们选取了典型的亮晶颗粒薄片样品来展示整个应用过程。
对整个薄片样品(顺X井,6 646.67 m)进行预览后发现颗粒类型主要为内碎屑,其次是包粒,在亮晶胶结物中混有少许灰泥,为典型的亮晶颗粒灰岩类型。由于颗粒分布不均匀,需筛选出最能代表其结构组分特征和矿物组分特征的区域作为示例进行图像采集,显微镜型号为ZEISS Axioplan2。
4.1.1 颗粒类型识别
颗粒类型识别为岩相学分析框架中结构组分特征的定性表征部分,采用3.1节中提供的方法和流程完成。将实验亮晶颗粒灰岩图像裁剪为多张子图像,经过像素值归一化处理之后,分别输入到3.2.2节中训练好的模型中识别其中的颗粒类型。如图5步骤一所示,综合所有子图像的识别结果,可知输入图像中的颗粒主要为内碎屑和包粒。
图5 亮晶颗粒灰岩图像结构组分特征提取过程示例
4.1.2 颗粒含量及形态学数据计算
颗粒含量及形态学数据计算为岩相学分析框架中结构组分特征的定量表征部分,采用3.2节中提供的方法和流程完成。根据实验图像中主要颗粒(内碎屑、包粒)的具体形态及纹理特征,在整个流程中需要对数字图像处理方法进行灵活运用。
(1)颗粒含量计算
首先,对图像进行预处理操作,经过图像去噪和图像增强处理之后的图像如图5b所示;然后,设置合适的阈值对图像进行二值化操作。图5c-d展示了采用Ostu算法动态调节阈值得到的结果,系统推荐的阈值是100(图5e),最接近原图像特征的分割结果。因此,将其设置为最佳阈值,即灰度值超过100的像素值置为0,低于100的像素值置为1。
考虑到图像亮区域(颗粒区域)还存在一些比结构元小的暗细节,再对其进行一次闭操作来削弱暗特征。这样二值化时产生的空洞大多被填充,感兴趣的目标区域便被提取出来(图5g),白色区域为颗粒区域,黑色区域为背景区域。统计并计算白色区域所占像素点个数与图像总像素点数的比值,即可估算出图中的颗粒含量为71.1%。
(2)颗粒形态学参数计算
由于二值化图像的白色区域有粘连并且噪声较多,采用形态学滤波算法对二值化图像迭代的进行2次腐蚀和2次膨胀操作,再经过8次开闭运算,即可将图5g中连为一体的颗粒区域分开,得到图5h。
接着,在图5h中查找每一个连通区域,使用Sobel算子提取每一个连通区域的外轮廓,并绘制最小外接矩形和最小外接圆,将计算得到的圆形框和矩形框叠加到原图像上,分别得到图5i和图5j。
同时,根据比例尺换算出每一个像素点的尺寸是1.72 μm,颗粒形态学参数即可通过像素点尺寸和与最小外接圆/最小外接矩形相关的几何参数来计算获得。
①颗粒粒径。计算图5j中每一个圆形框的直径,即可得到每一个圆形框中对应的颗粒粒径,其中,最大的颗粒粒径占据216个像素点,为371.5 μm,最小的颗粒粒径占据81个像素点,为139.3 μm。此处需要说明的是,由于最小外接圆的计算结果直接影响颗粒粒径参数,因此,在基于随机增量法的计算过程中,统计时需要去除过大或过小的异常值,将出现频率较高的直径作为颗粒直径。经过实验验证,这种方法可以较好地匹配颗粒真实直径。
②颗粒形状。亮晶颗粒灰岩中的内碎屑和包粒多呈圆、次圆或椭圆形。此处采用3.2.3(2)节中的第一种方案,对图5i中每一个颗粒最小外接矩形的长宽比(L/W)进行了统计(此处的长宽比是指矩形长边和短边的比值,因此,长宽比一定大于等于1.0),并邀请具有多年岩矿鉴定的专家对不同颗粒形状所对应的阈值范围进行了观察与设置:当L/W≥1.5时,对应的颗粒形状为椭圆形;当1.2≤L/W<1.5时,对应的颗粒形状为次圆;当1≤L/W<1.2,对应的颗粒形状为圆形。如图5k中颗粒的长宽比为1.06,判断该颗粒形状为圆形;图5l中颗粒的长宽比为1.61,判断该颗粒形状为椭圆形。
③颗粒接触方式。根据原始图像特征,将亮晶颗粒灰岩中颗粒之间的接触方式简化为无接触、点接触和线接触。在图5j的基础上进一步计算相邻两个最小外接圆之间的相交的部分,以红色区域表示,计算相交面积与最小外接圆面积的比值(IoU)。同时邀请具有多年岩矿鉴定的专家,对不同颗粒接触方式所对应的阈值范围进行了观察与设置:当IoU=0时,对应的颗粒接触方式为无接触;当0 岩相学分析框架中的矿物组分特征提取部分,采用3.2.4节中提供的方法和流程完成。 将亮晶颗粒灰岩薄片样品的盖玻片揭下,进行茜素红染色处理之后,对同一区域再次拍照,获得RGB色彩空间的染色图像(图6a),将其转换到HSV色彩空间并进行可视化处理之后获得图6b。统计HSV图像的颜色分布直方图,首先对目标染色图像进行观察,根据直方图的特性统计分析出红色在HSV色彩空间中对应的数值范围;然后将属于该范围的图像区域提取出来,统计提取出来的像素点个数,即可求得被染为红色的方解石含量。图6c中的白色区域表示被染为红色的区域,根据统计结果,该图像中方解石含量为95.4%。 图6 亮晶颗粒灰岩图像矿物组分特征提取过程示例 根据整个岩相学分析框架,融合图像处理和深度学习技术,对实验图像组分特征进行了分析(表2)。表2对比了专家的人工鉴定结果和本实验基于图像的鉴定结果。由于砂屑属于内碎屑类别,鲕粒属于包粒类别,因此,两种方法对于颗粒类型的判断和颗粒粒径的计算基本保持一致。对颗粒形状和颗粒接触方式,人工鉴定方法为主观描述,图像分析方法为定量计算,虽然结果略有出入,但主要的颗粒形状和主要的颗粒接触方式仍保持一致。颗粒含量结果有一定出入,但差值小于10%,这与人工鉴定需要观察多个视域,而图像分析仅针对薄片样品中最具代表性的区域有关。在矿物组分特征部分,两种方法给出的数据也差别不大,虽然当前的图像分析方法暂时给不出人工鉴定对于方解石之外其他矿物组分的鉴定结果,但针对茜素红染色的亮晶颗粒灰岩图像,基于图像分析法定量区分方解石与其他矿物可以精确至小数点后1位,相对于人工估算方法而言仍然具有一定优势。 表2 亮晶颗粒灰岩人工鉴定与图像分析结果对比 关于颗粒类型与人工鉴定结果的差异,是标签制作不够精细造成的。下一步有必要对颗粒标签进行分级标注,重新训练并进行校正。 经过测试,在I7-3.1GHz处理器、GTX1080显卡(8 GB内存)的硬件环境下,从输入单张实验图像到输出所有的测试结果,系统的平均处理时间约为312 ms,大大优于人工鉴定所耗费的时间。 本文以亮晶颗粒灰岩为研究对象,通过一套较为完整的岩相学分析框架,建立起从岩石特征到薄片图像之间的映射关系,并以深度学习为基础,结合数字图像处理,设计了全流程的亮晶颗粒灰岩图像特征综合提取算法。以顺X井亮晶颗粒灰岩薄片样品为例,通过完整的图像识别过程验证了各个特征点提取算法的有效性,并与人工鉴定报告进行对比。结果表明,本文提出的框架能够有效表征亮晶颗粒灰岩中的有意义信息,提供的算法也能够有效地提取这类图像中的目标信息。 在岩石学领域,相对于以探索岩石成因为目的的岩理学,以岩石分类和描述为目的的岩相学更适合作为图像分析的应用场景。岩矿鉴定专家在面向具体薄片对象时,从人眼到人脑的活动过程在逻辑上其实可以抽象为三个层次:(1)提取目标薄片在显微镜下的全局特征,将岩石对象定义到具体类别;(2)设置逻辑合理的结构层次,梳理出该类岩石对应的岩相学框架;(3)对框架中包含的各类局部特征信息进行观察、判断和描述,并完成组合和输出。相应地,专家经验也可以抽象为在各个层次的各个任务中都能够随意调用的、大脑中已经训练好的数个模型。以亮晶颗粒灰岩薄片样品的鉴定过程为例(图7):首先,专家依次通过岩石大类分类模型将其划分为沉积岩,通过沉积岩分类模型将其进一步划分为碳酸盐岩,通过碳酸盐岩分类模型再进一步将其划分为亮晶颗粒灰岩;接着,专家调用大脑中储存的亮晶颗粒灰岩岩相学分析模型,并迅速制定相应的薄片鉴定策略;最后便是执行策略,包括鉴定颗粒种类并记录颗粒的各项定性和定量特征,观察记录亮晶胶结物的各项特征,并进一步通过染色溶液来区分方解石和其他碳酸盐矿物等。完成所有观察内容之后,即可输出相应的薄片鉴定报告。 图7 岩矿鉴定人脑活动层次图示例 然而,前人对岩石薄片图像的分析研究多集中于某些特定类型的局部特征(如矿物/化石分类),忽视了对人类大脑活动的全流程模拟,即缺乏对岩石图像信息结构层次的系统分析和对信息特征的深度挖掘;采用的方法也多为单一型算法或模型,这严重制约了岩石薄片图像智能分析向真实场景的发展。相对而言,设计的基于图像的亮晶颗粒灰岩岩相学分析框架,是在方法研究与实际应用之间搭建桥梁的一次有益尝试。在对框架内图像特征信息进行提取的过程中,一方面,利用卷积神经网络的学习和推理能力来实现颗粒类型的识别;另一方面,针对不同的目的,灵活运用数字图像处理技术来计算获得颗粒含量、粒径、形状、接触方式以及方解石矿物组分的相对含量,使得整个图像分析流程在规范性的同时兼具灵活性。相对于大型神经网络模型需要的算力而言,融合深度学习与图像处理的方法对普通用户更加友好。总体来看,本研究提出的“岩相学分析框架”结合“图像分析算法”模式,可作为涵盖流程与技术的亮晶颗粒灰岩图像信息挖掘模型,据此实现对这一类碳酸盐岩的智能化、规范化、流程化鉴定。在面对其他具有统一特征的岩石类型图像时,也可参考这种模式,对图像信息进行全方位和系统性的挖掘。 本研究搭建的ResNet50网络结构以及训练出的超参数,依赖于当前典型类别的小规模数据集。在实际薄片鉴定过程中,由于碳酸盐岩颗粒的形态及纹理特征变化复杂,并且很可能遭受后期成岩作用(如重结晶作用、白云石化等)干扰而改变或混淆其特征,因此,面向大规模岩石薄片样本时,当前模型必定会面临普适性下降的问题。本研究提供的预处理和数学形态学处理算法,以及推荐的阈值范围,适用于最常见的内碎屑和包粒。考虑到碳酸盐岩颗粒的多变性和复杂性,在面向具有不同特征的颗粒对象时,需要设置其他更为合适的图像处理方法和阈值。这些方法都属于手工设计的特征提取算法,和深度学习模型的特征提取能力存在一定差距。如果能利用目标检测算法实现具有统计学意义的碳酸盐岩颗粒的定位和分类,并进一步计算形态学参数,结果应该会更为理想。另外,本研究设计的基于图像的岩相学分析框架和提供的图像分析算法,仅适用于亮晶颗粒灰岩,在进行其他类型碳酸盐岩(如晶粒型碳酸盐岩、粘结岩等)以及其他类型岩石(如碎屑岩)的分析时,虽然可借鉴“岩相学分析框架”结合“图像分析算法”这种模式,但必须根据具体的对象特征,来重新设计岩相学框架和具体的算法。 事实上,面对岩石这种自然界最复杂的固态多端元混合物,并不存在统一的岩相学分析框架适用于所有岩石类型,也不存在通用的卷积神经网络模型或图像处理算法,能解决所有类型岩石的图像分析问题。虽然关于岩石薄片图像的研究与日俱增,但面向具体应用时仍然受到极大的限制,其原因可以从岩石图像特征和图像识别技术两个角度进行分析。 三大类别岩石(岩浆岩、沉积岩、变质岩)在复杂的地质作用过程中既相互区别又相互转化,体现到图像特征上可以归纳为:(1)由于成因差异,造成不同类别、亚类、子类的岩石图像之间存在明显的类间差异,如三大岩典型图像;(2)由于岩石圈演化过程中物质的继承性,使得某些不同类别和不同级别岩石的组成端元(矿物)类似,图像之间存在一定的相似性和重叠性,如砂岩和变余砂岩的矿物组分基本重叠,某些页岩和板岩、灰岩和大理岩的图像十分相似;(3)由于成岩过程中遭受各种影响因素的不确定性,造成同子类岩石图像也存在类内差异,以砂岩为例,不同的压实强度、分选性、蚀变程度、孔隙发育程度等,甚至不同的制片方式,会使得砂岩图像呈现完全不同的特征;(4)由于形成过程中无处不在的能量交换(如交代作用、蚀变作用),使得岩石图像中某一类具体的局部特征也存在强烈的不确定性。以碳酸盐岩中常见的内碎屑和包粒为例,有的色暗,有的色亮,有的因重结晶作用或交代作用而色浅、边界模糊,还有的因白云石化或溶蚀作用而破坏原结构形态。当面临大规模岩石薄片图像样本时,这些特征的出现是非常随机的。因此,与人脸识别、医学影像识别等针对某一特定类别的应用场景不同,岩石薄片图像识别属于具有多层级多类别结构的复杂应用场景。对不同层级和类别结构的岩石薄片图像,需要设计不同的岩相学框架来对其中蕴含的地质信息进行表征。在设计过程中,既要考虑其特殊性,又要考虑岩石特征的普遍性,同时还要考虑基于图像技术的可实现性。因此,需要紧密融合岩矿鉴定专家与图像识别专家的经验,这对研究人员提出了更高的要求。 岩石薄片图像强烈的多变性和随机性对图像识别技术提出了新的挑战。图像领域的深度学习算法最适用于提取岩石薄片中复杂的组分和结构特征,但面向岩石薄片图像的深度学习算法面临着许多困难。例如:(1)以往的深度学习大多在特征典型的数据集上验证模型性能,而且在方法设计时通常只考虑简单场景的情形。这就很难验证模型在复杂场景中的性能,会严重制约图像识别在现实场景中的应用。(2)岩石薄片图像数据集的样本量小且制作难度高。数据集的数量和质量会直接影响模型的训练效果,公共应用领域较高的识别准确率背后通常是以动辄几百万上亿的数据量为支撑。而制作岩石薄片图像数据集时,一方面,面对的特征类型非常多,如岩石类别、矿物类别、孔隙类别,以及不同类型岩石所具有的不同的全局特征和局部特征等。以每种具体特征类型为目标的深度学习训练,都需要有对应的数据集作为支撑。另一方面,岩石先天的复杂性使得每一种具体的特征都具有强烈的多变性。而且对这些变化的准确识别和精确标注大多数时候都需要依赖于专业人员,大大提升了制作数据集的难度。考虑到这些因素,在扩充多类别高质量岩石薄片图像数据集的同时,采用更加符合人类思维方式的策略来训练模型以提升识别能力,都将是岩石薄片智能识别研究中值得尝试的重要方向。 (1)针对亮晶颗粒灰岩构建了一套基于图像的岩相学分析框架,包含结构组分特征和矿物组分特征两部分。结构组分特征包含对颗粒种类、颗粒含量和颗粒形态学参数的定性和定量分析;矿物组成特征包含对方解石和其他矿物的定性和定量分析。通过岩相学分析框架建立起从岩石特征到薄片图像之间的映射关系。 (2)融合深度学习和图像处理,对亮晶颗粒灰岩岩相学框架中的内容设计了全流程的图像特征综合提取算法。采用卷积神经网络识别颗粒类型;采用数字图像处理计算颗粒含量、粒径大小、形状和接触方式以及方解石和其他矿物的相对含量。 (3)以顺X井亮晶颗粒灰岩薄片样品为例,通过完整的图像识别过程,验证了各个特征点提取算法的有效性,并与人工鉴定报告进行对比。结果表明,本文提出的框架能够有效地表征亮晶颗粒灰岩中的有意义信息,提供的算法也能够有效地提取这类图像中的目标信息,且整个图像分析流程兼具规范性和灵活性。 (4)本研究提出的“岩相学分析框架”结合“图像分析算法”模式,可作为涵盖流程与技术的岩石薄片图像信息挖掘模型,推广至其他类型岩石薄片图像的智能识别研究,但必须根据具体的对象特征来重新设计岩相学框架和具体的算法。 (5)岩石的天然属性决定了不存在统一的岩相学分析框架适用于所有岩石类型,也不存在通用的深度学习或图像处理算法适用于所有岩石薄片图像。面向多层级多类别结构的岩石薄片图像,需要设计不同的岩相学分析框架和图像分析算法,来表征图像中有意义的地质信息,紧密融合岩矿专家与图像专家的经验,扩充多类别高质量岩石薄片图像数据集,采用更加符合人类思维方式的策略来训练模型等,这将是推动岩石薄片智能识别研究的有益尝试。 利益冲突声明/Conflict of Interests 所有作者声明不存在利益冲突。 All authors disclose no relevant conflict of interests. 作者贡献/Authors’Contributions 余晓露参与实验设计;杜崇娇、蒋宏完成实验操作;余晓露、李龙龙、卢龙飞参与论文写作和修改。所有作者均阅读并同意最终稿件的提交。 The study was designed by YU Xiaolu. The experimental operation was completed by DU Chongjiao and JIANG Hong. The manuscript was drafted and revised by LI Longlong and LU Longfei. All the authors have read the last version of paper and consented for submission.4.2 矿物组分特征提取
4.3 应用结果与人工鉴定对比
5 讨论
6 结论