基于卷积神经网络的12Cr1MoV 钢金相组织球化级别智能化分析

2024-04-17 06:14韩小稚王景人

中国特种设备安全 2024年3期

赵隆韩小稚王景人寇威

（陕西省特种设备检验检测研究院西安 710048）

目前，12Cr1MoV 钢被大量广泛地用于国内电站锅炉蒸汽管道、受热面等主要部件。随着12Cr1MoV钢长期在高温高压恶劣环境下使用，显微组织会逐渐出现球化现象，使材料的强度、硬度等主要抗疲劳力学性能指标下降，最终会导致胀管、爆管等威胁锅炉运行安全的危险事故。因此，对12Cr1MoV 钢显微组织球化现象的研究分析，是评判部件材料老化和使用期限的重要依据。传统的金相分析方法，主要依靠经验丰富的检验人员进行试样选取、试样制备、显微镜下观察组织特征，并与标准图谱进行对比分析评定。这种方法的优势在于检验人员可以根据自己的经验和知识进行细致的观察和分析。但是，传统方法也存在主观性误差大、费时费力、效率低等劣势。因此，国内外的研究机构和学者也纷纷利用人工智能技术，对金相组织智能分析进行研究。

国外Gola 等人[1]将支持向量机与基于像素和形态的参数相结合，对3 种不同钢材的微观组织进行分类识别，准确率达97%。国内张红旗[2]先用小波分析方法对12Cr1MoV 金相组织图像进行预处理，再用改进的自适应遗传算法与FCM（模糊C 均值）算法相结合完成金相图像的分割，并通过计算珠光体区域面积百分数、平均形状因子、平均离心率3 个特征参数作为评级参数实现珠光体球化评级。曹卓等人[3]采用卷积神经网络对材料特征矩阵的梯度进行分析，发现了梯度与材料性能间有一定关系，进一步验证了卷积神经网络具有较好的材料性能预测能力。张佳宁[4]采用改进的U-Net 卷积神经网络对金相图像中的晶粒度进行像素级分割，基于八邻域跟踪和扩散生长方法实现了晶界缺失区域的补全，最后基于Client-Server（客户端-服务器）架构开发了一套晶粒度自动评级系统。

然而，很多研究机构和学者主要针对钢材金相组织晶粒度的定量分析方向研究较多，但是对火力发电厂12Cr1MoV 钢金相组织球化级别分析方面研究甚少，也缺乏相关的分析软件。因此，本文针对上述难点问题，开展火电厂12Cr1MoV 钢金相组织球化级别智能分析研究，采用4 种不同的卷积神经网络模型对金相组织图像进行分类识别，并设计专用的分析软件。

1 创建数据集及预处理

1.1 创建金相图像的数据集

将收集的685 张12Cr1MoV 钢金相组织图像整理成数据集，与DL/T 773—2016《火电厂用12Cr1MoV钢球化评级标准》[5]的图谱进行对比分类，见表1。

表1 12Cr1MoV 钢金相组织图像类别

1.2 对数据集的预处理

因检验现场打磨和显微组织观察拍照等原因，金相图像的清晰度存在差异。首先用MATLAB 软件对数据集进行预处理，即RGB 图—灰度图—去噪（采用中值滤波）—尺寸归一化—数据增强（扩充数据集），从而获得1 370 张高质量的金相图像[6]。原始图像预处理结果如图1 所示。将1 370 张高质量的数据集划分，80%数据分为训练集，20%数据分为测试集。

图1 RGB 图预处理后的图像

2 采用迁移学习训练模型

2.1 卷积神经网络模型

卷积神经网络[7]是一种多层的监督学习神经网络，隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能的核心模块。该网络模型通过采用梯度下降法最小化损失函数对网络中的权重参数逐层反向调节，通过频繁的迭代训练提高网络的精度。因此，本实验选择以下4 种卷积神经网络模型对金相组织图像进行迁移学习训练：

1）VGG16[8]是由牛津大学的Visual Geometry Group 开发的深度卷积神经网络模型。它由16 层卷积层和全连接层组成，使用了小尺寸的3×3 卷积核和池化层，具有非常深的网络结构。VGG16 模型在图像分类任务中表现出色，其特点是简单而直观，具有高度可扩展性。

2）GoogleNet[9]是由Google 团队开发的深度卷积神经网络模型。它采用了Inception 模块，使用多个不同大小的卷积核进行特征提取，并通过1×1 卷积层降低计算量。GoogleNet 模型具有较低的参数量，能够在相对较少的参数下实现较高的准确度。

3）ResNet18[10]是由微软研究院提出的深度残差网络模型。它通过引入残差连接（Residual Connection）来解决深度神经网络中的梯度消失和梯度爆炸问题。ResNet18 模型具有18 层，包括卷积层、批量归一化层和全连接层。该模型在训练过程中能够更好地传递梯度，使更深的网络结构能够更容易地训练和优化。

4）Inception-v3[11]是Google 团队在Inception 系列中的第三个版本。它采用了更复杂的Inception 模块，包括多个并行的卷积和池化操作，以及通过1×1 卷积层进行降维和扩展。Inception-v3 模型在图像分类和目标检测等任务中表现出色，具有较高的准确度和较低的计算复杂度。

2.2 参数调优

1）采用小批量梯度下降法：每一次迭代中，使用一小部分的随机样本来计算梯度。梯度下降的目的就是求函数的极小值点。

2）L2正则化：通过向损失函数添加权重的L2范数惩罚项，可以控制模型的复杂度，减少过拟合的风险，提高模型的泛化能力。还可以防止模型中的权重过大，从而减少梯度爆炸问题。L2正则化公式见式(1)：

式中：

λ——正则化系数；

W——模型的权重参数。

L2范数也称为欧几里得范数，表示为，计算方式是将每个权重的平方相加再开平方。

3）动量法：因梯度下降法在收敛过程会产生震荡，动量不仅能解决收敛震动问题，还能加速优化收敛。具体在梯度下降法基础上引入一阶动量，见式(2)：

式中：

mt——当前一阶动量；

mt-1——上一步的一阶动量；

gt——当前梯度；

β1——超参数，经验值为0.9。β1越大，说明当前动量主要由以前累计的方向决定。β1越小，说明当前动量更多由前梯度决定。

2.3 训练模型

本实验采用MATLAB 作为深度学习开发框架，使用速石科技（fastone）超算平台的RTX 4090GPU 对训练过程进行加速处理。分别采用VGG16、GoogleNet、ResNet18、Inception-v3 模型进行训练。

随着训练次数及迭代次数增多，模型收敛速度加快，损失函数逐渐降低，准确率逐渐增高，VGG16模型可达到约90%，GoogleNet 模型可达到约84%，ResNet18 模型可达到约79%，Inception-v3 模型可达到约93%。因此，Inception-v3 模型为最优模型，见图2。

图2 采用Inception-v3 模型训练图

3 实验结果分析

3.1 对Inception-v3 模型的验证

泛化能力反映的是模型对未知数据的判断能力。为了验证模型的泛化能力的强弱，用测试集数据在训练后的Inception-v3 模型上进行准确率测试，并与训练集的训练数据做对比，见表2。

表2 Inception-v3 识别准确率比较

从表2 可以看出，训练后Inception-v3 模型在测试集数据上识别准确率达到89%，证明了模型的泛化能力较强，可以在实际金相分析中应用。

3.2 Inception-v3 模型的可解释性

金相图像通过卷积神经网络结构，卷积层负责提取特征，池化层负责减少特征图的尺寸和保留重要特征，全连接层负责将特征进行线性组合，最终得到分类输出。这些层的组合和堆叠构成了深度神经网络，能够学习复杂的特征表示并解决各种分类任务。

为了理解Inception-v3 模型如何识别金相组织图像，本实验使用Grad-CAM 算法，挑选4 张金相图像对Inception-v3 模型进行可解释性分析，并以热力图的形式展现该模型在分类图像时关注的区域，如图3 所示。

图3 金相图像的Grad-CAM 热力图

4 设计智能分析软件及应用

对Inception-v3 模型及其权重参数进行封装，用MATLAB 开发设计一套评定12Cr1MoV 钢金相组织球化级别的专用软件。

打开软件，点击“开始识别”，选择1 张金相图像，可自动分析金相类型、球化程度、球化级别、检测精度、检测时间等信息，见图4。点击“清空界面”，各个窗口数据清零。点击“退出系统”，软件自动关闭退出。该软件可以自动、准确和高效地评定12Cr1MoV 钢球化级别，为火电厂锅炉材料检验提供了更可靠的金相分析工具。

图4 软件主界面

5 结束语

本实验利用卷积神经网络模型进行金相组织分析研究，开发了12Cr1MoV 钢金相组织球化级别智能评定的专用软件，可实现自动、准确和高效的金相分析，推动了特种设备金属材料检验智能化的发展。