基于计算机视觉的油气管道失效识别技术

2023-06-29 14:13:17周权宫彦双吴超安超刘杰
四川建筑 2023年1期
关键词:残差油气准确率

周权 宫彦双 吴超 安超 刘杰

目前,传统的油气管道失效识别技术依然采用人工检测分析的方法为主,耗时较长且智能化程度低。提出了一种基于残差网络与迁移学习的管道失效图像识别算法,通过深度卷积网络建立了管道失效识别模型,然后利用大型ImageNet 数据集中训练好的Resnet152模型参数,在包含1万余张的管道失效图像数据集上进行微调与模型优化,最终实现对细菌腐蚀、土壤腐蚀、环境敏感开裂等15种失效类型的准确识别。实验结果表明,算法的准确率达到95%以上,并具有较强的泛化能力,能够实现对油气管道失效类型的快速准确识别。所提算法可以为油气管道失效的统计与分析提供简单快捷的方法,提高信息化管理水平。

油气管道失效; 图像识别; 残差网络; 迁移学习

TP391.413 A

[定稿日期]2021-12-27

[基金项目]四川省科技计划项目(项目编号:2020YFG0303、2020YFH0111);成都市科技项目(项目编号:2019-YF05-02657-SN)

[作者简介]周权(1999—),男,在读硕士,研究方向为机器学习、计算机视觉。

1 油氣管道失效识别

随着天然气及石油工业快速发展,我国的油气管道运输建设已相对完整,在2020年期间,新建成油气管道里程高达5 081 km,管道总里程累计达到14.4万km[1]。相比于油气管道的飞速建设,管道的日常维护却相对薄弱,相关部门对其投入的人力物力不足。管道的管理和检测体系不完善,给管道的安全运行造成一定的威胁。

目前,我国每年新增被石油污染的土壤约为10万t,部分重油田污染区的土壤原油含量远远超过国家标准临界值。另外,水资源石油污染现状也不容乐观,如2006年发生的长达一个多月的渤海石油污染事件和2009年陕西发生的地下输油管道泄漏事件等,给我国海洋环境和地下水资源造成了严重污染[2]。

开展油气管道失效的识别与统计,可以明确不同类型风险权重,对提高风险概率计算精度和提高风险评价工作科学性具有重要作用,有助于采取有针对性的维修维护方法,进而提升管理对象本质安全,防范失效泄漏的发生。由于油气田管线的失效问题涉及材料本身、服役环境、工艺流程等多个方面,给失效识别工作带来较大的困难。目前,管道一线巡检人员在缺乏专业知识的情况下,难以在现场对失效类型进行准确判断,失效类型往往不能被有效识别。专业实验室识别在时间和费用上较高,不适用于油气田管道失效多发的现状。因此急需建立一种能够为现场工作人员所掌握的,较为便捷的失效类型识别方法,低成本快速有效识别一些失效类型。

随着人工智能的快速发展,计算机视觉技术已经广泛应用于日常生活的各个领域,出现了一系列高效准确的图像识别算法,如基于卷积神经网络的水稻病害图像识别、垃圾图像分类、手写数字识别等[3-4]。因此,本文提出了一种基于深度学习的油气管道失效类型识别算法,使用残差结构搭建了图像分类神经网络,并采用迁移学习的方法,对油气管道图像数据集进行识别和分类。最终的模型能够实现对油气管道典型失效类型的快速准确识别,有助于完善油气管道腐蚀管理检测系统,提高信息化管理水平,为油气管道工程管理提供简单快捷的方法和科学的指导意见。

2 生成数据集

根据所采集到的数据,制作了相应的腐蚀分类图表,一共分了15个类型,如表1所示。

由于原始采集到的数据集较小,约为1 000张图片,远远不够实验要求,所以先对数据集进行增强处理以得到更多的数据,处理方法有放大缩小、旋转、改变明亮度、平移、添加噪声等。部分图片处理后的效果如图1所示,各类型的原始数据量与增强后的数据量如表2所示。

增强后一共得到了约10 000张图片,共15个类型,每个类型约700张,最后按照7∶2∶1的比例划分训练集、验证集和测试集,训练集数量约为7 000张,验证集约为2 000张,测试集约为1 000张,满足后续模型训练要求。

3 算法设计

3.1 迁移学习

对比传统机器学习,迁移学习在微调之前,模型的初始性能更高;在训练过程中,模型提升的速率更快;在训练结束后,得到的模型收敛效果更好,解决了小数据样本在训练时容易出现的过拟合问题,提高了小数据样本分类问题的准确性和效率性。

本实验将先冻结前面卷积层参数,只训练最后新建立的全连接层,保存下该次训练的最优模型;然后在前面保存的最优模型基础上,解冻前面的所有的卷积层,进行第二次全局训练。

3.2 Resnet152

传统的卷积神经网络当堆叠到一定网络深度时,会出现梯度爆炸和退化问题。2015年提出的Resnet网络解决了以上问题,它提出残差结构,建立了输入与输出之间的有效连接,使神经网络在深度拓宽的同时还能保持其特征表达的能力,成功解决了退化问题,可以搭建超深的网络结构,超过了1 000层[5]。残差块的基本结构如图2所示。

Resnet中提出了2种映射:

(1)恒等映射(Identity Mapping),指的是图2中数字2所标示的部分。

(2)残差映射(Residual Mapping),指的是图2中减去恒等映射剩下的部分。

残差块的最后的输出如式(1)所示。

y=F(x)+x(1)

其中残差指的就是F(x)部分。

在图2的残差块中有2层结构,第一层结构的表达式如式(2)所示。

F=W2σ(W1x)(2)

其中σ代表非线性激活函数ReLU函数。

然后通过一个恒等映射和第二个ReLU函数,得到输出y ,第二层表达式如式(3)所示。

y=F(x,{Wi})+x(3)

Resnet152的网络结构多达152层,可以更加充分提取提取图像特征,其网络结构如图3所示。从第 1 组卷积块起到第 5 组均为残差模块,将大小为 224×224 的图像数据输送后,经残差网络提取特征进行学习训练。经过训练后,将图像输入平均池化层取平均,最终由全连接层的 LogSoftmax 函数进行图像类别的划分。

4 实验流程

运行环境为Windows10 64bit系统,CPU为AMD Ryzen 9 5900HX,GPU为NVIDIA Geforce RTX 3070。实验基于Facebook开源的Pytorch框架运行,采用Python3语言编写。

具体流程:

(1)数据预处理:加载训练集和验证集,通过torch中的transforms函数,对每个epoch数据图像进行处理。

(2)模型初始化:加载在ImageNet上预训练的Resnet152模型参数,冻住前面所有的卷積层参数。

(3)修改全连接层:重新定义最后的全连接层参数,将其改为15分类问题,采用LogSoftmax。

(4)设置优化器和损失函数:采用NLLLoss损失函数和Adam优化器,学习率为 0.000 1。

(5)全连接层训练:总共训练25个epoch,画出模型的性能曲线,保存验证集准确率最高的模型。

(6)全局训练:先加载(5)中保存的模型,解冻前面的卷积层,使所有参数可以参与训练,学习率为0.000 1,训练30个epoch,最后保存验证集准确率最高的那次模型作为最优实验模型。

(7)模型测试:加载测试集数据与最优模型,对测试集进行验证。

5 实验结果与分析

对2次训练和一次测试过程进行性能分析,以迭代过程中损失函数值和预测精度为性能评估标准,分析模型的收敛性能及预测准确率。

5.1 全连接层训练

图4为模型准确率曲线,图5为模型的损失函数曲线。从图4可以看出,随着迭代次数的增加,准确率一直处于上升状态。当迭代次数到达第20次时,验证集准确率超过95%,训练集准确率接近90%,曲线趋于稳定,基本达到收敛状态。

从图5可以看出,训练过程中,训练集和验证集的损失函数值一直呈平稳下降趋势,并没有出现过拟合情况。

实验结果可知,全连接层训练的验证集最高准确率出现在第23个epoch时,其数值为0.964 3,保存下该次训练的模型。

5.2 全局训练

加载全连接层训练保存的模型,解冻前面的卷积层,训练所有网络参数,图6、图7分别为训练过程中模型准确率曲线与损失函数值曲线。

从图6可知,模型的准确率在小范围内发生波动,总体呈上升趋势,epoch为29时,准确率达到98%。从图7可知,训练集和验证集的损失函数值整体处于下降状态,并未出现过拟合现象。

全局训练的验证集最高准确率出现在第29个epoch时,其数值为0.980 3,保存下该模型,作为训练的最优模型。

5.3 模型测试

测试集数量为1 000张左右,加载前面训练保存的最优模型,在测试集上进行实验。图8是部分图片预测结果,图9是所有图片预测结果的混淆矩阵。

从图8的预测结果和图9的混淆矩阵可以看出,模型识别的准确率较高。从混淆矩阵可以看到,1 000余张测试图片,仅有35张图片预测错误,预测准确率达到了95%以上。

6 结论

本文将深度学习应用于油气管道失效类型的识别中,建立了一种基于迁移学习和残差网络的管道失效分类模型。实验结果表明,Resnet152模型能够做到在较少的Epoch次数中获得高准确度。实验过程包括两次训练,在第一次全连接层训练中,仅经过20次Epoch,其识别准确率能达到95%;在第二次全局训练中,经过30次Epoch,模型达到98%的准确率,并且最后的测试集准确率达到了95%以上。因此,该模型具有泛化能力较强、准确率较高、鲁棒性较好等特点,可以为油气管道失效类型的识别提供科学参考意见,提高信息化管理水平,有利于减少因管道失效泄露导致的环境污染。

参考文献

[1] 关鹏.论我国石油管道建设的特点和发展趋势[J].中国石油和化工标准与质量,2019,39(18):103-104.

[2] 郭峰.石油污染治理技术综述[J].化工管理,2021(19):51-53.

[3] 邱靖,刘继荣,曹志勇,等.基于卷积神经网络的水稻病害图像识别研究[J].云南农业大学学报(自然科学),2019,34(5):884-888.

[4] 李优,穆林平.基于迁移学习的垃圾图像分类模型研究[J].电脑与信息技术,2021,29(4):17-21.

[5] 郭玥秀,杨伟,刘琦,等.残差网络研究综述[J].计算机应用研究,2020,37(5):1292-1297.

猜你喜欢
残差油气准确率
基于双向GRU与残差拟合的车辆跟驰建模
平凉,油气双破2万吨
“峰中”提前 油气转舵
《非常规油气》第二届青年编委征集通知
非常规油气(2021年2期)2021-05-24 03:23:36
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
高速公路车牌识别标识站准确率验证法