摘要:该文设计了一种基于格拉姆角和场的传感器信号转图方法,并提出了一种基于AlexNet的卷积神经网络模块化结构搜索方法(block-GS)。实验结果表明,block-GS方法能够搜索到性能优秀的网络结构,在两个气体数据集上的分类准确率分别达到92.11%和93.33%,比普通网格搜索提高了近5%。此方法有望成为电子鼻模式识别算法设计的有效解决途径之一。
关键词:电子鼻;格拉姆角和场;卷积神经网络;网格搜索;气体分类算法
doi:10.3969/J.ISSN.1672-7274.2024.10.003
中图分类号:TP 183 文献标志码:A 文章编码:1672-7274(2024)10-000-03
Efficient Electronic Nose Based on Convolutional Neural Network Modular Search Multi Gas Classification Algorithm
Abstract: This paper designs a sensor signal mapping method based on Gram angle and field, and proposes a convolutional neural network modular structure search method (block GS) based on AlexNet. The experimental results show that the block GS method can search for high-performance network structures, with classification accuracies of 92.11% and 93.33% on two gas datasets, respectively, which is nearly 5% higher than ordinary grid search. This method is expected to become one of the effective solutions for the design of electronic nose pattern recognition algorithms.
Keywords: electronic nose; graham point and field; convolutional neural network; grid search; gas classification algorithm
0 引言
电子鼻作为一种气体传感的无损检测方法,在工业、农业和医学等诸多领域有着广泛的应用[1],其气体传感的效果与其使用的模式识别算法息息相关。深度学习以其强大的识别效果在电子鼻中展现出巨大应用潜力,但深度学习模型网络结构复杂且参数量大,结构设计十分复杂。网格搜索(Grid Search,GS)是一种常用的参数组合优化方法,在深度网络的结构优化中得到了广泛应用[2]。但其多是对网络结构中的超参数进行优化,不涉及网络的骨架设计,优化效果受到较大限制。
本文设计了一种基于分块的block-GS,将网格化的思想扩展到CNN的骨架设计,大大提高了算法的性能。
1 数据处理与转换方法
1.1 数据集
(1)Gas sensor array exposed to turbulent gas mixtures[3]。测试气体共有5种:乙烯、一氧化碳、甲烷及它们的两两混合物。
(2)Gas sensor arrays in open sampling settings[4]。测试气体共有10种:丙酮、乙醛、氨气、丁醇、乙烯、甲烷、甲醇、一氧化碳、苯和甲苯。本研究中选取了较为完整的8组数据。
1.2 数据处理方法
为了将CNN在图像处理上的优势迁移到电子鼻气体传感应用中,本文引入了格拉姆角和场(Gramian Angular Summation Field,GASF)作为数据二维图片化的方法[5],并将其在单通道一维数据上的处理扩展到多通道气体传感数据上。
基于电子鼻的数据测试包含多个通道的响应,而基于GASF的数据转换在原理上是针对单通道数据的分析方法,因此首先对传感数据进行了如图1的拼接。气体传感器的响应段数据包含了较多气体特征,而恢复段数据则与恢复气体流量等有更紧密的关系,因此选择传感器的响应阶段数据作为特征数据段。
对于拼接后序列通过式(1)进行归一化。
通过式(2)将归一化后的数据转换为极坐标表示,用响应值的大小表示极坐标的角度,把对应的时间戳作为极坐标半径。
式中,φ是由归一化数据计算出的角度值;ti是时间戳的大小;N是整个时间序列的长度。利用式(3)的计算规则对极坐标转换后的数据进行编码并映射为图像。
GASF可以保留传感器响应值大小与时间的相关性,同时通过将多个传感器的信号编码成一张二维图片,卷积时可以同时提取多个不同通道,实现传感器相互关系的特征捕捉[6]。如图2所示。
2 基于block的CNN网格搜索方法
2.1 经典网络层级分析
研究中对LeNet-5[7]、AlexNet[8]和VGG16[9]三种经典CNN进行了对比和测试。表1是三种网络结构的参数对比。
将两个数据集在三种经典CNN上进行了测试并对实验结果进行了分析,图片的输入尺寸设置为128´128´1。在训练过程中将数据集随机打乱并按7∶3的比例划分为训练集和测试集,测试集不参与模型训练过程。实验结果如表2所示。
不同结构的CNN在相同分类任务上表现差异巨大,LeNet-5的模型结构简单,无法充分拟合数据集,分类效果较差。VGG16和AlexNet分类效果相近,但前者参数量大,可能导致资源浪费和部署困难。
2.2 网格搜索方法
网格搜索(GS)在神经网络参数优化中应用广泛,具有简单易懂、易于实现和在一定范围内可以保证找到全局最优解的优势。但目前常见的GS方法多是基于一个确定的网络结构对其中的超参数进行搜索和优化,对于网络框架结构的设计涉及较少。
2.3 基于block和AlexNet的搜索方法设计
(1)分块。卷积操作可以捕获图像中的特征,然后通过池化操作降低特征图的维度,提取并保留重要的信息,同时降低计算复杂度,从而建立有效的特征提取和信息处理流程,使得网络能够更好地理解和处理输入数据。据此,对AlexNet中的层级结构做了如图3的划分。
(2)架构。在网格搜索的过程中,将block的数量作为可搜索的参数组合加入后,可以实现对网络整体框架的设计,为了降低搜索时间,相同block的最大数量限定为两个,通过这种设计方法可获取的框架类型如图4所示。
3 实验验证与分析
实验所使用的参数设置如表3所示。
本轮实验在单个数据集上基于图4所示的14种网络框架对1134个参数组合进行了搜索和效果测试,结果如表4所示。数据集1上的最优分类准确率达到92.11%,在3个block和4个block堆叠情况下均可达到。数据集2的最优分类结果出现在4个block堆叠的架构下,准确率达到93.33%。
表5所示为两种方法在最优网络分类准确率上的对比,block-GS方法可以寻找到准确率更高的网络结构,说明优化后的算法可以探索到具有更优解的搜索空间,具有一定的优越性。同时,由于模块化的搜索方法包含了对网络框架结构的设计,因此在一定程度上规避了需要先提出网络骨架,在优化参数的传统过程中对网络设计经验的要求,具有更强的可实施性。
4 结束语
本文使用了一种基于GASF的气体传感数据二维化方法,并提出了一种基于block的网格搜索方法(block-GS)用于CNN结构设计,有效提高了电子鼻的分类准确率。block-GS在测试数据集上搜索到的最优网络的分类准确率分别达到92.11%和93.33%,比AlexNet高出9.65%和4.79%,比模块化前的最佳模型准确率提升了近5%。本文为电子鼻多气体识别的CNN设计提供了一种新方法,以其更好的搜索效果和对操作者专业知识更低的使用要求展现出广阔的应用前景。
参考文献
[1] 李晶晶,胡颖菲,丁晓,等.近五年电子鼻技术在食品安全的应用进展[J].中国食品卫生杂志,2023,35(5):789-794.
[2] 陈祎,蒲彬,张晓丽,等.基于网格搜索的被动单站旋转定位算法[J].制导与引信,2023,44(2):1-5,19.
[3] FONOLLOSA J, RODRÍGUEZ-LUJÁN I, TRINCAVELLI M, et al. Data set from chemical sensor array exposed to turbulent gas mixtures[J]. Data in brief, 2015(3): 216–220.https://www.sciencedirect.com/science/article/pii/S2352340915000335
[4] FONOLLOSA J, RODRÍGUEZ-LUJÁN I, TRINCAVELLI M, et al. Dataset from chemical gas sensor array in turbulent wind tunnel[J]. Data in Brief, 2015(3): 169–174.https://www.sciencedirect.com/science/article/pii/S2352340915000256
[5] 张淑清,杜灵韵,王册浩,等.基于格拉姆角场与改进CNN-ResNet的风电功率预测方法[J].电网技术,2023,47(4):1540-1548.
[6] 邹倩倩,杨瑞峰,郭晨霞.一种基于二维卷积神经网络的舵机故障检测方法[J].航天控制,2022,40(6):80-85.
[7] 刘林密,崔伟成,李浩然,等.基于卷积神经网络的滚动轴承故障诊断方法[J].计算机测量与控制,2023,31(9):9-15.
[8] 林伟,仲伟波,袁毓,等.基于改进AlexNet与CUDA的大豆快速三分类方法[J].计算机与数字工程,2023,51(12):2997-3003.
[9] 胡骏,陆兴华,林柽莼,等.改进的VGG16在水稻稻瘟病图像识别中的应用[J].计算机应用,2023,43(S2):196-200.