改进的深度残差网络的混合气体定量分析方法*

2021-03-17 07:15詹灿坚何家峰骆德汉
网络安全与数据管理 2021年3期
关键词:混合气体电子鼻嗅觉

詹灿坚,何家峰,骆德汉

(广东工业大学 信息工程学院,广东 广州 510000)

0 引言

随着国民经济的快速发展、人民物质生活水平的不断提高,人们对室内居住环境的舒适化、高档化和智能化提出了更高的要求,由此直接带动了装修装饰热和室内设施现代化的热潮兴起。但是由于质量参差不齐的住宅建筑材料、装饰家具材料所释放的甲醛、甲苯、氨气等有害化学气体,使得室内空气质量不断恶化,严重者会对居住者的健康带来一定程度的损害;空调设备的广泛使用,使得室内通风率明显降低,导致住宅内空气污染程度不断累积[1]。

目前监测环境污染气体的方法和设备,包括有气相色谱法、非分散红外法和纳氏试剂比色法等,局限于对单一或某几种污染气体监测,单一设备成本较高,且无法实时实地来进行检测,这些监测方法的通用性较差。

而仿生嗅觉系统的采集装置的传感器阵列一般由多个或多组金属氧化物半导体(Metal-Oxide Semiconductor,MOS)传感器组成[2],该传感器通过这些MOS 传感器将混合气体信息转化为电信号。MOS 气体传感器中的气体敏感材料对于不同的气体具有不同的灵敏度,具有交叉灵敏度的特性,因此,仿生嗅觉系统通常需要与适当的模式识别方法一起互相结合运用,用以帮助分析识别室内环境下混合气体中的各气体成分相关信息。

在实际的运用过程中,仿生嗅觉系统会遇到许多噪声问题,很容易受到环境干扰因素的影响,例如环境温度、湿度和气压等影响。另外,电子鼻的阵列式传感器对目标气体有响应的同时,也会对一些未知气体产生响应。 这些干扰都会影响到仿生嗅觉系统中识别模型的准确性和稳定性。

本文将重点提出一种改进的深度残差网络的气体定量分析方法,主要结合了深度残差网络[2]和数字信号处理中的降噪分析算法的优点,利用深度残差网络有效解决深度学习中可能出现的梯度消失和梯度爆炸等问题,增加模型的鲁棒性,使用软阈值化来作为非线性层,从而大大降低未知气味对识别效果的不良影响,提高对不同目标气体识别的预测准确率。

1 仿生嗅觉系统组成

仿生嗅觉系统是指一种能够模拟人和其他哺乳动物的各种嗅觉系统结构和功能来实现对气体的预测或者定量分析的系统,被称之为人工嗅觉系统[3]。 仿生嗅觉系统一般由 MOS 传感器阵列、气味信号采集和模式识别方法组成,它可以在几小时、几天甚至数月的时间内连续地、实时地监测特定位置的气体信息。 仿生嗅觉工作原理如图1 所示。

图1 仿生嗅觉工作原理图

在仿生嗅觉系统中的模式识别方法主要由气味信号处理以及信号分析与识别两个步骤组成。 当今,在仿生嗅觉中常用一些基于线性的机器学习算法,如主成分分析法(Principal Component Analysis,PCA)[4]和线性判别分析(Latent Dirichlet Allocation,LDA)[5]等。 而上述机器学习算法在只有单一气体的场景下分类识别的效果较好,并且室内气体环境比较复杂,不只是单单存在一类气体,电子鼻的传感器阵列对混合气体的响应信号是非线性的,所以大多数情况下,难以通过基于 PCA 算法和 LDA 算法[5]的线性特征提取方法来准确提取混合气体信号中的非线性特征,会出现室内混合气体识别准确较低的情况。

在气体定量分析的步骤中,一般是采用传统的模式识别算法BP 神经网络[6]或者支持向量机(Support Vector Machine,SVM)[7]来进行气体定量分析。 BP 算法能够拟合气味模型中的非线性映射,但是收敛速度过慢,容易陷入局部最小值。 而通过SVM 可以处理小样本问题,但核函数的选取和参数的设置是影响气体识别结果的重要因素[8]。 因此,在仿生嗅觉系统中模式识别方法的选择会对系统的性能产生很大的影响。

而上述的文献大多数没有考虑到未知气体和噪声对实验结果的干扰的情况,于是本文在电子鼻数据采集阶段引入不同程度的干扰气体,根据实际情况分为不同的污染等级,再加上软阈值化降噪算法,能够充分地降低噪声以及冗余信息对准确率带来的影响,以便进行室内有害气体成分的定量分析,实现室内环境中有害气体组成成分的高准确度定量分析。

2 深度残差网络

深度学习中,卷积神经网络已被广泛应用于各种图像处理等问题[9]。 卷积神经网络(Convolutional Neural Network,CNN)用于图像分类、图像识别、目标跟踪问题,显示出较高的效率。在卷积层中,前一层的特征图成为可学习的内核并使用激活功能生成输出要素图。 每个输出特征图可以将卷积与多个输入特征图结合在一起[10]。 它通常如式(1)所示。

式中:i 为网络的第 i 个卷积核,g(i)为第 i 个卷积核提取所得到的特征图;a 为输入数据;β 为卷积核的偏置;x、y、z 为数据的维度,在处理一维时域信号时,对其中两个维度进行简化即可。

根据神经网络的数学本质,随着网络层数的增加,神经网络的效果应当越来越好,也即是损失函数会是逐渐下降的光滑曲线。 然而,在实际的操作中却不符合这个规律。

由于传统的CNN 自然地整合了由低到高不同层的特征,可以通过加深网络层次来到达丰富特征提取的目的。在构建卷积网络时,网络的深度越深,可抽取的特征层次就越加多。 所以一般会使用更深层次的网络结构,以便得到更佳的深层的特征图。不过,在使用高层次的深度网络的时候梯度消失、梯度爆炸问题和网络退化的问题会随之出现。

2015 年由何恺明提出的一种看似简单但是极为有效的网络结构被命名为残差网络(Residual Network,ResNet),在传统的前向传播基础上,深度残差网络增加了跃层连接(Skip Connection)。 实践表明,深度残差网路可以有效地改善“深度”网络的性能。 具体如下:

假如浅层的输出是x,经过深层后,输出为H(x),通常来说其他网络模型的做法是训练拟合H(x),但是在 ResNet 中,它把 H(x)看作两部分,即 H(x)=x+F(x),然后再训练拟合这两部分。

假如 x 已是最优,那么 F(x)在训练过程中将被push 趋近于0,即使继续加深网络,网络也一直处于最优状态而不输于浅层网络。

F(x)=H(x)-x 被称为残差映射(residual mapping),而x 则被称为恒等映射(identity mapping)。 这里的 F(x)是对应的残差,因而叫残差网络。

2.1 残差网络

残差单元可以通过跨层恒等连接的形式实现[11],如图2 所示。 即,将单元输入直接添加到单元输出并激活。 因此,使用基本的自动微分深度学习方案可以轻松实现剩余网络框架,并且可以使用BP 算法直接更新参数。 而深度残差网络就是多个基本残差单元堆积而成,形成一个新的较深的神经网络。

图2 残差网络的基本单元

在计算完成整个数据卷积之后,需要继续使用非线性激活函数将结果进行输出,CNN 中常用的激活函数一般为修正线性单元(Rectified Linear Unit,ReLU),其公式为:

2.2 信号处理中的软阈值化

在很多的信号降噪算法中都应用到了软阈值化这一关键步骤[12]。 信号通常被转换到一个域,软阈值化可以直接将接近于零的特征归零。小波阈值化通常包括三个步骤:小波分解、软阈值化和小波重构。 为了保证信号降噪的效果,小波阈值化的关键任务是设计滤波器。 滤波器能够将有用的信息转换成比较大的特征,将噪声相关的信息转换成接近于零的特征。 然而,设计这样的滤波器需要大量的信号处理方面的专业知识,这样是非常困难的。

深度学习提供了一种解决这个问题的新思路。这些滤波器可以通过反向传播算法自动优化得到,而不是由专家进行设计。 因此,软阈值化和深度学习的结合是一种有效地消除噪声信息和构建高判别性特征的方式。

软阈值化将接近于零的特征直接置为零,而不是像ReLU 将负的特征置为零,所以负的、有用的特征能够被保留下来,将绝对值大于这个阈值的特征朝着零的方向进行收缩,它可以通过式(3)来实现。

3 室内有害气体定量分析方法

本文基于深度残差网络的时序电子鼻气味信号定量分析模型[8],针对电子鼻采集的混合气味数据的特征以及残差网络的网络结构,提出一种改进的深度残差网络,本算法模型框图如图3 所示。 该模型与传统的残差模型相比,是通过加入软阈值化作为非线性层对未知的一些噪声干扰进行降噪[13],适用于电子鼻的室内混合气体数据维度大、噪声多的数据特性,也同时结合了深度学习与信号降噪算法的优点,提高了识别的准确性。

图3 残差网络的基本单元

4 实验结果

4.1 混合气体数据采集

本文通过电子鼻采集实验共收集了1 040 个数据样本。 根据室内空气质量标准(GB/T18883-2002),将数据样本分为三部分种污染程度、干扰程度不同的数据。 在开始实验前, 应打开室内空调和加湿器,使温度控制在25±1 ℃以内,湿度在 75±1%以内。 首先通过动态气体混合仪用标准气体配制实验所需的气体样品, 将配制好的气体样品送入气体测试箱,然后通过电子鼻采集气味数据。最后,将气体试验箱内残留的试验气体通过尾气处理装置进行无害化处理。其中320 份含甲醛的数据样本浓度 从 0.01 mg/m3到 0.08 mg/m3(无 0.08 mg/m3)的 种气体为合格 (正常),320 个甲醛浓度为 0.08 mg/m3至0.16 mg/m3的数据样本分类为轻度污染 (轻度),有400 个数据样本包含甲醛浓度大于 0.16 mg/m3的列为严重污染(严重)。

4.2 室内有害气体定量实验

电子鼻采集室内有害气体数据样本通过不同干扰程度分为正常、轻度和严重三个组别,通过基于深度残差网络对含有甲醛气体的室内有害气体样本进行定量分析。 为了探索分析基于深度残差网络的混合气体定量分析的效果,本文使用4.1 小节PEN3 电子鼻收集的室内混合气体数据集,分别运用PCA+LDA 算 法[14]、SVM 算 法[15]、CNN 算 法 以 及 改 进的深度残差算法进行不同干扰程度甲醛气体成分识别实验,实验结果如表 1 和表2 所示。

表1 不同算法对不同干扰程度的甲醛浓度识别率的比较(%)

表2 不同算法对混合气体中甲醛浓度识别的结果比较

通过实验结果,可见本文所提出的室内有害气体成分识别算法对混合气体中轻度干扰和重度干扰气体具有更高的识别率,均方误差也更小。 但模型训练比其他三种算法要花费更多时间。

5 结论

本文提出一种改进的基于深度学习与信号处理中降噪算法相结合的室内有害气体定量分析算法,利用深度残差网络和软阈值化的优点,在有外界干扰气体的场景下,对室内有害混合气体仍具有较高的识别率。 该算法的研究对仿生嗅觉系统在不同程度干扰的场景下进行定量分析以及后续浓度估计问题的解决具有重要意义。

猜你喜欢
混合气体电子鼻嗅觉
基于电子鼻的肺癌无创检测研究
超强嗅觉
电子鼻咽喉镜在腔镜甲状腺手术前的应用
NO、O2及NO2混合气体考点归纳
香辛料识别中电子鼻采集及算法研究
中考化学习题解析
飞到火星去“闻味儿”——神奇的电子鼻
让你的嗅觉降降温吧!
混合气体在聚合物注射成型保压阶段中扩散的分子动力学模拟
NO2、NO和O混合气体计算分类举例