张志刚,陈红岩,曲 健
(1.浙江农业商贸职业学院汽车技术系,浙江 绍兴 312088;2.中国计量大学机电工程学院,杭州 310018)
多组分汽车尾气定量检测系统*
张志刚1,陈红岩2*,曲 健2
(1.浙江农业商贸职业学院汽车技术系,浙江 绍兴 312088;2.中国计量大学机电工程学院,杭州 310018)
针对混合气体浓度检测中,气体间交叉吸收干扰及红外光谱数据计算量过大等问题,提出了一种基于网格搜索的支持向量机方法,建立多组分混合气体定量分析模型。运用网格搜索法对支持向量机建模中的参数进行优化选择,并与遗传算法优化的BP网络建模效果作对比。实验表明:SVM建模所用时间为39.824 s,BP神经网络约为2 682 s;SVM建模预测结果均方差明显低于BP网络。SVM建模时间约为BP网络的1/60,收敛速度更快,且预测精度更高。
气体检测;定量分析;支持向量机;BP神经网络;交叉干扰
目前,气体的定量分析技术已广泛应用于食品安全、环境监测、生产安全等多个领域[1]。在进行多组分气体同时测量时,待测气体的吸收谱线存在严重的交叉重叠现象,如果不加以回归分析修正,将严重影响测量的灵敏度和精度[2],需要后续的数据处理。
现代气体检测技术有人工神经网络ANN(Artificial Neural Network)方法和支持向量机SVM(Support Vector Machine)方法等。其中,耿志广[3]等将神经网络与气体传感器阵列技术相结合,克服了传感器阵列在混合气体检测中的交叉敏感现象;黄小燕[4[5]等利用粒子群优化算法对支持向量机进行参数优化,用于混合气体定量分析,进一步提高了预测精度;李玉军[6]等人将粒子群优化与最小支持二乘向量机相结合,并与遍历优化算法相比较,寻优时间节省40倍以上,预测结果误差水平相当。
本文以不分光红外法[7](NDIR)气体浓度传感器为研究对象,对多组分混合气体进行建模仿真分析。
SVM回归校正模型,就是利用SVM核函数,将红外光谱输入数据利用线性映射函数Φ,映射到高维空间;在高维空间进行回归分析,建立红外光谱数据与待测气体浓度的回归校正模型,其回归函数f(xi)可表示为:
f(xi)=ω·φ(xi)+b
(1)
式中:ω·φ(xi)为向量ω与φ(xi)的内积;ω为回归系数,b为阀值。
引入Lagrange函数,得到的SVM回归校正模型的回归函数为:
(2)
高斯函数能较好的模拟光谱信号,因此选用RBF核函数。其基本形式如下:
K(xi,xj)=exp(-g‖xi-xj‖2),g>0
(3)
式中:参数g为gamma参数函数设置(若k为属性的数目,则g默认为1/k)。
SVM的回归模型的建立需要进行参数的优选,主要选择核参数c和g。传统的网格搜索法[8]的基本原理是:让c和g在一定的范围划分网格并遍历网格内所有点进行取值,最终取使验证分类准确率最高的那组c和g作为最佳的参数。改进的网格搜索法,首先,在较大范围内采用大步距进行粗搜,在寻得了局部最优参数之后,再在这组参数附近选择一个小区间,采用小步距进行二次精搜,找到最终的最优参数,在保证准确率的前提下,缩短了寻优时间。具体的寻优过程如图1所示。
图1 改进网格搜索寻优流程图
遗传算法[9]是模拟自然界生物进化论和遗传机制而成的一种并行随机搜索方法。遗传算法优化BP神经网络流程如图2所示。
图2 遗传算法优化BP神经网络算法流程图
4.1 实验装置与条件
测试系统利用不分光红外法原理,经过MCU调制的红外光源通过一定长度的气室内,气室中充有待测浓度的气体。由于气体对红外线波段中特征波长红外线能量的吸收,特定波长的光源通过气体后,在相应谱线处会发生光强的衰减,红外线的能量将减少,探测器检测剩余的光强度并转化为电信号,经朗伯-比尔定律计算后,得到系统检测的气体浓度值,但受到电压波动、气体脉冲、气体间交叉干扰以及环境因素等影响,此时的浓度值并不准确,需要后续的模型仿真分析。
本实验搭建的实验装置的原理如图3所示。
图3 NDIR测试系统原理图
图3中,检测系统的核心部件—传感器,包括进气口、出气口、红外光源、气室、探测器和信号处理电路等部分。
整个传感器由MCU、光源、气室、探测器、信号处理电路和LCD显示屏组成。其中检测的核心部件红外光源和探测器的优劣,影响整个系统的检测精度。红外光源要求辐射的光谱成分稳定、辐射能量集中在待分析组分特征吸收波段范围内且红外线应平行于气室的中心轴。红外光源采用HawkEye公司生产的为快速电调制提供完美解决方案的IR55红外光源,输出光谱范围为中红外区2μm~20μm,而所需测量的CO、CO2、HC化合物的吸收光谱峰值主要在中红外区3μm~5μm区域,所以IR55完全满足红外吸收法对混合气体的测量要求,可以保证在3μm~5μm区域有足够的光能量输出。光源驱动电路由两级放大电路组成,通过MCU产生的脉冲信号对红外光源进行调制。探测器选用PerkinElmer公司生产的TPS4339热电堆探测器,是基于热电偶测温原理,用于红外光探测的2×2矩阵规则排列的4通道探测器,分别为CO检测通道、CO2检测通道、HC化合物检测通道和参考通道。由许多热电偶串联而成,提高了探测器对红外辐射产生温度变化的响应度;各个输出的热电势叠加,因此热电堆探测器所产生的热电势远远大于普通的热电偶探测器;在探测节点处增加了光接收面的面积,可更加有效的吸收红外光;4个热电堆探测器分别拥有独立的密封了不同红外滤光片的透射窗口,相互之间没有信号干扰,最多可同时测量4种气体。这些特点使得探测器应用于气体检测的信号处理能力明显提高,分辨率和灵敏度显著增强,满足气体检测的需要。信号调理电路包括输入滤波电路、放大电路、稳压电路和输出滤波电路。
4.2 网格搜索法优化SVM及建模分析
为提高检测精度,对不同气体进行独立建模。以CO气体为例,选择其中的15组样本为训练集,建立SVM模型并查看模型在训练集上的回归效果;选择剩余的5组样本为测试集,用建立好的模型对测试集进行回归预测,并验证SVM模型的预测精度和水平(详情见表1)。模型的建立需要对惩罚参数c(选取范围0~100)和RBF核参数g(选取范围0~1 000)进行合理的优化选择,本文采用改进的网格搜索法进行参数寻优,根据寻优流程图1,具体的步骤为:
(1)设定初始网格搜索的(c,g)范围和步距。本实验设定的初始范围c为-10~10(取以2为底的幂指数后),g为-10~10。步距设为2。
(2)采用交叉验证的方法,其中K取3,得到使分类准确率最高的局部最优参数,c=1,g=1。
(3)在得到的局部最优参数的附近,重新定义搜索范围和步距,其中c为-4~4,g为-4~4,步距为0.5进行精细化选择。二次寻优的结果如图4所示。
图4 参数选择结果视图
由图4参数选择结果图可知,改进的网格搜索法得到的最优参数c=0.707,g=0.5,交叉验证的均方差为0.004 2。选定好最优参数组合(c,g)后,便可以建立SVM回归模型,对测试样本进行回归分析,验证模型的准确率。
图6 CO测试集预测效果
为了验证模型回归预测准确度,用建立好的模型对训练集本身作预测,如图5所示。将模型应用于测试集样本的回归分析,预测结果如图6所示。
图5 CO训练集回归效果
由图5可知,SVM模型对训练集本身做预测时,预测曲线基本吻合实际浓度曲线;由图6可以看出,将训练好的模型对测试集仿真预测时,预测曲线能够反映真实的浓度信息。
4.3 遗传算法优化BP网络建模分析
按照如图2所示的遗传算法优化BP网络[10]的流程图,具体的优化步骤为:
(1)选取20组实验数据中的15组做训练样本,剩余的5组做测试样本,并将样本数据进行归一化处理。
(2)确定BP神经网络的拓扑结构。本课题同时对3种组分的混合气体进行定量分析,针对不同气体采用独立建模的方法,所以设置BP神经网络的结构为4-7-1,即输入层有4个节点,隐含层有7个节点,输出层有1个节点。
(3)初始化网络,得到网络的初始权值和阀值。
(4)设置适应度函数为训练数据预测误差绝对值的和。
(5)初始化种群,种群规模选取10~30为宜,本实验选择20;迭代次数为100代;交叉概率选在0~1之间,本文选择0.2;变异概率选择0.1。
(6)根据两个参数的优化范围对粒子群的初始位置和速度进行初始化。个体被选择的概率pi为:
(4)
交叉概率:例如第m个染色体am与第n个染色体an在l位进行交叉,则
(5)
式中:b为(0~1)之间的随机小数。
变异概率:以第m个个体的第i个染色体ami为例,则
(6)式中:amax为ami的上限,amin为ami的下限;f(g)=r2(1-g/G)2;r2为随机数,g为当前的迭代次数,G为设定的迭代次数;r为(0~1)之间的随机小数。
(7)优化流程的结束条件为模型预测误差和为0或者迭代次数达到设定值。未达到结束条件则转第6步。
把遗传算法得到的最优个体赋给BP神经网络,对训练集进行训练,建立神经网络回归模型,之后对测试集进行回归分析,得到测试集的模型预测结果。
根据图2优化流程计算,可得到如图7所示的遗传算法优化过程最优个体适应度值变化曲线。横轴为优化代数,纵轴为适应度值。
由图7看出,最优个体的适应度值从最高的0.682递减至最低的0.131,大约在迭代60次之后便趋于稳定状态。将优化得到的最优个体赋给BP神经网络,用训练数据训练100次之后,可以得到模型在训练样本和测试样本的预测结果,如图8和图9所示。
由图8可以看出利用训练集建立的模型对CO训练集本身做预测时,模型预测曲线和CO实际浓度值具有较大的偏差,误差明显;将模型应用于CO测试集的预测,如图9所示,误差很大,预测曲线不能准确地逼近真实浓度。
图7 最优个体适应度值变化图
图8 CO训练集回归效果
图9 CO测试集预测效果
图10 CO预测误差曲线
4.4 仿真分析
将SVM建模仿真误差曲线与遗传优化的BP网络建模仿真误差曲线,绘制如图10所示。
由图10可以看出,两条误差曲线相比,SVM模型预测误差明显减小,说明本实验建立的SVM模型预测精度较高。
同样地,可以得到两种分析模型对其他气体的仿真预测结果及平均绝对误差,见表1。两种优化方法的结果对比表,如表2所示。
表1 仿真结果对比
表2 寻优结果对比
由表1、表2可以看出:两种方法建立的气体定量分析模型的测试误差水平,SVM建模优于遗传算法优化BP网络。采用网格搜索法优化的SVM,建模所需时间平均为39.824 s,而遗传算法优化BP网络的建模时间为2 682 s,因此SVM建模方法在处理气体定量分析问题上,收敛速度更快,且精度水平更高。
本文将改进的网格搜索法用于SVM建模的参数寻优,对浓度范围在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3 270×10-6的C3H83种组分混合气体进行定量分析,选取其中15组样本作为训练集,建立了SVM回归模型,并对训练集进行预测分析,以检测模型的准确度;选择剩余的5组气体样本作为验证集,验证模型的预测精度和水平。在SVM参数的选取问题上,提出了改进的网格搜索参数寻优法,与遗传算法优化BP网络建模相比,SVM建模时间为39.824 s,BP网络为2 682 s;SVM预测平均方差为0.020 1,BP网络为0.035 2,SVM精度水平明显高于BP网络。因此,将网格搜索法与SVM相结合更适合处理混合气体的定量分析,在智能检测领域有一定的挖掘空间。
[1] 杨永杰,张裕胜,杨赛程,等. 一种PM2.5检测传感器设计[J]. 传感器与微系统,2014,33(3):76-78,81.
[2] 曲健,陈红岩,刘文贞,等. 基于改进网格搜索法的支持向量机在气体定量分析中的应用[J]. 传感技术学报,2015,28(5):774-778.
[3] 耿志广,王希武,王寅龙,等. 基于人工神经网络的电子鼻对混合气体检测研究[J]. 现代计算机(专业版),2010,(5):45-48.
[4] 黄小燕,赵向阳,方智勇. 电子鼻在气体检测中的应用研究[J]. 传感器与微系统,2008,27(6):47-49,52.
[5] 曲健,陈红岩,刘文贞,等. 基于自适应变异粒子群优化的SVM在混合气体分析中的应用[J]. 传感技术学报,2015,28(8):774-778.
[6] 李玉军,汤晓君,刘君华. 基于粒子群优化的最小二乘支持向量机在混合气体定量分析中的应用[J]. 光谱学与光谱分析,2010,30(3):774-778.
[7] 陈桄红,徐科军,陶波波,等. 不分光红外气体分析仪信号处理与控制系统研究与设计[J]. 电子测量与仪器学报,2013,27(11):1040-1046.
[8] 王兴玲,李占斌. 基于网格搜索的支持向量机核函数参数的确定[J]. 中国海洋大学学报,2005,35(5):859-862.
[9] 马永杰,云文霞. 遗传算法研究进展[J]. 计算机应用研究,2012,29(4):1201-1206,1210.
[10] 袁力哲,杨宪江,王宇. 基于自适应遗传BP算法的混合气体定量检测研究[J]. 仪表技术与传感器,2013,(6):118-120.
System of Quantitative Detecting Multi-Component Automotive Exhaust*
ZHANGZhigang1,CHENHongyan2*,QUJian2
(1.Department of Automobile Technology,Zhejiang Agricultural Business College,Shaoxing Zhejiang 312088,China;2.College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
For the problems of the quantitative analysis of mixed gas,it is difficult to calculate excessive data in infrared spectroscopy,as well as crosstalk between gases and other issues. A solution of improved grid search optimized SVM was proposed. It was to establish the models of a multi-component mixture gases quantitative analysis based on infrared spectroscopy.Then the related parameters are optimized based on the method of improved grid search,and compared to the effects of BP neural network optimized by genetic algorithm. Experiments show that the time of modeling by SVM was about 39.824 s,and optimized BP network is 2 682 s;and the prediction MSE of SVM was significantly less than BP. The time of modeling by SVM was about 1/60 of BP,convergence is faster and forecasting accurate is higher.
gas detection;quantitative analysis;SVM;BP neural network;cross interference
项目来源:浙江农业商贸职业学院2015年度科研项目(KY201533)
2016-05-03 修改日期:2016-07-19
TH744
A
1005-9490(2017)03-0773-06
C:7230;4145
10.3969/j.issn.1005-9490.2017.03.050