王金明,于金媛,李忠虎
(内蒙古科技大学,内蒙古 包头 014010)
近红外CO光谱采集及建模方法研究
王金明,于金媛,李忠虎
(内蒙古科技大学,内蒙古 包头 014010)
针对便携式光纤光谱仪的CO检测技术进行了研究。CO检测系统采用小型光纤光谱仪为核心进行搭建,光谱信号采用小波变换进行预处理。处理后的CO光谱信息采用高斯拟合算法进行特征提取,利用拟合得到的特征值来表征CO光谱信息,最后利用偏最小二乘方法和主成分回归法建立准确的数学模型。该方法能够快速准确地从光谱信号中提取特征信息并建立CO检测模型。
数学建模; 信号预处理; 特征点提取; 近红外光谱
CO是一种无色无味的有毒气体,社会不断发展,人们对空气质量要求也随之提升[1]。因此 CO检测技术也得到了长足的发展。光谱定量检测技术具有检测精度高、不易中毒、非接触测量等优点,是一种有待研究的CO浓度检测方法。随着科技的不断发展,近红外光谱技术是近十几年内快速发展起来的新型检测技术,其优点是检测时不需对样品作过多的处理,而且能定性定量检测气体、液体样品。从而使它成为很多国家在质量监督、品质控制和在线分析等领域中应用的重要技术手段。光谱信号处理分析在近红外光谱技术中有着不可代替的作用。
便携式光谱分析仪器是近年来各发达国家研究的热点,通过科学工作者的长期探索研究,可见光波段的微型光谱分析仪已有成熟产品进入市场,并得到了广泛的应用与开发,获得了显著的经济和社会效益。而技术难度大的红外光谱分析仪,由于巨大的市场需求与特点,其微小型化的研究与开发已成为近年来世界各国科学家攻克的又一个重要目标[2]。
在光谱定量检测技术中,数学模型的准确性和通用性对检测结果具有决定性影响。光谱信号预处理方法的研究在近红外(Near Infrared,NIR)光谱分析技术中起着不可或缺的作用。光谱信号预处理是建立预测模型的前提条件[3]。本文采用小型光纤光谱仪系统对CO进行检测,以Matlab软件为工具进行数据预处理和模型建立研究,定量检测分析其浓度成分,其研究具有实际意义。
光谱仪的工作原理是,被检测的近红外光经输入光纤系统分光后到达成像系统,成像系统将被检测的近红外光色散,再将色散后的光根据波长的长短聚焦成像在非致冷红外探测器阵列,最后由探测器把光信号转变成电信号,再通过16位信号采集处理电路将模数信号转换后送入计算机。由计算机完成信号的处理与分析,从而实现检测分析的目的。近红外CO检测实验平台实物连接如图1所示。
图1 近红外CO检测实验平台实物连接
近红外光谱检测系统的核心理论是Lambert-Beer定律[4]。从光谱仪自带软件界面中可以直接得到吸光度信息,实验光谱信号采集、处理分析都是由杭州晶飞FLA6800型近红外光纤光谱仪自带软件所完成[5]。其特点是光谱仪信号采集频率可调,动态显示非常直观,具有实时性,受系统干扰比较小,可以直接采集吸光度光谱。CO体积分数依次为23%、24%、25%的近红外光纤光谱仪采集光谱数据如图2所示。选取1.57 μm附近的吸收值作为实验数据。吸光度的测量用于检测光传输的介质中吸收光的溶液和气体的浓度。吸光度与样品的体积分数成正比。
图2 近红外光纤光谱仪采集光谱数据
微型近红外光纤光谱仪光谱信号的干扰因素主要有以下几个方面:来自光学系统的干扰信号、来自红外探测器的噪声信号和来自电路系统和电源的噪声信号。噪声的种类有以下几种:基线漂移、零点漂移及干扰组分背景光谱等。信号预处理在数学模型建立中具有不可忽视的重要性,通过去除噪声,将信号有用部分和噪声进行区分,获得信噪比较高、背景干扰低的分析信号。
3.1 小波变换
小波变换是从傅立叶变换发展出来的一种新的时间频率分析方法,由于它的多尺度分析特征,又被称为时间尺度分析方法[6]。
小波变换相较于傅里叶变换的优点:小波变换在时域内具有分辨优势,还拥有局部化思想,同时还能根据需求改变窗口形状和大小,这些都是傅里叶变换所不能达到的。小波变换对信号有拆分与重构、滤波、消噪声、基线修正等作用。小波变换还可以根据光谱信号和噪声频率的不同,将有用的光谱信号与噪声分离,从而实现噪声滤除[7]。
小波变换,首先要得到不同光谱信号频率的小波系数矢量,再将其中的高频单元小波系数移出,最终将能够抑制噪声信号频率的小波系数进行逆变换,从而得到有用信号[8]。
实验获得的CO吸光度光谱噪声频率较高,有用信号频率相对较低。小波变换对光谱要进行一定次数的拆分,实现噪声与有用信号分离,从而提高信号的信噪比。小波基的选取取决于信号处理中信噪特征的分析,分解次数则取决于对低通截止频率的要求。
小波变换也存在局限性,它不能得出信号在各个频带的时间分布。实验采用图形接口的形式直接对光谱曲线去噪。光谱仪的吸收范围是800~1 700 nm,本文选取1 200~1 580 nm段的波长作为实验数据。Matlab软件读取CO体积分数依次为23%、24%、25%的原始光谱数据如图3所示。CO体积分数依次为23%、24%、25%的原始光谱信号经小波变换除噪后光谱数据如图4所示。
图3 原始光谱数据
图4 小波变换除噪后光谱数据
采用Matlab软件中的wavemenu对光谱作去噪处理,可以直观地显示去噪前后的光谱曲线。由图3、图4对比可以看出,小波变换去除了光谱信号中较高与较低频的信号,从而达到了滤除噪声的效果。
采用高斯拟合算法对去噪后的光谱进行特征值的提取。高斯拟合所用的是高斯函数系[9],本文采用高斯函数进行拟合。从381个波长点中提取出11个特征值,用这11个特征值来表示CO的光谱信息。光谱高斯拟合后光谱数据如图5所示。高斯拟合最大的优点是在计算积分时简单快捷,这一优点在很多范畴都非常实用,特别是化学计量学。高斯拟合算法联合逐步回归算法建立预测模型,该方法即简化了模型参数,又提高了模型的可解释性[10]。
图5 光谱高斯拟合后光谱数据
通过Matlab软件中的cftool函数对去噪后的光谱信号进行拟合、提取特征值。利用高斯拟合结合之前的理论研究能有效地消除各种气体及环境因素带来的干扰,提高模型的准确性。
5.1 主成分回归
主成分回归(Principle Cnmponerit Regression,PCR)是由主成分分析和多元线性回归两部分组成,先对原始光谱矩阵X进行主成分分析[11],求出得分矩阵T和载荷矩阵P,T=XP。再对矩阵T与浓度矩阵Y进行多元线性回归,有Y=TB+E,矩阵B为回归系数,E为误差矩阵。未知样本有Y未知=T未知,B=X未知PB。
5.2 偏最小二乘法
主成分分析只对光谱矩阵X做了拆分并消除矩阵中多余信息,没有消除矩阵Y中的无用信息,偏最小二乘法(Partial Least Squares,PLS)可以弥补主成分分析法的这一缺点。
PLS的第一步,将矩阵分解,其模型为:
X=TP+E
(1)
Y=UQ+F
(2)
式中,T、U为矩阵X和矩阵Y的得分矩阵;P、Q为矩阵X和矩阵Y的载荷矩阵;E、F为用PLS模型拟合时的误差。
PLS的第二步将T和U作线性回归。B为关联系数矩阵。
U=TB
(3)
B=TU
(4)
在建立预测模型时,由未知样品矩阵的T未知[12]得到Y未知。
Y未知=T未知BQ
(5)
对采用高斯拟合前后的数据进行相同信息贡献值主成分回归分析,结果如表1所示。
CO体积分数为23%、24%、25%的光谱信号采用高斯拟合后偏最小二乘法建模和直接偏最小二乘法建模的未知样品的分析结果如表2所示。
表1 主成分回归分析结果
表2 未知样品的分析结果
对比分析4种算法建模的预测模型,模型评价指标相关系数为r。高斯拟合与PLS和PCR结合的模型评价指标相关系数r分别为0.963和0.966。直接采用PLS和PCR算法的模型评价指标相关系数r分别为0.960和0.920。由实验结果可以看出,采用高斯拟合与PLS和PCR结合的模型评价指标相关系数很接近,而直接采用PLS和PCR算法的模型评价指标相关系数却相差比较多,直接采用PLS算法优于直接采用PCR算法。将采用高斯拟合算法与直接拟合相比较,明显前者优于后者。
通过对比结果可以看出,由高斯拟合跟偏最小二乘法和主成分回归法结合后建立的数学模型的精度远远高于直接采用建模算法本身建立的数学模型的精度。
利用高斯拟合结合,偏最小二乘法和主成分回归法对CO光谱信息建立数学模型。在传统的模型建立方法基础上,增加了高斯拟合对特征值的提取。对CO光谱信息进行了一定程度的转换,有效地提高了分析信号的品质,简化了模型数据,突出了信号的特异性,从而提高了模型的准确度,使CO浓度检测的精度接近峰值。
[1] 马航,冯霄,杨亚斌,等. 羰基化合成甲酸钙实验安全分析及对策[J]. 云南化工,2015,48(3):34-38.
[2] 温泉.微型近红外光谱仪信号处理与分析系统研发[D].重庆:重庆大学,2008.
[3] 郭斗斗. 土壤有机质含量高光谱预测模型的构建[D].扬州:扬州大学,2014.
[4] 何柏村.基于红外光谱的CO气体浓度检测系统研究[D].北京:中国计量学院,2014.
[5] 吴瑾. 高分辨率的紫外微型光纤光谱仪研制[D].杭州:浙江大学,2015.
[6] 姜凤利. 基于小波变换的数字水印算法[J].辽宁石油化工大学学报,2007,27(1):63-66.
[7] 崔永福,吴国忱,郭念民,等. LIFT去噪方法在低信噪比资料处理中的应用[J]. 物探化探计算技术,2014,36(2):215-221.
[8] 花璐,韩超杰,丁一珂. 小波分析算法在图像处理中的研究与应用[J]. 中国新通信,2015,17(19):95.
[9] 陈言桂. 厦门年逐时室外干球温度的拟合[J]. 集美大学学报(自然科学版),2011,16(3):218-222.
[10] 李敏,盛毅. 高斯拟合算法在光谱建模中的应用研究[J]. 光谱学与光谱分析,2008,28(10):2352-2355.
[11] 周林峰. 黄酒主要品质的近红外光谱检测模型建立与转移的研究[D].北京:中国计量学院,2013.
[12] 张强. 基于近红外光谱技术的稻谷中霉菌和毒素检测研究[D].哈尔滨:东北农业大学,2015.
(编辑 陈 雷)
Near Infrared CO Spectra Acquisition and Modeling Method Research
Wang Jinming,Yu Jinyuan,Li Zhonghu
(InnerMongoliaUniversityofScienceandTechnology,BaotouInnerMongolia014010,China)
This article is about the study of portable fiber optic spectrometer CO detection technology. The detection system were built by used small optical fiber spectrometer as the core ,and the spectrum signal used wavelet transform to preprocess. Processed CO spectral feature extraction based on the information using a gaussian fitting method and CO in the characterization of eigenvalues are obtained by fitting the spectral information,finally a precise mathematical model were established by using partial least squares method and principal component analysis (PCA) . The method can fast and extractly characterize information from spectral signal and build the CO detection model .
Mathematical modeling; Signal preprocessing; Feature point extraction; Near Infrared Spectrum
1672-6952(2017)03-0054-04 投稿网址:http://journal.lnpu.edu.cn
2016-10-13
2016-12-06
国家自然科学基金项目(61640411)。
王金明(1980-),男,博士,讲师,从事光纤传感技术方向研究;E-mail:1390399451@qq.com。
于金媛(1992-),女,硕士研究生,从事光电检测方向研究;E-mail:yujinyuan007@163.com。
TP216
A
10.3969/j.issn.1672-6952.2017.03.012