化学计量学在光谱解析分析中的应用研究

2020-06-04 10:24
云南化工 2020年1期
关键词:计量学模式识别小波

薛 佳

(西安石油大学化学化工学院,陕西 西安 710065)

化学计量学(Chemometrics)[1]是一个包括数学、统计学、计算机科学等新兴的多科目化学分支,为当代化学光谱分析研究提供有效的方法支撑。它可以设计和选择优化的量测程序和实验工艺,用于最大程度地提取有用的信息以解释物化数据。它的优势已经在相关的光谱技术研究范围中得到了印证。因此,我们在这里回顾化学计量学在光谱解析中的应用研究。

光谱分析技术(LIBS、IR、Raman、UV-vis光谱等)[2]用做元素分析技术因其具有样品处理简单、无损、快速且实时监测和现场在线分析等优点,受到研究人员的广泛关注。由于激光能量的波动、复杂的基体效应和样品不均匀性等因素产生了复杂的光谱,如何从大量复杂的高维光谱数据中提取有用的信息并减少背景信号,噪声和重叠峰等干扰因素来提高定性和定量分析的准确性仍是光谱技术的主要问题。借助化学计量学工具处理复杂的光谱数据,可以提高光谱数据分析的准确性和稳定性,现已成为光谱分析技术的关键技术支撑。

1 光谱数据预处理

随着激光脉冲能量的波动、光谱仪分辨率的差异以及外部环境和样品不均匀性的影响,大量的干扰信息存在于光谱数据中,选择合适的化学计量学方法可以减少或去除光谱中随机产生的误差等因素对光谱的影响,提高信噪比,从而提高光谱分析检测的稳定性,灵敏度和可重复性。数据预处理的目的就是消除干扰信息对原始光谱的影响,并为后续的定性和定量分析提供高质量的光谱。常用的方法[3]有:平滑、基线校正、归一化、求导、多元散射校正、标准正态变量变换和小波变换等。

标准正态变量变换(Standard normal variate transformation,SNV):在光谱预处理中常用于纠正单个样品的样品粒度和水分含量有关的问题,通过减少基线偏移和曲率的混淆影响来降低多重共线性并计算光谱差异。可以削除样品(如土壤)粒径尺寸、不均匀介质的散射和光路变换对各种漫反射光谱的干扰。

小波变换 (Wavelet transform,WT):是时间-频率转换函数的一种新的变换分析方法,使用伸缩平移计算从多个方面细化信号,对时间和频率分别在高频和低频处细分,使光谱信息的每一个细节都能被关注,克服了其他分析方法适用的限制性。其实际上是将离散信号在小波基函数上的反射,常用的小波基函数主要有Haar小波、Daubechies小波、Coiflet小波、Symlets小波等。

2 定性分析(模式识别)

光谱数据内含大量样品特征的物化信息,不同类型样品的光谱是不同的,化学模式识别即使用化学计量学方法来提取该差异信息以分类区分样品的过程。它是一种多变量分析技术,能发现复杂光谱中暗含的内在规律,用于识别不同类型材料的光谱特点,以辨认区分未知样品。包括有监督和无监督模式识别。

有监督模式识别的基本思想是使用具有已知类别作为训练集样本来构建训练模型,然后由训练模型预测未知样本的类别。常见的方法有:簇类的软独立建模方法、K最近邻法、偏最小二乘判别分析、支持向量机和随机森林等。

无监督模式识别即聚类分析(Clustering analysis),利用同类样品彼此相似的思路,相似化合物之间的距离在多维空间中较小,反之非相似化合物之间的距离较大,从而实现未知样品的分类。其中最常见的方法是主成分分析法(Principal component analysis,PCA),通过光谱数据降维处理生成的较少主成分用于空间投影和映射来解释数据中的大多数信息。Tang等[4]采用PCA对数据降维,取前3个主成分输入小波神经网络,建立基于PCA和小波神经网络的近红外多组分预测模型 (WNN),表明所建立的WNN模型能用于同时预测小麦叶片全氮和可溶性总糖两种组分含量。

3 定量分析

常规的定量分析方法常使用统一回归分析方法建立元素或组分浓度与分析线强度间的关系,但建立的这种关系通常无法获得复杂矩阵样本的所需结果。现代频谱分析中的频谱信号由一系列矢量数据组成,其变量是相互依赖的,因此,应考虑具有多个自变量的回归分析问题,且在谱图数据大幅增加的条件下,能够获得有关定量分析的更多有用信息。建立定量模型的多元校正方法有:人工神经网络、支持向量机回归、偏最小二乘、主成分回归和多元线性回归等。

多元线性回归(Multiple linear regression,MLR):其回归模型可以通过PLS回归构建,能够有效使用光谱数据的特征变量来减少基体效应,提高光谱定量分析回归结果的稳定性。Jin等[5]使用DFT计算了17个取代芳烃类化合物的电子结构参数,筛选出影响发光菌毒性显著的5个变量,建立其结构与毒性之间的MLR模型,表明所建立的模型具有很好的稳定性和预测能力。

为了构建高性能的校正模型,可以建立以决定系数(R2)和相对误差(RE)为评价指标的模型评价体系,实现对模型参数及模型的选择与优化。

决定系数(R2):

相对误差(RE):

yi,actual为第i样品性能参数的实际值,yi,actual为所有样品性能参数实际值的平均值,yi,predicted为第i样品性能参数的预测值,n为样品个数。

4 结语

本文综述了化学计量学方法在光谱数据预处理以及定性和定量分析方面的应用研究。在传统单变量校正曲线方法的基础上,发展基于化学计量学策略的多变量定量分析方法。从复杂光谱数据中提取特性信息,减少背景噪声及干扰信息对定量分析结果的影响,建立稳健预测模型。化学计量学结合光谱技术应用模式识别和分类分析,在复杂的材料和工业分析中显示出巨大的潜力。因此,针对基于光谱技术的准确定性与定量分析问题,开展基于化学计量学预测模型构建过程中的光谱预处理、特征变量选择、模型选择与优化等一系列研究,有助于实现研究光谱技术的过程分析与精准控制。

猜你喜欢
计量学模式识别小波
基于多小波变换和奇异值分解的声发射信号降噪方法
基于CiteSpace的医药语料库文献计量学分析
构造Daubechies小波的一些注记
针刺治疗失眠症的文献计量学分析
基于MATLAB的小波降噪研究
化学计量学在中药质量控制研究中的应用
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
第四届亚洲模式识别会议
基于科学计量学的公安院校科研与评价