李增芳,陆江锋,虞佳佳,何勇
(1.浙江水利水电专科学校 机电工程系,浙江 杭州310018;2.浙江大学 生物系统工程与食品科学学院,浙江 杭州310029)
汽车发动机润滑油的作用是在运动机件之间形成良好的油膜,将接触面隔开,以湿摩擦代替干摩擦,变固体摩擦为液体摩擦,延长发动机机件使用寿命,因此汽车发动机润滑油品质的好坏会直接影响汽车的使用年限和安全问题,若长期使用假冒伪劣的润滑油将造成发动机内沉积物和腐蚀性物质增多,轻者降低润滑效果,加剧磨损,增大燃油消耗,重者会引发机械事故等。不同品种的润滑油从外观上难以区别,需要使用专用的检测技术才能加以鉴别,如显微镜方法、介电常数测量和中子活化分析等,但十分费时,并且成本高。可见-近红外光谱技术为近年来发展起来的一类新型分析检测技术,具有非破坏性、快速、简单等特点。目前国内外许多学者应用可见-近红外光谱技术对石油类产品进行了分类检测试验,并取得了很好的应用效果,这说明可见-近红外的光谱信息能很好地反映石油类产品中碳氢化合物组成和结构的特点[1~5]。而独立软模式法是Wold于1976年提出的一种基于主成分分析的特征投影显示方法,这种方法已成功地应用在茶叶品种鉴别、羊肉产地判别、药材识别等领域[6~8]。
本研究选用独立软模式法,建立不同品种润滑油的近红外光谱预测模型。采用一系列光谱预处理方法消除噪音,并通过SIMCA中的建模能力指标得到可能的敏感波段,然后再次进行SIMCA分析以确定其信息的有效性,从而为进一步的仪器开发做准备。
本实验采用了美国ASD(Analytical Spectral Device)公司的Handheld FieldSpec光谱仪,其主要参数见表1[9]。
表1 Handheld Field Spec光谱仪的参数Table1 Parameters of Handheld Field Spec
实验得到的光谱数据通过 ASD View Spec Pro V 4.2以ASCII码形式导出进行处理,由此得到的数据通过Unscramble V 9.6和Matlab R 2008a优化建模。
从杭州多家4S店中得到7种不同品牌种类的发动机润滑油,其中包括奥迪、宝马、丰田、丰田合成、本田、标致307专用润滑油以及通用公司在用的长城润滑油,以每20 mL为一个样本,共计210个样本,每个品种30个样本。样品池大小相同,以保证相同的光程距离进行透射,实验在恒温25℃下进行。光谱仪置于样品池正上方,对每一个样品扫描20次,从其中取3幅图谱,并将其取平均,由此得到一个样本光谱,样本随机分成建模集和预测集,建模集设置为140个,每个品种20个;预测集设置为7个,每个品种10个。
由于仪器本身状态、测量条件和实验操作的影响,光谱数据出现的基线漂移、光散射等影响,需要进行光谱预处理来消除噪音,而光谱预处理的目的是针对特定的样品体系,通过对光谱的适当处理或变换,以减弱或消除各种非目标因素对光谱的影响,尽可能地去除无关信息变量,提高分辨率和灵敏度,从而提高校正模型的预测能力和稳健性。常用的图谱预处理方法有数据增强变换、平滑、导数、变量标准化,多元散射校正、傅立叶变换等。本实验采用平滑和SNV[10]进行光谱数据预处理。
独立软模式法是一种基于成分分析 (PCA)的统计方法。SIMCA通过对各类对象分别进行主成分分析,然后在此基础上试探未知样本与已知样本模型的拟合程度,来解决未知样本的归属问题[7~8]。本试验研究过程中利用 Unscramble V 9.6对7种专用润滑油预处理后的光谱数据以品种分别进行PCA分析,再以最佳主成分数7为模型进行分类分析,其中模型距离反映各品种之间的区别度,建模能力是一种反映各个输入变量对模型的贡献能力,可以通过建模能力寻找敏感波段。其数学基础为:
其中Mp i为变量x i对模型的影响能力,xij表明样本j的第i的变量。
7种润滑油样本的可见-近红外原始光谱如图1(a)所示,图1(b)显示为短波近红外光谱曲线 (为图形显现清晰,每个品种的样品随意选取5条光谱曲线),图中不同颜色线型的曲线分别代表7种类型的润滑油样本。图1(a)中横坐标为波长范围400~1 000 nm,纵坐标为光谱吸光度。在图1(a)发现400~500 nm之间有一个坡度,表现为油品的颜色。在图1(b)中发现短波近红外区的吸光度值较图1(b)的可见光区的吸光度要小很多,900~950 nm之间有一个很小的凸起。从整体来看,不同品种润滑油的光谱曲线稍有集中,但因受噪音和基线漂移、光散射等因素的影响使得曲线交错重叠,在近红外部分的信息也比较微弱,人眼很难直观地看出种类间的差别,必须要结合化学计量学方法对所得的光谱数据进行处理,从而建立起不同品种润滑油的判别检测模型。
图1 润滑油品种样本的光谱吸光度Fig.1 The log of Vis/NIR absorbance reflected spectra of lubrication oil
从图1中可以看到光谱曲线有较大的噪音,为消除这些影响,先通过数据预处理,然后用主成分分析法对所有的210个样本进行分析。图2中X轴表示样本的第一主成分得分 (PC1),Y轴表示样本第二主成分得分 (PC2),图中不同颜色形状的小图标分别代表7种类型的润滑油样本。图2显示了不同品种润滑油的聚类效果,定性的描述了7种润滑油的特征差异。其中长城润滑油和宝马专用润滑油聚类效果比较明显,而宝马专用润滑油有明显的区分,其他4类润滑油相对比较集中,但品种重叠性不高。
图2 七种润滑油样本的主成分分析聚类图Fig.2 Principal component scores(PC1 PC2)of lubrication oil
通过对各品种润滑油的建模样本单独进行PCA后,对预测样本进行SIMCA建模预测,经预测可知本田专用润滑油和长城润滑油与其他样本模型的距离差距最大,最大值达到5 600,而其他模型距离的最大量级才180。根据表2结果可以得出以下结论,SIMCA可以对本研究对象进行区分,其辨别率达98.75%,这点说明可见-近红外谱段具有区分这7种润滑油的能力,因此我们可以进一步通过Modeling Power找寻敏感波段。
表2 全波段SIMCA分析预测结果(显著性水平<5%)Table 2 The Results of SIMCA with all spectrum data(significance level of 0.05)
Modeling Power的数值是基于0~1之间,且越接近1表明变量对模型的影响越大。图3中显示各个品种润滑油的光谱建模能力,图中不同颜色线型的曲线分别代表7种不同类型润滑油样本,通过Matlab 2008 a计算找出所有品种润滑油模型均满足建模能力大于0.7的波段,可以看出420~425 nm、492~518 nm和 796~816 nm对7个模型的影响趋势都是大于0.7,可以在一定程度上反映7类润滑油的特征。
图3 七种润滑油样本的波段建模能力Fig.3 Modeling Power of seven bands of lubrication oil
通过全波段的SIMCA分析计算,420~425 nm、492~518 nm、796~816 nm被选择作为可能的敏感波段,具有区分不同品种润滑油的信息。因此首先将所选波段作为SIMCA的输入参数再次分析,得到的结果见表 3,其整体辨别率达95.71%,这说明所选波段保留了原全波段的大部分信息。
表3 敏感波段SIMCA分析预测结果(p<5%)Table 3 The Results of SIMCA with effective spectrum data(significance level of 0.05)
本研究找到了一种结合SIMCA方法的可见-近红外光谱分析技术发动机润滑油快速鉴别方法,本文应用SIMCA分析得到的全波段分辨率为98.75%,并通过变量建模能力值找到可能的敏感波段420~425 nm、492~518 nm、796~816 nm,并再次进行SIMCA分析,分辨率达到95.71%。这说明所选波段包含了原波段中的大部分信息,可用于快速分类专用润滑油,也说明结合SICMA方法的可见-近红外光谱技术对区分不同品种的发动机润滑油是可行的,这些为今后开发相关的仪器设备奠定了基础。但同时在研究过程中发现敏感波段数量有53个,数量仍然需要减少,因此波段的选取方法需要进一步的研究和完善。
[1]熊智新,徐广通,胡上序.小波系数压缩用于柴油十六烷值近红外光谱分析建模[J].光谱实验室,2006,23(2):177-182.
[2]刘颖荣,许育鹏,杨海鹰,等.汽油样品类型的模式识别研究与应用 [J].色谱,2004,22(5):482-485.
[3]周子立,蒋璐璐,谈黎虹,等.基于光谱技术鉴别机油品种的新方法 [J].光学学报,2009,29(8):2203-2207.
[4]F.S.Falla,C.Larini,G.A.C.Le Roux et al.Characterization of crude petroleum by NIR[J].Journal of Petroleum Scienceand Engineering,2006,51(1-2):127-137.
[5]Minjin Kim,Young-Hak Lee and Chonghun Han.Real-time classification of petroleum products using nearinfrared spectra[J].Computers&Chemical Engineering.2000,24(2-7):513-517.
[6]张宁,张德权,李淑荣,等.近红外光谱结合SIMCA法溯源羊肉产地的初步研究 [J].农业工程学报,2008,24(12):309-312.
[7]陈全胜,赵杰文,张海冬,等.SIMCA模式识别法在近红外光谱识别茶叶中的应用 [J].食品科学,2006,27(4):186-189.
[8]严诗楷,罗国安,王义明,等.栀子药材提取工艺的近红外光谱实时控制方法研究 [J].光谱学与光谱分析,2006,26(6):1026-1030.
[9]王莉,李增芳,何勇,等.应用近红外光谱技术快速检测果醋糖度 [J].光谱学与光谱分析,2008,28(8):1810-1813.
[10]X Philip Ye,L Liu,D Hayes,et al.Fast classification and compositional analy sis of cornstover fractions using Fourier transform near-infrared techniques[J].Bioresource Technology,2008,99(15):7323-7332.