光谱数据融合技术在食品检测中的应用研究进展

2020-09-23 06:42:58杨巧玲邓晓军孙晓东古淑青
食品工业科技 2020年18期
关键词:红外光谱建模

杨巧玲,邓晓军,孙晓东,钮 冰,古淑青,陈 沁,*

(1.上海大学生命科学学院,上海 200444;2.上海海关动植物与食品检验检疫技术中心,上海 200135;3.上海大学医学院(筹),上海 200444)

食品质量安全问题是关乎国计民生的大事,随着经济的快速增长,物质生活质量的提高,人们对食品安全的要求越来越高。近年来频繁爆发的食品安全事件,使食品的质量安全问题成为社会关注的热点[1]。食品质量安全检测包括掺假食品检测、农药残留检测、添加剂超标检测,以及食品产地来源检测,特殊成分检测等。传统的检测技术主要为色谱法和质谱法,包括高效液相色谱法(HPLC)、液相色谱-质谱法(LC-MS)、气相色谱-质谱法(GC-MS)等,这些技术的样品前处理过程复杂,不利于现场的快速检查。与此同时,光谱检测技术迅速发展,其不仅不需要复杂的样品前处理过程,而且可以进行实时实地检测,被广泛应用于口岸等特定场合的食品质量安全筛查[2]。利用不同光谱的优势进行互补的光谱数据融合技术是近年来新兴的一种无损检测技术,可以对食品进行快速的定性定量分析[3]。如拉曼光谱可以检测原子的非极性键振动,如N-N、C-C、S-S键等,红外光谱可以检测具有红外活性的分子,即一些极性基团的谱带信号较强,如C-H、N-H和O-H键等,两者在分子基团定性检测中是互补的关系[4]。目前常用的光谱数据融合技术有拉曼-红外光谱技术,近红外-中红外光谱技术和紫外-红外光谱技术,由于这些技术获得的信息更准确更全面,成为近年来国内外研究的热点。因此本文介绍了光谱数据融合技术的特点,数据融合常用的化学计量学方法以及在食品检测中的应用,并对该技术的未来发展进行了展望。

1 光谱数据融合技术的特点

单个光谱检测技术如红外光谱技术、拉曼光谱技术、紫外可见光谱技术在食品质量安全检测方面应用广泛,但也存在一些弊端,如表1所示。

表1 常见光谱技术比较Table 1 Comparision of commom spectral techniques

为了弥补这些弊端,光谱数据融合技术应运而生,该技术主要是用不同方法,将单光谱的信息进行整合,以获得更准确更全面的结果。其主要特点有:a.检测结果更准确全面:目前应用最多的方法是对采集的光谱数据进行不同层次的数据融合,由于融合数据包含的有用信息更多,使建模得到的检测结果更准确更全面;b.检测效率高:光谱设备融合可以用一台仪器,同时采集样品的多种光谱信息,提高检测效率;c.操作方便:光谱一体化设备在采集光谱时可以一键切换成不同的光谱采集技术,操作比单光谱技术更方便;d.数据处理过程较复杂,难度较大:由于光谱数据融合技术需要许多化学计量学方法来对不同光谱数据进行融合、分析、建模等,对软件方面的开发要求较高,这也是光谱数据层融合技术的一个弊端;e.多光谱检测的一体机设备还未实现数据处理一体化,仍需要将数据进行分开处理,因此光谱仪器和数据处理一体化融合的设备是未来的光谱检测的发展趋势。常见的光谱数据融合技术有拉曼-红外光谱技术、近红外-中红外光谱技术、紫外-红外光谱技术,还有一些其它光谱技术如荧光光谱技术、核磁共振技术[22-23],微波消解-电感耦合离子体发射光谱技术[24]、火焰法原子吸收光谱技术[25]、太赫兹光谱分析技术[26]、高光谱成像技术[27-28]等,这些光谱技术也可以根据各自不同的特点进行融合,达到优势互补的目的。虽然应用的检测技术不同,但检测标准都要与国家检验标准一致[29]。在实际应用中,光谱数据融合技术就是在达到国家标准的基础上,不断提高检测结果的准确度和灵敏度,为食品质量安全检测提供更好的理论和技术支持。

2 光谱数据融合技术的方法

数据融合可以认为是多个信息源的组合,以获得改进的信息,在这种情况下,改进的信息意味着成本更低、质量更高或相关性更强。将各光谱的数据以不同的方式融合在一起,可以得到更全面更有用的信息。在光谱数据进行融合之前,通常需要结合化学计量学方法,对光谱数据进行预处理,提取特征波长,从而获得更有用的信息。

2.1 预处理

光谱数据在收集的时候易受到杂散光、噪声、荧光背景等因素的影响,从而影响建模效果。因此,需要对光谱数据进行预处理,以尽量消除各种因素的影响,从而得到较为理想的建模效果[30]。光谱数据预处理的方法有很多,根据处理效果分为平滑处理、散射校正、基线校正、尺度缩放[31]。平滑主要是为了降低噪声的影响,提高信噪比,包括Savitzky-Golay(S-G平滑)[32]、小波变换(WT)和小波阈值去噪。散射校正是用来消除散射光对光谱的影响,这种散射光主要由于样品颗粒分布不均匀及颗粒大小不同而产生,会使光谱基线平移和偏移,主要方法有多元散射校正(MSC)和标准正态变量变换(SNV)。基线校正是为了扣除仪器背景对光谱信号的影响,常用的处理方法有二阶导数法,8th多项式拟合法,极大极小值自适应缩放法,一阶微分和二阶微分法等[33]。尺度缩放是为了消除数据差异较大而带来的不良影响,包括最大最小归一化、标准化、中心化等。

光谱数据预处理的方法有很多,但由于实验的环境、仪器性能等方面的差异,要根据实际情况选择合适的预处理方法。例如许英杰等[34]提出了一种基于临近比较的快速基线校正方法,根据在相同背景下采取的光谱之间的相关性,实现快速基线校准,该方法比传统的基线校正方法更快,可以实现大量的拉曼信号基线校准。

2.2 特征波段提取

光谱进行特征波长提取可以除去冗杂的信息,筛选有用信息。最常用的提取特征波长方法是偏最小二乘判别分析(PLS-DA)。姚森等[35]利用PLS-DA将预处理后的傅里叶变换红外光谱和紫外光谱数据提取成分并整合,再进行中层融合,得到的预测结果比单光谱结果更准确。特征波长提取的方法还有竞争性自适应重加权算法(CARS)、间隔偏最小二乘法(BiPLS)、联合间隔偏最小二乘法(SiPLS)、连续投影算法(SPA)、无变量信息消除法(UVE)、随机蛙跳(SFLA)等。针对特定的光谱数据,用不同方法提取特征波长最后得到的检测结果不同。吴双等[36]利用标准正态变量变换方法(SNV)、标准正态变量变换方法和去趋势技术联用算法(SNV-DT)对食用植物油的激光近红外光谱数据进行预处理,再用CARS、SPA和CARS-SPA三种方法进行特征波长提取,最后用支持向量机分类方法(SVC)建模,结果表明CARS-SVC、SPA-SVC和CARS-SPA-SVC模型预测集准确率均达到96.77%,预测效果理想,其中SNV-DT-SPA-SVC模型预测效果最优,预测集准确率达到100%。说明基于特征波长建模的预测效果更好。

2.3 数据层融合

数据融合可以在三个层次上进行,分别是低层融合、中层融合、高层融合,流程如图1所示[37]。

图1 数据融合流程图Fig.1 Data fusion scheme

低层融合即光谱的数据层融合,来自所有数据源的数据被简单地按样本顺序连接到一个矩阵中,该矩阵的行数与分析样本的行数相同,列数与不同仪器测量的信号(变量)的列数相同,然后利用化学计量学方法提供最终分类或预测的单个模型。数据层融合目前已被广泛应用于食品和饮料的原产地认证和质量评估,如Nunes等[38]测定掺假肉的蛋白质、灰分、氯化物、钠、磷酸盐五个理化指标,并利用傅里叶变换衰减全反射红外光谱法记录红外光谱数据,再对数据集进行Savitzky-Golay平滑、MSC和类质心定心处理。将理化指标数据和ATR-FTIR数据简单地串联起来进行低层融合,建立PLS-DA模型,结果显示,在训练集和测试集中均只出现了2个假阴性数,没有出现假阳性数。对比没有数据融合建立的PLS-DA模型,数据层融合建立的模型更有优越性。但简单的数据融合会把一些冗杂的数据也应用到分类或建模过程中,增加数据的冗余性,使数据处理的工作量变大。

中层融合是分别从每个数据源中提取相关特征,然后将它们组合成一个矩阵,通过分类或校正方法进行处理,因此这一层次融合又称为特征层融合。在中层融合中,特征提取是一个基本步骤,大多数情况下使用的是潜在变量。中层融合方法广泛应用于食品质量安全检测中,如Dupuy等[39]利用中红外和近红外光谱技术对初榨橄榄油中的脂肪酸和三酰甘油进行定量分析,用PLS和PLS-DA分别对单独光谱数据,以及特征层融合后的数据进行建模,结果显示通过融合光谱建模,可以改进橄榄油的地理认证,但是融合光谱对初榨橄榄油中脂肪酸和三酰甘油的定量分析并没有改善,说明中层融合可能会把一些有用的特征信息排除,导致数据的饱和性减低,从而使一些检测结果不准确。

高层融合也称为决策级融合,是从每个数据源计算单独的分类或回归模型,并将每个单独模型的结果进行组合以获得最终决策。高层融合比低层融合和中层融合探索的少,主要是集中在分类问题上[37]。Li等[40]将气体传感器与液体传感器相结合,对苹果品质进行了研究,使用主成分分析(PCA)进行特征提取,并结合协方差矩阵适应进化策略(CMAES)将传感器的数据融合,与单个仪器检测相比,提高了苹果缺陷检测的可靠性。高层融合的复杂程度更高,但模型的效率也更高,对算法要求更严苛。

3 光谱数据融合技术在食品检测中的应用

3.1 拉曼-红外光谱技术

拉曼光谱技术和红外光谱技术在分子基团定性检测中有良好的优势互补特性,因此在物质的定性分析中,拉曼-红外光谱技术具有明显的优势。在食品检测中,拉曼-红外光谱技术被广泛应用在食品掺假物质检测中。陈达等[3]用该技术对牛奶中掺假物质的含量进行检测,将模型检测结果与单独对拉曼光谱和近红外光谱进行建模相比较,变量融合后建立的判别模型灵敏度提高至94.74%,正确率提升至99.42%。涂斌等[41]用激光拉曼、激光近红外光谱仪采集134个掺假油的光谱数据,结果显示多光谱特征融合Ram-NIR-SVR建立的模型比单光谱数据建立的模型相关系数要大,说明可以提高模型的预测能力。Márquez等[42]利用FT-Raman和NIR两种光谱技术所获得的信息协同效应,采用两种数据融合策略(高级和中级)和多变量分类方法(类相似的软独立建模,SIMCA)对榛子仁掺假进行检测。结果表明,单个技术的灵敏度和特异性分别在75%~100%之间,中高级数据融合策略的灵敏度和特异性分别在96%~100%和88%~100%之间,说明数据融合是一种有效的融合策略,其性能参数优于单个技术。以上研究结果说明通过光谱融合的方式,可以有效弥补单一光谱存在的信息漏洞,获得的信息更全面,更准确。

3.2 近红外-中红外光谱技术

近红外光谱技术可以用于显示含氢基团的谱带,但检测时存在一些缺点,如数据分析时不能利用痕量分析方法,检测的准确度不太高,中红外光谱和近红外光谱虽然都是红外光谱,但是两者吸收波长不同,而且中红外光谱应用更广,技术更成熟[43],所以近红外-中红外光谱技术可以利用两者的优势,提高检测准确度。相比较拉曼-红外光谱技术,近红外-中红外光谱技术在掺假物质检测应用中的检测范围较小,灵敏度也不如拉曼-红外光谱技术,但由于都是红外光谱,数据的采集不易受荧光背景的干扰,且技术发展得较成熟。

近红外-中红外光谱技术在国内外已有广泛应用。Zhang等[44]利用近红外光谱和中红外衰减全反射光谱采集芝麻油和掺有不同浓度玉米油的芝麻油光谱数据,利用二维相关谱技术得到样品的同步-异步二维近红外相关谱和中红外相关谱,再用MPCA技术提取预处理后光谱的得分矩阵,合并后建立偏最小二乘判别模型(PLS-DA)。结果显示融合后的光谱模型对校正集和预测样品的判别正确率达到100%,比单光谱预测模型的正确率要高,说明光谱融合模型可以更好的应用于芝麻油的掺假检测。在牛奶掺假中,张海洋等[45]分别采集伊利和蒙牛两品牌的近红外光谱和中红外光谱,建立单一光谱的预测模型和两光谱数据融合后的判别模型,结果显示融合光谱的判别模型能减小不同品牌牛奶对模型预测性能的影响,提高正确率。Ríos-Reina等[46]用近红外-中红外光谱技术对葡萄酒产地进行鉴定,结果显示数据融合方法的应用改善了PDO葡萄酒的特性和认证,提供了比基于单一方法的模型更有效的鉴别。Casale等[47]为了区分不同品种的特级初榨橄榄油,分别利用变数选择(SELECT)演算法与资料压缩(小波变换)演算法对近红外光谱与红外光谱进行融合,结果显示近红外光谱和中红外光谱融合建立的LDA模型预测能力更强,说明将化学计量学方法应用于近红外-中红外光谱技术,可以对特级初榨橄榄油进行有效分类。

3.3 紫外-红外光谱技术

紫外光谱根据分子在紫外光区的吸收光谱图获取物质信息,目前已经广泛用于生化、药物、环境等领域[48]。这种方法可以对食品的物质构成进行定性、定量、结构分析等[14]。将紫外光谱技术和红外光谱技术结合,可以提高单个光谱的准确率和灵敏度,在食品质量安全检测方面已有广泛应用。如姚森等[49]利用紫外-红外光谱技术对绒柄牛肝菌种类产地进行判别,对紫外光谱和红外光谱分别进行2D+Savitzky-Golay平滑和2D+SNV+MSC优化处理,通过PLS-DA提取VIP大于1的波段进行中级数据融合。结果显示中级数据融合建立的PLS-DA和SVM判别模型对未知样品产地的预测正确率分别为81.25%、96.88%,鉴别效果优于其他技术,表明中级融合对不同产地牛肝菌区分效果最佳,且SVM判别模型与PLS-DA模型相比更加稳定、可靠。叶旭君等[50]利用紫外-近红外光谱技术对蔬菜细胞的ATP含量进行无损检测。结果显示特征层融合的模型能很好的预测细胞原生质体ATP含量(R2=0.8029和0.901)。Casale等[51]采集特级初榨橄榄油的紫外光谱、近红外光谱和中红外光谱,然后进行数据层融合,再利用偏最小二乘法建立不等分类模型、类相似的软独立模型,结果显示融合光谱建模并没有对橄榄油成分预测进行改善,近红外光谱技术是预测样品中油酸和亚油酸含量的最有力的光谱技术,说明近红外-中红外光谱技术在橄榄油成分鉴定方面的应用还有待进一步改善。

3.4 其它光谱数据融合技术

实际应用中,还有一些应用较少的光谱数据融合技术,表2列举了一些在食品质量安全检测中应用的技术。

表2 其它光谱数据融合技术在食品检测中的应用Table 2 Application of other spectral fusion techniques in food testing

由检测结果来看,光谱数据融合检测技术比单光谱检测技术在食品检测方面更有优势。因此要不断完善和改进光谱融合技术,才能够更好的为食品质量安全控制服务。

4 展望

光谱检测技术是现阶段比较先进的检测技术,将其应用于食品质量安全检测中,不仅可以保证饮食安全,还能促进光谱技术的发展[55]。随着化学计量学的不断发展,单光谱检测技术在食品质量安全检测方面有了更深更广的发展空间。光谱数据融合检测技术的开发能实现各光谱技术的相互补充,相互较正,使检测结果更全面也更准确。多光谱数据融合技术的数据处理过程需要复杂的化学计量学方法,精准的建模和算法的完善有助于提高后期数据处理效率,有利于相应软件的开发,为数据处理提供一个更便捷有效的平台。目前光谱数据融合技术还不成熟,在一体机研究开发过程中,只有光谱检测设备一体化,仍需分开处理数据,而数据层融合方法中,应用虽较多,但无法实现同时采集多种数据。因此,针对光谱数据融合技术的这个缺点,光谱仪器和数据处理一体化融合的设备是未来的光谱检测发展趋势,将决策层融合的数据处理方法和多光谱检测一体机设备进行融合,建立数据处理云平台,实现检测设备和数据处理一体化,能进一步节约人力物力,提高检测速率。实现在线光谱数据采集和分析,实时监测食品的质量安全。

猜你喜欢
红外光谱建模
基于三维Saab变换的高光谱图像压缩方法
网红外卖
环球时报(2022-05-23)2022-05-23 11:28:37
闪亮的中国红外『芯』
金桥(2021年4期)2021-05-21 08:19:20
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
TS系列红外传感器在嵌入式控制系统中的应用
电子制作(2019年7期)2019-04-25 13:17:14
基于PSS/E的风电场建模与动态分析
电子制作(2018年17期)2018-09-28 01:56:44
不对称半桥变换器的建模与仿真
基于快速递推模糊2-划分熵图割的红外图像分割
星载近红外高光谱CO2遥感进展
中国光学(2015年5期)2015-12-09 09:00:28
苦味酸与牛血清蛋白相互作用的光谱研究