基于三维荧光光谱快速识别冷榨一级核桃油品牌和产地

2022-05-31 01:46夏阿林侯泰东雷渊雄
中国油脂 2022年5期
关键词:降维产地光谱

黄 炜, 夏阿林, 侯泰东, 雷渊雄

(邵阳学院 食品与化学工程学院,湖南 邵阳422000)

核桃油是一种食用价值很高的植物油脂,富含多不饱和脂肪酸,具有增强脑部记忆力[1-3]、抗氧化、预防心脑血管疾病、降低胆固醇、缓解2型糖尿病、抗肿瘤等生理功能[4-10],深受消费者的喜欢,拥有广阔的市场前景。消费者在购买核桃油时一般注重品牌和产地,这也驱使不良商家在这两个方面费尽心思,伪造品牌商标或虚假宣传来欺骗消费者。因此,迫切需要建立溯源监督系统,能快速对核桃油的品牌和产地进行识别,提供消费者作为维权依据并易于厂家打假。

建立溯源监督系统需要一定的技术支持,近年来,发展出不同的光谱检测手段(近红外光谱[11-12],低场核磁共振技术[13],荧光光谱[14],紫外-可见光谱[15])和化学识别模式相结合的植物油识别方法;但是,这些光谱技术大部分的研究方向集中于植物油的掺假判别,而对于品牌和产地的识别研究较少。三维荧光光谱技术相对于上述检测手段具有更高的灵敏度、选择性,且提供更丰富的化学信息,具有很强的分辨优势,适合于复杂体系的多元分辨。本文采集了同一加工方式的不同品牌、不同产地的4种核桃油的三维荧光光谱,光谱数据经主成分分析(PCA)进行特征选取,经筛选的荧光光谱结合两种化学识别模式(偏最小二乘和人工神经网络),分别建立品牌识别模型和产地识别模型,以期为发展核桃油溯源监督系统提供技术支持。

1 材料与方法

1.1 实验材料

冷榨一级核桃油,购于某大型超市,4个品牌3个产地3批次,平均每批次每个品牌25个样品,共300个样品,各个品牌容量都为110 mL,带有防伪标识,样品具体情况见表1。不同品牌的核桃油都为淡黄色的透明油状物,带有淡淡的植物清香,消费者很难通过感官进行区分。

表1 冷榨一级核桃油样品具体情况

石油醚(分析纯),天津市鑫宇精细化工有限公司。Cary Eclipse荧光分光光度计(配套10 mm的石英比色皿),美国安捷伦科技有限公司。

1.2 实验方法

1.2.1 植物油荧光光谱采集

取1 mL核桃油样品于10 mm的石英比色皿,放入样品室,调整参数,进行荧光光谱采集,测下个样品之前,比色皿需用石油醚润洗2~3次。另外,样品开封储存1个月后,以同样的操作步骤再采集1次荧光光谱。光谱采集参数:激发波长选取区域为200~580 nm,波长间隙10 nm,狭缝间隙10 nm;发射波长选取区域为250~700 nm,波长间隙5 nm,狭缝间隙10 nm;扫描速度24 000 nm/min;响应时间0.125 s;电压400 V。

1.2.2 主成分分析降维

主成分分析(PCA)是常用于特征提取的方法之一,即数据的降维和压缩,降维后的数据集保存着原始数据的变量,代表着原始数据的主要信息[16]。由1.2.1的操作获取600组激发-发射荧光光谱数据,大小为39(激发)×91(发射)×600的三维数据矩阵。运用PCA在发射光谱方向进行特征提取,分别选取同品牌或同产地样品的主成分1组成新的数据集,对应建立品牌识别模型和产地识别模型。

1.2.3 偏最小二乘判别(PLS-DA)

偏最小二乘判别是一种融合了偏最小二乘回归和分类判别能力的线性监督分类方法[17],可以用于模式识别。偏最小二乘判别分析是把已知类别的响应变量,设为多个整数(…,-1,0,1,…),建立模型后,通过预测值的情况进行判别。

核桃油品牌识别时,将其响应变量设计为:“-1”设计为品牌1,“0”设计为品牌2,“1”设计为品牌3,“2”设计为品牌4。建立品牌识别模型后,根据预测值yi按自设的区间进行品牌识别。yi<-0.5,归属品牌1;-0.5≤yi<0.5,归属品牌2;0.5≤yi≤1.5,归属品牌3;yi>1.5,归属品牌4。

产地识别时,响应变量设计的“-1”“0”“1”分别为吉林、山东、山西,建立产地识别模型后,根据预测值yi按自设的区间进行产地识别。其中:yi<-0.5,归属吉林;-0.5≤yi≤0.5,归属山东;yi>0.5,归属山西。

1.2.4 人工神经网络判别(BP-ANN)

人工神经网络从本质上看,其实是受到大脑中神经元功能启发而建立的数学模型[18],通过人为赋值把性质相近的特征转化为哑变量,达到分类目的。对于此次核桃油品牌和产地识别时,把期望输出值设计为“-1”“0”“1”“2”分别对应品牌1、2、3、4,对应的判别区间与偏最小二乘设计相同。产地识别时,期望值“-1”设计为吉林产地,期望值“0”设计为山东产地,期望值“1”设计为山西产地,判别区间的设定也与偏最小二乘设计相同。

1.2.5 数据处理

主成分降维算法、偏最小二乘算法、人工神经网络算法在MATLAB 软件平台上自编和运行。采用Origin软件作图。

2 结果与讨论

2.1 主成分分析降维

600组光谱数据经PCA算法在发射光谱方向降维后,由原来的三维数据集转换为二维数据集,所有样品的三维荧光主成分降维图如图1所示。由图1可见,经过特征筛选后的600组光谱,因产地或品牌的原因光谱有所差异,但仍然重叠严重,肉眼难以区分。

图1 所有样品的三维荧光主成分降维图

2.2 识别模型

4个品牌不同批次的300个冷榨一级核桃油样品,随机挑选200个样品共400组数据为训练集样品,100个样品共200组数据为预测集样品,用于核桃油品牌识别;3个产地的225个冷榨一级核桃油样品(产地相同的品牌2、3随机共挑选75个,品牌1、4各挑选75个),随机挑选150个样品共300组数据为训练集,75个样品共150组数据为预测集,用于核桃油产地识别。

2.2.1 PLS-DA和BP-ANN的冷榨一级核桃油品牌识别

训练集及预测集冷榨一级核桃油PLS-DA(a1,b1)和BP-ANN(a2,b2)方法品牌识别结果如图2所示,PLS-DA和BP-ANN方法冷榨一级核桃油品牌识别结果见表2。从图2可见:PLS-DA法的训练集和预测集样品的预测值与响应变量高度吻合,都能准确落于各自对应的判别区间,并且其预测值与设定的响应变量高度一致;BP-ANN法与PLS-DA法结果相同,训练集和预测集样品都归属于对应的品牌区间,获得很好的识别结果。由表2可知,PLS-DA法和BP-ANN法对核桃油的品牌识别率都能达到100%,都能准确识别出对应的核桃油品牌。实验结果表明,使用BP-ANN 法和PLS-DA法对核桃油品牌进行识别分析,可以得到准确、有效、高识别率的结果。

图2 训练集及预测集冷榨一级核桃油样品PLS-DA(a1 ,b1)和BP-ANN(a2,b2)方法品牌识别结果

表2 PLS-DA和BP-ANN方法冷榨一级核桃油品牌识别结果

2.2.2 PLS-DA和BP-ANN的冷榨一级核桃油产地识别

训练集及预测集冷榨一级核桃油PLS-DA(a1,b1)和BP-ANN(a2,b2)方法产地识别结果如图3所示。PLS-DA 和BP-ANN方法冷榨一级核桃油产地识别结果见表3。

图3 训练集及预测集冷榨一级核桃油样品PLS-DA(a1 ,b1)和BP-ANN(a2,b2)方法产地识别结果

表3 PLS-DA和BP-ANN方法冷榨一级核桃油产地识别结果

由图3可看出,由两种方法得到训练集和预测集的预测值都准确落于对应设定的产地判别区间内,特别是PLS-DA判别方法,得到的预测值与设定的响应变量高度吻合,产地归属性非常好。由表3可看出,两种识别方法对于核桃油的产地识别率都高达100%。因此,PLS-DA和BP-ANN方法可以用于核桃油的产地识别。

3 结 论

本实验选取4个品牌的冷榨一级核桃油用于构建品牌识别模型,共计300 个样品,分两个时间段(间隔1个月)采集其荧光光谱数据;同时,将这4个品牌共3个产地核桃油样品用于构建产地识别模型,共计225 个样品,分两个时间段(间隔1个月)采集荧光光谱数据。得到的600组光谱数据,运用PCA降维,再与PLS-DA和BP-ANN方法相结合,分别建立品牌和产地识别模型。结果表明:三维荧光与PLS-DA和BP-ANN方法相结合,构建的品牌和产地识别模型,所对应的品牌和产地识别率都能达到100%,识别效果很好。本方法同样可以满足更多类型的核桃油品牌和产地的识别。

猜你喜欢
降维产地光谱
基于三维Saab变换的高光谱图像压缩方法
混动成为降维打击的实力 东风风神皓极
基于3D-CNN的高光谱遥感图像分类算法
基于数据降维与聚类的车联网数据分析应用
推动产地农产品追溯进入下游流通消费环节
高光谱遥感成像技术的发展与展望
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
印尼燕窝产地探秘
降维打击
警惕“洗产地”暗礁