基于近红外特征变量筛选对火麻油掺杂的快速检测

2018-07-11 03:30陈元胜汪少芸付才力
关键词:玉米油麻油葵花籽

李 颖, 陈元胜, 吕 靓, 汪少芸, 王 武, 付才力

(1.福州大学生物科学与工程学院, 福建 福州 350116; 2.福州大学电气工程与自动化学院, 福建 福州 350116; 3.福建省医疗器械和医药技术重点实验室, 福建 福州 350002)

0 引言

火麻(CannabissativaL.)含有丰富的蛋白质、 碳水化合物、 油类以及各种矿物质, 其主要功能成分火麻油又称“长寿油”.火麻油中多不饱和脂肪酸含量高达76%~82%, 尤其是富含α-亚麻酸和γ-亚油酸,是昂贵的健康型食用油和高档化妆品基料[1-2].长期食用火麻油不仅补充人体所需的不饱和脂肪酸、 卵磷脂、 维生素及钙、 铁矿物, 而且火麻油具有抗肿瘤、 抗衰老和降低胆固醇和高血压等功效[3].目前, 市场上销售的食用油品质不一, 为降低生产成本、 提高销售利润, 通过低附加值的油料以次充好是不良商贩获利的主要手段.常用的掺杂物质是价格较低的大豆油、 花生油、 玉米油以及葵花籽油等, 这不仅大大降低油脂的营养价值, 并且损害企业和消费者的权益.因此, 对高附加值油料的掺杂进行定量检测显得尤为重要.

常用油脂掺假检测方法主要包括气相色谱法、 高效液相色谱法、 原子吸收光谱法和质谱法等, 测定准确度较高, 但存在样品需预处理、 耗时长、 操作复杂等不足.近红外光谱(near infrared spectrum, NIRs)主要检测有机物中含氢基团(—CH, —OH, —NH, —SH)在近红外光照射下分子振动组合频与倍频的吸收, 具有快速、 高效、 无损等优点.近年来, 近红外光谱已在鉴别食品掺杂问题上得到广泛应用, 如有效分析橄榄油、 芝麻油、 山茶油、 核桃油等油品的掺假情况[4-6].

由于近红外仪器的高分辨率, 光谱变量含有大量冗余信息, 不仅降低模型准确性和传递的稳定性, 而且增加仪器的成本.从近红外光谱中含有的大量光谱变量中提取特征变量, 有利于提高分析模型的传递性、 稳定性、 准确性, 更有利于近红外便携专用检测仪开发.

本研究利用NIRs对掺杂大豆油、 花生油、 葵花籽油和玉米油的火麻油进行鉴定, 通过偏最小二乘法(PLS)回归模型和最小二乘支持向量机(LS-SVM)模型建立定量分析, 结合连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取光谱的特征变量, 简化预测模型, 为油脂掺杂提供一种快速检测的定量分析模型.

1 实验部分

1.1 样品制备

实验所用火麻油由江苏苏州八马饮品有限公司提供, 为鲜榨纯火麻油.玉米油、 花油、 大豆油和葵花籽油购于福州永辉超市.实验配制一系列掺有玉米油、 大豆油、 葵花籽油和花生油的火麻油样品, 总体积均为200 mL, 掺入各类油品的体积分别为5、 10、 15、 20、 25、 30、 35、 40、 45、 50、 55、 60、 65、 70、 75、 80、 85、 90、 95、 100、 110、 120、 130、 140、 150、 160、 170、 180、 190、 200 mL, 充分振荡摇匀.每个样品平行3次, 依次扫描光谱, 并随机划分校正集和预测集.

1.2 光谱数据的采集

采用配有高灵敏度InGaAs检测器、 积分球采样系统以及内置自动金箔背景采集方式的ANTARISⅡ型傅里叶变换近红外光谱分析仪(德国Thermo公司)采集样品光谱集合.光谱分辨率为8 cm-1, 扫描波段范围为4 000~10 000 cm-1, 平均扫描次数为32次.以空白采集作为测量背景, 用一次性滴管取适量火麻油样品置于比色管中, 设置仪器流程参数, 在室温25 ℃、 空气湿度60%条件下测定火麻油样品的近红外图谱.每个样品采集3条光谱, 运用Matlab程序(R2016a)对所得样品的近红外光谱数据集合进行分析处理.

1.3 模型建立及特征变量筛选

偏最小二乘(PLS)回归是最常用的定量分析方法, 通过主成分分析与多元线性分析的有机结合, 实现回归建模和数据结构简化[7].支持向量机(SVM)是一种有监督的学习模型, 主要根据统计学习理论中的VC维理论和结构风险最小原理构建, 通过利用有限的样本信息在模型复杂性和学习能力之间寻找最佳折中, 可适用于定性分类识别以及定量组分分析[8].最小二乘支持向量机(LS-SVM)是在PLS和SVM基础上构建的, 通过结合PLS和SVM的优势, 降低模型运行时的复杂程度, 同时提高LS-SVM模型的泛化能力[9].

在建模的过程中, 由于近红外光谱变量中含有大量冗余信息, 有效信息弱并且带有相关噪声, 不仅增加计算的复杂和模型的复杂度, 还影响模型的预测能力, 降低模型传递的准确性.当相关性不强的变量过多时, 从大量的光谱变量中提取出对建模有用的特征变量, 有利于增强模型的相关性, 提高分析模型的拟合效果以及模型的稳定性.研究分别采用连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取近红外光谱的特征变量.SPA的原理是根据投影分析, 使光谱特征变量的共线性最小[10-11].CARS的原理是根据达尔文的适者生存, 将每个光谱变量作为一个个体, 根据自适应重加权采样技术搜寻最优变量组合, 算法具体流程参见文献[12-13].

2 结果与讨论

2.1 光谱分析

图1 火麻油样本的近红外光谱图  Fig.1 NIR spectra of hemp seed oil

采集掺杂大豆油、 花生油、 葵花籽油和玉米油的火麻油近红外光谱图, 如图1所示.其中, 脂肪烃C—H的一级倍频在5 800~6 000 cm-1附近, 二级倍频在8 200 cm-1附近, 脂肪酸O—H的一级倍频在6 800~7 050 cm-1附近[14], 从图1可以看出不同种类油品的原始光谱图相似度高.

2.2 基于PLS模型的特征变量选择

表1 不同火麻油样品的PLS模型效果

图2是大豆油样品利用SPA和CARS两种算法提取的特征变量, 从模型所含的变量数看, SPA和CARS提取的变量数目分别是29和5.其中, SPA-PLS模型提取的波数点分别是3 999、 4 003、 4 007、 4 011、 4 015、 4 018、 4 022、 4 026、 4 030、 4 034、 4 038、 4 045、 4 049、 4 057、 4 069、 4 076、 4 080、 4 084、 4 088、 4 099、 4 416、 4 427、 4 655、 5 272、 5 411、 5 689、 5 762、 5 816、 9 075 cm-1, CARS-PLS模型提取的波数点分别是4 015、 4 153、 5 804、 5 839、 5 843 cm-1, 相比于原始光谱1 557个特征变量, 变量数均大大减少.并且, 从模型的精度上看(见表2), SPA-PLS模型和CARS-PLS模型的预测集和校正集精度均比原始的PLS模型高.

图2 大豆油PLS回归模型提取的特征变量Fig.2 Selected variables for the PLS model of soybean oil

掺杂类型模型变量数校正集R2cRMSEC预测集R2pRMSEP大豆油PLS15570.99520.10350.92670.3561SPA-PLS290.99560.09960.95130.3004CARS-PLS50.99470.10830.97290.2425花生油PLS15570.97180.24390.73850.7331SPA-PLS290.93390.35770.90530.4309CARS-PLS70.94230.37710.95330.3385葵花籽油PLS15570.95550.30060.80090.5158SPA-PLS290.90700.41240.82460.6110CARS-PLS130.99720.07850.96780.3244玉米油PLS15570.77680.56620.62250.6498SPA-PLS290.91980.38810.90970.4785CARS-PLS50.93560.35370.91000.3887

2.3 基于LS-SVM模型的特征变量选择

表3 不同火麻油样品的LS-SVM模型效果

为提高模型的准确性, 利用SPA和CARS算法提取特征变量.以大豆油样品为例, 图3是大豆油利用上述两种算法提取的特征变量.从模型所含的变量数看, SPA和CARS提取的特征变量数目分别是29和8, 相比于原始光谱1 557个特征变量, 变量数大大减少.SPA-LS-SVM模型提取的波数点分别是3 999、 4 003、 4 007、 4 011、 4 015、 4 018、 4 022、 4 026、 4 030、 4 034、 4 038、 4 045、 4 049、 4 057、 4 069、 4 076、 4 080、 4 084、 4 088、 4 099、 4 416、 4 427、 4 655、 5 272、 5 411、 5 689、 5 762、 5 816、 9 075 cm-1, CARS- LS-SVM模型提取的波数点分别是4 015、 4 022、 4 045、 4 103、 4 153、 5 804、 5 812和5 839 cm-1.从模型的精度上看(见表4), 大豆油样品的SPA-LS-SVM模型的精度略下降, 而CARS- LS-SVM模型的精度确有较大提高.对比这两者的特征变量数, CARS进一步降低SPA提取的特征变量数, 并引入新的特征变量, 建模效果优于SPA.

掺杂类型模型变量数校正集R2cRMSEC预测集R2pRMSEP大豆油SVM15570.98420.17250.95040.2921SPA-SVM290.98790.15280.93570.3484CARS-SVM80.99490.10360.98210.1962花生油SVM15570.97580.22740.90580.4080SPA-SVM290.96670.24310.86160.4617CARS-SVM120.97610.22110.90750.4120葵花籽油SVM15570.93940.31560.85740.4690SPA-SVM290.95340.28260.85030.4681CARS-SVM460.99510.10210.95870.3204玉米油SVM15570.92850.35730.76730.5396SPA-SVM290.91630.37180.82930.4642CARS-SVM100.95790.28420.92490.3845

3 结语

猜你喜欢
玉米油麻油葵花籽
葵花籽休闲食品生产技术方案
玉米油精炼加工过程中营养及风险指标的探索
朱德庸漫画
葵花籽,摆一摆
天然抗氧化剂对冷榨火麻油保质期的影响
麻油拌菠菜治疗便秘
神奇的火麻油
湿法消解-石墨炉原子吸收光谱法测定玉米油中的铅
α-及γ-生育酚对玉米油回色的影响
“我的葵花籽”