基于NACA和LS—SVM的蜂蜜真伪识别

2014-05-04 18:59梁秀英
湖北农业科学 2014年2期
关键词:蜂蜜径向蚂蚁

梁秀英

摘要:针对目前蜂蜜掺假严重且传统检测方法耗时等问题,研究了基于近红外光谱

关键词:蜂蜜;近红外光谱(NIR);小生境蚁群算法(NACA法);偏最小二乘支持向量机(LS-SVM)

中图分类号:S896.1;TS207.3 文献标识码:A 文章编号:0439-8114(2014)02-0430-04

Identification of Honey Authenticity based on LS-SVM and NACA

LIANG Xiu-ying

(College of Engineering,Huazhong Agricultural University, Wuhan 430070, China)

Abstract: As honey has become the target of adulteration with cheaper sweeteners and the traditional methods for detecting honey adulteration are time-consuming and inaccurate. A new detection method of honey authenticity based on near infrared spectroscopy(NIR) was developed. The grid method and the ant colony algorithm(NACA) method were compared to optimize partial least squares support vector machine(LS-SVM) model parameters of γ and σ2 with RBF kernel. The results showed that two optimization methods could make the LS-SVM model to achieve 100% correct identify rate, but NACA can get the optimization solution in shorter time than that of the grid method. Using the standard normal variate calibration(SNV) as honey spectral data pretreatment and spectral data compressed by the partial least squares(PLS), the LS-SVM model is constructed to distinguish between unadulterated honey and adulterated honey samples in the range of 5 303~6 591 cm-1, 7 012~10 001 cm-1 and full spectrum range, respectively. The results showed that the 100 percent identification can be achieved in the range of 5 303~6 591 cm-1 and 7 012~10 001 cm-1.

Key words: honey; near infrared spectroscopy(NIR); ant colony algorithm(NACA); partial least squares support vector machine(LS-SVM)

蜂蜜是一种天然营养食品,含有丰富的糖类、蛋白质、氨基酸、多种维生素和矿物质等营养物质,经现代医学临床应用证明,服用蜂蜜可促进消化吸收,增进食欲,镇静安眠,提高机体的免疫力[1,2]。根据国际仪器法典、欧盟蜂蜜标准等国际标准规定,蜂蜜中不允许添加任何物质,也不允许从蜂蜜中去除某些成分[3]。然而,近年来由于经济利益的驱使,在蜂蜜的生产、加工、销售过程中,往往被加入其他价格低廉的甜味物质,如果糖、工业糖浆等,这些都制约了我国蜂蜜的出口,严重影响了国内蜂农和消费者的利益。因此研究快速、准确的方法来鉴别蜂蜜真伪,对中国蜂业的健康发展具有重要意义。

蜂蜜的主要成分为糖类,其中60%~80%是人体容易吸收的葡萄糖和果糖。在蜂蜜中掺入廉价的果葡糖浆是目前国内市场上最常见的蜂蜜掺假手段之一,尽管糖浆与蜂蜜中的葡萄糖、果糖成分类似,且当添加量控制在一定范围内时,难以用感官和常规化学方法检出,但在品质和营养价值方面与纯蜂蜜差异很大。

近红外光谱(NIR)分析技术具有快速、非破坏、无污染、可在线测量[3]等优点,已广泛应用于医药、食品、农业等领域。

蚁群算法又称蚂蚁算法,是Marco 1992年提出的模拟进化算法,是一种求解组合最优化问题的新型通用启发式方法,该方法具有正反馈、分布式计算和富于建设性的启发式搜索的特点,目前已被成功应用于人工智能、交通等领域。但该算法易出现“早熟”现象,即搜索进行到一定程序后,所有个体所发现的解都完全一致,不利于发现更好的解[4]。NACA法具有较强的局部搜索能力,对蚁群算法后期进行局部搜索,可找到更优解。

偏最小二乘支持向量机(LS-SVM)是经典SVM改进后的算法,在解决小样本、非线性及高维数据上具有许多特有的优势;另外,LS-SVM能较好地解决近红外光谱建模时出现的过拟合、局部最小点等问题,模型的稳健性可得到较大的提高。但采用LS-SVM分析一些复杂的体系时,需要对LS-SVM的模型参数进行优化[5]。

本试验基于NIR对蜂蜜用果糖溶液掺假进行了定性分析。比较了NACA法与网格法等优化方法,并确定了NACA法为LS-SVM模型参数的最佳优化方法;在不同光谱区域将NACA法用于LS-SVM建模参数的优化,建立蜂蜜真伪的LS-SVM识别模型,并确定了最佳建模波段。

1 材料与方法

1.1 光谱采集仪器及方法

试验用真蜂蜜为华中农业大学的康思农蜂蜜,共3个品种,分别是野菊花、荆条、枣花蜜,共66个样品。

掺假用果糖溶液为盾皇品牌的调味糖浆,主要配料为果葡糖浆、纯净水、葡萄糖、添加剂等。由于部分蜂蜜存在结晶现象,因此在掺入果糖溶液之前先将蜂蜜搅拌均匀并置于45 ℃的水浴中,直至结晶完全溶化,再冷却。从溶解晶体后的真蜂蜜中任意取15个样品,每个样品都按果糖:蜂蜜(体积比)为1∶9、2∶8、3∶7、4∶6、5∶5的掺假量掺入果葡糖浆,共得到74个掺假样品。

试验采用赛默飞世尔科技公司生产的Antaris II傅里叶变换近红外(FT-NIR)光谱仪。样品采集方法如下:采用傅里叶透射方式采集蜂蜜光谱,附件为玻璃管,光程为6 mm,扫描谱区为4 000~10 001 cm-1,分辨率为8 cm-1,扫描次数为64次。每个样品测试3次光谱后取平均值,得到140个样品光谱数据。在样本总集中采用KS法抽取94个样本作为建模集,剩下46个样本成为测试集。光谱数据处理采用Matlab R2007b编程实现。

1.2 化学计量学分析方法

每个样品采集的光谱数据有1 557个变量,各变量之间存在多重相关性,会使所建模型与训练样本集产生“过拟合”,使预测的适应性反而大大下降[6]。因此要选择少而精的变量输入进行建模。首先采用偏最小二乘法(PLS法)将预处理后的光谱数据进行压缩,得到相应的可表征原始信息的特征向量,然后将特征向量作为LS-SVM的输入构造分类器[3],LS-SVM的参数σ2和γ采用NACA法来优化。

1.2.1 PLS法 PLS法利用对系统中的数据信息进行分解和筛选的方式,提取对因变量的解释性最强的综合变量,辨识系统中的信息与噪声,从而克服变量多重相关性在系统建模中的不良作用。与主成分法相比,PLS法压缩成的主成分所含信息更精确地表达了输入与输出之间的关系[7]。

1.2.2 实数编码的NACA法 NACA法的基本思路是随机产生n个蚂蚁的初始群体,使蚂蚁随机分布在函数的可行域上,根据优化函数计算每个蚂蚁的初始信息素,信息素与函数值呈正比,根据每个蚂蚁的当前信息素和全局最优信息素求出蚂蚁的转移概率,每个蚂蚁根据转移概率的大小来决定是进行局部寻优还是全局寻优,蚂蚁每移动到一个新位置前,都会比较新的位置是否能使信息素(函数值)增强或减弱,若增强,则移动到新位置,同时向环境释放新位置的信息素(与函数值呈正比),若减弱,则继续试探别的方向,根据转移概率更新每个蚂蚁的位置,新位置限制在函数可行域内,蚂蚁移动到新位置后就立即更新自己的信息素[4]。

1.2.3 NACA法的LS-SVM分类器优化 在LS-SVM中,常用的核函数有线性内核、多项式、径向基、Sigmoid型。线性内核只有在样本数据线性可分的情况下才能得到较好的分类效果,而径向基函数可以将非线性样本数据映射到高维特征空间,可处理具有非线性关系的样本数据;径向基函数取值要比多项式内核取值简单;而Sigmoid内核在实际应用中用得很少[8]。因此,本试验用径向基函数作为LS-SVM的核函数建立蜂蜜真伪识别模型。确定了核函数后,对训练效果影响最大的是相关参数的选择,采用径向基RBF核函数的LS-SVM的参数主要有两个:γ和σ2,其中γ是控制对错分样本惩罚程度的可调参数,σ2是径向基核函数的参数。本试验采用实数编码的NACA法优化γ和σ2,具体计算步骤描述如下。

1)随机产生蚂蚁的初始位置(限制在可行域内)。

2)计算每个蚂蚁的初始信息素(与目标函数值呈正比)。

5)保存每代最优解,在每次迭代过程中,将信息素最大的蚂蚁保存下来,返回第一步,进行迭代循环。

6)得到全局最优解。如果迭代次数满足开始设置的要求,则搜索完成,从而得到最佳蚂蚁,将最佳蚂蚁转换成LS-SVM参数γ和σ2。

3 结论

[1] CHEN L Z, XUE X F, YE Z H, et al. Determination of Chinese honey adulterated with high fructose corn syrup by near infrared spectroscopy[J]. Food Chemistry,2001,128(4):1110-1114.

[2] 杨 燕,聂鹏程,杨海清,等.基于可见-近红外光谱技术的蜜源快速识别方法[J].农业工程学报,2010,26(3):238-242.

[3] CAJKA T, HAJSLOVA J, PUDIL F, et al. Traceability of honey origin based on volatiles pattern processing by artificial neural networks[J]. Journal of Chromatography A,2009,1216(9):1458-1462.

[4] 李彦苍,索娟娟.基于熵的小生境蚁群算法及其应用[J].四川大学学报(工程科学版),2007,39(增刊):229-232.

[5] 程志颖,孔浩辉,张 俊,等.粒子群算法结合支持向量机回归法用于近红外光谱建模[J].分析测试学报,2010,29(12):1215-1219.

[6] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542.

[7] 齐小明,张录达,杜晓林,等.PLS-BP法近红外光谱定量分析研究[J].光谱学与光谱分析,2003,23(5):870-872.

[8] 赵杰文,呼怀平,邹小波.支持向量机在苹果分类的近红外光谱模型中的应用[J].农业工程学报,2007,23(4):149-152.

[9] 虞 科,程翼宇.一种基于最小二乘支持向量机算法的近红外光谱判别分析方法[J].分析化学研究简报,2006,34(4):561-564.

本试验基于NIR对蜂蜜用果糖溶液掺假进行了定性分析。比较了NACA法与网格法等优化方法,并确定了NACA法为LS-SVM模型参数的最佳优化方法;在不同光谱区域将NACA法用于LS-SVM建模参数的优化,建立蜂蜜真伪的LS-SVM识别模型,并确定了最佳建模波段。

1 材料与方法

1.1 光谱采集仪器及方法

试验用真蜂蜜为华中农业大学的康思农蜂蜜,共3个品种,分别是野菊花、荆条、枣花蜜,共66个样品。

掺假用果糖溶液为盾皇品牌的调味糖浆,主要配料为果葡糖浆、纯净水、葡萄糖、添加剂等。由于部分蜂蜜存在结晶现象,因此在掺入果糖溶液之前先将蜂蜜搅拌均匀并置于45 ℃的水浴中,直至结晶完全溶化,再冷却。从溶解晶体后的真蜂蜜中任意取15个样品,每个样品都按果糖:蜂蜜(体积比)为1∶9、2∶8、3∶7、4∶6、5∶5的掺假量掺入果葡糖浆,共得到74个掺假样品。

试验采用赛默飞世尔科技公司生产的Antaris II傅里叶变换近红外(FT-NIR)光谱仪。样品采集方法如下:采用傅里叶透射方式采集蜂蜜光谱,附件为玻璃管,光程为6 mm,扫描谱区为4 000~10 001 cm-1,分辨率为8 cm-1,扫描次数为64次。每个样品测试3次光谱后取平均值,得到140个样品光谱数据。在样本总集中采用KS法抽取94个样本作为建模集,剩下46个样本成为测试集。光谱数据处理采用Matlab R2007b编程实现。

1.2 化学计量学分析方法

每个样品采集的光谱数据有1 557个变量,各变量之间存在多重相关性,会使所建模型与训练样本集产生“过拟合”,使预测的适应性反而大大下降[6]。因此要选择少而精的变量输入进行建模。首先采用偏最小二乘法(PLS法)将预处理后的光谱数据进行压缩,得到相应的可表征原始信息的特征向量,然后将特征向量作为LS-SVM的输入构造分类器[3],LS-SVM的参数σ2和γ采用NACA法来优化。

1.2.1 PLS法 PLS法利用对系统中的数据信息进行分解和筛选的方式,提取对因变量的解释性最强的综合变量,辨识系统中的信息与噪声,从而克服变量多重相关性在系统建模中的不良作用。与主成分法相比,PLS法压缩成的主成分所含信息更精确地表达了输入与输出之间的关系[7]。

1.2.2 实数编码的NACA法 NACA法的基本思路是随机产生n个蚂蚁的初始群体,使蚂蚁随机分布在函数的可行域上,根据优化函数计算每个蚂蚁的初始信息素,信息素与函数值呈正比,根据每个蚂蚁的当前信息素和全局最优信息素求出蚂蚁的转移概率,每个蚂蚁根据转移概率的大小来决定是进行局部寻优还是全局寻优,蚂蚁每移动到一个新位置前,都会比较新的位置是否能使信息素(函数值)增强或减弱,若增强,则移动到新位置,同时向环境释放新位置的信息素(与函数值呈正比),若减弱,则继续试探别的方向,根据转移概率更新每个蚂蚁的位置,新位置限制在函数可行域内,蚂蚁移动到新位置后就立即更新自己的信息素[4]。

1.2.3 NACA法的LS-SVM分类器优化 在LS-SVM中,常用的核函数有线性内核、多项式、径向基、Sigmoid型。线性内核只有在样本数据线性可分的情况下才能得到较好的分类效果,而径向基函数可以将非线性样本数据映射到高维特征空间,可处理具有非线性关系的样本数据;径向基函数取值要比多项式内核取值简单;而Sigmoid内核在实际应用中用得很少[8]。因此,本试验用径向基函数作为LS-SVM的核函数建立蜂蜜真伪识别模型。确定了核函数后,对训练效果影响最大的是相关参数的选择,采用径向基RBF核函数的LS-SVM的参数主要有两个:γ和σ2,其中γ是控制对错分样本惩罚程度的可调参数,σ2是径向基核函数的参数。本试验采用实数编码的NACA法优化γ和σ2,具体计算步骤描述如下。

1)随机产生蚂蚁的初始位置(限制在可行域内)。

2)计算每个蚂蚁的初始信息素(与目标函数值呈正比)。

5)保存每代最优解,在每次迭代过程中,将信息素最大的蚂蚁保存下来,返回第一步,进行迭代循环。

6)得到全局最优解。如果迭代次数满足开始设置的要求,则搜索完成,从而得到最佳蚂蚁,将最佳蚂蚁转换成LS-SVM参数γ和σ2。

3 结论

[1] CHEN L Z, XUE X F, YE Z H, et al. Determination of Chinese honey adulterated with high fructose corn syrup by near infrared spectroscopy[J]. Food Chemistry,2001,128(4):1110-1114.

[2] 杨 燕,聂鹏程,杨海清,等.基于可见-近红外光谱技术的蜜源快速识别方法[J].农业工程学报,2010,26(3):238-242.

[3] CAJKA T, HAJSLOVA J, PUDIL F, et al. Traceability of honey origin based on volatiles pattern processing by artificial neural networks[J]. Journal of Chromatography A,2009,1216(9):1458-1462.

[4] 李彦苍,索娟娟.基于熵的小生境蚁群算法及其应用[J].四川大学学报(工程科学版),2007,39(增刊):229-232.

[5] 程志颖,孔浩辉,张 俊,等.粒子群算法结合支持向量机回归法用于近红外光谱建模[J].分析测试学报,2010,29(12):1215-1219.

[6] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542.

[7] 齐小明,张录达,杜晓林,等.PLS-BP法近红外光谱定量分析研究[J].光谱学与光谱分析,2003,23(5):870-872.

[8] 赵杰文,呼怀平,邹小波.支持向量机在苹果分类的近红外光谱模型中的应用[J].农业工程学报,2007,23(4):149-152.

[9] 虞 科,程翼宇.一种基于最小二乘支持向量机算法的近红外光谱判别分析方法[J].分析化学研究简报,2006,34(4):561-564.

本试验基于NIR对蜂蜜用果糖溶液掺假进行了定性分析。比较了NACA法与网格法等优化方法,并确定了NACA法为LS-SVM模型参数的最佳优化方法;在不同光谱区域将NACA法用于LS-SVM建模参数的优化,建立蜂蜜真伪的LS-SVM识别模型,并确定了最佳建模波段。

1 材料与方法

1.1 光谱采集仪器及方法

试验用真蜂蜜为华中农业大学的康思农蜂蜜,共3个品种,分别是野菊花、荆条、枣花蜜,共66个样品。

掺假用果糖溶液为盾皇品牌的调味糖浆,主要配料为果葡糖浆、纯净水、葡萄糖、添加剂等。由于部分蜂蜜存在结晶现象,因此在掺入果糖溶液之前先将蜂蜜搅拌均匀并置于45 ℃的水浴中,直至结晶完全溶化,再冷却。从溶解晶体后的真蜂蜜中任意取15个样品,每个样品都按果糖:蜂蜜(体积比)为1∶9、2∶8、3∶7、4∶6、5∶5的掺假量掺入果葡糖浆,共得到74个掺假样品。

试验采用赛默飞世尔科技公司生产的Antaris II傅里叶变换近红外(FT-NIR)光谱仪。样品采集方法如下:采用傅里叶透射方式采集蜂蜜光谱,附件为玻璃管,光程为6 mm,扫描谱区为4 000~10 001 cm-1,分辨率为8 cm-1,扫描次数为64次。每个样品测试3次光谱后取平均值,得到140个样品光谱数据。在样本总集中采用KS法抽取94个样本作为建模集,剩下46个样本成为测试集。光谱数据处理采用Matlab R2007b编程实现。

1.2 化学计量学分析方法

每个样品采集的光谱数据有1 557个变量,各变量之间存在多重相关性,会使所建模型与训练样本集产生“过拟合”,使预测的适应性反而大大下降[6]。因此要选择少而精的变量输入进行建模。首先采用偏最小二乘法(PLS法)将预处理后的光谱数据进行压缩,得到相应的可表征原始信息的特征向量,然后将特征向量作为LS-SVM的输入构造分类器[3],LS-SVM的参数σ2和γ采用NACA法来优化。

1.2.1 PLS法 PLS法利用对系统中的数据信息进行分解和筛选的方式,提取对因变量的解释性最强的综合变量,辨识系统中的信息与噪声,从而克服变量多重相关性在系统建模中的不良作用。与主成分法相比,PLS法压缩成的主成分所含信息更精确地表达了输入与输出之间的关系[7]。

1.2.2 实数编码的NACA法 NACA法的基本思路是随机产生n个蚂蚁的初始群体,使蚂蚁随机分布在函数的可行域上,根据优化函数计算每个蚂蚁的初始信息素,信息素与函数值呈正比,根据每个蚂蚁的当前信息素和全局最优信息素求出蚂蚁的转移概率,每个蚂蚁根据转移概率的大小来决定是进行局部寻优还是全局寻优,蚂蚁每移动到一个新位置前,都会比较新的位置是否能使信息素(函数值)增强或减弱,若增强,则移动到新位置,同时向环境释放新位置的信息素(与函数值呈正比),若减弱,则继续试探别的方向,根据转移概率更新每个蚂蚁的位置,新位置限制在函数可行域内,蚂蚁移动到新位置后就立即更新自己的信息素[4]。

1.2.3 NACA法的LS-SVM分类器优化 在LS-SVM中,常用的核函数有线性内核、多项式、径向基、Sigmoid型。线性内核只有在样本数据线性可分的情况下才能得到较好的分类效果,而径向基函数可以将非线性样本数据映射到高维特征空间,可处理具有非线性关系的样本数据;径向基函数取值要比多项式内核取值简单;而Sigmoid内核在实际应用中用得很少[8]。因此,本试验用径向基函数作为LS-SVM的核函数建立蜂蜜真伪识别模型。确定了核函数后,对训练效果影响最大的是相关参数的选择,采用径向基RBF核函数的LS-SVM的参数主要有两个:γ和σ2,其中γ是控制对错分样本惩罚程度的可调参数,σ2是径向基核函数的参数。本试验采用实数编码的NACA法优化γ和σ2,具体计算步骤描述如下。

1)随机产生蚂蚁的初始位置(限制在可行域内)。

2)计算每个蚂蚁的初始信息素(与目标函数值呈正比)。

5)保存每代最优解,在每次迭代过程中,将信息素最大的蚂蚁保存下来,返回第一步,进行迭代循环。

6)得到全局最优解。如果迭代次数满足开始设置的要求,则搜索完成,从而得到最佳蚂蚁,将最佳蚂蚁转换成LS-SVM参数γ和σ2。

3 结论

[1] CHEN L Z, XUE X F, YE Z H, et al. Determination of Chinese honey adulterated with high fructose corn syrup by near infrared spectroscopy[J]. Food Chemistry,2001,128(4):1110-1114.

[2] 杨 燕,聂鹏程,杨海清,等.基于可见-近红外光谱技术的蜜源快速识别方法[J].农业工程学报,2010,26(3):238-242.

[3] CAJKA T, HAJSLOVA J, PUDIL F, et al. Traceability of honey origin based on volatiles pattern processing by artificial neural networks[J]. Journal of Chromatography A,2009,1216(9):1458-1462.

[4] 李彦苍,索娟娟.基于熵的小生境蚁群算法及其应用[J].四川大学学报(工程科学版),2007,39(增刊):229-232.

[5] 程志颖,孔浩辉,张 俊,等.粒子群算法结合支持向量机回归法用于近红外光谱建模[J].分析测试学报,2010,29(12):1215-1219.

[6] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542.

[7] 齐小明,张录达,杜晓林,等.PLS-BP法近红外光谱定量分析研究[J].光谱学与光谱分析,2003,23(5):870-872.

[8] 赵杰文,呼怀平,邹小波.支持向量机在苹果分类的近红外光谱模型中的应用[J].农业工程学报,2007,23(4):149-152.

[9] 虞 科,程翼宇.一种基于最小二乘支持向量机算法的近红外光谱判别分析方法[J].分析化学研究简报,2006,34(4):561-564.

猜你喜欢
蜂蜜径向蚂蚁
浅探径向连接体的圆周运动
RN上一类Kirchhoff型方程径向对称正解的存在性
基于PID+前馈的3MN径向锻造机控制系统的研究
一类无穷下级整函数的Julia集的径向分布
爱是一捧浓浓的蜂蜜
蜂蜜,你真的了解吗
“蜂蜜”CP
蜂蜜哪里去了
我们会“隐身”让蚂蚁来保护自己
蚂蚁