近红外光谱结合蚁群算法检测花茶花青素含量

2014-12-23 07:14黄晓玮邹小波赵杰文石吉勇张小磊
关键词:花茶花青素区间

黄晓玮,邹小波,赵杰文,石吉勇,张小磊

(江苏大学食品与生物工程学院,江苏镇江212013)

花茶在中国具有悠久的历史,是一种独特的茶叶品种,如玫瑰花茶、洛神花花茶、月季花茶等等.花茶不仅仅味道芳香,而且花茶中含有的花青素有较强的保健作用.花青素又称花色素,是一类广泛存在于植物中的水溶性天然色素,属花青素类化合物,其抗自由基氧化能力为维生素E的50倍、维生素C的20倍,另外花青素还具有抗炎症、抑制肿瘤、抗诱变、皮肤保健、改善微循环、保护脑和脊髓神经、抑制酶活性、抗病毒抗真菌、抗溃疡、促进毛发生长、减肥等很多功效,因此花青素含量可作为衡量花茶质量的重要指标[1-3].目前花青素含量的常规检测方法主要有分光光度计检测法、高效液相色谱法(HPLC),这些方法检测结果准确,但是费时、费力,消耗大量化学试剂,运行和维护的成本较高,不利于大样本的快速检测[3-5].

近红外光谱法(near infrared spectroscopy,NIR)是一种快速无损的检测方法,随着计算机软件技术的发展,其在石油、医药、农产品等的检测上显示出了巨大的潜力[6-11],因此本研究用近红外光谱方法检测花茶花青素含量.由于样本成分的复杂性和相干性,在对样品近红外光谱数据建立预测模型时,为了减小运算时间、剔除噪声过大的谱区,需要确定组分的特征谱区[12-14].此外优选特征谱区也具有一定实际运用价值,因为工程应用中的滤光片和LED光源都有一定的带宽,优选到的特征谱区可以为挑选合适的滤光片和LED光源提供参考.

国内外学者对近红外光谱特征波长选择方法的研究有很多,文献[15]中有详细介绍,每种方法均有各自的优劣[16-17].例如,目前比较常用的光谱信息提取方法有区间偏最小二乘法(interval partial least squares,iPLS),该方法虽然能有效提取光谱中与特定组分最相关的谱区,但建模时光谱区间的挑选方法比较单一,往往只考察单个子区间或者少数几个子区间,使得挑选出来的子区间不能很好地表征光谱的特征信息,难以保证模型具有最佳的预测效果.

蚁群算法(ant colony optimization,ACO)是近年来发展起来的一种优化算法,它是模仿蚂蚁觅食方式的一种启发式算法[18],但利用蚁群算法来优化选择光谱区间的研究报道较少.本研究将ACO和iPLS相结合来优选光谱区间,发挥各自的长处,既发挥ACO的鲁棒性和分布式计算特性的能力,又利用iPLS去除变量之间的共线性能力,提高模型的精度和预测能力.

1 ACO-iPLS基本原理

研究发现,蚂蚁在其觅食路上会留下一种被称为信息素的物质,并且在搜寻的过程中能够感知出信息素的存在及强度,以此作为其选择路径的参考.蚂蚁在觅食过程中,通常朝着信息素强度大的方向运动,某一条路经过的蚂蚁越多、信息素便越强、后来者选择该路径的概率也就越大.此外,信息素还会挥发,路径越长、时间越长,信息素挥发得愈多,信息素的强度就越小.信息素的累积和挥发的总和成为信息交流的媒体.相互协作的蚁群就是通过这种信息正反馈原理来完成最佳路径搜寻的.

图1是ACO-iPLS的流程图.

图1 ACO-iPLS优选光谱区间的流程图

假设将光谱分为m个区间,有k只蚂蚁来进行优化.其算法简要介绍如下:

1)信息素含量初始化.每个区间拥有相同的信息素含量,τi(0)=ø(i=1,2,…,m).

2)解的选择.每只蚂蚁基于概率函数选取特征区间,最简单有效的概率选择方法为

其中:τi(t)是区间i在时间t时所拥有的信息素含量.这一选择过程简要描述如下:① 多个区间的选择概率和通过公式accu(i)=accu(i-1)+P(i)来计算,其中accu(0)=0,当然accu(m)=1(m是所有区间总数);② 产生一个 (0,1)之间的随机变量,如果这个随机变量在accu(i-1)和accu(i)之间,则第i个区间入选.这种选择方法广泛用于遗传算法中,显然,光谱区间拥有的信息素量越多就越容易被选到,可以通过权重函数来调整各个区间的选择概率.

3)解的计分评价.建立一个标准或客观函数来评价多得的解.本研究中基于已选区间上的iPLS模型预测精度作为每只蚂蚁所选区间的评价参数,即模型的预测均方根误差RMSEP的倒数作为评价函数.

4)信息素含量的更新.每个区间的信息素含量的更新通过以下公式计算:

其中:i为第i个光谱区间;r为区间信息素含量遗留率,对应信息素含量挥发率e(r=1-e),r为(0,1)之间的常数;Δτi(t)为信息素含量的增长值,它与每只蚂蚁在所选区间上建立的iPLS模型精度成正比,即建立在该区间上的模型精度越高则信息素含量越多.在整个选择过程中,信息素含量的挥发率可以通过预先设定的挥发率e来获得.

重复以上2)到4)步中k个蚂蚁的“选择”、“计分评价”和“更新”这一迭代过程,最终通过一定数量的迭代后,理论上所有蚂蚁都会收敛到相同的区间变量上,从而得到最佳光谱区间.更多有关ACO的算法请参考文献[19-21].

2 材料与方法

2.1 试验材料与仪器设备

从超市购买6种花茶(山茶花茶、洛神花花茶、月季花茶、玫瑰花茶、康乃馨花茶、勿忘我花茶),每种花茶分别用粉碎机粉碎,并过40目筛,然后按照四分法原则,随机称取2 g左右的粉末作为一个样本,每种花茶取10个平行样本,6种花茶共60个样本.

设备包括AntarisⅡ型傅里叶变换近红外光谱仪(美国赛默飞世尔公司);UV-1601型紫外分光光度计.

2.2 光谱采集及预处理

本试验采用InGaAs检测器,波数范围10 000~4 000 cm-1,扫描次数为32次;分辨率为8 cm-1,波数间隔为3.853 6 cm-1,每条光谱包含有1 557个变量.数据采集过程中,室内湿度保持基本不变,温度保持在25℃左右.由于花茶粉末为不透明颗粒,所以试验采用积分球的漫反射式采样方式,每个样本扫描一次后将样品池旋转120°,共扫描3次,取其平均光谱作为该样本的原始光谱,如图2所示.

图2 花茶原始光谱图

2.3 花青素含量的测定

采用pH试差法测定花茶中花青素的含量,具体方法如下:准确称取2 g花茶粉末,加入100 mL含有1 mol·L-1柠檬酸的70%乙醇溶液,放入60℃水浴锅中浸提4 h后,经真空抽滤,60℃旋转蒸发10 min,取0.5 mL浓缩后的溶液于2个50 mL容量瓶中,分别用pH值为1的盐酸缓冲液和pH为4.5的醋酸钠缓冲液定容至刻度线,分别静置50 min和80 min,用分光光度计在513 nm和730 nm下测定吸光度值,花青素质量分数的计算公式为[22]

其中:A为吸光度,A=(A513pH1.0-A700pH1.0)-(A513pH4.5-A700pH4.5);DF为稀释因子;ε 为矢车菊花青素-3-葡萄糖普的消光系数,26 900;MW为矢车菊花青素-3-葡萄糖普的相对分子质量,449.4;V为最终体积,mL;Wt为产品质量,mg;L为光程,1 cm.

3 结果与讨论

3.1 检测原始数据和光谱预处理

60个样本花茶中的花青素含量统计结果如表1所示,花青素质量分数为 0.175 9~1.603 6 mg·g-1,每种花茶随机选择其中6个样本作为校正集,4个样本作为预测集,校正集共36个样本,预测集共24个样本.

试验中花茶样本颗粒的粒径大小和样本的密实度不可能完全一致,将会影响到光在固体颗粒内的漫反射.因而,需要对样本的原始光谱数据进行预处理,本试验采用SNV预处理.SNV首先从原光谱中减去该条光谱的平均值,再除以标准偏差,主要用于消除由于样品颗粒大小不均匀和密实度不一样对光谱的影响[16,23-25],预处理后的光谱图如图3所示.

图3 经SNV预处理后的花茶光谱图

表1 花茶样本花青素质量分数实测值

3.2 ACO-iPLS选择特征子区间

花茶粉末近红外光谱不仅包含了花青素信息,还包含了除花青素以外的组分信息.同时,由于花青素在近红外光谱的多个波长处有吸收,且近红外光谱的谱峰较宽,致使近红外光谱在1个波长处有多个谱峰重叠,难以确定花青素特征子区间宽度.为了使ACO-iPLS准确定位包含花青素特征波长的子区间,需要对子区间划分总数进行优化.

ACO-iPLS通过选择光谱子区间宽度、蚂蚁数、迭代次数、PLS模型变量数来选择最佳光谱区间进行建模.目标函数是判断种群中个体优劣和群体优化程度的标准,选择1个合适的目标函数可以加速算法收敛,提高计算精度.目标函数包括方差、标准差等.试验结果表明,选择均方差作为目标函数能够较快地收敛,因此文中选择了均方根误差作为目标函数.

将预处理后的光谱数据划分为m个子区间,m的取值范围为10~30.当m取不同值时,采用ACO-iPLS选择的特征子区间如表2所示.

表2 ACO-iPLS子区间优选结果

从表2中可以看出,当光谱划分为12(即m=12)时,对应的交互验证均方根误差(RMESCV)最小,选择窗口宽带为122 cm-1,每个光谱子区间对所建模型的权重系数是不相同的,如图4所示.

图4 ACO-iPLS光谱区间选择

选择权重系数≥0.3的子区间进行建模,满足上述条件的共有3个子区间:第1子区间(系数为1.00);第9子区间(系数为0.81);第10子区间(系数为1.00),这3个子区间对应的光谱范围分别为4 000 ~4 466,7 764 ~8 231,8 235 ~8 701 cm-1.在上述3个子区间的基础上,用iPLS建模,将所选光谱区间集合划分为25个子区间时,模型的预测精度和计算效率最高,校正集预测值和实测值之间的相关系数为0.901 3;预测集预测值和实测值之间的相关系数为0.864 2,其RMSECV和RMSEP分别为0.160 0和0.202 0 mg·g-1,如图5 所示.

图5 ACO-iPLS最佳模型的预测值与实测值之间的关系

3.3 模型比较

为了对建模效果进行比较,分别对PLS、iPLS进行建模,结果如表3所示.从表3中可以看出,ACO-iPLS建模波数变量数为366个,而PLS模型和iPLS模型需要的波数变量数分别 1 557个和86个,ACO-iPLS模型的精度要优于其他2个模型(虽然预测集的R值稍低,但RMSEP值较小,表明模型对外部样本的预测能力较高);iPLS建模只需一个光谱区间,较ACO-iPLS建模所需的少,但是模型的精度和预测能力较ACO-iPLS有一定的差距.

表3 不同谱区筛选的模型的结果

4 结论

本研究利用ACO-iPLS对花茶粉末近红外光谱优选出3个花青素对应的特征子区间,并结合花青素含量值建立了光谱模型.对应的RMSECV和RMSEP分别为 0.160 0 mg·g-1和 0.202 0 mg·g-1,校正集和预测集相关系数为0.901 3和0.864 2.研究结果充分表明,同全光谱PLS模型、iPLS模型相比,ACO-iPLS极大地减少了建模所需的波数点,降低了模型复杂度,同时明显提高了模型的预测精度和计算效率,为近红外光谱技术的在线运用提供了一套建模解决方案.

References)

[1]方世辉,徐国谦,夏 涛,等.花茶窨制中几个主要因子对花茶香气的影响[J].安徽农业大学学报,2004,31(4):440-445.Fang Shihui,Xu Guoqian,Xia Tao,et al.Influences of main factors on the aroma of flowering teas[J].Journal of Anhui Agricultural University,2004,31(4):440-445.(in Chinese)

[2]陈 健,孙爱东,高雪娟,等.蓝莓花青素的提取及抗氧化性的研究[J].北京林业大学学报,2011,33(2):126-129.Chen Jian,Sun Aidong,Gao Xuejuan,et al.Extraction and antioxidation of anthocyanins from blueberry[J].Journal of Beijing Forestry University,2011,33(2):126-129.(in Chinese)

[3]Sarma Annamraju D,Sreelakshmi Yellamraju,Sharma Rameshwar.Antioxidant ability of anthocyanins against ascorbic acid oxidation[J].Phytochemistry,1997,45(4):671-674.

[4]李凤英,崔蕊静,郑立红,等.植物中原花青素含量的分析测定[J].食品与发酵工业,2004,30(5):147-149.Li Fengying,Cui Ruijing,Zheng Lihong,et al.Study on deter mination of contents of proanthocyanidins in plants[J].Food and Fermentation Industries,2004,30(5):147-149.(in Chinese)

[5]Patil Ganapathi,Madhusudhan M C,Ravindra Babu B,et al.Extraction,dealcoholization and concentration of anthocyanin from red radish[J].Chemical Engineering and Processing:Process Intensification,2009,48(1):364-369.

[6]李 刚,赵 静,李家星,等.可见-近红外反射光谱用于疾病快速筛查[J].光学学报,doi:10.3788/AOS201131.0317001.Li Gang,Zhao Jing,Li Jiaxing,et al.Visible-Infrared reflectance spectroscopy applied in rapid screen of diseases[J].ActaOpticaSinica, doi:10. 3788/AOS201131.0317001.(in Chinese)

[7]郭伟良,王 丹,宋 佳,等.近红外光谱法同时快速定量分析蛹虫草菌丝体中4种有效成分[J].光学学报,doi:10.3788/AOS201131.0230002.Guo Weiliang,Wang Dan,Song Jia,et al.Simultaneous and rapid quantitative analysis of four components in cordyceps militaris mycelium powder using near infrared spectroscopy[J].Acta Optica Sinica,doi:10.3788/AOS201131.0230002.(in Chinese)

[8]张海红,张淑娟,王凤花,等.应用可见-近红外光谱快速识别沙棘汁品牌[J].光学学报,2010,30(2):574-578.Zhang Haihong,Zhang Shujuan,Wang Fenghua,et al.Study on fast discrimination of seabuckthorn juice varieties using visible-nir spectroscopy[J].Acta Optica Sinica,2010,30(2):574-578.(in Chinese)

[9]聂黎行,王钢力,李志猛,等.近红外光谱法在中药生产过程分析中的应用[J].光学学报,2009,29(2):541-547.Nie Lixing,Wang Gangli,Li Zhimeng,et al.Application of near infrared spectroscopy in process analysis of TCM manufacturing[J].Acta Optica Sinica,2009,29(2):541-547.(in Chinese)

[10]周子立,蒋璐璐,谈黎虹,等.基于光谱技术鉴别机油品种的新方法[J].光学学报,2009,29(8):2203-2207.Zhou Zili,Jiang Lulu,Tan Lihong,et al.Discrimination of oil varieties by using near infrared spectral technology[J].Acta Optica Sinica,2009,29(8):2203-2207.(in Chinese)

[11]赵建华,赵崇文,魏周君,等.基于近红外光谱技术的多组分毒性气体检测研究[J].光学学报,2010,30(2):567-573.Zhao Jianhua,Zhao Chongwen,Wei Zhoujun,et al.Study on monitoring multi-component toxic gases based on near-infrared spectroscopic method[J].Acta Optica Sinica,2010,30(2):567-573.(in Chinese)

[12]石吉勇,邹小波,赵杰文,等.BiPLS结合模拟退火算法的近红外光谱特征波长选择研究[J].红外与毫米波学报,2011,30(5):458-462.Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Selection of wavelength for strawberry NIR spectroscopy based on BiPLS combined with SAA[J].Journal of Infrared and MillimeterWaves,2011,30(5):458-462.(in Chinese)

[13]孙旭东,章海亮,欧阳爱国,等.南丰蜜桔可溶性固形物近红外特征波段选择[J].农业机械学报,2009,40(7):129-132.Sun Xudong,Zhang Hailiang,Ouyang Aiguo,et al.Selection of NIR characteristic wavelength bands for soluble solids content in nanfeng mandarin fruit[J].Transactions of the Chinese Society for Agricultural Machinery,2009,40(7):129-132.(in Chinese)

[14]Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Near infrared quantitative analysis of total flavonoid content in fresh Ginkgo biloba leaves based on different wavelength region selection methods and partial least squares regression[J].Journal of Near Infrared Spectroscopy,2012,20(2):295-305.

[15]Zou Xiaobo,Zhao Jiewen,Povey Malcolm J W,et al.Variables selection methods in near-infrared spectroscopy[J].Analytica Chimica Acta,2010,667(1/2):14-32.

[16]Chen Quansheng,Jiang Pei,Zhao Jiewen.Measurement of total flavone content in snow lotus(Saussurea involucrate)using near infrared spectroscopy combined with interval PLS and genetic algorithm[J].Spectrochimica Acta Part A-Molecular and Biomolecular Spectroscopy,2010,76(1):50-55.

[17]Zou Xiaobo,Zhao Jiewen,Huang Xingyi,et al.Use of FT-NIR spectrometry in non-invasive measurements of soluble solid contents(SSC)of'Fuji'apple based on different PLS models[J].Chemometrics and Intelligent Laboratory Systems,2007,87(1):43-51.

[18]Franco Allegrini,Alejandro Olivieri C.A new and efficient variable selection algorithm based on ant colony optimization.Applications to near infrared spectroscopy/partial least-squares analysis[J].Analytica Chimica Acta,2011,699(1):18-25.

[19]刘甲林.基于改进蚁群算法的油品调和配方优化研究[D].大连:大连理工大学电气工程学院,2011.

[20]郭 亮,吉海彦.蚁群算法在近红外光谱定量分析中的应用研究[J].光谱学与光谱分析,2007,27(9):1703-1705.Guo Liang,Ji Haiyan.Application study of ant colony algorithm in near infrared spectroscopy quantitative analysis[J].Spectroscopy and Spectral Analysis,2007,27(9):1703-1705.(in Chinese)

[21]朱 峰,陈 莉.蚁群与遗传算法融合的聚类算法研究[J].西北大学学报:自然科学版,2009,39(5):745-749.(5):601-605.Zhang Zhe,Liu Dengying.Non-Fourier effects in rapid transient heat conduction in a spherical medium[J].Journal of Engineering Thermophysics,1998,19(5):601-605.(in Chinese)

[2]Moosaie A.Non-Fourier heat conduction in a finite medium with insulated boundaries and arbitrary initial conditions[J].International Communications in Heat and Mass Transfer,2008,35(1):103-111.

[3]Lord H M,Shulman Y.A generalized dynamical theory of thermoelasticity[J].Journal of the Mechanics and Physics of Solids,1967,15(5):299-309.

[4]Green A E,Lindsay K A.Thermoelasticity[J].Journal of Elasticity,1972,2(1):1-7.

[5]Green A E,Naghdi P M.Thermoelasticity without energy dissipation[J].Journal of Elasticity,1993,31(3):189-208.

[6]Huang H M,Su F,Sun Y.Thermal shock of semi-infinite body with multi-pulsed intense laser radiation[J].Acta Mechanica Solida Sinica,2010,23(2):175-180.

[7]Yilbas B S,Al-Aqeel N.Analytical investigation into laser pulse heating and thermal stresses[J].Optics and Laser Technology,2009,41(2):132-139.

[8]王颖泽,张小兵,葛风华.急速热冲击作用下实心球体的热弹性响应分析[J].江苏大学学报:自然科学版,2012,33(4):414-419.Wang Yingze,Zhang Xiaobing,Ge Fenghua.Thermoelastic response of a solid sphere under transient thermal shock[J].Journal of Jiangsu University:Natural Science Edition,2012,33(4):414-419.(in Chinese)[9]Tian X G,Shen Y P.Study on generalized magnetothermoelastic problems by FEM in time domain[J].Acta Mech Sinica,2005,21(4):380-387.

[10]Wang X,Xu X.Thermoelastic wave induced by pulsed laser heating[J].Applied Physics A:Materials Science and Processing,2001,73(1):107-114.

[11]Bagri A,Eslami M R.A unified generalized thermoelasticity solution for cylinders and spheres[J].International Journal of Mechanical Sciences,2007,49(12):1325-1335.

[12]Wang Y Z,Zhang X B,Song X N.A unified generalized thermoelasticity solution for the transient thermal shock problem[J].Acta Mechanica,2012,223(4):735-743.

[13]王洪钢.热弹性力学概论[M].北京:清华大学出版社,1989.

猜你喜欢
花茶花青素区间
你学会“区间测速”了吗
全球经济将继续处于低速增长区间
原花青素B2通过Akt/FoxO4通路拮抗内皮细胞衰老的实验研究
柠檬花茶窨制试验初探
花青素对非小细胞肺癌组织细胞GST-π表达的影响
花茶
山楸梅浆果中花青素提取方法的优化和测定
区间对象族的可镇定性分析
原花青素对脑缺血再灌注损伤后肠道功能的保护作用
花茶