采用近红外光谱定量分析葡萄酒发酵液中总酸含量和pH值

2017-03-28 00:43贾柳君张海红王健李宗朋李子文熊雅婷李冬冬
食品与发酵工业 2017年2期
关键词:总酸发酵液波段

贾柳君,张海红,王健,李宗朋,李子文,熊雅婷,李冬冬

1(中国食品发酵工业研究院,北京,100015) 2(宁夏大学 农学院,宁夏 银川,750021)

采用近红外光谱定量分析葡萄酒发酵液中总酸含量和pH值

贾柳君1,2,张海红2,王健1*,李宗朋1,李子文1,熊雅婷1,李冬冬2

1(中国食品发酵工业研究院,北京,100015) 2(宁夏大学 农学院,宁夏 银川,750021)

利用近红外光谱分析技术对葡萄酒发酵液中总酸含量和pH值进行定量分析,并通过偏最小二乘法(PLS)建立定量分析模型,同时采用组合间隔偏最小二乘法(SiPLS)、移动窗口偏最小二乘法(MWPLS)并结合遗传算法(GA)对整个谱区进行光谱特征波长变量筛选。以决定系数(R2) 、校正标准偏差(RMSEC)、预测标准偏差(RMSEP)、相对分析误差(RPD)以及最佳主因子数作为模型质量的评价指标。其中SiPLS-GA对模型的优化效果最佳,总酸含量和pH值优化模型的R2分别达到0.978 5和0.983 8,RMSEC为0.074 5和0.065 4,RMSEP为0.076 3和0.062 7,RPD为4.85和5.58。结果表明:进行变量筛选可提高模型准确度和稳定性,降低解析难度,达到优化模型的作用。

葡萄酒;总酸;pH;近红外光谱技术;定量分析;波段筛选

随着葡萄酒市场的迅猛发展,人们对其品质有了更高的要求,而葡萄酒品质与其发酵过程中各项指标的变化息息相关[1]。其中,葡萄酒中涩味、澄清效果和微生物活性等因素的稳定在很大程度上受到总酸含量和pH值变化的制约[2-3]。目前采用传统方法检测总酸含量和pH值时,前处理复杂,使用化学试剂可能会对环境造成污染,很难进行大量样品的快速检测,监测信息滞后[4]。

近红外光谱分析技术具有分析速度快、检测效率高、操作简便、无需前处理且无污染、可同时对样品的多个指标进行检测,快速完成大批量样品生产过程的监测等优点,已应用到了食品、药品、化妆品、石油化工等许多行业[5]。目前,基于近红外技术的葡萄酒快速检测方面,国内外学者进行了大量的研究[6-8]。研究均表明了近红外光谱技术可用于葡萄酒发酵液中主要参数的检测,但在总酸含量和pH值的定量分析中,对波段和模型进行深入筛选优化的研究较为少见。

本研究拟对葡萄酒发酵液中总酸含量和pH值进行快速无损检测,利用组合间隔偏最小二乘法(SiPLS)、移动窗口偏最小二乘法(MWPLS)并结合遗传算法(GA)对全光谱波段进行筛选优化,探讨分析这几种波段筛选方法对葡萄酒发酵液中总酸含量和pH值预测模型效果的影响,提高模型准确度和稳定性。

1 材料与方法

1.1 材料与试剂

本试验所用葡萄酒发酵液样品共416个,由某葡萄酒企业提供,采用透反射方式扫描采集葡萄酒发酵液的近红外光谱。葡萄酒发酵液中总酸含量根据GB/T 15038—2006《葡萄酒、果酒通用分析方法》,采用指示剂法测定,pH值由pH计测定。

1.2 仪器与设备

实验使用Buchi N-500傅立叶变换近红外光谱仪,瑞士步琦有限公司。光谱仪光源为卤钨灯,检测器为温控InGaAs,配有高性能测量杯及透反射盖。光谱范围为4 000~10 000 cm-1,分辨率为8 cm-1,扫描次数为32次;利用配套软件NIRWare Operator 采集葡萄酒发酵液样品的近红外光谱信息。

1.3 实验方法

1.3.1 校正集与验证集的划分

在随机保留50个葡萄酒发酵液样本作为独立测试集的基础上,采用 Kennard-Stone(K-S)法[9]以2∶1的比例将剩余366个样品进行样本集和验证集的划分。选择校正集样本244个,验证集样本122个。校正集与验证集的值统计如表1所示。

表1 校正集与验证集统计结果

1.3.2 光谱预处理

为了消除近红外光谱中的基线漂移和不重复性等干扰因素对模型的影响,提高模型稳定性与准确度,本试验采用标准正态变量变换(SNV)对光谱进行预处理[10]。

1.3.3 光谱变量选择

为了剔除无效波长变量,简化模型简析难度,提升模型稳定性和预测精度,分别采用SiPLS、MWPLS并结合GA对全光谱1501个变量进行优化选择,同时采用PLS法建立模型。选取决定系数(R2)、校正标准偏差(RMSEC)、预测标准偏差(RMSEP)、相对分析误差(RPD)以及最佳主因子数来评价模型稳定性与预测能力[11]。R2越接近1,RMSEC与 RMSEP越接近并越小,同时RPD大于3时,则表明建立的模型效果越好[12]。

1.3.4 数据处理与分析

SiPLS、MWPLS、GA等程序通过MATLAB完成,偏最小二乘计算应用 Unscrambler X10.3光谱分析软件实现。

2 结果与讨论

2.1 光谱波段优选

2.1.1 组合间隔偏最小二乘波段选择法( synergy interval PLS,SiPLS)优选特征区间

SiPLS是将全光谱划分成k个均匀子区间后,组合不同区间个数并建模,最终选择RMSECV值最小的组合区间进行建模[13]。本实验k的取值范围为10~40,取值间隔为5,组合数范围为1~4。经计算得出总酸含量和pH值在k为25,组合数为4时,经过SiPLS筛选得到的RMSECV值最小,分别为0.101 7和0.081 3。总酸含量和pH值的波段筛选结果如表2所示,分别选择[3、8、13、24]和[2、3、12、13]组合波段建模。2个指标经筛选所得变量数均为240个,占全光谱的16%。

表2 总酸和pH的SiPLS优化结果

2.1.2 移动窗口偏最小二乘波段选择法(moving window PLS,MWPLS)优选特征区间

MWPLS是通过改变并移动窗口宽度,依次应用在窗口范围内的光谱数据建模,筛选出RMSECV值最小的区间组合为最优的建模波段[14]。本实验设定窗口宽度取值范围为101~201,取值间隔为10。总酸和pH值2个指标的原始光谱在不同窗口宽度下筛选的波段组合及其模型结果见表3。如表3所示,窗口宽度为分别为191和151时,总酸和pH值的建模效果最优,R2分别达到0.968 4和0.976 8,总酸和pH值2个指标经MWPLS筛选所得变量数分别为472和436个,仅占全光谱的31.4%和29.1%。

2.1.3 遗传偏最小二乘波段选择法 (genetic algorithms PLS,GA-PLS)优选特征区间

GA-PLS是基于生物进化论,模拟自然界进化机制的一种优化算法,通过选择频率最高的波长建模来挑选特征变量[15]。但是,若光谱的波长变量数过多,进行波长选择时可能会出现过拟合的现象。因此,本试验在SiPLS和MWPLS进行预选择的基础上结合GA-PLS进一步对总酸含量和pH值2个指标进行波长变量的筛选。

表3 原始光谱在不同窗口下MWPLS选取的最优波段及模型评价结果

设定GA-PLS优化参量:初始群体为30,交叉概率为0.5,变异概率为0.01,遗传迭代次数为100。图1中(a)、(b)、(c)、(d)为总酸含量和pH值2个指标分别通过GA-SiPLS和GA-MWPLS筛选后的各变量被选用的频次图,分别选取大于等于4、2、3、4次频率,筛选出相应频率在前68、149、73、174位的波长变量,占全光谱的4.5%、9.9%、4.9%、11.5%。

(a)总酸 SiPLS-GA;(b)总酸 MWPLS-GA;(c) pH SiPLS-GA;(d) pH MWPLS-GA图1 各变量被选用的频次图Fig.1 The frequency of each variable by chosen

2.2 模型建立与评价

经过上述4种方法的筛选,分别建立葡萄酒发酵液中总酸含量和pH值的全光谱-PLS、SiPLS、MWPLS、SiPLS-GA、MWPLS-GA定量模型,并对决定系数(R2)、校正标准偏差(RMSEC)、预测标准偏差(RMSEP)、相对分析误差(RPD)以及最佳主因子数进行比较,来评价模型效果,模型优化结果如表4所示。

从表4可看出,与全光谱建模相比,采用上述4种方法进行变量筛选后,建模所用变量数均有不同程度的减少,R2增加的同时RMSEP和最佳主因子数相对降低,模型分析效果均优于全谱模型。SiPLS和MWPLS筛选所得波长变量数极大的减少,简化了建模的复杂程度,通过将相关性大的子区间进行优化组合建模,去除信息冗余的区间,使得建模所用光谱更加全面有效,模型的分析精度更高[16]。相比之下,MWPLS的分析波段跨度较大,涉及的波长变量数较多,而SiPLS较之MWPLS筛选所得特征波长变量更少,建模的计算效率得到极大提升的同时不失参数代表性,模型效果略优。

表4 总酸和pH的不同 PLS 模型及性能评价结果

SiPLS-GA和MWPLS-GA则是在SiPLS与MWPLS的基础上对波长变量进行更进一步的筛选,在剔除无信息变量的同时,淘汰了光谱中共线性变量及受外界因素影响较大的波长变量,优选出最能表征目标信息的关键性波长变量,极大的减少变量数,有效的降低了模型复杂程度,提高了模型信噪比。通过这两种方法筛选出的特征波长中有多数波段一致,这些波长变量与样本在近红外区的特征吸收峰相近,能真实地反映出样本所含C—O、CO、C—H、O—H等官能团,如在4 184 cm-1处为C—H伸缩振动和COH弯曲振动的组合频吸收,在4 630 cm-1和4 696 cm-1处的一个双峰归属为C—H伸缩振动和CO伸缩振动的组合频吸收,4 800 cm-1处为OH伸缩振动和C—H弯曲振动的组合频吸收,在5 292 cm-1处的吸收峰,归属为OH伸缩振动和CO伸缩振动的组合频等,反映出葡萄酒发酵液中总酸含量和pH值的特征波长[17]。

其中采用SiPLS-GA筛选后所得变量建立的葡萄酒发酵液中总酸含量和pH值定量模型的优化效果最佳,建模所用变量数最少,模型的适应性、拟合程度和预测能力最为理想。R2分别达到0.978 5和0.983 8,RMSEC为0.074 5和0.065 4,RMSEP为0.076 3和0.062 7,RPD为4.85和5.58,最佳主成分数为7和6。

2.3 模型验证

将独立样本测试集中50个样品的光谱通过SiPLS-GA模型进行验证,如图2中(a)、(b)所示,总酸含量和pH值的实测值与预测值点呈现对角线分布,且经成对t检验,各参数的预测值与实测值无显著差异。经验证,葡萄酒发酵液中总酸含量和pH值的R2分别为0.975 3和0.981 1,RMSEP为0.075 2和0.063 4,说明这2个模型的预测结果较为准确。

(a)总酸;(b) pH图2 总酸含量和pH值的SiPLS-GA模型理化值与预测值分布Fig.2 Predicted vs. reference values of total acid and pH in SiPLS-GA model

3 结论

本文分别采用组合间隔偏最小二乘法(SiPLS)、移动窗口偏最小二乘法(MWPLS)并结合遗传算法(GA)对光谱特征波长进行筛选,得出以下结论:

结合上述4种波段筛选方法,分别建立葡萄酒发酵液中总酸含量和pH值定量分析模型,模型质量均有所优化,不仅极大的减少了建模变量数,简化了建模的复杂程度,同时大幅提升了模型的稳定性和预测能力,证明了近红外光谱技术在葡萄酒发酵液中总酸含量和pH值定量分析方面的可行性和巨大潜力,同时说明了波长变量筛选是优化模型的有效措施。

采用SiPLS-GA法进行波段筛选后所建模型的效果优于其余3种方法,在保留总酸含量和pH特征波长区间的同时剔除大量冗余无效信息,达到波长变量优选并提高模型预测精度和稳定性的目的,同时筛选得到的波长与总酸含量和pH在近红外区域中的特征吸收峰相对应,反映了这2个指标所含的主要基团。因此,利用SiPLS-GA法结合PLS法建立模型,可实现对葡萄酒发酵液中总酸含量和pH进行快速、实时、准确、无损检测的要求,并为该指标的快速检测提供一定参考依据。

[1] 张红梅,曹晶晶.中国葡萄酒产业的现状和趋势及可持续发展对策[J].农业现代化研究,2014, 35 (2):183-187.

[2] 邢凯,张春娅,张美玲,等.总酸、pH值与红葡萄酒稳定性的关系[J].中外葡萄与葡萄酒,2004(5):13-14.

[3] 陈晓前,张铁.试述pH值与葡萄酒的关系[J].酿酒,2002(2):62-63.

[4] 张树明,杨阳,梁学军,等.葡萄酒发酵过程主要参数近红外光谱分析[J].农业机械学报,2013,44(11):152-156.

[5] 丁美珍,宋岑,胡志明,等.近红外光谱技术在酒类产品分析中的应用[J].酿酒科技,2013,34(4):68-70.

[6] 张树明,杨阳,倪元颖,等.近红外光谱和电子鼻技术用于葡萄酒发酵过程中酒精度的定量分析[J].光谱学与光谱分析,2012, 32 (11):2 997-3 001.

[7] URBANO CUADRADO M,LUQUE DE CASTRO MD,PEREZJUAN PM, et al. Near infrared reflectance spectroscopy and multivariate analysis in enology: Determination or screening of fifteen parameters in different types of wines[J].Anal Chim Acta,2004,527(1): 81-88.

[8] 王豪,邬蓓蕾,林振兴.傅立叶变换近红外光谱法快速测定葡萄酒中的酒精度[J].中国酿造,2008,27(4):72-74.

[9] 褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:4.

[10] 邹小波,黄晓玮,石吉勇,等. 银杏叶总黄酮含量近红外光谱检测的特征谱区筛选[J].农业机械学报,2012,43(9):155-159.

[11] 严衍禄,陈斌,朱大洲.近红外光谱分析的原理、技术与应用[M].北京:中国轻工业出版社,2013:165-174.

[12] HE Kaixun, CHENG Hui, DU Wenli, et al. Online up-dating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy[J]. Chemometrics and Intelligent Laboratory Systems,2014,134(15) : 79-88.

[13] 彭海根,彭云发,詹映,等.近红外光谱技术结合联合区间间隔偏最小二乘法对南疆红枣糖度的测定[J].食品科技,2014,40(6) : 276-280.

[14] 赵振英,林君,张福东,等.近红外光谱法分析油页岩含油率中波长选择方法的研究[J].光谱学与光谱分析,2014,34(11):2 948-2 952.

[15] 张初,刘飞,孔汶汶.利用近红外高光谱图像技术快速鉴别西瓜种子品种[J].农业工程学报,2013,29(20):270-277.

[16] 张德涛,邹小波,石吉勇,等.近红外光谱结合不同偏最小二乘法快速检测镇江香醋的浑浊度[J].中国酿造,2012, 31 (1):169-172.

[17] JERRY WORKMAN,JRLOIS WEYER.近红外光谱解析实用指南[M].褚小立,许育鹏,田高友,译.北京:化学工业出版社,2009.

Determination of total acid and pH in wine fermented liquidby near infrared spectroscopy technology

JIA Liu-jun1,2, ZHANG Hai-hong2, WANG Jian1*, LI Zong-peng1,LI Zi-wen1, XIONG Ya-ting1, LI Dong-dong2

1(China National Research Institute of Food & Fermentation Industries, Beijing 100015, China)2(College of Agriculture, Ningxia University, Yinchuan 750021, China)

The total acid content and pH of wine fermented liquid were quantitatively analyzed using Near Infrared Spectroscopy, and the ment of the quantitative analysis model was established by partial least squares method, while the variables of spectral characteristic wavelength in the entire region of the spectrum were screened through SiPLS, MWPLS, and GA.R2,RMSEC, RMSEP, RPD, and the best main factors were used as index forevaluation of model quality. The results showed that variable selection could be optimized to obtain role model and improve its recognition accuracy and stability, thus reduce the analytical difficulty. The optimization effect of SiPLS-GA was the best.R2of optimization mode for total acid content and pH value were 0.978 5 and 0.983 8, RMSEC were 0.074 5 and 0.065 4,RMSEP were 0.076 3 and 0.062 7, and RPD were 4.85 and 5.58.

red wine; total acid; pH; near infrared spectroscopy; quantitative analysis; band selection

10.13995/j.cnki.11-1802/ts.201702032

硕士研究生(王健高级工程师为通讯作者,E-mail:onlykissjgohn@hotmail.com)。

国家自然科学基金(31671937)

2016-07-20,改回日期:2016-11-14

猜你喜欢
总酸发酵液波段
鼠李糖脂发酵液驱油性能研究
初探影响液态法米酒总酸总酯的因素
食品中总酸的测定方法确认报告
连翘内生真菌的分离鉴定及其发酵液抑菌活性和HPLC测定
基于PLL的Ku波段频率源设计与测试
桑黄纤孔菌发酵液化学成分的研究
百色当地产圣女果主要营养成分的测定
滴定法测定食醋中总酸含量及其不确定度评定
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性