近红外光谱波段优化在白酒酒醅成分分析中的应用

2016-06-15 16:35熊雅婷李宗朋王淑军尹建军宋全厚
光谱学与光谱分析 2016年1期
关键词:酒精度酸度波段

熊雅婷,李宗朋,王 健,张 英,王淑军,尹建军,宋全厚

中国食品发酵工业研究院,北京 100015

近红外光谱波段优化在白酒酒醅成分分析中的应用

熊雅婷,李宗朋,王 健*,张 英,王淑军,尹建军,宋全厚

中国食品发酵工业研究院,北京 100015

为了提高白酒酒醅主要成分的快速检测技术水平,利用近红外光谱法对白酒酒醅中的水份、淀粉、酸度和酒精度进行定量分析,通过PLS建立酒醅成分定量分析模型,同时采用CARS、间隔偏最小二乘变量选择法(iPLS)和无信息变量消除法(UVE),实现光谱特征波段选择,并利用多元散射校正(MSC)、导数以及标准正态变量变换(SNV)等预处理方法进行模型优化。用决定系数(R2)、预测标准偏差(RMSEP)以及最佳主因子数对模型进行评价,确定最佳建模方法。结果表明:波段筛选能够对模型起到优化作用,并提高模型运算速度,其中CARS优化效果最为明显,酒醅水份、淀粉、酸度和酒精度的R2分别达到0.885,0.915,0.951,0.954;RMSEP分别为0.630,0.519,0.228,0.234,有效地提高了模型的稳定性与准确度。经过优化,所建模型预测效果好,能够满足白酒酒醅主要成分的快速检测要求,在实际应用中有一定的参考价值。

白酒酒醅;近红外光谱技术;定量分析;预处理方法;波段筛选

引 言

酒醅发酵过程伴随着水份,淀粉,以及酸度等主要成分含量的变化,影响白酒酿造的产量、质量与风味,因此,对酒醅中主要物质及时检测是控制白酒生产品质的保障。目前传统化学检测方法存在操作繁杂,检测结果延迟,准确性差,污染环境,难以实现大批量快速定量检测等缺点[1]。寻找一种快速、高效、清洁的检测方法尤为重要。

近红外光能够穿透到酒醅样品内部,携带样品内部信息,所以可以采用漫反射技术对样品直接测定。近红外光谱(near infrared spectroscopy,NIR)技术操作简单、样品无需前处理、易于实现快速分析,已经在食品、药品、石油化工、农牧等领域广泛应用[2]。

目前,在白酒酒醅检测方面,郝建国等[3]采用偏最小二乘回归法(PLS)建立了汾酒酒醅中淀粉、酒精度、酸度、水份的定量分析模型,赵东等[4]分别对五粮液入窖、出窖酒醅的多种理化指标进行了建模与验证。以上研究结果均表明了近红外光谱技术对单一香型白酒酒醅的快速检测具有可行性,建立的模型具有较高预测能力。但是这些研究并未对模型进行深入优化。

实验综合了浓香型,白干型和芝麻香型等多种香型的白酒酒醅,通过比较全光谱、CARS变量选择法、间隔偏最小二乘变量选择法(iPLS)和无信息变量消除法(UVE),深入探讨光谱波段筛选方法对酒醅中淀粉、水份、酸度、酒精度指标建模的影响,并通过对比确定最佳波段选择方法及预处理方法,以此来降低模型复杂程度,提高模型运算速度、稳定性、准确性以及模型预测能力,为快速评价酒醅质量提供一定参考。

1 实验部分

1.1 仪器设备

实验使用QC-leader傅里叶变换近红外光谱仪(北京中安信达科技有限公司)。光谱仪光源为卤钨灯,检测器为温控InGaAs,配有固体测量池。光谱范围为10 000~4000 cm-1,分辨率为8 cm-1,扫描次数为32;利用配套软件 NIRWare Operator 采集样品的近红外光谱信息,采用UnscramblerX10.3光谱分析软件(挪威CAMO公司)进行光谱预处理、偏最小二乘计算,CARS, iPLS, UVE等程序均在MATLAB环境下运行。

1.2 材料

实验所用浓香型,白干型和芝麻香型酒醅样品共855个,由某白酒企业提供。为保证实验可靠性及模型准确性,对酒醅样品进行三次采样,采用漫反射方式扫描采集酒醅近红外光谱,并对光谱进行平均。酒醅水份、淀粉、酸度实测值分别根据直接干燥法[中华人民共和国国家标准GB5009.3-2010]、酶水解法[中华人民共和国国家标准GB/T5009.9-2008]、[中华人民共和国国家标准GB/T5517-2010]测得。

1.3 光谱处理

1.3.1 校正集与验证集的划分

采用Kennard-Stone(K-S)法[5]进行样本集划分,基于变量之间的欧氏距离在特征空间中均匀选取样本,可以直接采用光谱作为特征变量,也可以将光谱进行主成分分析后,选用主成分得分为特征变量选择样本。

最终选择了600个酒醅样品作为校正集,255个样品作为验证集,表1为校正集与验证集的统计信息。

Table 1 Statistical results of calibration set and validation set

1.3.2 光谱变量选择

为了剔除无用变量,降低模型复杂度,提高模型准确度,分别采用CARS[6]、间隔偏最小二乘(iPLS)[7]以及无信息变量消除法(UVE)[8]将进行光谱优选,根据决定系数R2、预测标准偏差RMSEP以及最佳主成分数得出最适合的光谱变量选择方法[9]。在选定的主成分数下,R2越接近1,RMSEP越接近0,表明模型效果越好[10]。

1.3.3 光谱预处理

改革后的“X+1+X”运营模式,增加了用户选择权,提高了管道服务质量,推动了定价机制市场化,改革后多个供应商、销售商与用户谈判博弈,价格由市场决定,价格更趋合理。

近红外原始光谱包含许多干扰因素,影响模型效果。为了消除颗粒分布不均,减弱基线漂移以及噪音的影响[11],选用多元散射校正(MSC)、标准正态变量变换(SNV)以及导数等预处理方法对光谱进行预处理,以提高模型准确性和可靠性。

2 结果与讨论

2.1 光谱波段优选

2.1.1 CARS(competitive adaptive reweighted sampling)波段选择法

Table 2 Results of CARS band filtering

Fig.1 Variable selection with CARS

2.1.2 间隔偏最小二乘波段选择法(interval PLS,iPLS)

将样品数据分割成15个等距波段进行PLS计算并交互验证,其波段筛选结果如图2所示。其中,纵坐标表示了各个波段交互验证均方差(RMSECV),虚线(M)表示全光谱区间建模时的交互验证均方差[14]。本实验选择位于虚线以下的波段进行建模,酒精度建模波段为1,2,5,12号波段;淀粉为2号、5号波段;水分为2,4,5号波段;酸度为2,5,12号波段。

Fig.2 iPLS variable screening results

(a):Alcohol;(b):Starch;(c):Moisture;(d): Acidity

2.1.3 无信息变量消除法(elimination of uninformative variables, UVE)

UVE是一种基于回归系数稳定性分析的变量选择方法,对全光谱采用UVE方法进行变量优选,变量稳定性分析结果如图3所示。竖直实线左边是波长变量,右边为引入的系统噪音变量。虚线表示变量稳定性的上下阈值,处于两阈值之间的变量可认为是无关的信息量,超出阈值的部分为有用信息波长变量[15],因此实验选择超出虚线阈值的光谱波段建模。

Fig.3 UVE variable stability analysis results

(a):Alcohol;(b):Starch;(c):Moisture;(d): Acidity

在上述各变量筛选方法的基础上,分别建立酒醅4个指标的全光谱-PLS,CARS-PLS,UVE-PLS,iPLS-PLS定量模型,并计算得出最佳主因子数,同时比较决定系数R2和预测标准偏差RMSEP,以此来评价模型效果,模型计算结果如表3所示。

Table 3 Quantitative model validation results of Fermented grains

从表3可以看出,各项指标经光谱波段选择之后,变量数显著减少,R2普遍较全光谱增大,同时RMSEP相对减小,主成分数有不同程度的减少,模型运算速度均有不同程度的提高,说明波段筛选能够有效优化模型。

比较三种波段选择方法,iPLS-PLS方法因等间距划分波长导致波长点选择不够精准,但是有效地减少了主成分数量,有利于提高模型预测能力。UVE-PLS法筛选的变量数过多,导致模型预测性、准确度不够,在酒精度测量结果中虽然R2、RMSEP优于其他方法,但是主成分数过多,可能引入噪音,在酸度测量中R2、RMSEP结果较差,模型稳定性和准确度有待提高。相比之下CARS-PLS法表现出更大的优势,经过筛选,变量数极大减少,有效保留了关键特征波长,降低了模型的复杂程度,加快了运算速度,R2较原光谱增大1%以上,同时 RMSEP减少,最佳主成分数合理,四种理化指标的模型稳定性和准确性均有较大的提高。总之,CARS-PLS法是最合适的白酒酒醅变量筛选法,能有效筛选出数量更少且合理的波长变量。

2.3 光谱预处理

导数光谱可有效的消除基线和其他背景干扰,提高分辨率和灵敏度,与S-G平滑结合使用能有效的降低噪声[16]。SNV与MSC的目的主要是消除颗粒分布不均匀及颗粒大小产生的散射影响。对CARS法波段选择结果用多元散射校正(MSC)、一阶、二阶导数结合9点Savitzky-Golay平滑以及SNV的方法分别对光谱进行预处理,并对酒醅指标进行PLS建模,结果如表4所示。

Table 4 Results of fermented grains preprocessing analysis

由表4数据可见,在CARS法已选择的波段范围内,对于水份和酸度,二阶9点S-G平滑法相比于原光谱有明显优化效果,决定系数R2分别达到0.901和0.952,RMSEP分别达到0.618和0.218;对于淀粉,MSC及SNV均表现出了良好的预处理效果,R2达到0.921,预测标准偏差RMSEP为0.509;对于酒精度,一阶9点S-G平滑效果最好,R2为0.955,RMSEP为0.225。

结果表明,合理地使用预处理方法能有效的提高模型稳健性,模型的各项指标均有所改善。但是大部分光谱预处理方法在运算过程中,会引入或放大噪声,或者减少光谱真正的样品信息,最终导致光谱信噪比下降,因此,有时会出现部分预处理后光谱模型质量下降,效果差于原光谱的现象。

2.4 模型验证

将60个未参与建模的样品光谱带入经CARS及相应预处理方法优化的模型中进行验证,由图4可以看到,各理化指标的实测值与预测值点呈对角线分布,且经成对t检验,各项指标预测值与实测值无明显差异。经验证,酒精度R2为0.950 2,RMSEP为0.243 8;淀粉R2为0.907 8,RMSEP为0.536 2;水份R2为0.876 9,RMSEP为0.661 7;酸度R2为0.943 3,RMSEP为0.273 1;说明,模型的预测结果较为准确。

3 结 论

采用近红外光谱法对白酒酒醅的淀粉、水份、酸度和酒精度指标进行了定量检测,通过对光谱特征波长选取,提高了模型的预测精度和稳定性,证实了波段优化对建模分析的重要性。此外,通过多种预处理方法比较发现,不同样品组分对预处理的需求不同,只有选择合适的预处理方法,才能最大限度的消除噪声及干扰因素,建立最优数学模型。

研究结果表明,CARS,iPLS,UVE三种波段筛选方法均能在不同程度上减少建模所用变量数,有助于模型优化。其中,CARS筛选变量的PLS建模效果更为理想,经CARS筛选后,建模波段明显减少,R2和RMSEP也表现出了较好精度,所得变量包含了成分中C—H,C—O,O—H等官能团的主要吸收峰所在区域,既保留了酒醅各项成分的特征波长,又有效地剔除了大部分无信息变量,实现了波长选择的目标,说明该方法可能更适用于白酒酒醅的定量检测。同时,针对酒醅不同指标进行适当光谱预处理,能显著提高模型预测能力。通过对建模波段以及预处理方法进行合理筛选,为实时、准确监控多香型白酒酒醅主要指标含量变化,以及科学优化近红外光谱模型提供了一定的参考依据。

Fig.4 Quantitative model of the measured values and near infrared prediction

[1] HAO Jian-guo, REN Jing-jing (郝建国, 任晶婧). Liquor-Making Science & Technology(酿酒科技), 2011, 5: 106.

[2] LI Zong-peng, WANG Jian, ZHANG Xiao-lei, et al(李宗朋, 王 健, 张晓磊, 等). China Oils and Fats(中国油脂), 2014, 39(2): 57.

[3] ZHAO Dong, LI Yang-hua, LAN Shi-rong, et al(赵 东, 李杨华, 兰世荣, 等). Liquor-Making Science & Technology (酿酒科技), 2004, 1: 72.

[4] ZHAO Dong, LI Yang-hua, ZHOU Xue-qiu, et al(赵 东, 李杨华, 周学秋, 等). Chinese Journal of Spectroscopy Laboratory(光谱实验室), 2003, 20(4): 614.

[5] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and its Applications (化学计量学方法与分子光谱分析技术). Beijing: Chemical Industry Press(北京:化学工业出版社), 2011. 4.

[6] Li Hongdong, Liang Yizeng, Xu Qingsong. Analytica Chimica Acta, 2009, 648: 77.

[7] LIU Yan-yun, HU Chang-qin(柳艳云,胡昌勤). Chinese Journal of Pharmaceutical Analysis(药物分析杂志), 2010, 30(5): 968.

[8] LI Qian-qian, TIAN Kuang-da, LI Zu-hong, et al(李倩倩, 田旷达, 李祖红, 等). Analytical Chemistry(分析化学研究报告), 2013, 41(6): 917.

[9] HUANG Fu-rong, LI Shi-ping, YU Jian-hui, et al(黄富荣, 李仕萍, 余健辉, 等).Chinese Journal of Spectroscopy Laboratory(光谱实验室), 2011, 28(6): 2774.

[10] ZHANG Hua-xiu, LI Xiao-ning, FAN Wei, et al(张华秀, 李晓宁, 范 伟, 等). Journal of Instrumental Analysis(分析测试学报), 2010, 29(5): 430.

[11] LI Shui-fang, SHAN Yang, FAN Wei, et al. (李水芳, 单 杨, 范 伟, 等). Food Science(食品科学), 2011, 32(8): 182.

[12] LÜ Qiang, HE Shao-lan, LIU Bin, et al(吕 强, 何绍兰, 刘 斌, 等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2012, 10(43): 211.

[13] WEN Zhen-cai, SUN Tong, GENG Xiang, et al(温珍才, 孙 通, 耿 响, 等). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2013, 33(9): 2354.

[14] Chen Huazhou, Tao Pan, Chen Jiemei, et al. Chemometrics and Intelligent Laboratory Systems, 2011, 107: 139.

[15] He Kaixun, Cheng Hui, Du Wenli, et al. Chemometrics and Intelligent Laboratory Systems, 2014, 134: 79.

[16] TANG Li(唐 利). Liquor-Making Science & Technology(酿酒科技), 2012, (4): 65.

*Corresponding author

The Near Infrared Spectral Bands Optimal Selection in the Application of Liquor Fermented Grains Composition Analysis

XIONG Ya-ting,LI Zong-peng,WANG Jian*,ZHANG Ying,WANG Shu-jun,YIN Jian-jun,SONG Quan-hou

China National Research Institute of Food and Fermentation Industries,Beijing 100015, China

In order to improve the technical level of the rapid detection of liquor fermented grains, in this paper, use near infrared spectroscopy technology to quantitative analysis moisture, starch, acidity and alcohol of liquor fermented grains. Using CARS, iPLS and no information variable elimination method (UVE), realize the characteristics of spectral band selection. And use the multiple scattering correction (MSC), derivative and standard normal variable transformation (SNV) pretreatment method to optimize the models. Establish models of quantitative analysis of fermented grains by PLS, and in order to select the best modeling method, usingR2, RMSEP and optimal number of main factors to evaluate models. The results showed that the band selection is vital to optimize the model and CARS is the best optimization of the most significant effect. The calculation results showed thatR2of moisture,starch,acidity and alcohol were 0.885, 0.915, 0.951, 0.885 respectively and RMSEP of moisture,starch,acidity and alcohol were 0.630, 0.519, 0.228, 0.234 respectively. After optimization, the model prediction effect is good, the models can satisfy the requirement of the rapid detection of liquor fermented grains, which has certain reference value in the practical.

Liquor fermented grains; Near infrared spectroscopy; Quantitative analysis; Pretreatment method; Band selection

Sep. 1, 2014; accepted Dec. 15, 2014)

2014-09-01,

2014-12-15

科研院所技术开发研究专项项目(2013EG111212)资助

熊雅婷,1990年生,中国食品发酵工业研究院硕士研究生 e-mail:xiongyating1130@163.com *通讯联系人 e-mail:onlykissjohn@hotmail.com

O657.3

A

10.3964/j.issn.1000-0593(2016)01-0084-07

猜你喜欢
酒精度酸度波段
沙枣红提复合果酒发酵工艺优化
最佳波段组合的典型地物信息提取
响应面法优化低酒精度桑果酒发酵的工艺参数
柴油酸度和酸值测定结果差异性研究
酒精度快速测定仪测定饮料酒酒精度
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
火焰原子吸收法测定高含量银的最佳酸度条件选择
传统客家黄酒的发酵条件优化
牛乳新鲜度与牛乳酸度关系的探讨