王海英,杨玉珍,任国军,王慧,张智洋,屈慧,潘冬
(内蒙古河套酒业集团技术中心,内蒙古巴彦淖尔015400)
利用近红外技术对河套原酒入库指标的检测研究
王海英,杨玉珍,任国军,王慧,张智洋,屈慧,潘冬
(内蒙古河套酒业集团技术中心,内蒙古巴彦淖尔015400)
研究利用近红外技术建立酒度、总酸、乙酸乙酯、乳酸乙酯、己酸乙酯和丁酸乙酯的快速检测方法。经过反复对模型进行优化、验证和修正,得到R2线性关系较好,交叉验证均方根差RMSECV较小的最优模型。通过对模型的可靠性、稳健性和实用性评估,表明酒度、总酸、己酸乙酯、乙酸乙酯、乳酸乙酯和丁酸乙酯6项指标模型分析的结果可靠准确,其准确度和精密度分别为100%,100%;99.89%,100%;99.35%,100%;98.33%,100%;96.89%,100%;95.87%,100%。说明模型预测效果好,能满足原酒入库质量等级判定的要求。
白酒;近红外光谱技术;模型预测
近红外光谱技术是近几年发展最为迅速的高新分析技术之一,属于一项物理性质的测试技术,具有快速、无损耗、多成分同时分析、分析过程无污染、分析结果重现性高等优点,已渗透各行各业,成为现代分析测试技术中的重要工具。近红外光谱区的波长范围为780~2526 nm(12820~3959 cm-1),是由分子振动从基态向高能级跃迁时产生的,主要记录是含氢基团X-H(X=C、N、O)振动的倍频和合频吸收,非常适合用于碳氢有机物质的组成与性质的测定[1]。
中国白酒行业是中国食品工业中重要的一个产业部门,且年产量巨大[2]。基于近红外分析技术分析速度快、结果准确稳定的特性,近红外光谱分析技术已经在白酒生产过程和产品质量的控制方面逐步得到应用[3]。我公司早在2006年已经将近红外光谱技术应用于检测酒醅成分如水分、淀粉、糖分和总酸等指标,效果较好,仪器操作简单、分析速度快,检测结果准确稳定、样品制备量小。鉴于此,本课题将近红外光谱技术应用到白酒酒体的检测方面,解析白酒样品的近红外光谱图,优化比较不同的光谱预处理方法对建模效果的影响,通过对所建立预测模型各项参数的选择比对,不断优化模型,旨在建立白酒的酒精度、总酸、己酸乙酯、乙酸乙酯、乳酸乙酯和丁酸乙酯的校正模型,研发高效、快速、准确的一套分析方法,为判定原酒入库的质量等级提供保障。
1.1 材料、试剂及仪器
1.1.1 样品
建模样品为河套酒业制酒车间现时生产的原酒样品。针对己酸乙酯、乙酸乙酯、乳酸乙酯、丁酸乙酯、酒精度和总酸建模指标选取不同浓度系列的样品,样品具有代表性。
1.1.2 仪器
德国布鲁克NIR光谱仪(MPA),配有样品腔以及透射光谱采集测量方法;日本岛津GC-2014色谱仪;电子酒精计;上海般特pH计(PHS-3CW)等。
1.2 实验方法
1.2.1 样品理化指标化学值的测定
利用日本岛津GC-2014色谱仪,依据GB/T 10345—2007白酒分析方法检测建模样品白酒中己酸乙酯、乳酸乙酯、乙酸乙酯、丁酸乙酯的含量;利用电子酒精计参照测定酒精度;利用pH计(PHS-3CW)采用GB/T 10345—2007白酒分析方法电位滴定法测定总酸。
1.2.2 样品光谱采集
利用Bruker(MPA)傅里叶变换(FT)近红外光谱仪采集光谱。TE-InGaAs检测器。选用光程为1mm样品杯,垂直光路,以空气为参比,扫描波数为12000~4000 cm-1,分辨率为8 cm-1,重复扫描16次,取平均光谱值,每个样品做2个平行样的光谱采集。
1.2.3 光谱数据预处理
利用Bruker(MPA)傅里叶变换(FT)近红外光谱仪采集到的白酒原酒光谱,采用自动交互功能将全波段光谱自动分为5个不同波频的光谱段,然后经过一阶导数(First derivative)、二阶导数(Second derivative)、矢量归一化(Spectra Vector normalization)等预处理方法,用于消除光程长短或样品浓度等变化对光谱响应产生的影响[4]。在建立定量模型时,从光谱图中提取与化学组成相关的信息,消除与样品浓度无关的其他影响因素的干扰,提高图谱与化学成分之间的相关性。同时经过对光谱做平滑处理,过滤噪音、提高信噪比[5],消除光谱基线产生的平移或漂移,从而得到最明显的特征光谱[6]。经过预处理后优化,使用内部交叉验证法,选择最佳校正模型。
1.2.4 衡量模型检测能力的指标
1.2.4.1 模型质量参数
光谱处理后,采用内部交叉验证法检验模型稳健性。通过比较模型的决定系数R2(R2给出了真实组分值中出现的变量的百分数,预测含量值愈接近真值,R²愈接近100%)和内部交叉验证均方根差(RMSECV)来衡量模型质量,R2越大,RMSECV越小,模型质量越好。模型的预测性能用预测标准偏差RMSEP和相关系数R2来表示,预测模型R2越大,RMSEP越小,模型预测能力越好。
1.2.4.2 模型的准确性、稳健性和可靠性研究
准确性研究:同一样品利用GC色谱仪分析和MPA所建模型分析,比较色谱值和预测值的一致程度。采用色谱值和预测值的相对标准偏差RSD表示,参照色谱分析同一样品平行样的RSD小于0.05,规定本实验同一样品的色谱值和预测值的RSD值≤0.05表示模型预测准确。
可靠性研究:模型预测批量原酒样品,其中样品预测准确的(色谱值和预测值RSD≤0.05)个数占总样品的比值越高,表示模型可靠性越好。
稳健性研究:利用所建立模型对同一样品平行测定5次,5次测定值的RSD≤0.05表示精密度良好。利用所建立模型对同一样品在2 d内每隔6 h测定1次,同一样品不同测定值的RSD≤0.05表示稳定性和重现性较好。
2.1 白酒样品图谱
实验中通过样品杯光程的选择实验、分辨率选择实验、检测器的设置实验和样品扫描时间、次数的实验等等,对采集白酒样品光谱的各种参数确定最佳值,按照光谱采集的最优条件和参数对收集的样品采集谱图。本实验近红外扫描图谱在全光谱范围3960~12800 cm-1范围内全波段扫描,光谱图见图1。
图1 部分浓香型原酒样品的谱图
结合图1分析:近红外谱区主要体现基频2000 cm-1以上的基团信息,其中以含氢基团为主,也有其他一些基团的信息如C=O基团、COOH基团等。白酒近红外谱图中对应Near Infrared Band AssignmentTable(近红外波段分配表)能够区分各官能团的吸收峰谱区:其中羰基C= O吸收峰谱区在FirstOvertoneRegion和SecondOvertoneRegion即第一、第二振动吸收区;羧基-COOH在FirstO-vertoneRegion第一振动吸收区;羟基-OH的吸收峰较强,在3个吸收区均有不同程度的吸收。
2.2 各指标对应的的校正模型
2.2.1 模型
对样品光谱图的处理,选择谱图有效信息最佳的波数范围和预处理方法预建模。通过对模型异常样品剔除、优化检验、补充目标样品(建模样品较少的)、再优化检验的循环过程,最终确定了各项指标的相应模型(图2)。
图2 各指标模型
表1 各指标模型参数
2.2.2 模型参数(见表1)
结合表1分析:不同理化指标建立模型时,结合样品化学值和图谱,利用(PLS)偏最小二乘法计算,会在不同光谱范围做不同的预处理,强化和提取光谱有效信息,来增加模型的稳健性,从而提高模型质量。对于模型来说,质量参数R2越大,RMSECV越小,模型越稳健,模型质量越好。
上述6项指标,其中己酸乙酯、乙酸乙酯和酒精度模型的R2已达到99%,乳酸乙酯、丁酸乙酯和总酸R2在97%以上,说明各模型线性关系较好;乙酸乙酯、丁酸乙酯、总酸和酒精度模型的RMSECV较低,模型预测误差较小。己酸乙酯和乳酸乙酯模型的RMSECV略偏高一点,模型预测误差也就略偏大一些。总体来说模型质量较好。
对于己酸乙酯和乳酸乙酯模型的RMSECV略偏高分析原因:在原酒中这些成分属于微量成分,如果实验中在取得化学值和光谱扫描这两个过程中有时间间隔,这些微量成分就会发生一些缩合、酯化和水解等化学反应,会导致微量成分发生微小的变化,另外酒样光谱的取得、模型预处理方法的选择等,对这2项模型的建立影响也较大一些,导致模型RMSECV略偏高,总体来说各指标的模型质量较好。模型预测结果是否可靠和稳健,还需要考虑在实际检测过程中预测误差对实验结果的影响,来确定模型的分析结果能否满足分析要求,能否达到实验室流动化学分析仪分析结果准确度的极限。
2.3 模型预测验证实验
2.3.1 模型重现性和准确性(见表2)
选取本单位1701份样品作为盲样,利用近红外建立的模型和色谱进行同步分析,每个样品重复检测2次,得出各指标的预测值和真值。
结合表2分析:同一样品利用己酸乙酯、乙酸乙酯、乳酸乙酯、丁酸乙酯、酒精度和总酸6个模型预测,2次预测值的RSD%值的平均值分别为0.2842%、0.631%、0.7372%、0.7341%、0.0338%和0.7250%,均小于5%,表明模型预测较为稳定,重现性较好。同一样品真值和预测值的RSD%的平均值分别为0.3449%、0.6540%、0.5548%、0.8146%、0.0318%和1.215%,也均小于5%,表明模型预测结果准确性好。
表2 部分酒样真值和预测值
图3 各指标模型预测性能
2.3.2 预测性能可靠性评估
将上述1000多份样品的预测值和真值做预测性能评价,来进一步验证所建立模型的可靠性。盲样预测能够客观地反映所建定标模型对样品的预测性能。
结合图3分析:图标为模型检验的预测值和样品的真实值之间的线性关系图,也表示模型预测值与真值的趋同程度,样品点靠近中间线性区域,说明预测结果准确性高。实验中系统自检模型预测偏差和误差,己酸乙酯、乙酸乙酯、乳酸乙酯、丁酸乙酯、酒精度和总酸的预测模型对于盲样的预测均方根差(RMSEP)分别为7.18、 3.06、6.54、1.01、0.0226、0.123;模型预测系统误差值(Bias)分别0.528、0.105、0.327、0.072、0.0031、0.0219。同时将每项指标的预测值和实测值做F检验t检验,均存在p<0.05,表示2种测定方法几乎不存在显著性差异;说明各指标模型检测数据准确可靠。
2.3.3 模型实用性评估
利用所建立的各指标模型检测本单位连续3个月原浆酒共756个样品的各项理化指标,同时将这些样品按照GB/T 10345—2007白酒分析方法中气相色谱法检测各指标。通过整体考量模型在检验大量样品时检测准确性高的样品占总样品的百分比,来确定模型的最终实用性。
结合图4分析:利用所建立的各项指标的模型检测大量样品,检测样品的各项指标重复性好的样品占总样品的百分比几乎接近100%,说明模型检测样品的重复性较好、稳健性较强,检测几乎不受任何因素的干扰;检测样品的各项指标准确度高的样品占总样品的百分比都在95%以上,其中己酸乙酯、乙酸乙酯、乳酸乙酯和酒精度这4项指标占比更高一些,而丁酸乙酯和总酸稍低一些,都达到了我们既定的检测要求。
图4 各指标模型检测样品的实用性
针对丁酸乙酯和总酸检测准确度高的占比略低一些的现象进行了分析。原酒总酸的检测方法采用是酚酞酸碱滴定法,滴定由于手工的操作肯定存在系统误差和手工操作误差,建立模型的数据来源于此,模型受到影响,所以检测准确程度较高的样品占总样品的比值不是很高;另一方面是在同一样品中,一般丁酸乙酯的含量是己酸乙酯含量的十分之一到三十分之一,所以白酒中丁酸乙酯含量较低,在模型预测时预测偏差和检测操作误差对丁酸乙酯影响较大。这2项指标的模型通过以后的优化和修正,检测准确度还会进一步提高。
2.4 预测值对原酒部分微量成分规律的影响
选取河套原酒400个样品,利用建好的各指标模型分析检测,同时将这400个样品作为一个整体,分别将其微量成分各指标的含量总和做百分含量占比的结构分析,分析见图5。
结合图5分析,在这5项指标己酸乙酯占比最高,高于乙酸乙酯和乳酸乙酯;丁酸乙酯占比最小,总酸略小于乙酸乙酯。
经过图5分析,这些微量组分结构的趋势符合河套原酒入库标准对于微量成分结构的要求。说明近红外模型预测数据和原酒指标的实际情况相符,存在的检测偏差对整个原酒微量成分的结构没有质的影响。
图5 部分微量组分的结构图
本课题利用近红外技术对己酸乙酯、乙酸乙酯、乳酸乙酯、丁酸乙酯、酒精度和总酸指标建立定量分析模型,相关性系数R2分别为99.33%、99.11%、98.29%、97.53%、99.95%和98.71%。相关线性良好,模型质量较好。进一步对各项指标的模型验证和评价,得出了6项指标的趋同程度基本一致,同时预测均方根差(RMSEP)分别为7.18、3.06、6.54、1.01、0.0226、0.123;模型预测系统误差值(Bias)分别为0.528、0.105、0.327、0.072、0.0031、0.0219。且经过F检验和t检验验证,说明两种方法之间无显著性差异,表明模型的预测效果很好,能满足生产中白酒6项指标的检测分析。
利用近红外技术检测白酒中的己酸乙酯、乙酸乙酯、丁酸乙酯、乳酸乙酯、酒精度和总酸的含量,前提条件是尽可能利用数量多、覆盖范围广的样品光谱和准确的化学值来构建近红外检测模型。所建立的模型分析样品中这6项指标的含量时,样品实际含量不能超过模型的分析范围。如果在实际检测过程中,样品这6项指标含量有超过模型的分析范围时,会产生分析错误。所以在遇到这种情况时,我们需要继续补充优化模型,从而扩大模型的分析范围。
[1]彭帮柱.傅立叶变换近红外光谱法检测白酒总酸和总酯[J].农业工程学报,2006,22(12):216-219.
[2]徐玮.近红外光谱法快速测定白酒中的酒精度[J].中国农学通报,2010,26(19):70-72.
[3]江苏.近红外光谱分析技术及其在烟草行业中的应用[J].光谱实验室,2006,23(3):633-637.
[4]BARNESR J,DHANOAM S,LISTER SJ.Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra[J].Appl spectrosc,1989,43:772-777.
[5]陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社, 2007.
[6]彭帮柱.用偏最小二乘法及傅立叶变换近红外光谱快速检测白酒酒精度[J].农业工程学报,2007,23(4):233-237.
Rapid Detection of Warehousing Indexes of Hetao Base Liquor by Using Near Infrared Technology
WANG Haiying,YANG Yuzhen,REN Guojun,WANG Hui,ZHANG Zhiyang,QU Hui and PAN Dong
(Technology Center of Hetao Distillery Group,Bayannur,Inner Mongolia 015400,China)
In this study,the rapid detection model of alcohol content,total acid,ethyl acetate,ethyl lactate,ethyl caproate and ethyl butyrate in Hetao base liquor has been established by using near infrared technology.Through repeated optimization,verification and correction of the model,the optimum model with good R2linear relation and good cross validation root-mean-square deviation RMSECV was eventually obtained.Through assessment of the reliability,the robustness and the practicability of the model,it was demonstrated that the analytic results of 6model indexes including alcohol content,total acids,ethyl caproate,ethyl acetate,ethyl lactate and ethyl butyrate were accurate and reliable with accuracy and precision of 100%,100%;99.89%,100%;99.35%,100%;98.33%,100%;96.89%,100%;and 95.87%,100%,respectively.The established model had good prediction effects and it could meet the judging requirements of warehousing Hetao base liquor.
Baijiu;near infrared spectroscopy;prediction model
TS262.3;TS261.7
A
1001-9286(2017)01-0037-05
10.13746/j.njkj.2016276
2016-09-12
王海英(1982-),女,工程师,本科,河套酒业技术中心高级技术员,主要从事酿酒相关发酵理论分析、理化检测和微生物检测。
优先数字出版时间:2016-11-25;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20161125.1408.008.html。