张思梦,石颖,王一迪,张静,雷晓茵
陕西学前师范学院生命科学与食品工程学院(西安 710000)
中国是白酒的生产和消费大国,根据中国酒类协会的最新统计,2021年1~9月,在全国范围内,白酒的产量达到了501万亿升,较上年同期增加了6.5%[1]。2021年度白酒行业整体实现营收6 033亿,而贵州茅台、五粮液、洋河股份、山西汾酒、古井贡等20家A股白酒上市企业总营收3 062亿元,净利1 084亿元,均创近年来新高,且总营收首次超过3 000亿元,总净利润首次突破1 000亿元。由于白酒具有较高的利润和销量,因此,生产和销售假冒品牌酒的案件时有发生。不仅侵害了生产者的合法权益和消费者的利益,还影响了正常的经营活动。所以,进行白酒的品质分析,对白酒的鉴别、分级、掺假判定具有一定的指导作用[2-3]。
对白酒品质的分析,一般包括专业人员鉴定法和傅里叶近红外光谱法(NIR)、紫外可见吸收光谱法(UV-VIS)、气相色谱-质谱联用法(GCMS)等精密仪器分析法[4]。而电子舌作为近10年内一种检测味觉品质的新技术,以多传感阵列为基础,获取液体样本味觉特征的总体信息,具有感受阈值、感知味强度与人保持一致等特点,可以实现快速的检测[5]。电子舌技术因灵敏度高、可靠性强、重复性好的优点已应用于白酒、黄酒等酒类的口感评价[6-7]、香型判定[8]、品牌区分[5,9-10]、分类鉴别[11-12]、掺假鉴定[13]等。
始于殷商时期的凤香型白酒——西凤,是陕西省白酒的代表。西凤酒以“醇香、甘润、协调、留香”而闻名[14]。2021年实现年销售收入80亿元,在2021年中国白酒企业前200强排名中陕西西凤酒厂集团有限公司居于第18名[15],为当地,乃至陕西省经济发展做出了重要的贡献[16]。因此,西凤酒有不小的发展前景。
因此,以西凤酒为研究对象,利用电子舌技术结合降维算法、分类预测建立西凤酒品牌、等级和酒龄判别模型,为西凤酒的生产和销售过程中的分类定级提供技术支持。建立真假西凤酒识别模型探讨电子舌技术在辨别真假西凤六年区分中应用的可行性,为西凤酒产品真假鉴别技术的发展提供新的方向及思路。
试验样酒选自陕西省凤翔县柳林镇的西凤酒,见表1。试剂:饱和氯化钾(比克曼生物科技有限公司)。
表1 样酒一览表
C-Tongue电子舌(上海保圣科技公司);ZYMICRO-Ⅱ-20L超纯水机(四川卓越水处理设备有限公司)。
Tongue电子舌系统由传感器阵列、信号调理系统、测试平台和应用软件四个部分组成。传感器阵列由六个工作电极和一个辅助电极组成一个独立单元机构与一个参比电极共同组成一个完整的传感器阵列;信号调理系统由信号激发单元、信号调理单元以及数据采集单元组成;测试平台为样品安置、检测提供严格的工作环境。应用软件是在电脑上运行的用于控制电子舌检测、分析数据、输出结果的应用程序。
传感器阵列中每个独立的传感器像舌面上的味蕾,具有交互敏感作用,即一个独立的传感器并非只感受一种化学物质,而是感受一类化学物质,并且在感受某类特定化学物质的同时,还感受一部分其他性质的化学物质。
1.3.1 类别鉴定
取20 mL待测酒样于烧杯中,在室温环境下用电子舌传感器进行数据采集(采集时必须保证传感器底部完全浸入),每个样品重复采集5次,每检测完一个样品需要用超纯水对电子舌传感器部分进行清洗。将待测酒样的电子舌信号值完全准确地记录下来[5],经电子舌系统分析后得到响应信号,采用主成分分析法和降维分类分析法对西凤酒进行定性识别分析、对高价位段西凤酒进行品类鉴定等。并将两种分析方法进行比较,选出西凤酒定性鉴别的最优方法。
1.3.2 掺假检测
定性掺假试验为西凤六年掺假。试验遵循单一变量原则,参考生活中常见的掺假方法,选用同为凤香型的太白酒,且参考马泽亮等[9]、周红标等[17]的研究。将西凤六年与预试验中区分度最高的2021年产的太白酒进行100%,80%,60%,40%,20%和0的不同比例混掺,固定取量为100 mL,重复测量5次,制备6个西凤六年掺假定性识别模型。
2.1.1 西风酒的传感器雷达图
对于西凤酒来说,不同品牌酒的风味物质在含量上存在着不小的差异,因此,通过电子舌检测可以获得不同频率的电信号[18]。试验结果表明,西凤酒的电子舌传感器电信号基本一致,但所得传感器雷达图仍有不小区别,结果见图1。传感器的响应值同时代表着传感器对特定物质浓度的响应。从图1可以看出,西凤酒在对传感器2,4和6的响应最为敏感,普遍对传感器1,3和5响应度低。
图1 11种西凤酒的传感器雷达图
2.1.2 主成分分析(PCA)法对西凤酒的类别鉴定
试验中,对电子舌传感器采集到的不同信号数据进行转换和降维,得到西凤酒的主成分分析法(Principal Component Analysis,PCA)图(图2)。PCA是一种无监督的数据降维方法,结果图中,每一点表示一种样本的一次检测,点与点之间的距离代表不同检测次数之间特征差异;横纵坐标分别是占据总信息量最多的两个主要成分。两个主成分的累计贡献率越大,说明原本各个指标的信息能被越好反映,当累计贡献率大于75%时,就基本能用这两个主成分的二维图来表示整体的信息[19-20]。从图2可以看出,11种西凤酒的前两个主成分的贡献率分别是95.754 9%和2.363 7%,累计贡献率高达98.118 6%>75%。因此,PCA选择的两种主要成份的向量可以反映11种西凤酒的整体数据信息。贾洪锋等[10]采用电子舌对不同品牌啤酒进行主成分分析,第一主成分和第二主成分的总贡献率达到了95.2%;郭壮等[4]采用主成分分析法对市售米酒滋味进行品质评价,累计贡献率高达96.7%。主成分分析常常用于减少数据库的维数,同时又可以维持数据库的方差贡献率和最大的特征值。两个数据的贡献率均大于75%,说明主成分可以较好地反映原来多指标的信息。所以PCA法可以对多种酒类进行类别鉴定。
图2 11种西凤酒的PCA图像
在进行全部样品的主成分分析时发现,在无监督的数据降维分析方法下,只能将西凤酒样较为清晰地分为三大块区域。为了能进一步对酒样进行明确的区分,现将散落在图2中的4种高价位段西凤酒样单独进行分析。这几种酒样分别是:2015年产的西凤十五年陈酿、2012年产的西凤六年陈酿、西凤华山论剑、西凤金七彩。这四种酒样均为西凤酒中的高价位子品牌,知名度广、销量好。
对这四种酒样进行主成分分析,累积贡献率为89.293 3%>75%(图3);结合临近算法(K Nearest Neighbors,KNN)[13]运用PCA-KNN对高价位段西凤酒进行分析,得到如图4所示的高价位段西凤酒的彩色区域PCA-KNN模型图像;图5是高价位段西凤酒的混淆矩阵图,由图得该分类模型的模型准确率(model’s accuracy)为1,表明该模型的准确率很高。
图3 高价位段西凤酒的PCA
图4 高价位段西凤酒的彩色区域PCA-KNN图
图5 高价位段西凤酒的混淆矩阵图
西凤年份系列的酒主要有西凤六年陈酿和西凤十五年陈酿,将西凤六年陈酿与西凤十五年陈酿放在一起进行比较。运用PCA分析得到图6,运用线性判别分析(Linear Discriminant Analysis,LDA)分析得到图7。LDA和PCA很类似,但LDA的结果是将数据进行不同的分类,PCA得到的数据是最大的相似度,最后两种方法都是在特征值和特征矢量的基础上进行降维[20]。
图6 不同年份的西凤酒PCA图
图7 不同年份的西凤酒LDA图
图6 中,第一、第二主成分累积贡献率达到98.95%>75%;图7显示,用LDA分析得到的前两种主成分的贡献率相加为95.18%>75%,所以两种分析方法均能将西凤六年陈酿和西凤十五年陈酿分离开来。同时,二者相比(98.95%>95.18%),用PCA选出的两种主成分组成的二维图来表达两种酒样整体信息更好。
试验选用电子舌设备所带的PCA-SVM[8]数据分析方法。
图8为不同比例掺假西凤模型的彩色分类区域PCA-SVM图。试验进行PCA-SVM分析法时,首先建立分类模型,再通过建立的模型进行未知样品的预测。从图可见,黄色散点均匀地落在了代表着西凤六年0%+100%太白酒模型灰色区域,并且蓝色散点全部都落在了属于不掺太白的纯正六年西凤的淡紫色区域。表明西凤与太白之间有较好的区分度。此外,在整个模型中,中间比例的掺假模型都有部分重叠交叉,这也是模型准确度不是很接近完美值1的原因。建立预测模型,预测模型准确地判别出待测样品是否是西凤六年,但不能准确地判别掺假比例。综上,可以认为西凤六年掺假运用PCA-SVM建立模型比较准确,可以有效地区分出纯正六年,为进行未知样品的定性鉴别做出预测。
图9为六年西凤掺假模型样品的混淆矩阵PCASVM图,表格中央的数字代表样品数量,主对角线上代表正确分类的样品数目,位于主对角线上的样品数越接近每组样品数量,说明模型的准确率(model’s accuracy)越高。由图10可见,该分类模型的准确率为0.966 7,表明该模型中96.67%的样品可正确分类,说明该模型可以很好地进行西凤六年掺假的分类鉴别。
建立图8和图9的分类模型后,利用这两个模型进行未知样品的预测。在预测结果图示中(图10),选用的未知样液为西凤六年60%+40%太白酒,根据预测,样品在彩色区域PCA-SVM图的蓝色位置,与图8对比,对应蓝色区域为“西凤六年60%+40%太白酒模型”的分类模型区域,表明预测与现实结果一致。
图8 六年西凤掺假模型样品的彩色区域PCA-SVM图
图9 六年西凤掺假模型样品的混淆矩阵PCA-SVM图
图10 六年西凤掺假模型样品的模型预测PCA-SVM图
通过此次试验,得出结论:
1) 在西凤酒的定性分析中,采用主成分分析法(PCA)对11种酒样模型进行类别鉴定时,可以有效对酒样进行区分。其中,PCA的累计贡献率高达98.118 6%>75%,因此所选用的两个主要成分相对应的向量能反映各个酒样整体数据的信息。
2) 运用PCA对高价位段西凤酒进行分析,累积贡献率为89.293 3%;运用PCA-KNN对高价位段西凤酒进行分析,模型的准确率为1,准确率很高,说明电子舌可以对高价位段的西凤酒进行准确区分。
3) 运用PCA、LDA对西凤酒年份的判别进行讨论。在西凤六年陈酿与西凤十五年陈酿的比较中,PCA主成分累积贡献率达到98.95%,LDA主成分的累积贡献率为95.18%,二者相比,PCA的精确度更高一点。
4) 在掺假西凤六年的定性分析中,结果表明,采用降维分类分析法中的PCA-SVM对六种掺太白的酒样模型进行识别时,模型准确率高达96.67%,故该模型可以很好地进行西凤六年掺假酒的分类鉴别。
综上所述,可以看出,电子舌可以用于西凤酒的品种鉴定和真假检验,且在西凤酒质量的检测和管理方面有很大的应用潜力。