秦 连,孙 健,樊阿萍
(绍兴国家黄酒工程技术研究中心有限公司,浙江 绍兴 312000)
黄酒感官品评是依靠人的基本感觉器官对黄酒的色泽、香气、口味、风格等方面进行评判的一种手段,是黄酒生产、科研和质量管理的一项重要方法。每年冬酿结束,绍兴黄酒的几个主要生产企业都会进行一次冬酿黄酒感官品评会。通过交流和评比,取长补短,促进绍兴黄酒的质量长期保持稳定。
本试验基于近五年绍兴黄酒主要生产企业的冬酿黄酒的感官品评数据结合实验室检测数据作统计分析,以期获得有用的结果,指导实际的生产。
黄酒感官品评和实验室理化检测的样品抽样:主要按CAC/GL 50-2004 抽样通则的表10 抽样计数方案进行。参考GB/T 2828.1 计数检验抽样程序第1 部分和GB/T 13546—1992 挑选型计数抽样检查程序及抽样表。
手工酒:批量以生产的作数为单位正常水平抽取,如加饭酒生产50作,则每组抽6只样。
机械化黄酒:以生产的月份数为单位正常水平抽取,如机黄加饭抽取连续生产的5 个月,每月2只,总共抽10只。
感官品评方法参照中国轻工业出版社2020 年3月出版的《黄酒酿造技术》及其2018年5月出版的《黄酒品评技术》。感官品评的评委对每杯酒样独立打分(满分为100 分,其中色泽10 分、香气25 分、口味50 分、风格15 分),最终获取感官品评的评分数据。
在电子表格EXCEL 中录入某一年冬酿(以2020 年数据为例)前两轮1 号—12 号杯酒样,各位评委评酒分数及每个酒样的平均分(表1)。
表1 2020年1号—12号杯酒样评委打分表
2.2.1 杯1、杯2品评分数的概率图(图1、图2)2.2.2 绘制1号—10号杯品评分数的概率图指标
图1 杯1品评分数的正态分布概率图
图2 杯2品评分数的正态分布概率图
1 号—10 号杯概率图指标和结论汇总结果见表2。
表2 1号—10号杯概率图指标和结论汇总表
2.2.3 1—50号杯品评分数的概率图及其统计
绘制1—50 号杯品评分数的概率图,对1 号—50 号杯品评分数的概率图作统计。杯次号为8、14、20、25、31 的5 杯酒样品评分的概率图P 值小于0.05,不符合原假设(正态分布),其余45 杯的P值>0.05符合假设,符合率和前10杯一致,符合率为90%。
2.2.4 概率图验证分析
通过以上的概率图和概率图指标汇总表发现:本年度的感官品评数据概率图90 %符合正态分布。评酒分数符合正态分布在《黄酒品评技术》149页中也可以得到相同结论。因此,本次感官品评分数可以近似看成是服从正态分布。
为了验证其他年份的数据,将2016 年至2019年冬酿品评每杯次的分数也作概率图分布检验。同样每年选取50 杯次品评分数的概率图作统计(表3)。据此,历年的感官品评分数也可以近似看成是服从正态分布。
表3 近五年评分分布概率图(正态)统计汇总表
因为理论上每杯次评分应符合正态分布,根据每年评分分布概率图(正态)的符合率,可以衡量每年冬酿评酒的质量,符合率越高,评酒质量越好。
因为评酒分数符合正态分布,故一般可以运用格拉布斯检验法检测异常值,借助MINITAP17 也可以快速检测异常值,剔除异常值后重新计算每杯酒的平均值。
汇总每个最小统计的生产单位当年同类型酒样(如加饭酒)以作或月为统计单位的平均分并计算生产单位该类型酒的总平均分,排序后得2020年评酒结果及排名(表4)。
表4 2020年评酒结果及排名
计算每个生产单位同类型酒样近五年的平均分数,同一单位有多个机黄车间或手工小组的合并计算,在EXCEL 运用STDEV 函数计算每个单位同类型酒样近五年的标准偏差(表5)。
表5 2016年—2020年评酒分数统计表
表5 可知,C 元红和C 机加近五年质量稳定性较差,五年标准偏差分别为2.38 和5.13,明显较其他的标准偏差大,质量存在较大的波动。
通过五年的评分数据分析,C 元红和C 机加近五年质量稳定性较差的原因并不相同。C 元红因为评酒分数逐年上升且极差较大导致标准偏差大,说明C 单位元红酒总体质量向好。而C 机加2019年分数较其他年份明显偏低导致标准偏差大,说明2019年C机加质量有异常波动。
图4 五年标准差排序图
由图3可知,B单位的甜酒五年平均评分最高,另一个D 单位的甜酒评分也较高,而3 个元红酒的评分最低,加饭酒评分居中。参考文献资料,蜂蜜的添加可以显著提高品评员对黄酒的偏好程度。据此,这可能也是由于糖度增加显著提高了品评员对黄酒的偏好。由此可见,糖度和感官品评偏好之间可能有某种关联。为了验证以上观点,我们对数据进行相关性验证。
图3 五年平均排序图
3.4.1 以2016 年冬酿数据为例进行统计分析(表6)
表6 2016年冬酿加饭酒分数对应的实验室检测数据均值汇总表
表6 中全部12 个加饭酒的评分和实验室糖度检测数据(所有批次实验室检测样本的均值,下同)做相关性检验。在MINITAB17 进行相关性计算,加饭酒品评分数和糖度的Pearson 相关系数=0.728,P 值=0.007,P 值很小而相关系数大于0.7 表明加饭酒的评酒分数与糖度有很高的正相关。
因有两个组别的加饭酒实验室检测频次较低,不具有代表性,故而剔除这两个组别的数据,剩余10 个加饭酒的评分和实验室糖度检测数据再次做相关性检验。此时品评分数和糖度的Pearson 相关系数=0.865,P 值=0.001,相关性较前面12 个加饭酒的统计结果更好,散点图见图5。
图5 2016年冬酿加饭酒分数与糖度的散点图
运用MINITAB17 继续验证加饭酒感官品评分与其他指标的相关性。发现除了糖度指标外,其余理化指标与感官品评分的相关性不明显。实验室检测指标与评分的相关性指标汇总见表7。
表7 2016年冬酿加饭酒分数和检测指标相关性汇总表
3.4.2 2017 年度冬酿感官的分数与实验室检测糖度
以2017 年冬酿数据为例,再次验证分数与糖度的相关性。选取加饭酒抽检频次较多的11 个车间,汇总2017 年度冬酿感官的分数与实验室检测糖度数据(表8)。
表8 2017年冬酿加饭酒感官品评分与糖度对比
在MINITAB17 进行相关性检测,品评分数和糖度的Pearson 相关系数=0.837,P 值=0.001。再次证明加饭酒品评分数与糖度的正相关性很高,2017年冬酿加饭酒分数与糖度的散点图见图6。
图6 2017年冬酿加饭酒分数与糖度的散点图
3.4.3 黄酒的实验室检测糖度与感官品评分数的相关性研究
统计2016 年和2017 年冬酿全部类型黄酒的实验室检测糖度与感官品评分数的相关性。甜酒因样品量较少,半甜型和甜型酒合并为甜酒进行计算(表9)。
表9 评酒分数和糖度相关性
根据表9 结果,加饭酒评分和糖度正相关性很高,相关系数大于0.7,P 值小于0.05。甜酒评分和糖度正相关性也较高,相关系数大于0.6,P 值小于0.05。
元红酒评分与糖度的相关性不明显。2016 元红虽然相关系数较高,但P 值为0.065 大于0.05。尤其是2017 年元红P 值有0.964,相关系数只有0.018(实验室检测和感官品评样本量都很少)。
2016 年和2017 年所有类型的黄酒的整体评分和糖度都有正相关性,2017年整体感官品评分与糖度的相关性好于2016年整体。
3.4.4 品评分和糖度的线性拟合方程
综上所述,通过EXCEL 绘图和计算2016 年及2017 年加饭酒感官品评分Y 和糖度X 平均拟合线性方程为:Y=0.553X+71.89,R=0.67。以GB/T 17946 的加饭酒糖度最大值40.0 计算,冬酿加饭酒感官品评分最大值为94 分。以加饭酒糖度最小值15.1 计算,冬酿加饭酒感官品评分最小值为80.24分。据此,一般冬酿加饭酒感官品评打分范围在80~94分为宜,与历年实际感官品评结果较吻合。
通过图7 对近五年15 位评委的平均残差统计发现,品评打分较均值偏大的有9 位,偏小的有6位。残差极小值0.05,极大值2.71,均值为0.31。图8 残差标准偏差极小值1.43,极大值3.14,均值2.11。15 位评委的残差平均值概率图(图9)和残差标准偏差概率图(图10)都符合正态分布。
图7 评委五年残差均值柱形图
图8 评委五年残差标准偏差柱形图
图9 残差平均值的概率图
图10 残差标准偏差的概率图
根据以上的统计数据,可以获得各位评委的打分偏向性,也可以用平均残差衡量他们的黄酒感官品评准确性,用历年平均残差的标准偏差衡量他们的品评稳定性。从而帮助黄酒感官品评人员了解自己的品评打分偏向和稳定性,进行针对性相关训练,提高他们的感官品评水平。
本试验结论如下:(1)每杯次酒样所有评委黄酒感官品评的分数理论上服从正态分布,实际数据符合正态分布的有90%左右;(2)加饭酒的感官品评分数与糖度有很高的正相关性,相关系数0.72 以上,P值0.007;(3)甜酒的感官品评分数与糖度也有正相关性,相关系数0.61 以上,P 值0.007;(4)元红酒因检测和感官品评的样本量小,相关性不明显,需要在以后的检测中加以验证。
本研究具体应用前景:(1)科学判定产品质量等级,指导生产厂家产品的分级入库;(2)科学判定产品质量稳定性,发现生产过程中出现的质量波动;(3)为黄酒新产品开发、酒体优化设计等方面作参考;(4)衡量每年冬酿感官品评的质量;(5)发现黄酒感官品评存在的问题与不足,推动黄酒感官品评标准化;(6)帮助黄酒感官品评人员了解自己的品评打分偏向,提高他们的感官品评水平。