葡萄酒的评价模型

2017-09-03 10:23缪子阳李婷玉祝梦琳

科技与创新 2017年16期

关键词：白葡萄酒红葡萄酒显著性

缪子阳，李婷玉，祝梦琳

（1.南京邮电大学管理学院，江苏南京210000；2.南京邮电大学贝尔英才学院，江苏南京210000）

葡萄酒的评价模型

缪子阳1，李婷玉2，祝梦琳1

（1.南京邮电大学管理学院，江苏南京210000；2.南京邮电大学贝尔英才学院，江苏南京210000）

对于多个葡萄酒样品，2组评酒员的打分不尽相同。要解决的就是通过显著性检验来判别不同组别的评酒员的打分是否具有显著性差异，同时根据2组评分的方差的平均值来判断哪一组的可信度更高；对酿酒葡萄进行聚类分析。

葡萄酒；t-检验；聚类分析；多元线性回归

葡萄酒质量的好坏通常都是聘请一些专业的评酒员来鉴定。而葡萄酒的质量往往与酿酒葡萄有关，因此对酿酒葡萄的理化指标、葡萄酒本身的理化指标和葡萄酒质量这三者的关系进行研究是十分必要的[1]。本文结合2012年全国大学生数学建模竞赛A题建立数学模型对葡萄酒进行评价。

1 问题分析

对于问题一，分析2组评酒员的评价结果有无显著性差异，将红、白2种葡萄酒分别进行显著性检验。首先将每位评酒员对每种样品葡萄酒的各指标评分进行求和，得到总评分，然后对每一种葡萄酒样品的2组的10个总评分进行t-检验，最后总体分析对于红、白2种葡萄酒，不同组别的评酒员的评分是否具有显著性差异。此过程可以通过SPSS软件进行数据分析得出结果。

对于问题一中分析哪一组的评价结果更可信，首先计算出2个组的10个评酒员对每一样品葡萄酒的总评分的方差，再分别计算2个组对红、白2种葡萄酒不同样品总评分的方差的平均值，求得的平均值越小，说明评价值越稳定，可信度越高。法二对2个组对红、白葡萄酒评分的平均差进行比较，较小者可信度高。

对于问题二，将酿酒葡萄进行聚类分析，可以以第一问比较可信的那组的葡萄酒质量评分和酿酒葡萄的理化指标为依据。对于葡萄酒的质量，采用问题一求解出的可信度较高的一组总评分来衡量，将酿酒葡萄的理化指标无量纲化，利用MATLAB软件进行聚类分析，可分别对红、白2种葡萄酒进行分级。

2 基本模型假设

假设各评酒员的评价水平稳定，不发生改变；各评酒员之间的评价结果相互独立，互不影响。

3 基本符号说明

X1ij表示第1组各评酒员对各红葡萄酒样品的总评分（i表示评酒员编号，j表示酒样品编号，下同），x2ij表示第2组各评酒员对各红葡萄酒样品的总评分，x3ij表示第1组各评酒员对各白葡萄酒样品的总评分，x4ij表示第2组各评酒员对各白葡萄酒样品的总评分。

4 模型的建立与求解

4.1 对问题一的求解

4.1.1 模型的建立

4.1.1.1 显著性检验

分析2组评酒员的评价结果有无显著性差异，将红、白2种葡萄酒分别进行显著性检验。首先将每位评酒员对每种样品葡萄酒的各指标评分进行求和，得到总评分，然后对每一种葡萄酒样品的2组的10个总评分进行t-检验，最后总体分析对于红、白2种葡萄酒，不同组别的评酒员的打分是否具有显著性差异。

首先对红葡萄酒的2组评分样中的每一种葡萄酒样品进行方差的齐性检验，此题运用Levene方差齐性检验模型[2]，进行F-检验。检验假设H0∶σ1＝σ2＝…＝σk，即各处理组方差相等；H1∶σi≠σj，即各处理组方差不全相等。取α＝0.01或α＝0.05.计算检验统计量F值：

Zhi的定义公式如下：

然后对红葡萄酒的2组评分样中的每一种葡萄酒样品进行样本平均数差异的显著性检验。运用SPSS软件处理数据，进行数据等同性t-检验[3]。

检验假设H0∶μ1＝μ2；H1∶μi≠μ2，即各处理组方差不全相等。取α＝0.01或α＝0.05.

构造检验统计量t并计算：

4.1.1.2 可信度评价

对于分析哪一组的评价结果更可信，法一首先计算出2个组的10个评酒员对每一样品葡萄酒的总评分的方差，再分别计算2个组对红、白2种葡萄酒不同样品总评分的方差的平均值，求得的平均值越小，说明评价值越稳定，可信度越高。法二对2个组对红、白葡萄酒评分的平均差进行比较，较小者可信度高。

运用平均差评价时，对每种酒样品的10个总评分计算平均差，再计算每组评价的平均平均差。

对于第1组红葡萄酒的评分，每种酒样品的平均差为：

第1组评分的平均差：式（6）中：n为样品数目。

同理对于第2组，对红葡萄酒的评分以及白葡萄酒的2组评分也作上述处理，此处不再赘述。

4.1.2 模型的求解

4.1.2.1 显著性评价结果

对于显著性检验，运用SPSS软件处理数据，得到红、白2种葡萄酒的每一种样品的2组总评分的显著性检验结果，红葡萄酒的27组评价结果中，在0.05显著水平上，有样品2，3，11，12，13，16，23，24这8个样品的2组评价结果有显著性差异；在0.01显著水平上，只有12，23这2组存在显著性差异。所以可以认为，对于红葡萄酒，2组评分结果不存在显著性差异。同理，白葡萄酒的28组评价结果中，在0.05显著水平上，有样品5，27这2组存在显著性差异；在0.01显著水平上，没有存在显著性差异的组。所以认为，对于白葡萄酒，2组评分结果不存在显著性差异。

综上，对于红、白2种葡萄酒，2组的评分结果都不存在显著性差异。

4.1.2.2 可信度评价结果

对于分析哪组评价结果可信度高，根据模型可以求得一系列方差数据，得到不管是红葡萄酒的评分，还是白葡萄酒，都是第2组给出的评分稳定，即红、白2种葡萄酒的评分都是第2组的可信度高。

运用平均差评价的方法，也可以得到一系列平均差值及最终的平均平均差，AD1＝6.48，AD2＝4.71，AD3＝9.05，AD4＝5.85，显然AD1＞AD2，AD3＞AD4.因此可以认为不管是红葡萄酒的评分，还是白葡萄酒，都是第2组给出的评分稳定，也即红、白2种葡萄酒的评分都是第2组的可信度高。

综合2种可信度评价的方法，可以得到相同的结果，即不管是红葡萄酒的评分，还是白葡萄酒，都是第2组给出的评分稳定，也即红、白2种葡萄酒的评分都是第2组的可信度高。运用2种方法求出的结果相同，也说明模型的可靠性。

4.2 对问题二的求解

4.2.1 模型的建立

设Yi＝（Yi1，Yi2，Yi3，…，Yi30，Yi31）表示第i个酒酿葡萄样品的理化指标和葡萄酒的质量为（Yi1，Yi2，Yi3，…，Yi30，Yi31）个指标统计值的样本均值为μj，样本方差为σ.

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级，对于葡萄酒的质量，采用问题一求解出的可信度较高的一组（组二）的总评分来衡量，即：

酒酿葡萄的理化指标采用了附件2中所给的30个一级指标，对于其中有多次测量的指标，取平均值。

由于各指标量纲不统一，且数据相差悬殊，为了消除不同量级和不同量纲指标对距离的影响，先将样本数据进行标准化处理，采用Zscore法进行如下变换：

设dij表示第i个酒酿葡萄样品的理化指标和葡萄酒的质量Yi与第k个酒酿葡萄样品的理化指标和葡萄酒的质量Yk之间的欧式标准距离，即：

dij越小，表示第i个酒酿葡萄样品的理化指标和葡萄酒的质量与第j个酒酿葡萄样品的理化指标和葡萄酒的质量整体情况越接近，即这2个葡萄样品划为一类的机会就越大。

4.2.2 模型的求解

利用MATLAB软件进行聚类分析，可分别对红、白2种葡萄酒的酒酿葡萄进行分类，得到谱系图。根据谱系图，将红葡萄酒酒酿葡萄分为5类，分类结果为{11}，{1}，{10}，{3}，{2，4，5，6，7，8，9，12，13，14，15，16，17，18，19，20，21，22，23，24，25，26，27}。将白葡萄酒分为7类，分类结果为{27}，{3}，{15}，{1，13}，{22}，{8，11，16}，{2，4，5，6，7，9，10，12，14，17，18，19，20，21，23，24，25，26，28}。

再通过计算每一类酒酿葡萄对应的葡萄酒的评分的平均值，按照评分的高低排序，对其进行分级。

5 总结

经总结，得出以下结论：①问题一中分析2组评分的可信度运用方差和平均差2种方法分析，且得到相同的结果，验证了模型的正确性与可靠性；②对数据进行归一化处理，消除量刚不同的问题；③不仅分析出理化指标间的关联度，还运用多元线性回归给出具体的表达式；④葡萄分级的结果存在明显的极端现象，有些级别分到的样品过少，而有些级别过多，需要运用其他模型，比如模糊综合评价等方法进行改进。

［1］刘伟城.葡萄酒的评价［J］.才智，2013（10）：312.

［2］程琮，范华.Levene方差齐性检验［J］.中国卫生统计，2005，22（6）：408-409.

［3］孙立宏.独立样本平均数差异的显著性检验方法与应用［J］.职大学报，2009，4（3）：34-35.

〔编辑：刘晓芳〕

O212.1

：A

10.15913/j.cnki.kjycx.2017.16.022

2095－6835（2017）16－0022－03