葡萄酒的评价

2020-04-07 03:37何皓明章文卓李子敬
科技资讯 2020年2期
关键词:相关性分析回归分析主成分分析

何皓明 章文卓 李子敬

摘  要:该文主要讨论葡萄酒的质量评价问题,研究酿酒葡萄和所酿葡萄酒的理化指标与葡萄酒的质量的关系,给出评价方法。葡萄酒的质量对于葡萄酒制造商和购买者来说都至关重要,该文主要讨论葡萄酒的质量评价问题,研究酿酒葡萄和所酿葡萄酒的理化指标与葡萄酒的质量的关系,并给出评价方法,具有十分重要的现实意义。

关键词:质量  理化指标  主成分分析  相关性分析  回归分析

中图分类号:O212    文献标识码:A 文章编号:1672-3791(2020)01(b)-0190-02

1  问题重述

确定葡萄酒质量时通常是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。笔者分析了某一年份一些葡萄酒的评价结果,以及该年份这些葡萄酒和酿酒所用葡萄的成分数据。尝试建立数学模型讨论下列问题:

(1)分析两组评酒员给出的葡萄酒质量的评价结果有无显著性差异,哪一组结果更可信?

(2)分析葡萄与所酿葡萄酒的理化指标之间的联系。

2  问题分析

葡萄酒的质量对于葡萄酒制造商和购买者来说都至关重要,该文主要讨论葡萄酒的质量评价问题,研究酿酒葡萄和所酿葡萄酒的理化指标与葡萄酒的质量的关系,并给出评价方法,具有十分重要的现实意义。

2.1 问题1分析

观察统计数据可知,两组评酒员团队每组10人,需对每种酒的10项分类指标进行打分,各项综合起来,满分为100分。将每位评酒员给每类酒的10项指标打的分数累加即可分别得到不同评酒员对每类酒的总评分数,则易得每组内的10名评酒员对每种酒的平均总评分数。将两组的平均总评分数分别用SPSS进行正态分布检验,判断出它们均符合正态分布,可以进行t检验。因此我们采用了信度分析的方法,用SPSS求得每组10人对每类酒评分的信度系数,經比较即可知哪组的评分更可信。

2.2 问题2分析

由于酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,而葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,因此我们认为葡萄的理化指标会影响所酿葡萄酒的理化指标。

对葡萄酒的每一个理化指标都用主成分分析法将影响它的葡萄的理化指标进行降维处理,并通过MATLAB编程,最终得到葡萄酒的各理化指标与葡萄的理化指标间的具体关系。

3  模型的建立和求解

3.1 问题1的模型建立及求解

3.1.1 判断两组评价结果是否有显著性差异

观察统计数据可知,两组评酒员团队每组10人,需对每种酒的10项分指标进行打分,各项综合起来,满分为100分。将每位评酒员给每类酒的10项指标打的分数累加即可分别得到不同评酒员对每类酒的总评分数:(其中,gjn表示j第名评酒员给酒n的总评分数,gijn为第j名评酒员给酒n的指标i所打分数)。易得每组内的10名评酒员对每种酒的平均总评分数为:,k=1,2(表示第k组的10名评酒员对酒n的平均总评分数)。

可知配对样本显著性检验结果为P=0.014<0.05,则由概率统计知识可知,当α=0.05时,拒绝H0,即认为两组评酒员对各类白葡萄酒的评分结果存在显著性差异。

3.1.2 判断哪一组的评价结果更可信

假设每位评酒员的评分都是客观的,则组内10人的评价结果应具有一致性和稳定性,这样的评分才更可靠。以第1组的红葡萄酒评分为例将每种酒每位评酒员的打分列出。

用同样的方法可知,第1组的白葡萄酒评分的信度为0.972;第2组的白葡萄酒评分的信度为:0.959,0.972>0.959,因此第1组的白葡萄酒评分更可信。

3.2 问题2的模型建立与求解

3.2.1 问题2模型的建立

由于酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,因此我们认为葡萄的理化指标会影响所酿葡萄酒的理化指标。为确定葡萄酒的各理化指标分别与葡萄的哪些理化指标有较强的相关性,我们采用相关性分析法对葡萄酒的各理化指标和葡萄的30个理化指标进行分析,建立模型如下:

然后采用主成分估计的方法:对于多个相关的指标,选择其中一部分重要的主成分作为新的自变量,此时丢弃了一部分影响不大的自变量,这实际达到了降维的目的,然后用最小二乘法对选取主成分后的模型参数进行估计,最后再变换回原来的模型求出参数的估计。线性回归模型如下:

3.2.2 问题2模型的求解

通过MATLAB编程可得葡萄酒的各理化指标和葡萄的30个理化指标的相关性矩阵,例如红葡萄酒的花色苷与葡萄的前5个理化指标的相关性(见表1)。

将葡萄的相关指标和葡萄酒的指标值列出,以红酒前5个样品的色泽b*(D65)为例:将表2数据采用与问题2相同的方法进行指标的标准化,通过MATLAB编程求得前5个特征值之和所占比例(累积贡献率)达到0.9212。于是我们略去第6、7个主成分。

4  模型的评价

模型的优点如下。

(1)第二题中理化指标过多,故采用了主成分分析的方法来提取主要成分,并通过主成分来分析结果,解决了指标繁琐的问题。

(2)采用了计算相关性确定葡萄指标与葡萄酒指标的对应关系,简化了模型。

(3)考虑到了芳香物质对葡萄酒质量的影响,使结果更加合理。

参考文献

[1] 司守奎.数学建模算法与应用[M].2版.北京:国防工业出版社,2015.

[2] 童晓燕.葡萄酒专业高职学生创新素养的培养——以应用文写作课程教学改革为例[J].现代职业教育,2018(34):52-53.

[3] 唐纪芳.借助图论方法,指导数学建模[J].现代职业教育,2018(8):170.

猜你喜欢
相关性分析回归分析主成分分析
上市公司财务指标与股票价格的相关性实证分析
淘宝星店成长中的粉丝力量
中国城市化与经济发展水平关系研究
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
基于变形监测的金安桥水电站坝体稳定性分析
SPSS在环境地球化学中的应用
森林碳汇影响因素的计量模型研究
河北省城镇居民人均可支配收入与消费统计分析
河南省经济增长质量与创新能力关系的实证分析