罗贤晖 江从喜 洪翔
[摘要]对于品酒员的评价是否有显著差异的问题,本文运用配对T检验法,采取“先总分—后项目分”的策略,对两组品酒员的评价结果进行检验,得出两组评价结果有显著性差异;对于评价结果可信度分析,本文综合运用标准差检验、肯德尔W系数检验以及品酒员打分均值的相关系数检验,得出第一组品酒员的评价结果更可信的结果。
[关键词]T检验;标准差检验;肯德尔W系数;相关系数
[中图分类号]TS262[文献标识码]A[文章编号]1005-6432(2012)49-0076-02
针对2012年高教社杯全国大学生数学建模竞赛A题第一问,本文对其中两组品酒员评价结果的差异性、可信度做了如下统计分析。
1问题假设
(1)品酒员评分是相互独立且不受外界因素影响的;
(2)样本均为随机抽取,样本的容量足够大,符合统计学相关规律。
2模型的建立与求解
2.1数据分析及处理
分别按红葡萄酒和白葡萄酒两种类型对两组品酒员的评分进行分析。其中,第一组红葡萄酒品尝评分中,样品酒20的4号品酒员二级指标色调数据缺失;第一组白葡萄酒品尝评分中,样品酒3的7号品酒员,样品酒8的9号品酒员在二级指标持久性的得分高于该项指标满分,显然是异常数据。为尽可能还原真实数据,采用其他9位品酒员在该项指标平均值替代异常数据。异常数据经过处理后分别为6,6,6(单位:分)。
2.2问题求解
分析两组品酒员的评价结果有无显著性差异,若对数据进行变换,使分数尽可能反映葡萄酒的真实品质,必然会使两组品酒员的评分结果趋向一致,可能会导致本来具有显著性差异的原始数据经处理后变得无显著性差异。故本文采用每组葡萄酒十位品酒员对同一样品分类指标打分求和得到总分相加取平均的做法,作为该组该样品的最终得分。
接下来,分别对同一类型的两组数据“配对T检验”,即用每一种葡萄酒二组的最终总得分进行配对T检验[原假设(H0):没有显著差异性,备择假设(H1):有显著差异性,检验水准:p=0.05]。如果不通过检验,说明两组数据总体呈现显著性差异,反之,说明两组数据总体不呈现显著性差异,需要进一步对两组样品数据的一级指标求和取均值,逐一对其进行配对T检验,重复上述判断。
2.2.1分类型计算各组葡萄酒样品最终总得分
依据前面提到的方法,分红葡萄酒、白葡萄酒两种不同类别,计算出两组葡萄酒样品最终总得分,见表1。
2.2.2配对T检验
(1)T检验类型。T检验分为单总体检验和双总体检验,本文采用的是双总体检验中的配对样本T检验。
(2)T检验的适用条件。a.已知一个总体均数;b.可得到一个样本均数及该样本标准差;c.样本来自正态或近似正态总体。
前两个条件很容易满足,可用P-P概率图考察第三个条件是否满足。通过Matlab编程观察可知各点近似分布在一条直线上,表明样本满足正态分布,故样本可以采用配对样本T检验。通过SPSS17.0软件,不难得到红葡萄酒样品配对T检验结果和白葡萄酒样品配对T检验结果。红葡萄酒样品配对T检验结果0.020<0.05,拒绝原假设(H0),即品酒员对红葡萄酒的评分有显著性差异;白葡萄酒样品配对T检验结果0.097>0.05,接受原假设(H0),即总体上品酒员对白葡萄酒的评分没有显著性差异。不再对红葡萄酒进一步讨论,对于白葡萄酒,则在项目指标上的数据按求和取均值的方法,逐一重复配对T检验。结果表明:两组白葡萄酒在口感分析、平衡/整体评价两个一级指标存在显著性差异,在外观分析、香气分析两个一级指标不存在显著性差异。总的来说,品酒员对白葡萄酒的评分有显著性差异。
参考文献:
[1]陈亚力,裘亚峥,刘诚.概率论与数理统计[M].2版.北京:科学出版社,2010.
[2]林杰斌,林川雄,刘明德.SPSS12统计建模与应用实务[M].北京:中国铁道出版社,2006.
[3]何佳,何惧,席雁,等.评分者信度的分析方法简介及比较[J],医学教育,2007,45(6):76-77.