基于模拟实验的假设检验教学

2016-04-01 08:21陈占寿
数学教育学报 2016年1期
关键词:对比实验假设检验模拟

陈占寿

(青海师范大学 数学系,青海 西宁 810008)



基于模拟实验的假设检验教学

陈占寿

(青海师范大学 数学系,青海 西宁 810008)

摘要:基于单样本T检验介绍了如何利用模拟实验的方法讲解假设检验问题.在母体分别服从正态分布和T分布的条件下,给出了T统计量在不同样本容量下模拟得到的经验水平和经验势,从而直观地解释了为什么要求检验数据服从正态分布,什么是犯第一、二类错误的概率以及决定错误概率大小的因素等问题.对比实验结果表明,在假设检验问题的教学中加入模拟实验环节可以显著提高教学质量.

关键词:假设检验;模拟;T检验;对比实验

1 引 言

数理统计是数学、统计、金融等许多理工科专业本、专科学生的基础必修课[1].假设检验是数理统计中最主要的教学内容之一,如何教好这部分内容,培养学生假设检验的思想,是每一名数理统计任课教师的重要任务[2].文献中有许多关于假设检验相关问题的讨论[3~5].目前,国内外绝大多数概率论与数理统计教材中关于假设检验问题的理论讲解基本都可总结为4步:第一步是提出原假设和备择假设;第二步是选择合适的检验统计量,并利用样本观测值,计算统计量在原假设成立时的值;第三步是提出显著性水平α,并根据检验统计量的分布查出临界值,确定出接受域和拒绝域;第四步是做出判断,如果检验统计量的值落入拒绝域,则拒绝原假设,认为原假设不成立,否则接受原假设,认为当前的抽样数据无法说明原假设不成立[6~8].

根据多年的教学经验发现,学生很容易就能够记住假设检验的基本步骤,但对于假设检验的本质原理无法很好地理解,导致在做题时会出现许多问题.学生遇到的主要困难和出现的主要问题有:如何选择原假设和备择假设,为什么要选择这个统计量,为什么要假定所抽取的样本要服从指定分布,如果样本不服从这种分布会出现什么问题,显著性水平为什么就是犯第一类错误的概率,犯第二类错误的概率是多少,为什么接受原假设不能简单地理解为原假设一定成立等.对于许多学生,任课教师要一一解释清楚这些问题难度比较大,尤其对于学困生,传统的教学方法效果不佳.

文献中有许多学者调查分析了目前中国大学数学教学的现状,发现对于大部分学生,都存在一些数学原理只知如何计算,但不知道为什么要这样计算,更不能解释计算结果的实际意义[9~10].为提高概率统计教学课程的教学质量,文[11]提出了一种类比教学法,但这种方法主要针对的是概率论知识,而对于数理统计知识不易实现.若能让学生参与到教学活动中,不仅有利于激发学生的学习兴趣,提高教学质量[12],还有利于学生创新能力的培养[13].虽然国内出版的一些新的概率统计教材中倡导理论教学与Matlab软件教学相结合的模式[13],但这些教材中对于软件的讲解基本停留在如何利用Matlab软件函数命令实现结果,无法真正促使学生参与到教学中积极思考和理解统计原理.反而容易让学生产生既然软件能做,自己就不需要动手计算的惰性思想.对于假设检验问题,研究者在教学过程中,把理论教学与计算机模拟实验教学相结合,通过让学生利用Matlab软件自己编写假设检验程序计算经验水平和经验势的方法让学生不仅很好地掌握了假设检验的基本原理,提升了学生对前述多个问题的理解程度,还提高了编程能力,达到了很好的教学效果.

文章第2节以最基本的单样本T检验方法为例,介绍如何通过计算机模拟实验的方法让学生尽快理解假设检验原理,理解为什么要假定观测样本要服从正态分布,犯第一类、第二类错误的概率与样本容量大小之间有什么关系等问题.第3节通过对比试验的方法揭示了计算机模拟实验教学方法在提高学生学习成绩方面的显著效果.

2 模拟实验方法及结果

单样本T检验的目的是对服从正态分布的数据,检验均值是否与理论均值相同,其检验统计量为

第一步:利用Matlab函数randn生成一组均值为μ0,容量为n的样本.

第二步:利用生成的随机数据计算统计量T的值,并与查到的临界值C=tα/2(n -1)作比较,当|T|>C时记k=k+1.这里给出的临界值是双侧检验的情况,在单侧检验问题中可相应的改变,k的初始值为0.

第三步:将第一、第二步循环M次,并计算值k/M,称为经验水平,即犯第一类错误的频率.

当计算统计量T的值时建议让学生自己编程计算,而不要用现成的函数命令[7],这有助于学生更好地记住这个统计量.在以上步骤中只需要让学生明白每循环一次就相当于做了一次假设检验,由于检验数据就来自均值为0μ的正态分布,所以当|T|>C时说明检验犯了第一类错误.当样本容量n和循环次数M足够大时,经验水平与显著性水平会非常接近.为了让学生明白样本容量n和样本所服从分布对于检验结果的影响,在第一步中可以分别通过改变n的值和生成其它分布的随机数据重新做模拟来观察经验水平的变化.

表1给出的是取μ0=1,α=0.05,分别通过生成标准正态分布,自由度为2、5、10、20的t分布,当样本容量n分别取10、20、30、50、100时,经10 000次循环得到的经验水平值.从表1可以看出,当检验数据来自正态分布时,在各种样本容量下,经验水平都很接近检验水平(即显著性水平).而对于不同自由度的t分布,经验水平与显著性水平间的差距较大,这说明当检验数据不服从正态分布,而服从t分布时,犯第一类错误的概率不再是给定的显著性水平,而且自由度越小,犯错误的概率不受控性越高.通过观察和分析这些结果,就很容易让学生理解显著性水平的意义,并明白要求检验数据服从正态分布的原因.此外,还有利于学生探索不同自由度t分布的特征.需要指出的是,要让学生理解一种检验方法犯第一类错误的概率不是越小越好,而应该是越接近检验水平越好.

为了让学生理解什么是犯第二类错误的概率,以及犯第二类错误的概率与样本容量间的关系.在前述第一步的模拟实验中生成均值为μ1≠μ0的随机数据,并在μ0=1原假设下做检验.此时,由于原假设为假,所以比值k/M(称为经验势)越接近1,说明这种检验方法越好,即犯第二类错误的概率1-k/M越小.表2和表3分别给出的是μ1取1.5 和2时的模拟结果.从表中可以看出,样本容量越大时经验势越高,即犯第二类错误的概率越低,且检验数据越接近正态分布,检验势越高,这也从另一个方面解释了为什么要求检验数据满足正态性要求.比较两个表中的数据,还可看出检验数据的真实均值与原假设的均值差异越大,经验势越高,即犯第二类错误的概率越低.通过这些结果的观察和分析,可以让学生很直观的理解什么是犯第二类错误的概率以及影响它大小的一些因素.此外,还可以通过改变正态分布方差的大小来观测经验水平与经验势的变化规律,从而进一步加深学生对于假设检验原理的理解.这部分模拟结果不再一一列出.

表1 经验水平

表2 1μ=1.5时的经验势

表3 1μ=2时的经验势

3 对比实验

为检验上述方法的教学效果,以青海师范大学2011级两个数学专业本科班学生作对比实验,其中A班79人作为实验班,利用模拟实验教学的方法讲解假设检验一章的内容,B班80人作为对照班,采用教材中介绍的传统教学模式.这两个班级是在入学时按高考成绩分班,各班学优生、普通生和学困生的比例基本相同,且大学所有课程都是由相同教师教课,各科平均成绩接近.调查发现两个班级在大学期间的各方面表现都基本相似,能够满足对照实验的要求.为进一步说明实验的公平性和有效性,首先通过独立样本T检验法分析了两个班第一学期概率论课程的期末成绩,检验结果表明两个班的概率论成绩无显著差异.教学内容完成后,用相同的卷子分别在两个班进行了测试,对测试成绩的T检验p值小于0.001,即两个班的成绩具有显著差异,发现实验班的平均成绩比对照班提高了8.6分.说明这里提出的模拟实验教学法确实能够更好地提高教学质量.

为进一步比较两种教学方法对于不同层次学生的教学效果,首先将各班第一学期概率论成绩分为60—69,70—79,80—89,90分以上4组(分别记为Level 1、2、3、4),利用方差分析方法分析各层次学生的学习成绩提高程度是否有显著差异.方差分析结果表明A班的p值小于0.001,B班的p值为0.007,所以认为不论新教学方法还是普通教学方法,对不同层次的学生成绩提高程度都有显著差异.

为具体区分各层次的差异程度,进一步做两两分析.分析结果表明,试验班成绩只有60—69与70—79层次之间的成绩提高无差异,其余各层次间都有显著差异,这说明新教学方法对于不同层次学生的成绩提高程度有不同的效果.对照班成绩的两两分析结果表明,除了60—69分的学生与其余各层次的学生成绩提高程度有差异外,其余各层次学生的成绩提高程度无显著差异.将每位学生的测试成绩与概率论成绩之差称为提高的分数,如图1分别是实验班和普通班第一学期概率论成绩与提高分数间的散点图,由于两幅图中的拟合直线都有负的斜率,这说明不论新教学方法还是传统教学方法,对于成绩越差的学生,成绩提高程度越明显,成绩越好的学生成绩提高程度越小,且新教学方法的提高程度更显著.

图1 概率论成绩与提高分数散点图

影响一个班级成绩的因素可能有多个方面,由于课程的设置,无法获取更多的成绩数据,导致这里只以一次期末考试成绩做了对比实验,可能会出现一次检测未必具有一般性的问题.但从直观因素比较可知,两个班级的各方面环境都很接近,且两个班级的概率论成绩无显著差异,所以基本可以认可实验得出的结论,认为基于模拟实验的假设检验教学方法确实能更好地帮助学生理解和掌握这部分知识.研究者在这两个班级教授《多元统计》课程时,也的确能感觉到实验班的学生对于假设检验原理理解得更加透彻.

4 总 结

以单样本T检验为例,介绍了如何通过计算机模拟实验教学的方法讲解假设检验问题,分别模拟了正态分布和几个不同自由度的t分布在不同样本容量下的经验水平和经验势,通过模拟结果形象具体地解释了为什么要求检验数据要服从正态分布,并揭示了犯第一类、第二类错误的概率与样本容量间等因素的关系.最后通过在两个班级作对比实验的方法说明了基于模拟实验的教学方法在提高教学效果方面的功效,并具体分析了这种教学方法对于各类层次学生成绩的改进效果.虽然这里只以单样本T检验做了比较分析,在教学中可按相同的方法模拟其他假设检验问题,并可进一步研究这种基于模拟实验的教学方法在改进参数估计、方差分析等知识点方面的效果.

[参 考 文 献]

[1] 李双.《概率论与数理统计》教材与实践[J].数学教育学报,2012,21(5):84-87.

[2] 张艳艳.大学数学文化课程中培养随机性数学思维的实践研究[J].数学教育学报,2013,22(5):86-90.

[3] 尹江丽.数理统计课程教学方法探讨[J].数学教学研究,2013,(1):65-67.

[4] 张建侠,鞠银.假设检验功效的蒙特卡罗模拟[J].统计与决策,2012,(4):83-84.

[5] 郭宝才,孙利荣,关于假设检验中的几个问题的探讨[J].统计与决策,2010,(6):10-11.

[6] 王明慈,沈恒范.概率论与数理统计[M].北京:高等教育出版社,1999.

[7] 魏宗舒.概率论与数理统计(第二版)[M].北京:高等教育出版社,2007.

[8] 汤大林.概率论与数理统计[M].天津:天津大学出版社,2004.

[9] 伍建华,江世宏,戴祖旭,等.大学数学教学的现状调查和分析[J].数学教育学报,2007,16(3):36-39.

[10] 刘喆,高凌飚,黄淦.数学师范生数学素养现状的调查研究[J].数学教育学报,2012,21(5):23-28.

[11] 彭红军,梁艳.概率论与数理统计课程的全程类比教学研究[J].数学教育学报,2012,21(1):95-97.

[12] 胡启宙,孙庆括.高师数学教学论课程中参与式教学模式的构建[J].数学教育学报,2013,22(3):77-79.

[13] 付军,朱宏,王宪昌.在数学建模教学中培养学生创新能力的实践与思考[J].数学教育学报,2007,16(4):93-95.

[14] 张德丰.MATLAB概率论与数理统计分析[M].北京:机械工业出版社,2010.

[责任编校:周学智]

Teaching Hypothesis Test Based Simulation

CHEN Zhan-shou
(Department of Mathematics, Qinghai Normal University, Qinghai Xi’ning 810008, China)

Abstract:This paper introduces how to teach hypothesis test problem via simulation based on single sample T test.The simulated empirical sizes and powers of T statistic for different sample size under the normal distribution and T distribution are reported.These results can explain intuitively why one should assume the data must follow normal distribution, what are type I and type II error probabilities, and what factors can influence them.Parallel test indicates that it will improve the teaching quality significantly to add simulation experiment when teach the topic about hypothesis test.

Key words:hpothesis test; simulation; T test; parallel test

作者简介:陈占寿(1982—),男,青海互助人,教授,博士,主要从事数理统计教学及相关研究.

基金项目:国家自然科学青年基金——基于sieve bootstrap方法的长记忆过程变点分析与应用研究(11301291);2013年青海师范大学教研项目——概率统计课程中的计算机模拟实验教学研究

收稿日期:2015–09–20

中图分类号:O212.1

文献标识码:A

文章编号:1004–9894(2016)01–0031–03

猜你喜欢
对比实验假设检验模拟
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
刍议初中化学对比实验的运用
宝鸡地区胶东卫矛秋季扦插繁育技术
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨
一个高分子模拟计算网格的作业管理
对比实验在化学概念教学中的应用探析
工业机器人模拟仿真技术在职业教育中的应用浅析
浅析柔道运动员的模拟实战训练