王丽
“独立性检验的基本思想及其初步应用”是人教版普通高中课程标准实验教科书《数学》A版(选修)2-3第一章第二节的内容.作为高中教材课改新增内容,本课涉及数据的收集、数据的处理等统计学的基本知识,虽教学时间不长(1-2课时),但由于贴近实际生活,在高中数学中的地位不可小觑.本课内容在近几年各省新课标高考试卷中屡屡出现,多为解答题形式.
下面呈现三篇“独立性检验的基本思想及其初步应用”教学设计及对比评价,供读者研究或参考.
一、教学背景与内容分析
本节内容是统计知识的进一步应用,并与课本前面提到的事件的独立性一节关系紧密,此外还涉及到与“反证法”类似的思想,建立在统计思想、假设检验思想(小概率事件在一次试验中几乎不可能发生)的基础之上.通常按照如下步骤对数据进行处理:明确问题→确定犯错误概率的上界α及K2的临界值K0→收集数据→整理数据→制列联表→计算统计量的观测值→比较观测值与临界值并给出结论.
二、教学目标分析
知识与技能: 通过对典型案例的探究了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;了解随机变量K2的含义,并能通过K2的值对两个分类变量进行分析;
过程与方法:借助对实际案例的探究设计解决方案,经历案例分析的过程,体验在解决实际问题时假设检验思想的合理性,提高数据分析能力;
情感、态度与价值观:体验数学与现实生活的联系,增进质疑、探索的勇气和自信,感受探究的乐趣,积累进行统计活动的经验.
三、教学重点、难点
重点:了解独立性检验的基本思想及实施步骤.
难点:(1)了解独立性检验的基本思想;(2)了解随机变量K2的含义,能通过K2的值对两个分类变量进行分析.
四、教学策略与方法
以“问题”的形式层层设疑;用已经学过的回归分析和设置的案例为引,循序渐进地引导学生探究;多媒体辅助教学.
五、教学问题诊断分析
1. K2的结构比较奇怪,出现得比较突然,学生可能会提出疑问.对这个问题的处理,要利用好前面对“比例”和两个分类变量“独立”的分析. K2的具体构造过程比较复杂,无法在课堂上具体推导,可以当做课后学习内容.课堂上只定性指出K2是一个连续性随机变量,服从另一个常见的连续性随机变量的分布——K2分布.统计学家给出的临界值表也是依据积分的方法给出的概率值,与之前学过的正态分布类似.
2. 对独立性检验的基本思想的理解要和反证法做一个对比,可以让学生通过完成表格(印在学案上)对二者的基本思想做比较并加以区别.
3.为什么在表达结论的时候要出现“在犯错误的概率不超过XX的前提下”?原因在于独立性检验的过程中存在一个小小的漏洞,就是假设“在一次实验中,小概率事件不发生”,而事实上小概率事件是可能发生的(用反证法可以推出,如果始终不发生,就是不可能事件了),而正是因为这一点点漏洞,导致独立性检验的结果可能是错误的,但是犯错误的概率不会太大,我们就把犯错误的最大概率等同于小概率事件发生的概率了.
六、教学设计
(一)引入新课
以“吸烟有害健康,劝吸烟者戒烟”为引子,帮助学生快速进入问题情境.
探究:吸烟与是否患肺癌有关系吗?请设计一个调查方案.
问题1:怎样判断两个变量是否有关系?
由定量变量、分类变量,定量变量—回归分析,分类变量—独立性检验引出调查思路.
设计意图:引导学生在解决问题的过程中理解独立性检验的基本思想,让学生主动思考、积极参与、互相指导、互相学习.
问题2:判断吸烟与是否患肺癌的独立性需要哪几项数据?
设计意图:引出列联表以及列联表的定义,强调高中数学只研究2×2列联表.
(二)案例探究
调查报告1:某同学共调查了15个人,不吸烟的13人中没有人患肺癌,吸烟的2人中有1人患肺癌.
设计意图:通过对吸烟者的质疑指出:样本容量越大与总体的近似程度越高,在实际问题的研究中通常要求每一组数据都不小于5.
调查报告2:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人.
列联表是分类变量的汇总统计表(频数表),一般将每个分类变量只取两个值的列联表称为列联表 .
问题3:观察此列联表,你能从中获取吸烟与患肺癌有关系的信息吗?
通过比重粗略判定两者有关,再由图形(等高条形图、三维柱形图、二维条形图)直观展示,粗略判定两个分类变量有关.
设计意图:引导学生借助已学知识对两个分类变量是否有关进行探究,不同的思路会得出不同的探究结果.
问题4:若用字母代替表格中的数据,在吸烟与患肺癌没有关系这一前提下,a,b,c,d应该满足什么关系式呢?
ad≈bc
从两方面进行分析:(学生分组进行验证)
(1)吸烟者中患肺癌的比重和不吸烟者患肺癌的比重的比较;
(2)事件的相互獨立性P(AB)=P(A)P(B)得出.
因此│ad-bc│越小,说明关系越弱;│ad-bc│越大,说明关系越强.
质疑:“大”的标准是什么?这种判断太粗糙了,抽样调查可靠吗?
设计意图:让学生通过自主探究获得粗略判断“是否有关”的方法,通过吸烟者的质疑突出强调进行独立性检验的必要性.
为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量K2=■,其中n=a+b+c+d,为样本容量.
问题5:根据以上分析,若“吸烟与患肺癌无关”,则K2应该——(填“大”或“小”).由公式计算得到K2的观测值k为56.632,它应该和谁比大小?
问题6:56.632远远大于6.635,这样的情况下,你认为H0成立吗?
问题7:你认为“吸烟与患肺癌有关系”这种判断会犯错误吗?犯错误的概率是多少?
设计意图:一是使学生意识到犯错误概率是进行独立性检验中不可缺少的数据,缺了它将来就没有了参照的标准;二是让学生了解独立性检验中因为有“认为小概率事件不可能发生”的观点而存在漏洞,从而存在犯错误的风险.我们认为犯错误的概率不会超过小概率事件的发生概率,因此在结论中会这样描述:“在犯错误的概率不超过XX的前提下,我们认为XXX.”
实际上借助于随机变量K2的观测值k,建立了一个判断H0 是否成立的规则:如果K≥6.635,就判断H0不成立,即吸烟与患肺癌有关系;否则就判断H0成立,即吸烟与患肺癌没有关系,也称“在样本数据中没有发现足够证据说明两者有关系” .在该规则下,把结论“成立”错判成“不成立”的概率不会超过P(K2≥6.635)≈0.01,即有99%把握认为H0 不成立(强调99%的含义).
独立性检验的定义:这种利用随机变量K2来判断“两个分类变量是否有关系”的方法,称为两个分类变量的独立性检验.
(三)归纳提升
问题8:能否认为在推断错误的概率不超过0.001的前提下得出“有关”的结论?k到底应该和谁比大小呢?
在成立的条件下有:
设计意图:让学生熟悉理解独立性检验的基本思想和K2的不同临界值的作用;解读临界值表,强调根据实际问题需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值K.
总结并板书独立性检验的一般步骤:
第一步:收集数据得到列联表,提出假设H0:两个分类变量无关;
第二步:利用卡方公式计算随机变量K2的观测值k;
第三步:查临界值表得出结论.:如果k≥k0,就判断“X与Y有关系”,这种判断犯错误的概率不超过P(K2≥k0),否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
(四)理论对比
设计意图:使学生了解归纳独立性检验的一般步骤,对比体会反证法原理与独立性检验原理,帮助学生更好地理解獨立性检验思想.
(五)习题演练(略)
(六)直击高考(略)
(七)课堂小结
(八)课后思考
1.K2是如何构造出来的?
2.定义W=││,如何用W构造一个判断“X和Y有关系” 的新规则?