何本胜
一、教学目标
1.知识与技能:通过对典型案例的探究了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,能利用独立性检验的基本思想来解决实际问题.
2.过程与方法:通过探究“吸烟是否与患肺癌有关系”引出对分类变量是否有关的独立性检验问题.通过列联表、等高条形图直观感觉到吸烟和患肺癌可能相关,这一直觉来自于对数据的初步处理.我们需要知道通过样本数据有多大把握认为两个分类变量有关,具体过程是让学生在直观感受的基础上深入分析处理数据,提高数据分析和处理的能力.
3.情感、态度与价值观:让学生通过本节课的学习认识到数学与实际生活是紧密相连的,学会直观和客观、粗略和精确地评估两个分类变量是否相关.培养学生处理实际问题的能力,提高学生自我思考的能力,让学生体验到统计方法的作用,体验到统计方法的科学性和严谨性.
二、教学重、难点
重点:独立性检验的基本思想及进行独立性检验的基本步骤.
难点:独立性检验的基本思想;随机变量提出的背景和理论基础.
三、教学方法
以层层设问的方式引导学生逐步了解独立性检验的理论基础和基本应用;结合讲授法帮助学生掌握本节课的内容和思想方法;用分组合作的方式引导学生对本节内容进行总结,全面提升学生的思想认识.
四、教学过程设计
1.创设情境,提出问题
PPT出示题为“韩国肺癌患者败诉 状告烟草公司赔偿无果”“烟民患肺癌去世 烟草公司被判236亿美元天价赔偿”的新闻(具体内容略).
问题1:韩国烟草公司反驳的理由是什么?
问题2:应从哪几方面数据研究吸烟与患肺癌的关系?
设计意图:通过现实中的具体案例激发学生的好奇心,为引入本节课内容——分类变量独立性检验“吸烟与患肺癌是否有关”做好准备,通过引导学生回答问题引出分类变量、2×2列联表等概念.
2.启发引导,探究新知
为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人.
问题1:观察统计表格具有怎样的结构特点,核心数据在哪?
1.分类变量——变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量
2.列联表——像上表这样列出的两个分类变量的频数表称为列联表.在高中阶段我们只研究2×2列联表.
设计意图:引导学生从数学的角度观察研究对象,自然生成本节课所要学习的新的概念:分类变量和2×2列联表.
问题2:从表格中还能得到其他信息吗?
在不吸烟者中患肺癌的比重是 ;在吸烟者中患肺癌的比重是 .
得出结论:吸烟者患肺癌的可能性大.
相对于表格,图像能更直观地看出差异.
等高条形图:
在这个等高条形图中,两者之间的比重有明显差异,所以吸烟与患肺癌很可能是有关的.
问题3:上述结论是否可靠?或者说我们有多大可能性认为它们有关?这在数学里属于什么问题?
概率问题.
对所研究问题的数学表述:
“吸烟”记为事件A,“患肺癌”记为事件B,“吸烟与患肺癌有关”即事件A与事件B有关.
问题的反面是:事件A与事件B相互独立.
问题4:怎么判断事件A与事件B相互独立?
P(AB)=P(A)·P(B)
设计意图:通过对统计表数据的初步处理和对等高条形图的直接观察,让学生感受吸烟与是否患肺癌之间的联系,在学生充分了解列联表的数据信息后,引导学生运用概率知识分析吸烟与患肺癌是否有关,由感性的直观分析过渡到理性的精确分析.
问题5:验证两事件是否无关,沒有概率如何处理?
以频率来代替概率.
将“吸烟”记为事件A, “患肺癌”记为事件B.
P(AB)= P(A)= P(B)=
P(AB)≠P(A)·P(B)
左右两边不等,如果相差不多意味两事件无关的可能性比较大,若相差较多意味着两事件相关的可能性较大.不等式左边是实际值,右边是无关的前提下的理论值,从而得到一个研究两事件相关的思路:通过研究样本数据在无关的前提下对应的理论值和实际值的差异的大小来判断两个分类变量是否相关.
让问题由特殊到一般,把表中数字用字母代替,得到如下用字母表示的列联表:
在假设两分类变量无关的前提下估算理论值和实际值的差异,由此估计吸烟且患肺癌人数约为 ,同理吸烟且不患病的人数约为 ,不吸烟且患病的人数约为 ,不吸烟且不患病的人数约为 .
问题6:如何表示实际和理论的差异?
类比回归分析中表示残差的方式,可以采用平方和形式.
问题7:如何求出样本容量对差异的影响?
可以通过比例形式衡量偏差,回避容量对差异的影响.
为了使不同样本容量的数据有统一的评判标准,基于上面的分析,在统计学中构造一个随机变量K2=,其中n=a+b+c+d,为样本容量.
在成立的前提下,即“吸烟与患肺癌没有关系”,K2应该很小.
计算得到的观测值为:
k=≈56.632
卡方的观测值越大,两变量相关的可能性就越大,大与小需要看临界值.
临界值表:
设计意图:假设两个分类变量无关,学生可以通过所学的概率公式对吸烟与患肺癌之间的关系在概率层面作出判断,符合学生的认知规律,可以提高学生的思维能力,体现了特殊到一般的思维方法.通过分析总结差异产生的原因,类比回归分析中残差的处理思路,引导学生建立体现理论和实际差异的统计量卡方的表达式,突破了难点.解读临界值表,为独立性检验做好准备.
假设H0:吸烟与患肺癌没有关系.
K2的观测值为
k=≈56.632
根据临界值表可知,(K2≥6.635)≈0.01,
而56.632远大于6.635,所以有理由判断H0不成立,即有99%的把握认为吸烟与患肺癌有关系.
独立性检验定义:这种利用随机变量来判断“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.
判断步骤:(1)提出假设H0:两个分类变量没有关系;(2)根据2×2列联表与公式计算K2的观测值k;(3)查对临界值,作出判断.
问题8:独立性检验的原理和反证法的区别和联系.
设计意图:将独立性检验与反证法对比,加深学生对独立性检验思想方法的认识,同时帮助学生建立新旧知识的联系,合理建构思维体系.
3.巩固新知,强化训练
问题1:在现实生活中,有人说秃顶与患心脏病有关,我们如何辨析真假?
问题2:如果想调查秃顶与患心脏病是否相关,需要从哪几个方面调查数据?
例1:在某医疗机构通过调查得到如下数据:
利用独立性检验法判断有多大程度认为秃顶与患心脏病有关.
设计意图:通过巩固练习强化学生自觉利用统计知识解决现实生活中的问题的习惯,提升学生自我思考能力.
4.总结提升
总结本节所学内容、独立性检验的步骤、独立性检验的思想方法.
5.板书设计(略)