陈侃 陈梅
独立性检验在实际生活中有着广泛的应用,与它有关的试题比较新颖,贴近生活,对考查大家“获取信息、分析信息、应用信息的能力”以及“运用数学的思想和意识”起到了非常重要的作用. 本文通过几个例题对这一类问题进行分析,加以总结,找出解决这类问题的方法.
对分类变量概念的理解
例1 对两个分类变量A,B的下列说法中正确的个数为( )
(1)A与B无关,即A与B互不影响
(2)A与B关系越密切,则K2的值就越大
(3)K2的大小是判定A与B是否相关的唯一依据
A. 1 B. 2
C. 3 D. 0
解析 (1)正确,A与B无关,即A与B相互独立;(2)错误,[K2]的值的大小只用来检验A与B是否相互独立;(3)错误,还可以借助三维柱形图、二维条形图等.
答案 A
点评 涉及独立性检验的概念问题,对基本概念的理解是求解的关键. 基本概念有分类变量、定量变量、列联表等.
分类变量的强弱关系
例2 分类变量X和Y的列表如下,则下列说法判断正确的是________. (填序号)
(1)ad-bc越小,说明X与Y的关系越弱
(2)ad-bc越大,说明X与Y的关系越强
(3)(ad-bc)2越大,说明X与Y的关系越强
(4)(ad-bc)2越接近于0,说明X与Y的关系越强
解析 判断两个变量是否有关系,可以考查[ad-bc]的值的大小. [ad-bc]的值越大,说明两个变量之间的关系越强;[ad-bc]的值越小,说明两个变量的关系越弱. 故此题填(3).
答案 (3)
点评 在列联表中,如果两个分类變量没有关系,则[ad≈bc],即[ad-bc≈0]. 所以在判断两个分类变量的强弱关系时,应判断[ad-bc]的大小.
考查[K2]的意义
例3 在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A. 若随机变量K2的观测值k>6.635,我们有99%的把握说明吸烟与患肺病有关,则若某人吸烟,那么他有99%的可能患有肺病
B. 若由随机变量求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个人患有肺病
C. 若由随机变量求出有95%的把握说吸烟与患肺病有关,那么有5%的可能性使得推断错误
D. 以上说法均不正确
解析 K2是确定多大程度上可以认为“两个分类变量有关系”;并不是说有99%的可能患有肺病,也不能说在100个吸烟者中必有99个人患有肺病.
答案 C
点评 本题考查对独立性检验的结果与实际问题的差异的理解,独立性检验的结论是一种相关关系,它与实际问题中的确定性是存在差异的,是反映有关和无关的概率.
对两种表示方法的理解
例4 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列联表.
参照附表,得到的正确结论是________.
(1)在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
(2)在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
(3)有99%以上的把握认为“爱好该项运动与性别有关”
(4)有99%以上的把握认为“爱好该项运动与性别无关”
解析 由K2≈7.8可知,[P(K2≥6.635)≈0.010],在犯错误的概率不超过1%的前提下或有99%以上的把握,认为“爱好该项运动与性别有关”.
答案 C
点评 本题考查随机变量的观测值[K2]与临界值[k]的关系,使得在假设成立的情况下,观测值[K2]要大于该临界值[k],然后得出结论.
独立性检验的综合问题
例5 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品. 从两个分厂生产的零件中各抽出了500件,测量其内径尺寸,得结果如下表.
(1)分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写2×2列联表,并回答是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
分析 独立性检验问题的一般步骤:①用相关数据作出列联表;②计算统计量[K2]的值;③与临界值比较,判断是否相关,若相关,得出相关结论.
解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为[360500]×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为[320500]×100%=64%.
(2)由题意得列联表如下.
点评 独立性检验的基本思想类似于反证法. 要确认“两个分类变量有关系”成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量[K2]应该很小. 如果由观测数据计算得到的[K2]的观测值很大,则在一定可信程度上说明假设不成立.