基于蒙特卡洛模拟的四格表独立性检验研究

2017-05-12 06:06叶仁道徐立军
关键词:四格蒙特卡洛环卫工人

叶仁道,徐立军

(杭州电子科技大学 经济学院,浙江 杭州 310018)

基于蒙特卡洛模拟的四格表独立性检验研究

叶仁道,徐立军

(杭州电子科技大学 经济学院,浙江 杭州 310018)

文章通过给出四格表三种独立性检验统计量的蒙特卡洛模拟算法,研究不同样本量和参数条件下各检验统计量犯第一类错误的概率和功效,并进行统计量优良性对比。结果表明,在样本量较小时,似然比检验优于卡方检验和优比检验;而随着样本量的增加,三种检验统计量都能较为有效地控制犯第一类错误的概率,并具有较高的检验功效。在此基础上,将上述三种检验统计量应用于实际案例的数据分析中。

四格表;蒙特卡洛模拟;独立性检验;统计功效

四格表是一种应用非常广泛的数据分析方法,常被用作分析处理社会科学、人口和医学等领域的分类数据。近年来,关于用何种独立性检验方法对四格表进行统计推断,已受到众多学者的广泛关注[1-3]。例如,包和平等[4]、何平平等[5]基于现有统计推断方法基础上,提出了在不满足正态近似时所需要采用的精确检验方法。此外,赵博娟和吴喜之[6]提出列联表形成过程的不同会影响所做假设检验的结果。然而,现有关于四格表的统计推断研究,较少涉及在不同样本量下比较检验统计量的优良性。

鉴于此,本文针对四格表的卡方检验、似然比检验和优比检验等三种独立性检验方法[7],给出其蒙特卡洛模拟算法。并利用此算法分别获得上述三种检验统计量犯第一类错误的模拟概率和功效,用以检验统计量的优良性。最后,将上述三种统计推断方法应用于环卫工人生活现状问题研究中,以检验环卫工人性别与收入、月剩余是否存在相互独立等问题。

一、四格表独立性检验统计量及蒙特卡洛模拟方法

考虑如下四格表:

表1 四格表和它的边际部分

其中,A、B分别表示两种属性,n1+=n11+n12,n2+=n21+n22,n+1=n11+n21,n+2=n12+n22,n=n11+n12+n21+n22。当单侧n1+和n2+给定时,本文假定n11和n21是服从二项分布的随机变量。

(一)四格表独立性检验统计量

H0:p1=p2vsH1:p1≠p2

(1)

若H0成立,则属性A和B相互独立;反之,若H1成立,则属性A和B不相互独立[7]。为探讨假设检验问题(1),本文首先给出四格表三种独立性检验统计量。

在(1)中原假设条件下,定义以下检验统计量:

1)χ2检验

(2)

2)似然比检验

(3)

3)优比检验

(4)

(二)蒙特卡洛模拟算法

针对假设检验问题(1),本小节给出检验统计量Ti(i=1,2,3)的蒙特卡罗模拟算法,以获得该统计量犯第一类错误的概率及功效。为方便起见,本小节仅以T1为例给出其算法,具体算法步骤如下。

(a)给定样本量n1+、n2+及参数p,其中p=p1=p2;

(b)在(1)中原假设下,分别模拟生成N个服从二项分布b(n1+,p1)和b(n2+,p2)的随机变量n11和n21;

(c)将(b)中得到的随机变量代入卡方检验公式(2)中可得T1值;

此外,由于检验统计量功效的模拟步骤与上述模拟步骤类似,故本文将其略去。

二、模拟结果

基于上述所给的蒙特卡洛模拟算法,本文利用R软件模拟(2)-(4)检验统计量犯第一类错误的概率及功效。

对于假设检验问题(1),在不同显著性水平下,对(2)-(4)检验统计量进行蒙特卡洛模拟。为此,设定不同样本量和参数,取样本量n1+=15、45、60以及n2+=15、30、60。在模拟各检验统计量犯第一类错误的概率时,取条件概率p=0.2、0.5和0.7。在模拟各检验统计量的功效时,分别取p1=0.2,p2=0.3、0.5和0.6。具体模拟结果见表2和3,其中检验方法1、2、3分别表示卡方检验、似然比检验和优比检验。

表2 各检验统计量犯第一类错误的概率

表3 各检验统计量的功效模拟结果(p1=0.2)

由表2可见,在样本量较小时,优比检验犯第一类错误的概率远小于名义显著性水平,说明其较为保守;而在个别情况下,卡方检验犯第一类错误的概率大于名义显著性水平,故而较为自由。随着样本量逐渐增加,以上两种检验方法犯第一类错误的概率接近于名义显著性水平。而在大多数情况下,似然比检验犯第一类错误的概率接近于名义显著性水平。此外,由表3可知,样本量较小时,在个别情况下优比检验的功效小于名义显著性水平,表明功效较低。随着样本量的增大,该方法功效显著增大。而当逐渐偏离时,卡方检验和似然比检验的功效显著增大,且增量接近。综上所述,在小样本情况下,似然比检验优于卡方检验和优比检验;在大样本情况下,三种检验统计量都能较为有效控制犯第一类错误的概率,且具有较高的检验功效。

三、案例研究

本小节将四格表独立性检验统计量应用于实际案例的数据分析中。其中,相关数据来源于对杭州市环卫工人的实地调查。

例1 为检验不同性别的环卫工人在个人收入方面有无差异,调查了122名男性环卫工人和314名女性环卫工人。具体调查数据如表4所示。

表4 收入与性别四格表

考虑假设检验问题(1),由式(2)-(4)可得各检验方法的χ2统计量值。进一步,基于蒙特卡洛模拟算法,得到独立性检验结果及功效。具体结果见表5。

表5 独立性检验及功效(1)

由表5可见,三种检验方法在0.05的显著性水平下均拒绝原假设,表明不同性别的环卫工人在月工资方面有显著差异。此外,各检验方法的功效均较高。

例2 在例1研究的基础上,为检验不同性别的环卫工人在个人收入剩余方面有无差异,继续对这436名环卫工人进行了调查。具体调查数据如表6所示。

表6 月剩余与性别四格表

与例1相似,可得表7所示的独立性检验结果及功效。

表7 独立性检验及功效(2)

由表7可见,三种检验方法在0.05的显著性水平下均接受原假设,表明不同性别的环卫工人在月剩余方面无显著差异。相应地,各检验方法的功效均较低。

例3 为继续研究不同工龄的环卫工人在个人收入方面有无差异,对这436名环卫工人在工龄方面的数据进行了调查。具体调查数据如表8所示。

表8 收入与工龄四格表

与上述例子类似,可得表9所示的独立性检验结果及功效。

表9 独立性检验及功效(3)

由表9可见,三种检验方法在0.05的显著性水平下均拒绝原假设,表明不同工龄的环卫工人在月工资方面有显著差异。此外,各检验方法的功效均较高。

四、结论

由于不同检验统计量在各种样本量条件下的检验效果不同,因此本文首先给出四格表三种独立性检验统计量的蒙特卡洛模拟算法。进而,在不同样本量和参数条件下,利用此算法获得其犯第一类错误的概率和功效,以验证统计量的优良性。研究结果表明,在样本量较小时,似然比检验优于卡方检验和优比检验。同时,随着样本量的增加,三种检验统计量都能较为有效控制犯第一类错误的概率,并具有较高的检验功效。最后,将以上三种检验方法应用于实际数据的分析中,说明环卫工人性别与月剩余相互独立,而与个人收入不相互独立。同时表明,不同工龄的环卫工人在个人收入方面也存在明显差异。

[1]陆运清.相关四格表数据资料检验方法的进展与应用[J].统计与决策,2011(17):30-32.

[2]鲁庆云,刘红霞.关于列联表卡方检验在数学教育研究中的使用方法分析[J].统计与决策,2008(2):156-158.

[3]陆贤杰.用平均误差校正2×2联列表x2检验的可行性研究[J].中国卫生统计,1994(2):24-26.

[4]包和平,白玉峰,包德喜.四格列联表的独立性Fisher精确检验的近似检验法[J].数理医药学杂志,2007(3):301-302.

[5]何平平,王洪源,郭利霞,等.配对设计2×2列联表的精确检验方法及应用[J].中国卫生统计,2006(5):450-451.

[6]赵博娟,吴喜之.形成过程不同的列联表的检验[J].数理统计与应用概率,1997(2):78-85,86.

[7]王静龙,梁小筠.定性数据统计分析[M].北京:中国统计出版社,2008:39-65.

A Research on Independence Test of Fourfold Table Based on Monte Carlo Simulation

YE Ren-dao,XU Li-jun

(SchoolofEconomics,HangzhouDianziUniversity,HangzhouZhejiang310018,China)

In this paper, a Monte Carlo simulation algorithm is presented for three kinds of independence test statistics of fourfold table. And then, in order to test the optimality of the statistics, it uses the algorithm to obtain the Type I error probability and power of each statistics in different sample sizes and parameters. The result shows that the likelihood ratio test is better than the other methods when the sample size is small. Moreover, with the increase of the sample size, the three test statistics can more effectively control the probability of Type I error, and have a high power of the test. On this basis, the above-mentioned three test statistics are applied to the data analysis of the real cases.

fourfold table;Monte Carlo simulation;independence test;statistical power

10.13954/j.cnki.hduss.2017.02.004

2015-12-16

浙江省哲学社科规划“之江青年”课题(16ZJQN017YB);杭州电子科技大学优秀硕士学位论文培育基金(yxlw2016014)

叶仁道(1981-),男,浙江温州人,博士,教授,数理统计、经济统计.

C812

B

1001-9146(2017)02-0020-05

猜你喜欢
四格蒙特卡洛环卫工人
征服蒙特卡洛赛道
呈贡区总工会:对一线环卫工人进行慰问
爆笑四格
爆笑四格
跟踪导练(五)(4)
爆笑四格
爆笑四格
暖心!环卫工人收集50多把弃伞送给路人
基于蒙特卡洛法的车用蓄电池20h率实际容量测量不确定度评定
环卫工人 工会一直在你身边