邢雨晴 漆志鹏 盛梦成 刘素红
【摘 要】本文介绍了运用Simmons模型对敏感性问题调查的原理及方法,在此基礎上建立了针对多项选择敏感性问题的科学简单的作答方法,并运用于高校体育场馆大学生不文明行为的调查中。调查时选取有90%把握,使敏感性问题调查所得估计值与真实概率之间差异不大于5%的最小样本量,节省调查时间与成本。
【关键词】Simmons模型 多项选择敏感问题 最大似然无偏估计 最小样本量
一、引言
敏感性问题通常指涉及隐私或利益而不便向外界透露的问题。调查者若直接问答,作答者为了保护自己的隐私或其他目的往往会拒绝回答或故意作出错误的回答。这破坏了调查结果的真实性,调查者也无法知晓破坏程度的大小。1965年Warner提了针对敏感性问题的随机应答技术,作答者根据随机化装置,回答两个相互对立的敏感性问题之一且只需回答”是”或”否“,这使调查者不知作答者回答两问题中哪一问题。1967年Simmons等人对Warner模型进行了改进,问题设置为一个敏感性问题与另一个与之不相关且已知概率的非敏感性问题,更加改善了作答者合作态度。本文基于Simmons模型的原理并对其进行改进,运用可产生多项结果的随机化装置,建立一种针对多项选择敏感性问题的作答方法。
二、模型的建立与求解
1.多项选择敏感性问题调查方式
在一个不透明装置中放置大小、质地相同的写有字母A,B,C,D,E,F,G,H,I(设字母为i,字母种类为m)的小球,比例分别为pA,pB,pC。。。。。。。敏感性问题的选项个数为n(nm),若作答者抽中字母j,则选择选项j。设p为回答敏感性问题的人的比例,为所有作答者选择选项j的概率,为回答敏感性问题的人中选择选项j的概率。由全概率公式,得,可得回答敏感性问题选项的概率为。
设作答者总数为,作答者中选择选项的人数为。随机变量表示第位作答者选择选项,由于诸相互独立,则 服从二项分布 ,由数理统计知识,可得 为的最大似然无偏估计。由此得的最大似然无偏估计为,的方差的一个无偏估计为
2.样本容量的选取
样本容量较小时,可能出现的估计值为负数的情形,这显然与现实不符。为了提高调查精度,通常要选取较大的样本量,但这会增加调查的花销与时间成本。为此,本文计算有90%把握使多项选择敏感性问题调查所得估计值与真实概率差异不大于所需的最小样本量。与的接近程度可由中心极限定理得出,故
因此有,得到可选取的最小样本量为为了尽量减少调查样本量,同时使调查结果精度较高,应使值较小同时增大值,但值过大时作答者合作意愿会降低,可令,此时调查所需的最小样本量为。
三、应用实例与结果分析
以调查南昌航空大学体育场馆中严重不文明行为为例,选取多项选择敏感问题调查方式,应用随机应答技术,在不透明装置中放置大小、质地相同的写有字母A、B、C、D的小球,比例分别1/9,1/9,1/9,2/3。综合考虑其他因素影响,选取校内650名本科学生作为调查对象,问题设置为:“您有过在校内体育场馆因比赛或运动激烈等爆粗口的行为吗?”。选项为:.从未有过;.有过,但很少;.经常
调查结果显示
根据调查结果,可以得出大学生在体育场馆中约33.12%的大学生在体育场馆内有过爆粗口的行为,4.30%的大学生在体育场馆内经常爆粗口,由此可见大学生高校体育场馆内不文明用语现象严重。文明是大学生应具备的基本素质,反映出大学生的思想面貌和精神境界。文明的体育场馆环境,会使学生更加愿意进入场馆内锻炼身体,提升高校体育场馆的利用率,优化资源配置。同时,这促使学生把文明运动当成一种习惯,在运动中增强体质,在运动中升华品德。
参考文献
[1]修洪波.对高校大学生不文明行为的分析及教育对策[J].中华少年,2015,(20):6.
[2]茆诗松,程依明,濮晓龙.概率论与数理统计[M].北京:高等教育出版社,2011.