丁鹏
摘要:本文运用pps抽样方法对2014年全国31个省市区社会工作人员考试合格人数进行抽样并对其总量和方差进行估计,并在95%的概率保证程度下进行区间估计,并就其估计结果与总体真实值进行对比与比较,发现运用pps抽样的对总体总量进行估计时要精确的多。
关键词:pps抽样;简单随机抽样;分层抽样;区间估计;比较分析 一、调查背景
社会工作是社会建设的重要组成部分,是一种体现社会主义核心价值理念,坚持“助人自助”宗旨,遵循专业伦理规范,在社会服务与管理等领域,综合运用专业知识、技能和方法,帮助有需要的个人、家庭、群体、组织和社区,整合社会资源,协调社会关系,预防和解决社会问题,恢复和发展社会功能,促进社会和谐的职业活动。在我国,各地的社会工作发展不一,但总体来说属于发展初期。随着我国社会工作的全面转型,各地正在按照中央的要求,着力建设宏大的社会人才工作队伍。社会急需一批既懂理论,又有实际训练的社会工作专业人才,以满足广大的市场需求,充分发挥他们在构建社会主义和谐社会中不可替代的重要作用。
二、原理介绍
pps抽样是一种不等概率抽样方式,最常见的是按总体单元的规模大小来确定抽选的概率。设总体中第i 个单元的规模度量为Mi ,总体的总规模度量M0=∑Ni=1Mi,则该单元的抽选概率为Zi=MiM-。这种不等概率抽样称作按与规模大小成比例的概率抽样,简称pps抽样。设总体中有N个单元,其规模度量分别为M1,M2,…,MN,假定Mi都是整数,且有M0=∑Ni=1Mi,这样共有M0个代码,每个总体单元都有一个代码范围,其中第I个单元相应的有Mi个代码,各代码的编号,可用累积的方法求的。
每次抽样时在整数1~M0中随机等可能的抽取一个号码,假设为R,观察R 落入哪一个单元的代码范围,若属于第J 个单元的代码范围,则第J个单元入样。若有的号码相同或落入同一个单元的代码范围,则该单元被重复抽中,如第1个单元共有M1个代码,被抽中的概率为M1M0,这就是按与规模大小成比例的概率抽样。
(一)抽样过程
在利用pps抽样方式抽取样本并对总体进行估计时,必须要有一定的先验信息,即事先知道总体单元的标志值差异较大,并且知道上一年或者若干年的相关信息为辅助,现利用表2中的数据来显示pps抽样的实施与估计过程。其中2014、2015年的数据完全已知,现利用2014年的数据作为 辅助工具,估计2015年全国各地区社会工作者考试合格人数,并与2015年数据进行对比.具体做法如下:(1)根据2013年全国各地区城市社会工作者合格人数编制单元的累计代码范围表,如下表(2)所示:
确定样本量,其中,n0表示有放回情况的样本量,Z0/2=1.96,Δ为置信度1-a估计总体均值时的允许误差,S2位=为总体方差。根据以往历史数据和统计经验,此处假设Δ=245,而根据13年数据可算出S2=27283.8,根据公式(1)课计算出n0=1.962×272836.82=7,因此在采用规模累计pps抽样时应取7个数据代码作为样本,并根据此估计标准值。
(1)这7个省市被抽中的概率为Zi=MiM,分别为:0.0265、0.0106、0.0944、0.0134、0.0527、0.0041、0.2147.用着7个样本来估计2014年社会工作者合格人数。采用汉森-赫维茨估计量,有公式可得:
(YHH∧)=1n∑ni=1YiZi=17×1730.0265+1240.0106+7010.0944+
1020.0134+3990.0527+270.0041+12760.2147=5145(2)
故估计推断31个省社会工作者合格总量5145人。
(2)抽样的方差由如下公式得:
V∧(YHH∧)=1n(n-1)∑ni=1∑ni=1Yiz-YHH∧2=1163720
(3)置信度为95%的置信区间为YHH∧±Za2V∧(YHH∧)即5145±1.961163720=5145±1.961163720,即3033-7457,而14年社会工作者考试合格人数为7417在置信区间内。
三、总结
PPS抽样的误差比较小,估计效果远优于简单随机抽样和分层抽样。PPS抽样的主要优点是使用了辅助信息,减少抽样误差,并且使总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。由此可以得出,PPS抽样适用于社会工作者考试合格人数的估计。(作者单位:西北师范大学)
参考文献:
[1]金勇进,杜子芳,蒋妍 著.抽样技术[M].北京:中国人民大学出版社,2012.
[2]倪佳勋. 抽样调查[M].桂林:广西师范大学出版社,2002.12
[3]中华人民共和国国家统计局.http://www.stats.gov.cn/