PPS抽样方法在我国国际旅游收入预测中的应用

2014-09-28 23:29殷航
2014年22期

殷航

摘要:本文通过对我国31省市自治区的国际旅游收入进行不等概率抽样,抽取了12个对象作为样本,预测了2012我国国际旅游收入总额以及抽样方差,通过与简单随机抽样的结果进行对比,发现当总体单元之间差异较大时,PPS抽样方法能够取得较好的估计效果。

关键词:PPS抽样;简单随机抽样;国际旅游收入

引言

改革开放以来,中国旅游业迅猛发展,2007年到中国旅游的外国游客就已达到了5470万人,我国的国际旅游收入不断增长,从2007 年的3723.3亿美元到2012年的6644.7亿美元,增长接近两倍。据世界旅游组织的预测,至2020年,中国将成为全世界主要的旅游目的地国家,据估计届时将有1.3亿旅客前往中国。我国已经逐渐发展成为一个世界级的旅游大国,而旅游业也不可或缺的成为了我国国民经济的重要增长点。从2005年起,我国汇率制度有所调整,新的汇率制度使得人民币的波动性有所增加,这一变动将相应的对我国国际旅游收入有所影响。本文通过运用PPS抽样方法,对我国国际旅游收入进行预测,为保障我国宏观经济平稳增长的政策制定提供了借鉴意义。

一、PPS抽样方法简介

1.不等概率抽样

在简单随机抽样中,总体中的每一个单元都是等概率入样,而分层随机抽样中,对每一个层中的抽样也是简单随机抽样,所以层内抽样也是等概率的。等概率抽样的实质就是把每个单元平等对待,但如果总体单元相差较大时,等概率抽样得到的效果不好。为了取得较好的预测效果,采用不等概率抽样,即在抽样中将总体中的每个单元的入样概率与单元规模大小结合起来,这样每个单元就被赋予了不同的入样概率。假设总体的第i个单元的规模度量为Mi,总规模度量为M0=∑ni=1Mi,那么i单元的入样概率则为Zi=MiM0。我们把这种抽样方法简称PPS抽样。

2.PPS抽样的操作方法

PPS抽样的操作方法较多,本文选择规模累积等距抽选法,该方法的操作具体如下:

设总体单元数为N,其规模度量分别为M1,M2,…,MN,将规模度量不断累积至M0=∑ni=1Mi。假设需要抽取容量为n的样本,那么就必须先求出等距抽样的间隔K=M0n,然后在1~K中随机一个整数,将该数记做a,则a所在的单元代码区间对应的单元就为选中的单元。之后每隔K个度量值,即a+K,a+2K,……a+(n-1)K等数字所在的单元代码区间的相应单元,即为被抽中的单元。

3.Hansen-Hurwitz估计量

1)总体总量的估计

Hansen-Hurwitz提出对总体总和Y的估计量为:

Y∧HH=12∑ni=1YiZi

Yi表示第i个入样单元的变量值,Zi是第i单元的规模大小的入样概率,Zi=MiM0。且Y∧HH是总体总量的一个无偏估计。

2)方差估计量为:

V∧(Y∧HH)=1n(n-1)∑ni=1yizi-Y∧HH2

二、实证分析

1.PPS抽样估计

1)数据收集与处理

本文选取2012年与2013年我国31个省市自治区国际旅游收入的原始数据,针对2012年国际旅游收入总额,本文采用PPS抽样方法,共抽取了12个省市作为入样样本,以2012年国际旅游收入总额为规模度量并同时进行累积。计算得M0=∑Mi=59682,样本容量n=12,抽样间隔K=M0n=5968212=4974。在1-K间抽取随机数a=351,随机数a处于北京的代码范围之内,所以北京作为抽中的样本,按照PPS抽样的实施方法,继续抽取剩余省市,即为辽宁省、上海市、江苏省、浙江省、福建省、山东省、广东省、重庆市。其中,北京市被重复抽中两次,记入样2次,广东省被重復抽中三次,记入样3次。本次抽样总共由9个省市。

2)总体总量估计

根据抽样概率的公式为Zi=MiM0,可以得到入样的10个省市的被抽选的概率。

根据汉森-赫维茨对总体总量的估计式,由公式可得:

Y∧HH=1n∑ni=1YiZi=112

51490.09075+32640.04546+…+11680.01622=61322

所以,根据估计结果可以推断出全国31个省市2012年国际旅游收入总额为6132.2亿美元

抽样方差:

V∧(Y∧HH)=1n(n-1)∑ni=1yizi-Y∧HH2=3860531

在置信度95%下,2012年国际旅游收入总额的置信区间为:

Y∧HH±Za2V∧(Y∧HH)=(57470~65173)

在2012年,根据统计年鉴数据,实际的31个省市国际旅游收入总额为6466.7亿美元,处于计算所得的置信区间之内。

2.简单随机抽样估计

根据随机数,抽取12个地区作为样本,各入样省份即为天津市、河北省、青海省、上海市、福建省、四川省、广东省、湖南省、云南省、甘肃省、山西省、新疆省。

总体总量估计:Y∧=Nn∑12i=1yi=87751

总体方差估计:V∧(Y∧)=N(N-n)n(n-1)∑ni=1(yi-y)2=932490842

置信度为95%的置信区间为:(27899~147603)

三、小结

本文采用PPS抽样方法对我国31个省市自治区2012年的国际旅游收入进行抽样,估算得我国国际旅游收入2012年总额为6132.2亿美元,置信区间为(57470~65173) ,而2012年我国国际旅游收入总额为6466.7亿美元,处于置信区间中。本文通过实践,对PPS抽样方法、简单随机抽样方法这两种方法进行比较,得出在总量估计值、方差估计值这两种计算结果上,PPS抽样方法的计算精度都优于简单随机抽样方法。所以,针对总体单元差异很大的情况,选取PPS抽样方法能更准确的预测国际旅游收入总额,预测精度更高。(作者单位:南京财经大学)

参考文献:

[1]冯士雍.抽样调查理论与方法[M].北京:中国统计出版社,1998.3

[2]倪家勋,张勇.调查内比估计效果的数据模拟分析———关于简单抽样设计与 PPS 系统抽样设计的比较[J].统计研究,2005,(11):32-35.