郑大龙
摘要:抽样框的设计在城市住户抽样调查中起着非常重要的作用,抽样框的主体结构以及所包含的内容将决定住户调查中抽样设计的估计方案和类型,而且会直接影响到抽样估计的精度。本文对城市居民住户抽样框设计展开研究,分析现阶段城市住户调查抽样框设计存在的缺陷及优化策略,对抽样框的设计方法进行修正,提高样本价值。
关键词:抽样调查;抽样框;误差;优化;改良
城市居民抽样调查是规模最大、调查范围最广的连续性的消费行为与媒介接触习惯的同源数据研究,一般每三年开展一次。抽样框的构造会直接影响估计的准确性,而抽样框的构造以及所涵盖的信息将会决定城市居民住户调查中估计思路的设计和整个方案的方向。
一、现阶段城市住户调查抽样框存在的弊端
近几年,城市经济发展迅速,经济的发展带动了城市人口的增多,使其占人口总数比例上升。由此看出,导致城市住户调查抽样框难确定的主要因素之一是城市人口变化。城市人口变化的主要原因有三点:首先城市郊区范围不断扩大,郊区是工业园的聚集地,从事工业成产的人口较多,而这部分人的生活特征也具有很强的代表性,导致分类模糊。其次是城市建设步伐加快,城市房地产行业快速发展,而且城区内的道路建设、旧建筑群拆迁改建,使得城市规模不断扩大。最后一点是调查方案中,数据统计困难,在统计户口在外地的居民时,因为公安户籍部门没有统计,街道办事处也没有可参考的准确数据,人口流动快,总数变化量大。除此还应该提到的是,城市人口调查资料是每三年更新一次,这导致调用的原有数据时间与调查时间又不匹配,从而得不到准确的住户数目,因此在构造抽样框时会有偏差。
在抽样调查中,每一个环节的非抽样误差都是难以避免的,无论哪一个阶段出现漏洞都有可能导致非抽样误差增加而使数据失真,控制误差的关键便是控制非抽样误差,在城市居民住户调查中,以下六点是导致出现非抽样误差的因素:
其一,当今社会,贫富差距大,财富聚集化严重,许多住户拥有多个住宅,这些住宅对应多个地址,在调查数据中造成一对多的现象。在抽样调查时,会破坏随机抽样中每个单一个体等概率抽取平衡体系,导致这些住户被抽中的概率增大,如果这些住户身上拥有某些特征值就会导致调查出现漏洞,产生非抽样偏差。
其二,我国经济稳步迅速发展,新城市的建设以及城市旧建筑群拆迁改造等项目增多,城市人口波动大,抽样调查对象的范围变大,使得抽样框的覆盖率不能达到百分之百,调查对象不能完全被涵盖,产生偏差。
其三,居民住户抽样框涵盖非对象单位。随着经济的发展,城市流动人口数量增多,例如农村进城务工人员很多,出租住房的情况也非常普遍,城市人口的大幅度变动使得目标对象整体发生变化,造成抽样框中包含非整体对象单位。这样的抽样框显然存在一定的缺陷。
其四,辅助信息在抽样框设计中的作用被忽略,在我国实际抽样框的编制中辅助信息的收集和利用没有引起足够的重视。在城市住户调查中辅助信息的准确性较差,有的数据没有及时更新已经过时,有些指标之间的数据相互矛盾,使用这些辅助信息进行统计分析必然会造成不准确的抽样调查结果。
其五,无意无回答误差。有两种情形,一种情况是调查对象没有按规定填写调查表并按时上交,另一种情况是没有按照真实的情况或者自己意愿填来填写调查表。前一种情况造成的原因有调查住户生病、出差、探亲访友等等,后一种情况则是由于调查住户的疏忽大意产生。对于这两种情况下的无意无回答,都需要调查员经常与调查住户保持联系,或者进行回访。在入户调查中,调查员的素质、责任心、访问技巧、沟通能力等都会使无回答现象发生。另外,由于我国部分城市的郊区地段,许多住户的文化水平较低,从对统计工作的配合意识淡薄,统计法律、法规对与此次参与抽样调查的对象而言,无法律效力。中国的法律中,统计部门对被调查者没有实质的法律约束力,使得这几年调查工作的开展都不是很顺利,造成重要调查数据有偏差。
其六,抽样框老化。抽样框的老化包括其结构的和包含内容的老化。抽样框的过时会导致调查中诸多问题的出现,更新不及时会导致在城市住户调查中产生较大的偏差。
二、城市住户调查抽样框缺陷的优化策略
(一)对调查对象涵盖不足的改良
1、重新界定目标抽样总体,把调查范围扩大。比如说,现在随着城市现代化格局的较大变化以及城市规模的扩大,城市中有些大中型企业设在郊区,这些在郊区的企业虽然分布在城市的边沿地带,少受人们的关注,但是这些也是城市组成不可丢弃的一部分,能够带动城市经济的发展。在这些企业工作的职员的庭活动在抽样调查时具有一定的代表性。在调查中涵盖这些对象,会使样本更具有代表性,估计值更加有价值,可为有关部门制定城市发展方向提供相关的有价值的资料。
2、把已经发现的丢失了的对象与原来抽样框中单位重新组合。例如,城市在发展建设过程中,使新建住宅区不断增加,但是抽样框未能及时更新,使得原抽样框目标单位涵盖不足,遗漏目标总体住户。对于这类漏洞,在没有展开调查前,对新增的小区设立专有的联合方式。对于新增的住宅区,可以使它与最相近的小区相连接,如果最近的小区被抽中,那么就可以认为新建小区被抽中,并接受相应的调查。
3、对流动人口建立单独的抽样框。由于城市郊区的镇子逐渐城市化,工业发展业迅速,我国的人口流动量大,速度快,进入了最活跃的时期,人口的流动趋势主要是由农村流向城市。而城市住户调查的调查对象包括居住半年以上的住户。我们可以对常住人口和流动户口分别建立对立的抽样框,把两个抽样框结合起来使用,这样就减少了人口流动变化大造成的抽样框偏差。
(二)对包含非调查对象总体单位的调整改良
1、利用有关信息调整。
2、对抽样框进行质量检查。
(三)针对无回答城市住户的办法
因为现在社会经济环境更加的复杂,人们也改变了其配合意识,在城市住户调查中,被调查者不愿提供所需要信息、不如实回答和拒访的现象越来越多。处理无回答无响应的调查住户,如果不采用新的方法抽样,沿用上下移动的方法重抽样本,就会使偏差变大,重抽样本的数量变多,这会直接影响到抽样调查的意义和随机原理。解决这个问题的办法有以下四点:
1、对样本进行插补。重新抽取与无回答住户的相似的住户调查,按照原来的住户信息类型进行补插。
2、设计合理的调查问卷。在调查中可以适当的调整问卷,对实质的敏感问题作出合理的补充。问卷不仅不要包裹实质性的问题,还需要设置一些问题使他们具备调节,过滤,控制的特点。
3、提高调查员的素质。建立健全调查体系,设置专门的机构对调查者进行培训,改善调查者的工作态度,明确调查的要求。以此来提高调查工作的质量。
4、利用回归模型来进行推算。如果调查时间充足,不需要过于担心预算,对无回答漏洞最好的改良方法就是进行多次访问,直到被调查者能够给出满意的调查问卷,但是如果条件不允许,我们可以利用回归模型,利用辅助信息与缺失样本项目的相关性,建立回归模型,求出回归值。
(四)针对抽样框老化问题采取的办法
抽样框的老化问题是导致抽样调查失真的关键所在,抽样框的诸多缺陷都是因为抽样框没有及时更新导致的,它会直接影响辅助信息的准确性,使得目标总体对象涵盖量达不到指定的要求。因此,缩短对抽样框的更新周期是很有必要的。首先抽样框应该根据最新的调查结果不断更新。其次是充分利用地方统计部门对抽样框进行彻底清查,提高估计精度。(作者单位:山东省龙口市统计局)
参考文献:
[1]方匡南,王斌会.抽样框误差测量及其控制[J].统计与决策,2007,(6).