俞桂芳
( 富阳市统计局, 浙江 富阳 311400 )
杭州富阳市城乡住户一体化调查误差控制分析探讨
俞桂芳
( 富阳市统计局, 浙江 富阳 311400 )
本文结合城乡住户一体化调查工作的实际,介绍了一体化调查误差的类别,分析了抽样调查误差、记账误差、数据处理误差,提出优化样本结构、提高记账质量、减少数据处理误差三个层面的误差控制措施。
住户调查;一体化;误差控制
住户调查是指以家庭为调查对象,为收集各种社会经济统计资料而组织的各项调查的总称[1]。作为民生统计之一,其重要性不言而喻。但是受城乡二元结构的制约,我国住户调查一直由城镇和农村实行不同的住户调查制度,两者在指标、标准、口径和方法上自成体系,收支水平和结构等统计数据不完全对称,没有形成涵盖全国城乡全体居民的可支配收入和消费性支出数据,也难以精确测算全体居民内部的收入差距和支出结构。随着以人为本、统筹城乡发展的持续深入,国家统计局初步制定城乡住户调查一体化改革总体方案,2012年底统一实施城乡住户一体化调查。由于城乡居民收入组成和消费结构变化显著、居民配合程度不高等原因,在主客观方面很容易引起调查误差,影响数据的准确性。如何最大限度地提高住户调查居民配合程度和控制调查数据误差,保证居民收支数据的准确性和透明度,始终是城乡住户一体化调查的重要课题之一。本文以富阳市为例,对一体化调查误差的类别、表现来源、控制措施进行了分析探讨。
调查误差(Error in Survey)是指调查户对自身家庭经济状况和收支水平记录与其客观实际情况的符合程度,即记账质量的可靠性[2]。按照城乡住户一体化调查工作的实施流程,大致可分为抽样和非抽样调查误差。
抽样调查误差,主要体现在样本选择过程中的样本误差。样本抽选包括抽样方法设计、调查小区抽选以及摸底调查、调查户落实等现场抽样工作[3]。抽样误差主要决定于抽样方法和样本量的多少。
非抽样调查误差,也称为登记误差,主要是指样本户确定以后,在进行实际调查过程中,由于样本户家庭和调查人员两方面原因造成的误差[4]。主要有记账误差、数据处理误差,这是现阶段影响住户数据质量的主要因素。
调查误差来源指的是引起调查误差的主客观因素。研究城乡住户一体化调查误差表现及来源,便于制定调查误差针对性的控制措施。从实践来看,住户调查中产生的误差主要表现为三种形式:
(一)抽样调查误差。城乡住户一体化调查的调查样本是以第六次人口普查的调查小区为抽样框抽取调查小区,采用随机起点、等距抽样方法抽选调查住宅。根据满足省、市两级样本代表性和分区、县(市)出数据的需要,富阳市的样本量确定为300户。无论从抽样方法还是从样本量看,300户的样本量是综合了人口规模、收入差距等因素,科学合理,抽样调查误差处于可控范围。但是受主客观因素的制约,会出现由于样本覆盖面不全而产生样本代表性偏低的非数量性误差。主要原因是:
1.低收入家庭占比偏高引起样本覆盖不全。就城镇点来说,富春街道抽中点收入明显偏低的有两个,占25%:凤浦社区第029普查小区为农居点(即老小产权房),小产权房的特点决定了样本户本质上还是农村人员,收入水平偏低;金桥社区第029普查小区本地居民较少,抽中的样本户均为外来户,流动人口的收入普遍偏低。新登镇作为富阳市副中心城市,两个抽中调查小区的居民收入完全不能与富春街道社区的居民收入相提并论。就农村点来说,抽中调查小区地理位置较偏、经济较差的有六个,占27.3%。
2.高收入家庭不配合引起样本覆盖不全。越是收入高的家庭,对记账工作越是不肯配合,甚至直接拒绝记账,就算勉强“接受任务”,也是为完成任务而“选择性记账”。“害怕窥视”,这有居民对住户调查认知、意识上不足的原因,说到底还是缺乏对住户调查明确的法律约束,这样导致的结果就是高收入家庭占样本量的比例过低而引起样本覆盖不全。
3.行政区划不对等引起样本覆盖不全。一些新建成的小区,因为入住率、配套设施等原因,没有纳入行政区划抽样框;部分村变社区,行政区划由农村变为城镇,但村进社区的配套工作并未同步完成,生活状况与农村类同,诸如此类导致抽样框本身存在问题。
(二)记账误差。记账误差主要来源于住户调查过程中住户配合程度和调查员业务素质。产生记账误差主要原因是:
1.记账户不稳定。富阳市一季度样本户配合程度评价显示,记账户不稳定的占20.3%。记账户记账不稳定有主观和客观的原因。主观上的原因,一是配合程度不够,一季度样本户配合程度很好和较好的占75.6%,一般的有15%,较差和很差的8.8%;二是记账户负担重,场口、大源、万市、新登部分样本户还承担了杭州市中心镇住户收支与生活状况记账工作,部分城镇样本户参加了“十个更好收入倍增”和“消费意向”问卷调查,可能让这些记账户产生畏难情绪。客观上的原因,一是流动人口不定期返乡,存在记账不连续和样本流失的压力。二是其他原因而不能继续记账,如偏远乡镇样本户举家外出打工、独居老人搬去子女家居住而成为空宅。
2.记账户漏报瞒报。城乡住户一体化调查工作的难点是收支漏报瞒报,收支水平较高的家庭漏报瞒报情况尤为严重。一是多代家庭的漏记,由于观念不同,多数子女对收支的内容与金额,采取保守的“汇报”,客观上造成漏瞒;二是隐性消费的漏记,网络及服务性消费的非实物性,容易忽视这部分消费支出;三是实物产品和服务收入漏记,比如单位食堂的免费工作餐、有价券、农村自产自用实物,由于不是现金收入,也容易漏记。
3.辅助调查员编码差错。这部分的误差是由于辅助调查员在账本审核、编码的过程中产生的。如调查中发现某个调查点出现多条大额的“房屋租赁支出”,经核实是辅助调查员在编码的时候,把“出租房屋收入(收入)”编成“租赁私房房租(支出)”。这种编码差错程序无法审核出,但是对收支两方面的影响是巨大的。辅助调查员负责的调查业务偏多、工作强度大、编制收支平衡表能力欠缺是主要原因。
(三)数据处理误差。城乡住户一体化调查数据先审后录,后期数据可以通过iHaps一体化住户调查数据处理系统的奇异值审核、控制范围审核、逻辑审核等进行一定程度的误差控制,但是人为误差还是普遍存在。主要原因是:
1.审核误差。收支的部分指标需要填写人码,如工资性收入和非农业生产经营收入、报销医疗费、农村外出从业寄回带回收入、非农生产经营费用等。只有在数据录入时通过显示的人名才能准确判定人码填写是否有差错,因此在账页录入的过程中还需要额外承担不断纠正账本剩余差错的任务。
2.操作误差。在较短时间内录入所有的账本数据,高强度任务下,手工录入不可避免出现误差。如数字多录入一位、重复录入;对计量单位较多的指标,如亩/公斤、头/元/公斤在iHaps一体化住户调查数据处理系统上并没有相同的单位名称,相对应的是数量/金额、数量/金额/备注,录入位置容易出错。手工录入误差的逐步累积,对收支数据的影响有时候是灾难性的。
在总结、借鉴城乡住户一体化调查的实践和经验的基础上,城乡住户一体化住户调查可以采取如下误差控制措施:
(一)优化样本结构。对于不够符合实际现状的样本结构,在居民人均可支配收入、现金消费支出数据的变化趋势进行对比分析评估的基础上,建议通过调整个别样本点和零星换户的方式对样本结构进行微调。零星换户需要对新老户的基本情况,如家庭规模、就业人口、职业、收入等情况进行详细比对,同时充分考虑高收入群体对记账配合程度较低的因素,适当增加高收入群体的样本分配比例,以保证高收入层足够的有效样本数。通过这样的方式,合理修正样本结构,逐渐减小因样本代表性不足带来的误差,让样本代表性合理回归。
(二)提高记账质量。记账质量对一体化调查工作至关重要。可以从三个方面来提高。1.调动记账积极性。一是培养记账习惯。调查中发现很多家庭都没有记账的习惯,也不知晓记账方法,需要多次上门辅导记账方法,逐步让记账内化为一种习惯。二是提高记账补贴。虽然记账是一种社会义务,也是一种劳动,物质报酬是劳动价值的体现;2.夯实记账基础。一是设定试记账周期。实践证明,试记账周期必不可少。辅助调查员与新记账户在试记账周期深入沟通,基本能发现记账漏记瞒记之处。二是及时反馈记账差错。记账质量需要在不断修正中提高,每月将记账差错进行上门反馈、指导;3.科学管理辅助调查员。辅助调查员作为与记账户的直接联系人,他们责任心、沟通能力、业务素质的优劣,直接影响住户数据质量。一是提高业务能力,使“死账”(住户的记账)变为“活账”(真实反映居民生活状况的记账)。通过辅助调查员例会,系统学习住户收支调查方案,交流新情况、新问题,提高质量审核把关能力。二是强化台账建设。加强分户分人收支台账、分户常规收支台账、访户台账、大笔收支台账建设,促进辅助调查员的基础工作。
(三)减少数据处理误差。数据处理过程很难做到零误差。目前能做到的就是最大限度地减少人工操作误差,将数据处理误差的不利影响降到最低。1.提高账本质量审核的标准,采取自审、互审、专审等多种审核方式,注重平衡关系、逻辑关系、对应关系等方面的审核。2.提高数据录入人员的责任心,关注大额数据录入,保证录入准确度。3.将人工审核与程序审核相结合,减少因录入失误造成的误差。
[1]尧声.住户调查.中国统计,1983,4.
[2]百度百科调查误差词条. http://baike.baidu.com/link?url =3DAGq7BEw8fITGkZFwXioDkVBhTWGvtOGtw9OwXB49q2 QZrNeq-_o6guP3qase_1jwsSDsS8iZ9QDWalO_UDHq.2012.
[3]浙江省收支与生活状况调查方案(试行).2012.
[4]宫春子.减少城市住户调查误差.中国统计.2005,10:53-54.
10.3969/j.issn.1674-8905.2014.02.021
牛域宁)