刘林平 毕先进 刘昱君
摘 要:缺失值(项目无回答)现象是问卷调查中的“元问题”,不只涉及问卷设计、数据收集方式、访员素质等因素,还有更为深刻的社会原因。通过分析2010年珠三角和长三角19城市进行的一次大型问卷调查所得数据,我们发现,与西方研究者认为经济社会地位较低的被访者具有较高的项目无回答率相反,在农民工群体中,显得更为弱势的女性、有宗教信仰者、蓝领、精神健康状态不佳人群和朋友数量较少者更能配合问卷调查。但遭受过权益侵害的人则可能保持沉默,有较高的缺失值。问卷调查不是简单的信息收集过程,还是涉及被访者回答能力、态度的社会互动过程。问卷回答者的沉默是社会生活中沉默的自然表现,具有深刻的涵义。如果将问卷调查看作一种社会关怀的形式,我们认为,农民工群体中弱势但不对社会绝望的人,更希望社会了解他们,更需要关怀。
关键词:缺失值;项目无回答;农民工;问卷调查
中图分类号: C912 文献标识码:A 文章编号:0257-5833(2017)04-0064-13
作者簡介:刘林平,南京大学社会学院教授、博士生导师;毕先进,泰山学院管理学院讲师,博士;刘昱君,香港大学社会工作与社会行政学系博士候选人(江苏 南京 210023)
2016年美国大选以共和党候选人唐纳德·特朗普的获胜告终,这使得世界范围里的社会公众大为震惊,因为此前的大多数民意调查预测的结果与之恰恰相反。这些科学的民意调查为何失灵呢?根据分析,其中一个原因是特朗普的支持者在民意调查时保持了沉默,造成了缺失值,从而形成了系统性偏差。由此可见,在社会科学研究尤其是定量研究中被不少研究者忽视的缺失值问题,其实非常重要,它既是一个技术性问题,也可能是一个社会性问题,在特殊条件下,它甚至可能成为一个非常重要的社会问题。
问卷质量对于问卷调查的成功与否至关重要。评估问卷质量的一个重要指标是问卷中缺失值的多少。缺失值又被称作项目无回答(item nonresponse),即“调查中的部分问题被拒答或无回答,而不能编码。通常,这种类型的缺失数据使得调查中的总体回答率相对降低”。1缺失值使得问卷收集的信息量减少或受损,过多的缺失值,尤其是在关键变量上的缺失使得问卷的一些变量无效或作废。在数据的缺失不是随机缺失(missing at random, MAR)的条件下,这样的数据用作估计时就会产生选择性偏误(selectivity bias)。因而,对问卷缺失值进行研究非常有必要。
对缺失值问题进行的研究有两种取向:统计学取向和社会学取向。前者往往将问卷缺失值的产生归之于问卷设计、数据收集方式、访问员素质和工作责任心等因素,认为缺失值的出现是一种“错误”或“缺陷”,质量好的问卷应该将缺失值降至最低,甚至没有。统计学还将怎样对缺失值进行修补作为其工作重点1。从社会学的视角来看,问卷缺失值的产生就不仅仅是技术失误问题,而是有更深刻的社会原因,缺失值可能体现了社会结构、社会条件和社会生活的某些特征。如有的研究指出:对弱势群体的调查可能会导致更高的缺失值。本文重点从社会学取向来研究缺失值,从农民工自身的社会特征,以及调查员和农民工的互动来探讨缺失值产生的社会原因。对农民工来说,是什么使得他们面对问卷调查时不愿说、不能说、不会说、不知道怎么说,从而形成缺失值,是需要我们去探讨的。
一、文献回顾
在问卷调查中,被调查者无回答的情况可以分为两种:单位无回答(unit nonresponse)和项目无回答。单位无回答是指,接受调查的一个完整的分析单位的数据对于统计分析来说是不可用的。出现这种情况的原因可能是,一个单位不能被联系到,或者其拒绝合作。所谓“单位”指的是应用于抽样、数据采集或分析的单位2。项目无回答则是特定项目(如某些问题或变量)的数据不可用于分析,但整个单位还是可以的。“不可用”这个词是对目标而言的,答案是否算作缺失取决于研究的特定目标。例如,“不知道”对于选举投票的倾向来说是有意义的回答,但对于收入来说并没有报告的意义,因而被算作缺失。所以,一般而言,项目无回答在调查或问卷中对于获得信息来说是失败的,即数据缺失3。
项目无回答有四种潜在的来源:问卷、数据收集方式、被访者和访问员。这四种来源之间也相互作用4。问卷本身的设计、布局5,以及问卷设定的回答项“不知道”的内涵6等会导致项目无回答的产生。就问卷题目类型来说,涉及个人或敏感问题、需要回忆的问题,或对于不知道的问题,项目无回答率较高7。Donald发现,在邮寄调查中,被调查者对目前行为的问题比态度问题的项目无回答率低8。Ferber在消费者调查中发现,在需要思考或努力回忆的问题中,项目无回答率较高9。Craig和McCann在对邮寄式问卷的研究发现,一般来说,问卷中3-8%的项目被留空。“项目无回答”现象与问卷长度无关。与其他类型的问题相比,AIO (activity-interest-opinion,即行为-兴趣-意见)式问题的回答遗漏情况更少10。Messmer和Seymour发现,分支型问题无回答率显著高于其它问题11。Emil Kupek对1990年至1991年进行的英国国民性态度和生活方式的调查研究发现,对于大多数被调查者而言,关键的困难是回忆的准确性而不是性问题的敏感性。对于少数(5%)被调查者而言,话题的敏感性对项目不回应才有很大影响1。
搜集数据的方式同样也很重要。三种主要的资料收集方式——自填式问卷、面对面访问和电话访问——都有其优点和缺点。一般来说,自填式问卷适合于那些更有经验和被人信任的被调查者,用以更加诚实地回答敏感性问题。当题目敏感并看起来有威胁性时,使用自填式问卷会减少大量的缺失值2。计算机辅助的面访问卷和自填问卷比纸笔问卷的项目无回答更少3。有研究认为,电话调查比访问调查更容易出现项目缺失数据4。但Rogers的研究结果表明,打电话与亲自面访获得的数据质量差不多。区别在于,面访比电话访问使被调查者更容易给出符合社会期望的答案,电话获得的投票数据更加准确,面访获得收入数据更加成功5。不过,面对面和电话访问都比邮件访问可能有更少的项目无回答6。
就调查员来说,训练有素和受严格监督的调查员所得数据缺失值更少7。女访问员比男访问员能得到更高的回答率,可能因为女性较不易引起被访者的怀疑,对部分被访对象(如老人)来说,女性的威胁性也小。尽管许多人赞同这一说法,但仍然缺乏有力的证据表明回答率与访员性别的关系8。Riphahn和 Serfling认为,如果调查员为女性而被访者也是女性的话,则项目无回答率较高。被访者和调查员具有相同的职业地位或教育水平对项目无回答结果并没有显著影响9。Rogers发现,那些不受个人情感影响的、“冷酷的”(以任务为导向)访问员与那些容易受个人情感影响的、“热情的”(以人为导向)访问员相比,前者的项目无回答率更低。在面对面调查中,访问员这种差异的影响比电话调查要大。此外,项目无回答还受调查员对调查问题态度的影响10。Sudman等人发现,访问员对于整个访问偏差大概要承担7%的责任,调查员认为某个问题很难回答,可能就会出现较高的项目无回答率,而调查时充满信心,无回答率就相对较低11。Bailar等指出,如果调查員认为该问题是不恰当的敏感性问题(例如收入问题),在他的调查对象中,这个问题会有较高的项目无回答。他们提出,对调查员的偏见和误差可以以无回应率和非精确率作为衡量指标12。
就被访者来说,Ferber在消费者调查中研究了被调查者的特征对项目无回答的影响。他发现被调查者的社会经济特征(年龄、性别、职业和教育程度)是与项目无回答相关的重要因素。女性、年龄较大者、受教育程度和职业等级较低者的项目不回应率较高1。Francis 和Busch认为,“不知道”和“无意见”的回答都不是随机现象。女性、非白人、低教育程度者、低收入者、具有低政治效能感的非参与回答者会有较高数量的“不知道”反应2。Craig和McCann的研究指出,被访者的年龄和教育程度是影响回答率的重要因素,而收入和职业对项目无回答没有影响3。Messmer和Seymour发现,年纪偏大的被访者确实更容易出现漏答的情况,而教育和性别对无回答出现的概率没有显著影响4。但是,很多研究者认为,年长者和教育程度较低者有较高的缺失值5。Colsher 和 Wallace研究了65岁及以上的成年人对问卷调查中的项目无回答问题后指出,面对面的问卷调查中被访者的无反应率随项目的主题变化而变化,“不知道”的反应比被拒绝的要常见得多,并且随着被调查者年龄增加而增加,女性往往比男性更为常见,而且常常与较差的生理、认知、心理功能相关。6John Chesnut对人口普查问卷缺失值的分析表明,被访者是少数族裔、有租客的家庭,或是人口较多的大家庭使项目回答率降低,被访者是一般家庭成员还是家庭主要成员也有较大影响7。Leigh 和 Martin认为,在电话调查中,有经验的、参与过调查的被访者比没有什么经验、没参与过调查的被访者项目无回答率更低8。
西方研究者对项目无回答问题进行了深入和细致的分析,一些结论比较明确和稳定,但并没有较为统一的标准答案,说明了该问题的复杂性。这可能是由于研究的问卷和调查方式各不相同,而这些因素又相互影响,所以形成错综复杂的结果。需要特别指出的是:很多研究者认为,较低经济、社会地位的被访者(如少数族裔、低收入者、低教育程度者、职业等级较低者等)具有较高的项目无回答。 问卷调查的过程并不只是一个简单的信息收集,也是被调查者解除戒备、建立信任、回答问题的社会互动过程,不同的社会和文化可能有不同的社会互动过程。因而,中国问卷调查中缺失值的产生可能有不同于西方的影响变量和发生机制。
国内学术界对问卷调查的无回答问题也有研究。统计学的研究者较多采用数理方法讨论无回答所引起的误差和补救方法,基本不涉及引起无回答现象的社会因素9。社会学的研究者较多讨论问卷的回收率,从而间接涉及到单位无回答问题1,但这种讨论并非直接研究单位无回答问题,而且讨论也主要基于一般经验而缺少细致、扎实的实证材料和统计模型分析。
孙妍等人研究跟踪调查中的拒访行为,他们分析了导致拒访的受访家户和主事者的社会经济特征、参访经历等影响因素,其研究比一般性讨论问卷的回收率更为深入和细致2。
严洁用序列变量逻辑斯蒂回归和稳健回归研究了受访者特征和问卷题目信度对项目无回答的影响。她的研究发现:首先,中国公众对问卷题目无回答的根本影响因素是受访者的回答能力,这主要表现为教育程度和年龄,无回答的发生比率随着教育年限增加而降低,老年人相对于年龄较轻者更不愿意回答问题;第二,受访者的城乡和地域属性对无回答也有显著影响,农业户口比非农业户口,西部省份比东、中部省份的受访者有更高的无回答率;第三,测量指标的信度水平对无回答也有显著影响3。但是,这篇文章对相关变量的处理情况交代不够细致,使得我们对其模型及其结果难以评判。此外,严洁的研究完全忽视了调查员因素。当然,这可能与她不是这些问卷的设计、组织和调查执行者因而缺乏资料有关。
的确,国内研究者对项目无回答问题少有研究,以至于严洁说:“迄今为止还几乎没有专门针对中国社会科学抽样调查中的项目无回答的成因所做的实证研究。”但是,其实在此之前,陈膺强、王建平和张立娟就对此进行过研究。
陈膺强分析了1995年香港社会指标调查(问卷E)的资料,发现部分问题的无回应(包括拒绝作答或表示不知道者)接近20%甚或达到30%以上。就问卷问题而言,被调查者较少关注、想及或涉及隐私的问题无回应率较高。女性、年龄较大或教育程度较低的被访者有较高的无回应率4。但是,陈膺强的结论主要建立在描述统计的基础上,并没有建立模型进行深入分析。
王建平、张立娟将影响调查数据质量的因素概括为四:问卷设计、调查员、被访者自身特征和调查场景。他们使用“全国综合社会调查”(2003年城市部分)的问卷为资料,以被访者特征做为第一层次、调查员特征作为第二层次构建了一个多层次泊松回归模型,结果发现:在被访者层次,女性比男性、已婚者比单身者、在职工作者比离退休等未工作者,前者答题缺失值显著少于后者;年龄越大答题缺失值越多,收入和受教育程度越高者缺失值越少;居住在单位社区、高级住宅区或普通商品房小区者比之老城区、移民社区、集镇社区和农村社区者缺失值更少;调查员上午12点以前入户比晚上6点以后入户缺失值少;在调查员层次,性别和调查员与被访者年龄与性别的交互项都不显著,从常数项和随机效应来看,调查员对于问卷质量的影响是显著的,但上述调查员变量却不显著,这主要是调查员信息太少所致5。
王建平和张立娟的研究思路非常清晰,所得结论也很有启发性。但是他们的工作可能具有的问题或缺陷是:其一,他们对缺失值的统计并不是问卷的全部题器,而只挑选了165个普适题器,仅占问卷全部747个变量的22.1%。而以往研究告诉我们,缺失值更多地发生在后续(或分支)题上6,对后续题或其他没有进入统计的题器的忽视一定会带来偏差;其二,在自变量上,一些重要变量可能遗漏,从而产生遗漏变量偏差。我们认为,缺失值的多少,并不只是被访者回答能力的问题,也是一个态度问题,这显然和被访者的社会经济地位相关,也和他们的生活遭遇相关;其三,他们模型中调查员的变量都不显著,就如他们自己所说,显然是缺乏调查员的基本资料所致。
二、抽样与问卷
2010年7-8月,我们对珠三角和长三角19个城市1的外来工(农民工)进行了较大规模的问卷调查。本次调查对象是两区域跨地域(县、市、区)流动的、大专学历及以下的外来务工人员,共发放问卷4254份,回收有效问卷4152份,有效回收率为97.6%。
对于外来农民工调查进行抽样的困难在于缺乏一个总体的抽样框。这也是几乎所有流动人口或边缘人群的抽样调查中曾经遇到的问题2。为此,我们以城市外来人口的相对比例作为样本分配根据,将各省市政府部门公布的有关统计数据中性别、产业、地区分布作为参数进行配额。具体而言,根据以上统计数据,计算出19个城市的外来人口总数,然后按照各城市占总体的比例分配样本,再进行微调——将低于100样本的城市调至100,最终确定各城市样本配额;在城市内部,我们根据性别、产业和地区外来工的分布,进一步制订了配额表,每个城市的分配方法是一致的;而在企业样本的数额分配上,我们规定:企业规模在30人以下的,只做一份;企业规模在30-299人之间的可做3份;规模在300人以上的,则可做5份,多份问卷须选择不同性别、工种、年龄或来源地的外来工。
本次调查的访问员由广东、上海、江苏和浙江的在讀本科生和研究生组成。在调查之前,对调查员进行培训,并组成调查小组,每一小组有一名督导员专职指导调查活动,检查问卷质量。调查根据配额信息与便利原则选择被访者,由调查员与被访者一对一进行面访。在面访过程中,要求调查员严格按照问卷的题目顺序提问。在调查执行过程中,课题组与各地访问员之间每天汇总样本信息,随时调整,使之符合配额分布。
总之,这样的抽样方式是一种大样本、多地点、多机构合作的非概率抽样方式。相关研究表明,只要样本足够大,并且根据已知的抽样定额分配样本,非概率抽样也可以大大减少误差3。而我们的抽样方式有助于克服抽样时的地理集中(geographic concentration)和隐藏的选择偏见(hidden selection bias),从而可以提高样本的代表性和推论统计的可靠性4。因此,我们的数据尽管并非是一个严格意义上的随机样本,但仍然具有相当的代表性。当然,它也不可避免地包含了非随机抽样的局限性。
由于问卷缺失值问题(项目无回答)属于非抽样误差5,现有文献基本无人提及由项目无回答所引起的误差与抽样有关,因而,我们对本次调查的抽样过程不做详细介绍,相关情况参见我们已经发表的论文6。
此外,本次调查所用问卷包含的全部变量为687个,调查平均耗时58.96分钟。我们以此次问卷收集的数据为资料,对缺失值问题进行研究。
三、缺失状况
在我们的问卷中,缺失值分为两类:其一,是对某一问题完全无反应或没有回答;其二,是回答“不知道”、“不清楚”。对于“不知道”、“不清楚”的回答,我们的处理原则是:如果问题涉及知识或态度,这样的回答就是有效的。比如,问卷中询问了对《劳动法》、《劳动合同法》的了解程度,如果回答“完全不知道”,也是有效的回答,不算作缺失值。如果问题是对自身最基本情况的了解,比如宗教信仰,回答“不清楚”的,就算作缺失值。
问卷缺失的情况可以分为两种:其一,以变量为单位的缺失,也就是指每一个变量的缺失情况,在本次调查的4152份有效问卷中,有些变量是没有缺失的,比如年龄、性别,有一些则有缺失;其二,以问卷为单位的缺失,指的是一份问卷共有多少个缺失值。这里的问卷缺失,不是前文所述的单位无回答,即并不是整份问卷的缺失,而是已经回收的有效问卷中,以一份问卷为单位来计算的项目无回答。
(一)变量缺失
在全部687个变量中,完全没有缺失的变量有43个(6.26%),缺失值超过30个的变量有161个(23.44%),超过100个的有54个(7.86%)。全部变量的缺失值的平均值为31.63(标准差71.10),众数为2,中位数为9,最大值为628。
在我们问卷的问题中,有一些题是全部回答者都要回答的,可以称之为必答题(238个);有一些题有选择性,即跳答题(449个)。根据研究的需要,我们将这些题型分为三类进行比较。由于跳答题的基数较难确定,我们只比较必答题。结果见表1:
表1 三类题型缺失值的比较
[题型(题量) 平均值 标准差 众数 中位数 最小值 最大值 均值差 第一组 目前状况(173) 35.27 65.96 2 13 0 487 -32.71** 回忆问题(65) 67.98 127.05 2 11 0 628 第二组 行为或事实(175) 47.34 97.49 2 14 0 628 11.83 态度(63) 35.51 52.63 2 11 0 279 第三组 自身情况或态度(159) 48.59 97.27 2 11 0 628 -86.63** 家庭或其他成员(9) 135.22 153.16 - 14 0 312 涉及朋友(3) 17.33 6.35 21 21 10 21 13.94 涉及企业(52) 20.60 17.29 4、11 15 2 77 涉及社区(6) 34.67 56.92 0 18 0 149 涉及社会(11) 23.55 25.69 9、11 11 5 82 ]
注:均值差采用T检验,*** p<0.01, ** p<0.05。第三组均值差依次为“自身情况或态度”与“家庭或其他成员”之差、“自身情况或态度”与其他组加总之差。
从表1可见,回忆型问题的缺失值显著高于关于目前状况的问题,而行为或事实的问题与态度问题并无显著性差异。在第三组中,我们按照费孝通差序格局的说法1,将问卷问题分为从自己到社会的六个等级,显然,涉及家庭情况的问题缺失值最高。进一步的交互分析则表明,对家庭情况的缺失值集中在未婚和26岁及以下者。
在241个必答变量(或问题)中,有29个变量的缺失值超过100个,相关情况见表2:
表2 超过100个的缺失值题型情况
[题型 题量 平均缺失值 平均缺失值差 第一组 目前状况 16 196.94 -88.21* 回忆问题 13 285.15 第二组 行为或事实 20 277.70 132.81** 态度 9 144.89 第三组 自身情况或态度 24 203.21 -36.39 家庭或其他成员 4 296 涉及朋友 0 - 涉及企业 0 - 涉及社区 1 149 涉及社会 0 - ]
注:均值差采用T检验,** p<0.05,*p<0.1;第三组平均缺失值差为自身情况或态度与其他组加总之差。
在表2中,目前状况与回忆型问题的缺失值还是存在显著差异,行为或事实的问题与态度问题也有显著差异,而第三组分类则无显著差异。
由此,我们的结论是:在农民工问卷调查中,回忆型问题的缺失值与不需要回忆的问题(目前状况)有显著不同,回忆型问题缺失值更高。一般来看,行为或事实的问题与态度问题并无显著性差异,但在超过100个缺失值的问题中,行为或事实问题的缺失值显著高于态度问题。这一结论与Donald1的发现恰好相反。不过,他研究的是邮寄式问卷,而我们的问卷是面对面的访问;农民工中的未婚者和26岁以下者對家庭情况不太了解,在从自身到社会的分组中,缺失值最高。
(二)问卷缺失
表3描述了以整份问卷为单位的缺失情况:
表3 问卷缺失的一般情况
[ 平均值 标准差 众数 中位数 最小值 最大值 缺失
数量 空缺 4.94 5.54 1 3 0 53 不知道或不清楚 0.41 0.80 0 0 0 8 总计 5.35 5.64 1 4 0 53 缺失
比例(%) 空缺 1.54 1.71 0 1.00 0 15.27 不知道或不清楚 0.13 0.26 0 0 0 2.52 总计 1.67 1.75 0 1.19 0 15.27 ]
从上表中可以看出,在4152份问卷中,缺失值最多的有53个,占全部应答题量的15.27%;平均每份问卷有缺失值5.35个,平均缺失比例为1.67%。
在全部问卷中,没有缺失值的问卷有440份,占10.6%,有缺失值的问卷为3712份,占89.4%。随着缺失值数量的增加,问卷数量减少,形成一个明显的偏态分布,其中缺失值在1-5个之间的约占55%,6-10个缺失值的问卷约占21%,10个以上缺失值的问卷约占13%。
四、影响因素
为了分析导致缺失值的影响因素,我们以被访者和调查员的主要特征为自变量,建立多层的Poisson回归模型。模型自变量的基本情况见下表:
表4 模型自变量描述(N=3761)
[变量 均值(标准差) 百分比 变量 均值(标准差) 百分比 被访者特征 权益侵害情况 性别 无 94.20 男性 54.19 有 5.80 女性 45.81 朋友数量(位) 6.23(7.82) 年龄 30.45(9.50) 月均收入(元) 1995.65(1144.40) 受教育程度 地区 初中及以下 59.32 珠三角 48.74 高中 17.02 长三角 51.26 中专、技校 12.71 性别比对 大专及以上 10.95 同性访问 52.01 有无配偶 异性访问 47.99 无配偶 41.66 精神健康状况 有配偶 58.34 低危人群 66.45 宗教信仰 中危人群 19.06 无宗教信仰 83.44 高危人群 14.49 有宗教信仰 16.56 调查员层次 职业 性别 蓝领工人 88.70 男性 35.39 白领工人 11.30 女性 64.61 居住类型 专业 无私人空间 39.64 理工医学类 9.28 有私人空间 60.36 社会学类 58.04 问卷时间(分钟) 58.93(27.97) 其他文科 32.68 所做问卷份数 17.23(9.98) ]
在表4的自变量中,我们在被访者层次加入了“宗教信仰”、“权益侵害”、“朋友数量”和“精神健康”等变量。被访者接受访问、提供答案的过程,是一个社会性的互动过程:被访者提供答案是否完全,既涉及被访者的能力,更涉及他们的态度。人们有宗教信仰可能促使他们更为诚实、坦率和耐心地回答问题。朋友数量的多少,表现出人们交往圈子的大小,朋友数量越多的人,应该更具有开放性,更能坦率地回答问题,但也可能不太耐心和细致;反过来说,朋友较少者社会关系较为缺乏,可能更需要关怀。农民工是一个特殊的群体,他们在工作和生活中较易遭受权益侵害,权益侵害对他们接受访问、回答问题究竟有什么样的影响呢:是使他们沉默寡言,还是令他们更有倾诉的欲望?这是需要检验的假设。2010年上半年,深圳“富士康17起自杀事件”爆发之后,我们在问卷调查中加入了对农民工进行精神健康测量的量表,根据量表结果,将农民工的精神健康状态分为低危、中危和高危人群1。接受问卷调查当然也是一个心理反应过程,那么,农民工的精神健康状态对问卷调查质量有什么样的影响呢?这也是我们想考察的问题。
在调查员层次,我们将调查员的专业加入,不同的专业受到不同的训练,学风和要求也可能不一样,应该是评估调查员的重要变量。模型结果见表5:
表5 两层泊松回归模型结果
[变量 系数 标准误 被访者特征(第一层次) 性别(以男性为参照) -0.042** 0.017 年龄 0.013*** 0.001 受教育程度(以初中及以下为参照) 高中 -0.092*** 0.022 中专、技校 0.091** 0.025 大专及以上 -0.044 0.029 有无配偶(以无为参照) -0.075*** 0.022 宗教信仰(以无信仰为参照) -0.082*** 0.022 职业(以蓝领为参照) 0.051** 0.026 居住类型(以无私人空间为参照) -0.010 0.017 问卷花费时间/15 -0.003 0.004 有无受到权益侵害(以无为参照) 0.126*** 0.032 朋友数量/10 0.048*** 0.010 月均收入/1000 -0.010 0.008 地区(以珠三角为参照) 0.142 0.088 性别比对(以同性访问为参照) 0.013 0.016 精神健康状况(以低危人群为参照) 中危人群 -0.083*** 0.021 高危人群 -0.113*** 0.025 调查员层次(第二层次) 性别(以男性为参照) -0.107 0.069 专业(以理工医学类为参照) 社会学、社会工作 0.283** 0.121 其他文科 0.229* 0.119 所做问卷数/5 -0.052** 0.021 常数项 1.262*** 0.124 Inalpha -1.185*** 0.084 第一层次样本数 3761 第二层次样本数 305 ]
注:*** p<0.01, ** p<0.05,* p<0.1。
通过对表5回归结果的分析,我们发现:
1.被访者的性别、年龄、婚姻状况(或有无配偶)对问卷缺失值有显著影响:女性比男性有更少的缺失值;年龄越大,缺失值越多;有配偶者比无配偶者缺失值更少。这三个变量的作用与王建平、张立娟的回归结果基本一致,只是系数大小有差异。这个结果中关于年龄的影响与Ferber、Francis等人的研究结论基本一致,但关于性别的影响则正好相反。
2.被访者的教育程度对缺失值的作用不是线性的:相较于初中及以下教育程度者,高中可以显著减少缺失值,而中专、技校者则又显著增加缺失值,大专以上则在0.1的显著性水平上可以显著减少缺失值。为什么中专、技校的作用是这样的呢?我们在访谈材料中发现,一般来说,上中专、技校的人,可能是初中成绩不太好,或者家庭经济条件不好,没有考大学的可能和打算,而想学点技能早点工作。中专、技校的教育可能会增加受教育者的工作技能,但不一定会增加人文和社会知识,从而可能使他们欠缺回答问卷调查问题的能力。
3.和蓝领相比,白领人员的缺失值显著增多,可能说明白领人士对问卷调查更没有耐心,或者说,蓝领工人对问卷调查更为重视,更能配合调查。这一结果与Ferber认为职业等级较低者的项目不回应率较高1的结论正好相反。
4.有宗教信仰者比无宗教信仰者,缺失值显著减少;权益遭受侵害者比未遭受者缺失值显著增多;在精神健康状况中,中危人群和高危人群比低危人群缺失值显著减少;朋友数量越多,缺失值也随之增多。
5.居住类型对缺失值无显著影响。这一结果与王建平、张立娟的发现并不一致。在居住类型上,我们认为,由于农民工普遍来说居住的私密性都不是太好,他们对私密性的要求也不像城市普通居民要求那么高,所以影响并不明显。此外,月均收入、问卷花费时间、地区、问卷调查时访问员与被访者的性别配对都对缺失值没有显著影响。
6.在调查员层次,性别没有显著差异。但专业差异明显,出人意料:社会学、社会工作和其他文科专业比理工医科专业学生缺失值显著增加,可能说明自然科学对学生严谨、认真的要求更高;调查员所做问卷数多一些更能减少缺失值,根据我们的计算,做18份问卷的调查员所做问卷平均缺失值最低。
在上述发现中,最为我们重视的是第4点。在对中国人的实证研究尤其是定量研究中,很少能发现宗教信仰的显著作用。在对华人社会的问卷调查中,宗教信仰对调查结果的影响也几乎没有人论及,比如边燕杰等人所主编的两本研究华人社会调查问题的专著中,就没有讨论宗教对问卷调查的影响2。我们却发现,有宗教信仰者更能全面回答问题,这可能说明宗教信仰使人更为坦诚、耐心,更能配合调查。农民工是容易遭受权益侵害的群体。权益遭受侵害者缺失值更多,可能说明权益侵害对农民工来说,不仅仅是直接的利益受损,更由于这个群体的特殊性,面对权益侵害大多无力抗争,可能使其对社会、对现实产生更多的悲观、失望情绪,心理遭受打击,使他们更加自我封闭、保持沉默。精神健康状况中的中危人群和高危人群比低危人群缺失值显著减少,也许说明这些人更需要倾诉,更需要人们去了解,因而也更愿意配合调查。朋友数量越多的人缺失值也越多,朋友数量在这里更可能是性格的外在表现,交结朋友的人,可能愿意接受调查,但不一定有足够的耐心来全面回答问题;还可能的是,朋友少的人,更需要社会关怀,当有人对他们进行问卷调查,他们会更为配合。
概而言之,我们在回归分析中发现,与西方研究者认为经济、社会地位较低的被访者具有较高的项目无回答率相反,作为中国社会阶层中的弱势群体的农民工,其中更为弱势的女性、有宗教信仰者、蓝领工人、精神健康状况中的中危与高危人群和朋友数量较少者更能配合问卷调查,他们回答的问卷更少缺失值。但是,其中遭受过权益侵害的人却又有较高的缺失值。这一点非常值得我们深思。
五、讨 论
对农民工的问卷调查,不是一个简单的信息收集过程,而是一个社会互动过程,既涉及被访者的回答能力,更涉及被访者的态度。农民工是一个在异地城市打工的、与社会中上层不同的边缘群体、弱势群体,他们更需要社会的关怀,问卷调查也可能是一种社会关怀的形式。在我们的调查中,一些被访者一旦了解了我们的研究目的,是为了了解他们的情况,并向政府反映,就非常配合调查,并坚持不要报酬。从问卷调查是一种社会关怀形式的解释逻辑出发,我们看到,处于弱势一方的女性、有宗教信仰者、蓝领工人、精神健康状况中的中危与高危人群和朋友数量较少者更能配合调查,他们回答的问卷更少缺失值。而年龄、教育程度更可能是表现被访者回答能力的指标。当然,权益侵害的变量似乎不符合弱势一方更配合调查的解释,这一方面说明这种解释有一定的界限,另一方面说明当弱势者遭遇打击时其心理感受和社会态度会发生变化。弱势但不对社会绝望的人,更希望社會了解他们。而弱势群体中的绝望者则更可能保持沉默。总体来看,将问卷调查视为一种对弱势群体的关怀形式是符合社会实际和逻辑的。此外还有下列问题值得进一步讨论:
其一,盡管中国和西方社会存在着巨大的制度和文化差异,但是,有些影响问卷调查的因素在这两种社会和文化中却是相同的,具有普遍性。我们的回归分析已经表明像被访者的年龄、教育程度等变量对缺失值的影响与西方研究者的发现是基本一致的。这一类因素,更可能是决定被访者能力的因素。
其二,基于中西方社会、文化的不同,有很多因素对问卷调查的影响是不同的,如我们上面所讨论过的职业类型、权益侵害、心理健康、朋友数量等等。这一类因素,更可能是决定被访者态度的因素。
其三,在我们的研究中,没有讨论问卷问题的敏感性,这一方面是由于我们的问卷中涉及的敏感性问题不多(比如只有两个问题涉及强暴和性骚扰),另一方面,一些在西方研究中公认的敏感性问题,比如工资收入问题,对农民工来说并不敏感。在我们2010年的问卷调查数据中,月平均工资的缺失值仅为20个,占全部4152个样本的0.48%。这既可能是中西方文化对敏感性的理解不同,也可能是社会的下层和中上层对敏感性的理解不同。就工资收入来说,农民工的收入不高,而且基本都是打工收入,没有隐瞒的必要,这个问题对他们来说,一点都不敏感。但是,对企业家来说,这个问题也许就是敏感的。从文化上来说,中国社会历来都有不露富的传统。
其四,关于问卷缺失值(项目无回答)的问题,更为全面的研究应该将对不同群体进行调查的问卷类型、访问方式(面对面、电话、信访等)、更为仔细的访问员资料和被访者特征结合起来进行研究,最好在一个模型中包括了这四个方面的变量。现有的研究,几乎没有同时考虑上述四个方面因素,控制变量不足,具有较大的局限性,导致许多结论缺乏稳定性。当然,我们并不是说,用一个同时涉及上述四方面因素的模型进行研究,就可以一网打尽,得出终极结论。而是说,要尽可能控制变量,减少遗漏变量偏误,得出更为稳定可靠的结论。
问卷缺失值问题,并不只是一个问卷设计、调查的技术性问题,更是一个重要的社会性问题,更进一步说,它是问卷调查中的“元问题”。在人类活动中,无论是表明政治态度、进行法庭辩论,还是开展学术讨论和日常生活交流,都有保持沉默或者说“不清楚”、“不知道”的权利和现实。这种基本的权利和事实反映到问卷调查中来,就形成缺失值。换句话说,无论问卷设计得多完美、调查组织得多严密、调查员多么认真负责、被调查者多么配合,缺失值只能减少,不能完全消除。完美的问卷调查,不在于有没有缺失值,而在于不要有不应该有的缺失值。所谓“不应该有”,主要是技术性失误所引起的。也就是说,当被调查者由于社会原因不能说、不愿说、不会说、不知道怎么说时,缺失就是正常的。正常的缺失,是社会的问题,社会因素让人们不能说、不愿说、不会说,应该反思的是社会。
问卷调查的回答结果是多样的,尽管人们将多样化的社会现象纳入有限的答案中,由于问题的不同和社会现象的复杂性,答案还是多种多样的。唯有一种答案是一样的,不论什么样的问题,回答者都不给予回答,或者回答“不知道”、“不清楚”。 “凡是不能说的事情,就应该沉默。”1与可说的世界相比,沉默的世界更为辽阔、深邃。问卷回答者的沉默,是社会生活中沉默的自然表现,是各种沉默中的一种,它同样乃至更加具有深刻的意义。定量的社会学家和社会科学家们更多地关注了外显的、给予了明确答案的问卷回答结果,却较少关注回答者内敛的沉默。西方的研究者们更多地关注了问卷回答者沉默的技术层面。而对于我们来说,技术的也是社会的,通过技术问题去思考社会问题,这是本文的基本逻辑。当然,我们的思考才刚刚开始。
(责任编辑:薛立勇)
Abstract: The issue of missing value in questionnaires (item non-response) has been less concerned by domestic researchers than western researchers, who mostly study it on the technical level. In the questionnaire of Chinese migration workers, we found that missing values occurred more often among those who were without religious believes, or with higher occupational level, or whose labor rights had ever been infringed, or with many friends or who had mental health problems. In our opinion, surveying migrant workers is not just a process of collecting information, but also a process of interaction that involves the respondents capability to answer questions and their attitudes toward the questions. What we argue here is that questionnaire surveys of rural-to-urban migrants could constitute a form of social care for them since this population is a disadvantaged group in China. Therefore, missing value is not just a problem of questionnaire design or investigation techniques, but a social problem which could be regarded as the “meta problem” in surveys. The silence of the respondents is a reflection of their silence in social life, which is worth academic reflection and study.
Keywords: Missing Value; Item Non-Response; Migrant Workers; Questionnaire Survey