李 勇
基于网上调查的科研成果可信吗?
李 勇
本文以2016年美国总统大选网上调查和专业调查机构的调查结果大相径庭为例,说明网上调查可能存在的一些局限性,并初步分析了产生这些局限性的统计逻辑。进而认为基于网上调查取得的信息用于科学研究需慎之又慎,其运用必须满足统计的基本原则。
网上调查 科研成果 统计原则
网络的匿名性与虚拟性导致的信任缺失问题及调查的参与率低等缺陷始终阻碍其普遍应用。而很多社交网站(SNS, Social Network Sites)的实名制特性能够增强被调查者的受信水平,使其更用心地作答。朱文龙等(2014)以人人网、腾讯QQ为例,研究了匿名调查与非匿名调查获取科研数据的一致性问题,得出在非敏感性量表下,两类调查具备完全一致性,而对于敏感性量表,两类调查数据不完全一致。类似的相关研究,国内外已有不少文献。2016年10月16日,《新周刊》总主笔闫肖锋在2016年美国总统大选全国选民投票还未开始前,大胆预测民主党候选人希拉里胜券在握。其主要依据为,专业调查机构的调查比网上调查的样本更具总体代表性。这引起了笔者的深思,当下,很多科研工作者通过发放网络问卷,网络在线问答,运用网络技术收集网络舆情等方法收集相关信息,然后对所获得的信息进行分析进而得出结论。那基于这些网络调查的科研成果真的能反映真实的状况吗?笔者的答案很明确,不一定。下面从此次美国总统大选说起。
美国总统大选的全国选民投票时间为选举年11月第1个星期一后的第1个星期二,今年则为11月8日。由于美国总统选举实行选举人团制度, 11月8日选民投票时,不仅要选举总统,还要选出代表50个州和首都华盛顿哥伦比亚特区的538名选举人。美国除了缅因州和内布拉斯加州,其他州和首都实行“胜者全得”的制度,即获得选民票数最多者获得该州或首都所有选举人票。赢得270张及以上选举人票的总统候选人即获得选举胜利。在选举年的12月第2个星期三之后的第1个星期一,选举人按照选民投票结果选出总统,今年为12月19日。新当选美国总统将于次年1月20日宣誓就职。2016年总统大选第一场辩论结束后,总统候选人希拉里和特朗普均自信满满地对外声称自己胜出。CNN发布的舆论研究公司所作的调查结果为,希拉里以约62%比27%,大胜特朗普。而各种网络投票结果恰恰相反,例如Twitter上的网民投票结果显示,特朗普将以62%比29%大胜。为什么会产生如此大的差异?专业调查公司对线下的登记选民作调查,通常是通过发放问卷或电话调查。根据以往统计,线下调查的结果,只有4.5%左右的误差,且被调查样本人数有时甚至少至521个。很多人质疑,这样的调查结果之准确性怎能和网站几十万的拟投票选民样本的调查结果之准确性相提并论?
从统计学来说,样本不一定需要很大,但一定要保持样本抽样的随机性,这才能保证样本能较好地代表总体的特征。而专业调查公司有相对科学的抽样调查和统计分析方法。例如,盖洛普民意测验所(Gallup Poll)是美国最大的民意测验机构。它在美国总统大选民调中,根据性别、年龄、受教育程度、职业、收入、信仰等标准,在美国各州和首都按比例选择调查对象,然后对调查结果加以分析并得出结论。这样做的好处可以保证选取的样本有较好的总体代表性。其实,一个统计学运用于实际民调的非常有名的案例,为1936年的美国总统大选。当时,竞选下一任美国总统的是民主党候选人在位总统罗斯福和共和党候选人兰登。当时,美国权威杂志《文学摘要》(The Literary Digest)根据电话簿和俱乐部成员名单上记载的地址发出1000万封调查信,收到回信200万封,这么大的样本容量在调查史上也是罕见的,杂志社因此花费了大量的人力、物力。得出的调查结果是兰登将以57%对43%的比例在总统大选中获胜。而最终的选举结果却是罗斯福以62%对38%的显著优势连任总统。这使《文学摘要》名誉扫地,不久后即停刊。究其原因是《文学摘要》抽取的样本不是从总体(全体美国选民)中随机抽取的。因为在1936年,美国拥有电话和参加俱乐部的家庭都是比较富裕的家庭。1929年到1933年的世界经济危机,使美国经济遭受重创,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国非富人群体却从中得到了好处。由于富人群体在全体美国选民中只占少数,所以,基于调查样本几乎都是富人而得出的民调结果实际上已经严重偏离了大多数美国人的真实选举意愿。
社会学中有一个“二级传播理论”,是由美国著名社会学家拉扎斯菲尔德1944年出版的调查报告《人民的选择》中提出的。该理论的核心思想在眼下的语境中可理解为理念总是先从网络、报刊、电视、广播等媒介传播到关键意见领袖(Key Opinion Leader,简称KOL),然后再由这些关键意见领袖传播到那些 “沉默的大多数”。而关键意见领袖这个概念源自营销学,通常被定义为:拥有更多、更准确的产品信息,且为群体所接受或信任,并对该群体的购买行为有较大影响力的人。例如,某人购买某款产品,并不决定于其先前看到过的该产品的媒体广告,而真正促使其购买的,有时仅仅可能是其周围某个关键意见领袖的一句话。所以网民在网上表达出来的观点,并不一定是左右大多数人行为选择的观点,很多时候还依赖于关键意见领袖的中介作用。
最后引用肖锋文章中作家余华说过的话:一上网,感觉中国人明天就要闹事;一上街,感觉中国人一百年都不会闹事。
[1]肖锋."网红"特朗普为什么突然不行了[OL].功夫财经,2016-10-16.http://news.hexun.com/2016-10-16/186436727.html.
[2]朱文龙,邵培基,方佳明.社交网站调查的科研数据一致性研究[J].科研管理,2014(02).
(作者单位:河南大学商学院)