郑渝川
因为人的认知错误,数据往往也会被利用来愚弄人们,诱使人们做出错误选择。
2010年,两位哈佛教授卡门·莱因哈特和罗·罗戈夫发表论文说,当政府债务相当于GDP总值的比例超过90%时,国家的经济增长会受到拖累。
这听上去很符合常识和逻辑。两位教授的结论在全球范围内广泛传播,并被普遍应用于反对2008年金融危机及欧债危机以后,各国政府举债救助金融机构的行动。
尽管如此,也有质疑者看到了问题。政府债务即便很高,如果不是短期内必须清偿,就不必过于担忧。一个很简单的道理,我们购房贷款的总额,会大大超出我们的目前及未来预期的每年年收入,但我们不会因此感到担忧,因为,只要我们付得起每月月供,就能确保不违反房贷合同。
莱因哈特和罗戈夫为回应批评,公布了他们的结论,即20个发达国家1946-2009年每年债务与GDP的比率,还有扣除通胀因素后的GDP增长率。从数据来看,的确呈现出他们所说的债务超过90%这样一个临界点,GDP增速下降的关系。
但美国在上述时间内,出现债务与GDP比例超过90%的时间只有4年:1946-1949年。那4年中,美国经济转向民用,而政府需要处理大量的二战债务。而在1949年之后的20多年时间内,美国经济持续快速增长,很显然无法排除政府投资基础建设、补贴人才引进和尖端科技研發所起到的作用。
质疑者继续紧追,还发现莱因哈特和罗戈夫还有意遗漏了5个发达国家的案例,这几个国家拥有债务与GDP之比大于90%的时间段里,增长率都是正值。不仅如此,在被莱因哈特和罗戈夫列入计算范围的20个国家的数据样本中,有一部分不利于佐证其结论的数据被从样本中清除了出去。
耶鲁大学博士、畅销书作家加里·史密斯在其所著的《简单统计学》一书中分析指出,莱因哈特和罗戈夫选择性地采用数据,遗漏不利于证明其预设结论的其他数据,所以使其得出了至少非常不全面的结论。《简单统计学》这本书出版后,获得了诺贝尔经济学奖得主罗伯特·希勒、哈佛大学政治经济学教授本杰明·弗里德曼等经济学大家的高度赞赏,指出通过这本书,可以让读者更好的认识统计学和数据分析,更为清楚地洞察生活中滥用、错误使用数据的方式,更加轻松地识破以科学分析、统计分析、数据分析为名的奇谈怪论。
书作者开篇就指出,人们渴望寻求各种确定性,来对冲不确定性给自己内心带来的担忧,所以会出现比赛前穿上没有洗过的“幸运袜子”、掷骰子时如果不断摇出某一点数则坚信自己手气很顺并将延续下去、看中的房产一定会大幅增值、购买虚假宣传的高价保健品等怪诞现象,人们甚至会对“章鱼保罗”敬畏有加,听从其预测竞猜足球大赛的赛果。实际上,这无非是以后见之明来寻找与某次、某几次随机结果关联的结果,然后将之推定为规律的显现,希望借此规避风险。但这样的努力,在绝大多数时候都是徒劳的。
消费者经常会通过媒体看到,酒店企业、电商企业宣称经过消费者调查,愿意再次选择这些企业的比例超过九成甚至更高的比例。这种调查极具迷惑性,也是完全错误的(即便相关企业装模作样真的进行了数据采集和汇总),因为面向已有客户进行没有约束力的意向调查,这就叫做“幸存者偏差”。事实上,我们在商业图书市场上,可以看到很多陷入了“幸存者偏差”分析方式的图书,也就是根据过去一段时期内的成功企业的案例,找出符合先验结论的故事,然后梳理在一起。这样的经验总结,相当不靠谱。最为著名的《从优秀到卓越》和《追求卓越》两本书里的成功企业范例,在书出版之后的几年内,已经有相当多数陷入了困境甚至走向了破产。
我们知道,随机投掷硬币,只要次数够多,硬币朝上和朝下的概率会趋于相等。但这并不是说,当选择次数有限的情况下,一定会出现正面或背面平均分布的结果。一些实验中,投掷硬币可以获得一连串的正面,或是多次连续的背面,而这些连续出现的相同选择,其实都是随机性的结果。这样的道理并不难以理解。但在生活中,我们往往会低估巧合,漠视随机性,而是将一些连续出现的巧合结果,解读为规律的存在。比如,观看体育比赛中,连续罚中多个球的球员,会被认为该场比赛的球感极佳,人们预料其将继续高质量的完成罚球——这样的判断显然并不成立,除非极个别能够完全克服失误的顶尖运动员,一般选手(无论是足球、篮球还是其他运动类别的运动员)能否罚中,说到底还是随机性在起作用。
统计学中有个著名的名词“均值回归”,也跟概率有关。比如,股票市场上做出了最佳选择的咨询师,会在来年变得相对平庸。但这一名词也被广泛的错误理解和应用。均值回归并不意味着每个投资者都会从股票投资、风险投资中获得相同回报,更不可能在某个投资者投资失败后,肯定带来盈利回报的对冲。“回归是双方向的,因为它仅仅反映了随机波动。”
数据聚集,有时会造成假象并诱使人得出错误结论。书中叙述说,20世纪70年代,流行病学家南希·韦特海默注意到了一个现象,即许多癌症受害者的家庭靠近大型输电线,并因此得出结论,大型输电设施会造成癌症。韦特海默的报告迄今让很多人对于电力设施谈而色变,造成很多国家和地区改善电力等基础设施面临民意抵制。书中指出,韦特海默的研究形同“德克萨斯神枪手谬误”(向许多目标射出子弹,然后找到自己击中的一个目标,用油灰盖住其他弹孔,刷掉痕迹,宣称自己是神枪手)。实际上,在那之后的几十年里,各国科学家反复实验和观察,发现比输电线生成的电磁场大得多的电磁场,对于死亡率、癌症发病率、免疫系统、繁殖力、出生异常等没有影响。
总的来说,数据的应用有助于深化我们对于事物、现象的认知,购买到更加合算的商品,进行投资管理,通过锻炼改善健康,但因为人的认知错误,数据往往也会被利用来愚弄我们,打着统计学的旗号,诱使我们做出错误选择。就像前面所提到的那样,管理学家会根据已有的成功企业案例,得出并不全面和准确的管理秘诀,然后推动形成管理风潮,对于中小企业形成误导。而投资者会追逐热门股票、超高估值的投资项目,对于风险不管不顾。消费者会追随最新的减肥热潮,还会因为房价一直上涨而追加投资。《简单统计学》书中概括了常见的数据应用谬误:被模式诱惑、具有误导性的数据、变形的图像、均值回归(谬误)、平均定律、德克萨斯神枪手、数据经过过滤(修剪)、数据与理论分离。endprint