〔美〕达莱尔·哈夫 廖颖林 译
我相信你不是一个势利小人,而我也并不从事房地产生意。但请让我们作这样的假定,并且假设现在你正在一条我熟知的街上看房子。对你的情况进行了初步判断后,我巧舌如簧、费尽心思地让你相信附近居民的年收入大约有10000英镑。也许这增加了你居住于此的兴趣,不管怎样,买卖最终成交了,那美妙的数字也被牢记在你的脑海中。你有那么一点势利,当与朋友聊天时,你就会不经意地流露出你居住的地点:我住在一个相当棒的高收入小区。
大约一年后,我们又见面了。作为某纳税者委员会的成员,我正在四处奔走,为降低税率、降低财产估价、降低公共交通费用而呼吁。我的理由是:我们支付不起各种上涨的费用,毕竟,附近居民的平均年收入只有2000英镑。也许你会加入我们委员会的工作中来——这说明你不仅势利,而且还挺吝啬。但是,当听到那可怜的2000英镑时,你也禁不住大吃一惊。到底是我现在撒了谎呢,还是一年前撒了谎?
其实这两次你都无法怪罪于我,这便是利用统计撒谎的妙处。两个数字都是正规的平均数,计算方法也完全正确。两个数字都基于相同的数据,来自相同的居民,根据相同的收入。所有都是相同的,但显然至少其中一个数据令人误解,足以与弥天大谎相媲美。
我的花招是两次分别使用了不同的平均数,而“平均数”这个词有很宽泛的含义。当一个家伙希望影响公众的观点,或者向其他人推销广告版面时,平均数便是一个经常被使用的伎俩。虽然有时出于无心,但是更多的时候是明知故犯。所以,当你被告知某个数是平均数时,除非能更进一步地说出它的具体种类——均值、中位数还是众数,否则你对它的具体含义仍知之甚少。
当希望数值较大时,我所使用的10000英镑是均值,即附近居民收入的算术平均数。你只要将所有家庭的收入加起来并除以家庭总户数,便可得到该平均数。数值相对较小的是中位数,它透露了这样的信息:一半家庭的收入超过2000英镑,另一半家庭的收入不及2000英镑。我还可以利用众数,它是在所有家庭收入序列中出现次数最多的那个收入。例如,如果附近的居民中,年收入为3000英镑的家庭数多于其他收入的家庭数,那么收入的众数就是一年3000英镑。
在这个例子中,不合适的平均数实际上是毫无意义的。只要碰到收入数据,这种情况就经常出现。
(曾纪洲摘自中国城市出版社《统计数字会撒谎》一书)