蒋骁飞
曾有人起诉贝克莱大学,说他们歧视女性,有数据显示他们学校男性录取率比女性录取率高。后来校方也给出数据,虽然从全校来看,男性录取率比女性高,但从各系来看,女性录取率都比男性高。后来,经法院调查证实贝克莱大学所言不虚,贝克莱大学最终胜诉。这里出现了一件令人匪夷所思的事——各系女性录取率比男性高,但全校女性录取率却比男性低。这究竟是怎么回事?先来看看下面这个简化的例子,也许能帮助你消除困惑。
假设某大学只有A系和B系,招生时共有130名男生和130名女生报名。A系有50男80女参加考试,录取10男20女,女生录取率(20/80)大于男生录取率(10/50);B系有80男50女参加考试,录取60男40女,此时,女生录取率(40/50)仍高于男生录取率(60/80)。两系女生录取率都大于男生录取率,这是否意味着全校录取女生的总数高于男生的总数呢?你也许会毫不犹豫地给出肯定答案。然而,实际情况并非如此,总共被录取女生是(20+40)个,总共被录取男生是(10+60)个,男生多于女生。这意味着,从全校看,女生录取率(60/130)是低于男生录取率(70/130)的。
这个例子说明,分组比较中都占优势的一方,也许在总评中反而是失势的一方。大家不要对此迷惑不解,这并不是这个例子有什么高深莫测的地方,而是我们惯常的思维方式存在着一个隐蔽的缺陷——喜欢将局部的阶段性的评价相加汇总作为总体的全程性的评价。
再来看一个体育赛事的例子。我们通常用胜率来衡量运动员在某一时期的运动水平,胜率高意味着运动成绩好。现有甲乙两名运动员,在一个赛季的上半程,甲7战2胜,乙2战皆输,甲的胜率(2/7)高于乙的胜率(0/2);在这个赛季的下半程,甲3战2胜,乙8战5胜,此时甲的胜率(2/3)仍高于乙的胜率(5/8)。但从总个赛季来看,甲的胜率(4/10)低于乙的胜率(5/10),阶段性评价中占优的甲运动员在全程性评价中却处于了劣势。
现实中存在不少这样的现象——某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。英国统计学家辛普森曾深入研究过这种现象,于是人们就把这种局部评价与总体评价相悖的现象称为辛普森悖论。辛普森曾说过一句发人深省的话:“量与质是不等价的,无奈的是,量比质容易测量,所以人们总是习惯用量的多少来评定质的好坏。然而,不少事实证明,数据其实并没有我们认为的那么重要、可靠。”