美国历史学家利希特曼使用苏联地震学家波洛克设计的预测地震的算法预测美国大选,从1984年到2016年的九次大选中,预测对了八次。他还用这个方法来预测美国的中期选举,命中率也很高。遗憾的是,这个算法在地震预测中却没有取得同样的成功。
南方周末特约撰稿 陈希
人们自古以来就对公共职位的选举结果抱有极大的兴趣。古罗马凯撒在选举大祭司的时候,已经负债累累,一旦失败,铁定破产。但是仍然有人愿意借大量资金给他。这些人可以说是最早的预测者和博彩者。中世纪的人们更青睐枢机主教们选举教皇,在1503年就出现了关于教皇候选人的投注赔率。在近现代民族国家出现后,在人民主权原则下,选举成为普遍的政治活动,也催生了民意调查这种预测技术。
有史料可查的第一次民意调查是1824年美国宾夕法尼亚州的一个报社做的栏目。该报在1824年7月对威尔明顿市的公民群体进行了调查,调查他们心目中最喜欢的总统。这个335人的民意调查显示,安德鲁·杰克逊以70%的优势领先国务卿约翰·昆西·亚当斯(23%)。但是1824年的总统选举结果是对这个预测的反讽:根据美国宪法第十二修正案,只有竞选人赢得相对多数、且过半数的选举人票才可以当选,当时四位候选人没有一人票数过半,所以最终交付众议院裁决,原本遥遥领先的杰克逊在众议院投票环节惨败给亚当斯。就是这么一个满足读者好奇心的栏目,持续到现在。
这种民意调查在1936年发生了巨大改变,一家默默无闻的舆论研究所成功预测了罗斯福的当选,横扫当时流行的各家民意调查机构,其创始人乔治·盖洛普将统计学方法引入民意调查,这个机构日后发展成了盖洛普公司。随着统计技术的发展,选举数据变得越来越容易处理。选举预测已经成为民意调查公司、新闻机构和博彩市场以及政治学研究的宠儿。
然而科学的方法还是经常会被复杂的现实打脸,美国1948年和2016年的总统选举,英国1970年、1974年、1992年的大选,让很多民意调查机构的专家大跌眼镜。人们不禁要问,有没有一种更加准确的预测方法呢?
美国美利坚大学的政治史教授艾伦·利希特曼(Allan Lichtman)和苏联科学院院士、数学地球物理学家弗拉基米尔·基里斯-波洛克(Vladimir Keilis-Borok,1921-2013)合作,将后者设计的地震预测算法加以改过,发展出一套总统选举预测算法,由此衍生出“白宫钥匙”(The Keys to the White House)系列丛书。从1984年至2016年,共举行了九次美国总统选举,两人关于实际当选者的预测对了八次,准确率不可谓不高。惟一出错的年份还是2000年,利希特曼预测戈尔能当选美国总统,结果戈尔也的确赢得了普选票,这次选举后来被称为“最难产的一次大选”,佛罗里达州的重新计票官司几次打到最高法院,最后小布什赢得271张选举人票,戈尔赢得266张选举人票,一波三折,奈何!
歪打正着的波洛克
两位学者,一位研究历史,一位研究地震,可谓风马牛不相及也,他们是如何走到一起的?
艾伦·利希特曼是华盛顿的美利坚大学政治史教授,曾担任该校历史系主任。他还做过前副总统戈尔和参议员爱德华·肯尼迪的顾问。
弗拉基米尔·基里斯-波洛克的来头要大得多,他曾先后当选为美国人文与科学院(1969)、美国国家科学院(1971)、苏联科学院(后为俄罗斯科学院,1988)、英国皇家天文学会(1989)、奥地利科学院(1992)、欧洲学术院(1999)正式成员,还是一系列国际科学组织,如国际大地测量学与地球物理学联合会(1987-1991)、国际地震学与地球内部物理学联合会(1983-1987)、国际科学理事会(1988-1991)的领导人。
波洛克1921年7月31日出生于莫斯科一个犹太商人家庭。二战中,他被派往苏德战争前线当通信兵。这需要时刻冒着炮火保障通信线路畅通,无疑是一项非常危险的工作。幸运的是,他的文化水平较高,所以被送到乌拉尔山以东为国家寻找石油。在那里,实际勘探工作激发了他对地球物理学的兴趣。战争结束后,他前往苏联科学院学习,于1948年获得数学地球物理学博士学位。在20世纪60年代,波洛克研究地下核爆炸产生的地震波,并将它们与天然地震波进行比较,为1963年美苏军控谈判提供了专业知识。大约在同一时期,他开始前往西方旅游,随后在美国和意大利的大学担任客座教授。到了20世纪80年代,他转向了地震预测研究,并在莫斯科建立了“地震预测理论和数学地球物理学国际研究所”。
地震预测被公认为是地震学界的“圣杯”,很多科学家都无比向往,但是又觉得这是一个不可能的任务。波洛克则认为,基于最基本的因果关系的研究就可以找到答案。如果我们以一个对立状态来观察地震,那么就是“稳定-地震”,地震破坏现有地质状态的稳定性,出现新的稳定。大地震发生之前会发生很多活跃的地质活动,从中总结出一些有指标性的事件,建立模型,然后就可以从指标性事件发生的频率,来推断下一场大地震发生的可能性。
早在1985年,波洛克就预测在美国加利福尼亚的圣安德烈亚斯断层将发生地震。苏联当局非常认真地对待这个预测,在那年的日内瓦峰会上,苏联领导人戈尔巴乔夫特意向美国总统罗纳德·里根提到了这一点。1989年10月17日,美国加利福尼亚洛马·普雷塔(Loma Prieta)圣克鲁斯山附近发生了一场里氏6.9级的大地震,造成63人死亡,3757人受伤,波洛克的预测似乎得到了证实。正好1989年棒球世界大赛就在加州奥克兰的体育场举行,大批记者把镜头转向了灾区,这场地震也成为美国第一次在全国电视台直播的大地震。
波洛克1998年加入了加州大学洛杉矶分校。真正让他在地震预测领域名声大噪的,是他准确预测了2003年的加州圣西蒙地震和日本北海道地震,他因此上了很多报纸的头条。但是随后又遭遇了重大失败。2004年他又预测了一次加州的地震。公共部门不敢怠慢,马上发布紧急预告,要求居民准备物资和饮用水,这造成了民众不同程度的恐慌。结果这次被证明是一次预测失误。这似乎证明,地震预测的确是一个“不可能完成的任务”。
从地震预测到大选预测
波洛克的职业生涯中有个有趣的插曲,成就了大选预测。
1981年,利希特曼和波洛克恰好都在加州理工学院访问。一次晚宴中,两人被安排坐在了一起。波洛克提出两人合作,利用他的地震预测方法来预测总统大选。利希特曼后来回忆,当时听到这个创意时觉得很奇怪,但是很快就意识到:政坛也是会发生“地震”的,与地质活动“稳定-地震”的关系类似,“现任-挑战”的关系时刻存在:现任政党被挑战,现任官员被挑战,每一次挑战的成功实现,也就是政坛的地震;同时,挑战者也就变成了现任。
两人的重大理论成果是1981年发表于《美国国家科学院院刊》第11期的论文:《美国总统选举中的模式识别应用:整体社会、经济和政治特征的作用,1860-1990》。其中的原理和分析比较复杂,这里简单介绍一下他们的算法。在这篇文章里他们提出12个问题:
1.现任政党的任期是否超过一个任期?
2.现任政党获得超过上次选举投票数的50%吗?
3.大选年期间是否有重大的第三党活动?
4.现任政党候选人的提名是否存在严重的竞争?
5.现任总统属于现任政党吗?
6.选举年是否经济衰退且萧条?
7.现任政府治下实际国民生产总值(GNP)的年人均增长率,是否等于或大于过去8年的平均水平,并且等于或大于1%?
8.现任总统是否对国家政策进行了重大改变?
9.现任政府治下,全国是否存在重大的社会动荡?
10.现任政府是否因重大丑闻而受到负面影响?
11.现任政党候选人是否具有卡里斯玛气质或者是民族英雄?
12.挑战现任的政党候选人是否具有卡里斯玛气质或者是民族英雄?
以上12个问题,回答“是”赋值为1,回答“否”赋值为0。两人通过对1860年到1980年历次大选的历史数据进行梳理,分别给每个选举年的12个问题赋值打分。
第一步,将所有选举年份分为两组,“现任胜利组”和“挑战胜利组”。两个组内,分别将每个问题历年得分总数除以胜利总数。例如“挑战胜利组”中在此期间胜利了13次,在第一个问题累计得了10,10除以13得到约0.769,这也就是“挑战胜利组”中年均得到的赋值。
第二步,将“现任胜利组”和“挑战胜利组”中12个问题年均得到的赋值进行比较,把比较的结果当作“核心值”。如果“挑战胜利组”大于“现任胜利组”,那么“核心值”赋值为0,反之赋值为1。举例说明,第一个问题的年均赋值,“挑战胜利组”为0.769,“现任胜利组”为0.500,那么第一个问题的“核心值”就是0。
第三步,将特定年份的12个问题的赋值,与12个问题的“核心值”进行比较,等于“核心值”赋值0,反之赋值1。最后,将此年份12个问题与“核心值”比较后的得分进行求和,这个得分也就是通往白宫的钥匙数量。
通过研究,两人发现在既有的大选历史数据中,最后得分大于5的,全是挑战者获胜,小于5的,全是现任者获胜。等于5的情况下,挑战者胜利1次,现任者胜利2次。通俗来说,如果挑战者获得5把钥匙以上,那么白宫的大门就已经向他敞开了。虽然利希特曼在1990年出版的《总统之路的十三把钥匙》一书中,将问题从12个增加到了13个,并且希望将此预测法更加简化,核心的算法还是没有改变。这种修改也引起质疑,特别是关于外交军事的重大成功或失败问题,缺乏客观标准,容易受到预测者主观感受的影响。例如,特朗普上台后退出奥巴马的标志性外交成果伊朗核协议,从一开始的评价就是两极分化,很难评价。
无论如何,利希特曼用这个方法从1984年到2016年几乎准确地预测了每一届总统选举,甚至是最难预测的2016年大选。该算法没有对普选票获胜者和选举人票获胜者分开预测。它只是预测现任政党是否会保留白宫。从1984年至2016年,共举行了九次美国总统选举,利希特曼有八次对实际当选人的预测是准确的。
惟一美中不足的是2000年,利希特曼预测在任政党候选人戈尔胜出。结果戈尔赢得了普选票,挑战者党候选人乔治·W。布什赢得了选举人票。普选票中布什得票率为47.87%,戈尔为48.38%,但是最终布什得到271张选举人票,胜过了戈尔的266票,当选了总统。
2016年,利希特曼成功预测了挑战者唐纳德·特朗普的胜利。在任政党希拉里·克林顿赢得了普选票;特朗普赢得了选举人票。2016年希拉里的普选票得票率为48.2%,远远超过特朗普的46.1%,但是特朗普赢得了更多的州,所以在选举人票上以304票碾压了希拉里的227票。阅读《白宫钥匙》系列丛书,不光是对美国政治生态能够有较深的理解,更重要的是该书提供了一个方法论来预测选举。
失之东隅,收之桑榆
与预测人类事务大获成功相反,波洛克的地震预测却难以保持成功。这也毫不奇怪,人类能观察到的地质现象始终是有限的,世界上最深的科拉超深钻孔也才12公里,还没有达到平均地壳深度的一半。一些触发大地震的关键性、指标性的地质活动,很有可能我们到现在都没有观察到,或者已有观察却低估了其重要性。在评估波洛克关于2004年加州地震的预测时,美国地质调查局(USGS)说,波洛克团队的方法是合理的,但无法证明是有效的。加州地震预测评估委员会(CEPEC)指出,波洛克的预测太少,达不到统计学上的有效性要求,迄今没有证据表明有任何方法能做到有用的地震中期预测,包括波洛克的方法在内。
波洛克去世后,《洛杉矶时报》发表悼文说,在1980年代,地震预测是地震研究中的边缘学科,受到很多科学家的鄙视。波洛克这两次准确的预测扳回了一局,让科学共同体不再认为地震预测全是胡说八道。失之东隅,收之桑榆,波洛克的地震预测虽然没有取得预期的成功,但能让地震预测重新回到科学家的视野之中,也算功不唐捐了。
敬请关注南方周末APP了解本文续篇:《我们用地震学家的算法,“算”了一下2018美国中期选举》。