汪为(杭州市经合办,浙江 杭州 310006)
随笔漫谈
浅谈统计在美国大选的应用深化
——数据驱动型选举模式成为政界主流
汪为
(杭州市经合办,浙江 杭州 310006)
随着初选的白热化,美国大选不仅成为政界的热门话题,世界各国人民也看得津津有味,距离11月的大选日还有5个月,各大媒体纷纷开始公布各位选举人的民调数据,作为选情动向的风向标--各类统计数据的起伏提前预示了候选人的命运。
美国很早就开始运用统计辅选,最有名的就是1936年的大选预测,美国《文摘周刊》成功地预测了此前5次总统选举的结果,它预言本次大选中共和党人兰登将击败罗斯福总统当选,而当时还名不见经传的盖洛普预测罗斯福总统将继续连任。结果罗斯福以压倒多数再次当选,原来《周刊》虽然样本量大,但采用电话抽样,农民、工人这些没有电话的下层人士就被剔除在样本之外,而他们正是罗斯福的铁杆票仓;相较之下盖洛普的样本库不仅汇集了各个阶级,还首次将选民态度的动态变化考虑到预测模型中,预测结果当然比《周刊》准确。这次著名的预测让盖洛普名声鹊起,也让越来越多的政治家将目光投向统计应用。
统计技术逐渐被应用到选举的各个方面,广告投放、筹款募捐、投票动员、预测决策处处可以看到统计应用的身影。从最初的民情调查到克林顿智囊团看重的microtrends分析,再到当前最流行的Data-driven campaign(数据驱动选举模式),可以毫不夸张地说统计技术的大量应用改变了美国大选竞选模式。
本次选举中,不论共和党还是民主党,都采用了数据驱动竞选模式,这种竞选模式中一切以数据分析为导向,非常注重细分建模,强调对每个特定分类选民进行分析,然后针对不同选民选取不同渠道传达针对性信息,在候选人形象设定、电视广告投放、邮件电话动员等竞选方案设计中全部以数据分析为基础进行决策。数据驱动竞选模式突破了传统竞选的对实体网络的限制,具备传统选战没有的灵活性,跳出了传统选民的物理界定标准,可以对选民根据特定电视频道、特定网站等新标准进行划分,群体定位更具针对性。在精确性上也较传统模式更胜一筹,通过商业数据的整合,数据驱动竞选模式甚至可以达到对每一个选民的精确定位。
数据驱动竞选中,往往选战未行,数据先行,总统竞选人通常在竞选前两年就成立数据团队,大量收集各类信息,各党派也会给候选人提供选民数据库,有实力的候选人还会向google等企业购买数据来完备数据库。基础数据收集完成后,通过标签归类,对选民进行群体细分建立特定的模型,再通过线下信息和线上数据的实时整合对数据模型进行动态优化,以便在竞选开始后针对不同的选民采用不同的宣传模式和动员路径,以最少的花费达到最优的助选效果。在2012年的大选中,奥巴马与罗姆尼在俄亥俄州的选情一直呈胶着状态,奥巴马的数据团队就对该州近3万选民样本进行跟踪分析,即时了解每一类人群和每一区选民的态度,电视辩论结束后立即掌握了哪些选民改变了态度,哪些选民坚持原来倾向,再根据人群归属对摇摆选民进行针对性的电话(网络)投票游说,统计分析甚至判断出哪些选民在投票日可能未投票,需要派出志愿者上门做最后的接触动员,同时他们采用Facebook等网络手段进行投票动员,期间Facebook用户都会收到包含“摇摆州”好友照片的消息,提示他们点击相关按钮对方就会收到投票注册等提示,20%收到请求的选民都做了响应,而此前数据分析师发现来自熟人的请求比志愿者的登门动员更有效,在强大的统计应用助力下奥巴马拿下最关键的“摇摆州”,再次入主白宫。
数据推动竞选中,竞选的另两大关键——资金募集和竞争宣传效率也更高。就在本次选举中,希拉里团队邀请乔治·克鲁尼为其举办筹款晚宴,就因为通过海量数据分析发现克鲁尼是美国西海岸40-49岁女性的男神,而40-49岁女性是最有经济实力也是最可能为她们偶像买单的女性群体,预计克鲁尼将在自家豪宅举办的筹款晚宴上为希拉里募集到数以百万计的竞选资金。同时她的数据团队对每一个选民群体进行建模,预测他们的捐款行为模式(实地汇款、捐赠还是网络捐款),进而通过定向广告投放获取目标捐赠者最大的资金支持。
竞选广告的投放也是通常先通过复杂的模型设计锁定目标选民,再根据选民特征确定广告覆盖模式:2012年,民主党数据团队根据模型发现年轻女选民一旦选定奥巴马后忠诚度非常高,于是奥巴马的助选机构在数据团队帮助下对《行尸走肉》、《23号公寓的坏女孩》等35岁以下女性最欢迎的电视剧中投放广告,调查表明电视剧广告投放虽然花费低廉,对目标选民的鼓动效果出乎意料的好,而以往竞选广告投放一直锁定在黄金时段的新闻、脱口秀上,花费高昂却对目标选民的影响不明显。采用跟踪特定人员购买广告后,奥巴马团队宣传资金使用效率较初次参选的2008年提升了14%。
统计应用在竞选决策方面的应用虽然不为公众所知,却也相当重要,在参选前很多选举人都会进行预测,应用统计模型推断赢面,不利的预测能直接让选举人打退堂鼓,纽约州州长安德鲁·库莫在民主党呼声很高,本人也非常愿意参加总统选举,但因为数据模型推演:如若特朗普成为共和党候选人,他的参选势必分流其他民主党候选人选票,客观上助阵共和党,帮助特朗普入选。于是他最终决定退出选举。
在这个微竞争时代,统计不再是锦上添花,而是雪中送炭,在激烈的选战中,必须深入了解每一个选民的动向和诉求,满足他们的个性化需求,才能在竞争中击败对手,获取胜利,而支持这一切的,是无处不在的统计应用。
(责任编辑:牛域宁)