陈冰
最近的世界有点乱。
“前任”们纷纷遭到清算——萨科齐遭到司法当局“被动受贿、非法资助选举活动及窝藏利比亚公共资金罪”的指控,被进行司法调查不说,还被进行了司法管束。韩国前总统朴槿惠还身陷囹圄,不得自拔,前前任李明博又因涉嫌受贿、渎职、挪用公款、逃税等正式被拘捕……
现任也没闲着。因为Facebook5000万用户泄密事件,本来快消停的特朗普通俄门又波澜再起——这背后竟然是一起高科技操控美国选举的惊人事件。司法部门穷追不舍地追查,让特朗普焦头烂额,特朗普调转枪头,大笔一挥,3月22日签署总统备忘录,对600亿美元中国商品加征关税……
就在同一天,他还将著名的鹰派人物、2003年美军入侵伊拉克的主要拥护者博尔顿推上了总统国家安全事务助理的位置。这位不断靠推特投下政策巨石的非常规总统,还真是把“真人秀”玩得惊天动地。
有分析指出,在这次Facebook操控选举的惊天大丑闻曝光后,如果特别检察官穆勒和国会携手,特朗普将会越来越接近被弹劾。为了避免因通俄门而被弹劾,特朗普恐怕还会做出更多疯狂的举动以自保,这位与互联网有着不解之缘的美国总统,接下来大概要在美国和世界上很多地方掀起惊涛骇浪了……
3月中旬的一个周末,美英两国的主流媒体《纽约时报》和《卫报》踢爆了Facebook泄露5000万用户信息的新闻之后,引起轩然大波。
3月16日,Facebook迅速封杀了两家裙带机构。一个叫Strategic Communication Laboratories(SCL),主要为全球官方机构提供数据分析和战略决策。另一个是剑桥分析公司(Cambridge Analytica),作为特朗普的数据运营团队,他们在2016年成功助力特朗普上任。Facebook给出的封杀理由是这两家公司违反了Facebook在数据收集和保存上的政策。
根据剑桥分析公司的前员工克里斯托夫·维利的爆料,2014年,有27万名用户真正参与了性格测试的调查,调查中这些用户同意提供自己的个人数据供学术研究。不过,这一应用软件不但搜集了他们本人信息,还进一步顺藤摸瓜搜集了从他们Facebook页面能看到的其所有好友的信息。而这些人的Facebook好友则对其信息被搜集毫不知情。利用这种方法,27万名参与“问卷调查”的“种子用户”变成了特洛伊木马,导致了5000万用户信息泄露。剑桥分析公司根据这些数据为这些用户画像,然后预测他们的政治倾向,再根据不同的政治倾向,给他们定向推送不同的新闻,从而让特朗普,这名被传统媒体口诛笔伐、认为必败的候选人,靠着社交媒体的高效精准运作,最后爆冷逆转入主白宫。
据悉,这5000万份数据,包括了11个州的200万个匹配文件,占到了北美Facebook用户的近三分之一,而且,其中有四分之一是选民。
在2016年大选中,总投票人数约为1.3亿人。特朗普获得的总票数其实比希拉里还少300万,但只是因为在几个人口较多的关键州以极其微弱优势险胜才勉强上位。人们完全有理由认为,如果特朗普团队没有拿到这批海量信息,大选的结果就会改写。
3月19日开始,欧盟、美国、英国纷纷抨击Facebook和剑桥分析公司。欧洲议会主席塔亚尼表示,欧盟议员将调查逾5000万名Facebook用户的数据是否被不当使用。塔亚尼要求Facebook承担更多责任,他在Twitter上表示,Facebook用户数据被指不当使用,这侵犯了我们公民的隐私权,是不可接受的。
紧接着,聯邦贸易委员会(FTC)也宣布正在就数据泄露事件对Facebook进行调查,调查Facebook在此事件的操作上是否违反了此前在2011年的一项承诺。2011年,由于Facebook更改了一些设置却没有通知用户,美国联邦贸易委员会指控Facebook欺骗用户,强迫用户分享更多其本无意分享的个人信息。Facebook最终与联邦贸易委员会就该案达成和解协议,即2011和解令。和解令的要求之一是,Facebook在隐私设置变化时要事先征得用户同意。根据相关人士介绍,和解令每违反一次,可判处4万美元罚款。如果真的有5000万用户的数据被泄露,Facebook将面临2万亿美元(约12.7万亿元人民币)的巨额罚款,而Facebook的总市值也才4885亿美元。
这一罚,就是4个Facebook,不知扎克伯格心里作何感想。
Facebook,这家全球最大的社交网站的商业模式,就是通过全球最大的社交网络矩阵,获取有关用户个人身份和兴趣的大数据,帮助广告主投放比传统广告更为精准、更有效果的社交广告。Facebook高达98.2%的营收都来自广告,也是全球第二大广告公司(最大的广告公司是谷歌)。
可以毫不夸张地说,Facebook的盈利模式就是通过收集数据并将它们出售给应用程序开发人员和广告客户来赚钱。而防止这些买家将这些数据传递给别有用心的第三方,基本是很难做到的。
实际上,这也不是Facebook第一次遭遇第三方利用收集到的数据谋利。2010年,一家叫RapLeaf的网络追踪公司就曾经利用Facebook数据组建自己的数据库,出售给政治咨询公司。此次事件发生之后,剑桥分析公司也发表声明称,已经解除了公司CEO的职位,而且他们的政治分析部门并没有使用考根收集的Facebook用户数据。在了解到考根违反Facebook政策之后,他们就已经删去了所有数据。不过,主流媒体并不相信剑桥分析的这一说法。
一个无可争辩的事实是,Facebook在此次信息泄露事件中负有不可推卸的责任。Facebook并未在知情同意条款上区分某位Facebook用户自己发布的信息,和并非他本人发布,但是从其页面上能看到的他人所发布信息这二者的巨大不同。这一漏洞导致了海量用户信息在自己不知情的情况下泄露。
Facebook这一泄露事件已经在美国引发滔天巨浪。一方面全球最大的社交网络竟然在信息安全方面如此脆弱,再度侵犯了欧美人极其看重的隐私;另一方面,泄露事件正好给持久不衰的“通俄门”以最有力的证据,让美国主流媒体和民主党确信,俄罗斯干预了美国大选。不管特朗普是否会因此遭到弹劾,这一事件至少说明了社交网站在如今的政治选举中正发挥着巨大的影响力。
何止政治选举,大数据正在影响到我们生活的每一个角落。
2012 年 2 月,纽约时报记者报道了一则新闻《公司怎样知道你的秘密》(《How Companies Learn Your Secrets》),内容是这样的:一名高中女生收到了 Target(类似美国的大润发)所寄给她的折价券跟 DM,广告主打孕妇装及各式婴儿用品,这名少女的父亲看到后十分生气,认为 Target 这些广告是在鼓励未成年少女怀孕,便气冲冲地去找 Target 经理理论,经理当下也只能道歉了事,而且在几天后再度打电话拜访说明,没想到这名父亲反而在电话中羞愧地向经理道歉,道歉的原因是——原来他女儿已经怀孕了,预产期在 8 月。
当时这则新闻引起了广大讨论,大家纷纷赞叹于 Target 公司的“读心术”,实际上这不过是大数据在商业上的一则成功运用罢了。实际上,这一年——2012年也被公认为是“大数据”热潮的开始!
从网络上浏览的页面、光顾的网站、所点击的链接,掌握这些数据的公司比你还要了解你自己。有了这些资料,企业不需要“靠直觉”猜测客户的需求(更何况有时候客户也不知道自己要什么),数据不说谎,这也是为什么搜寻引擎、社群媒体能够逐渐扩大自己的专业领域且立于不败之地的根本原因。
数据、数据、大数据!
所有的企业都在挖空心思在数据收集、数据挖掘上下大力气,以此设计更好的营销手法来迎合消费者、吸引新顾客。记得2013年,国内还爆出一条新闻,一位网友听说很多棺材是包邮的,就在淘宝上搜索了一下“棺材”,结果在接下来的一个月里,每当他打开微博,都会看到骨灰盒、寿衣之类的广告推介,不胜其烦。这应该算是大数据挖掘初期的一个小插曲。数据挖掘发展到今天,可以说已经非常精准了。
比如芝加哥的Mattersight公司,就设计出了一款客服软件,它没有自己的情绪,永远只会依据你的情绪状态,做出最恰当的反应。通常,打电话咨询客服或投诉的时候,大概需要花几秒钟把电话转给专员。而Mattersight系统里,电话会由一套聪明的算法来负责转接。算法会先请你说出致电原因,接着聆听问题,分析你用的词语和语调,因此推断出你当时的情绪状态甚至是性格类型(内向、外向、反叛或依赖),根据这套信息,算法再为你转接至最适合你当时心情并符合你个性的专员。算法能够判断你需要的是具备同情心、能够耐心听完投诉的客服,还是毫不废话、立刻提出技术解决方案的客服。搭配越得当,客户就越满意,客服也就能降低服务的时间和成本。
科技的飞速发展,已经渐渐展现出一幅“算法”比人类运转更高效的未来图景。越来越多的互联网公司,如谷歌、Facebook、推特、阿里巴巴、腾讯、百度……正在成为令人畏惧的数据巨无霸,人们的衣食住行都被它们“铭记在心”,这些庞大的数据意味着一种全新的致富手段——
当你仍然在把微博等社交平台当作抒情或者发议论的工具时,华尔街的敛财高手们却正在挖掘这些互联网的“数据财富”,根据民众情绪抛售股票;对冲基金依据购物网站的顾客评论,分析企业产品销售状况;银行根据求职网站的岗位数量,推断就业率;投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;美国总统的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好……
庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府。“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。
可以毫不夸张地说,以后“算法”将是比你自己还了解你的“大师”,它将成为我们生活的主宰。
以色列学者尤瓦尔·赫拉利就在他的《未来简史》中预言,也许不久的将来许多人就会很乐意将大多数决定过程交给系统,或者至少是在面临重要抉择时参考一下意见。“谷歌将能够建议我们该看哪部电影,去哪里度假,上大学读什么专业,选哪个工作机会,甚至是该和谁去约会及结婚。”
他假设了这样一个场景:“嘿,谷歌。保罗和约翰都在追我,我两个都很喜欢,但喜欢的点不太一样,很难做决定,根据你手上所有的资料,你怎么建議?”
谷歌就会回答:“这个嘛,我从你出生那天起就认识你了。我读过你所有电子邮件,听过你所有电话录音,知道你最爱的电影,也有你的DNA资料和完整的心跳记录。你过去每次约会我都有精确的数据,如果你要的话,我可以把你过去和保罗或约翰约会时的资料调出来,显示出你每秒的心跳、血压和血糖值变化。如果有必要,我甚至也能把你们每次做爱的数据调出来,用数字比较谁高谁低,当然我对他们认识也不少于对你的认识,所以基于以上所有信息,和我杰出的算法,加上几十年来几百万对伴侣的统计资料,我建议你挑约翰。大约有87%的概率,你们长期满意度会比较高。
“当然,我非常了解你,所以我知道你不会喜欢这个答案。保罗长得比约翰帅,而你又太看重外表,所以你其实内心希望我的答案是保罗。确实,外表很重要,但实在没有你想的那么重要。你体内的生化算法是从数万年前的非洲大草原开始进化的,在对于潜在配偶的整体评价之中,外表占了35%,至于我的算法是基于最新的研究和统计数据,认为外表对于长期成功的浪漫关系只有14%的影响,所以虽然我已经把保罗的外表纳入考虑,但我还是认为约翰是你更好的选择。”
有了这种完全掏心的咨询服务,你到底是相信自己热情如火的直觉还是依靠冷静准确的“算法”呢?当然,谷歌也不见得永远是对的,毕竟这一切只是概率。但只要谷歌们做出足够多的正确决定,人类就会将更多的权力交给它。随着时间慢慢推移,数据库的规模会越来越大,统计的数字也会更加准確,算法会继续改进,决策质量也会进一步提高。可如果人类的思想、行为都能被“算法”算计好了,那么人存在又有何意义?
难怪一些经济学家预测,人类若不能变得更强大,迟早会变得完全没有用途。这绝不是危言耸听。当越来越多的人心甘情愿地让“算法”帮助自己正确地行为处事的时候——人工智能助理提醒您,你的血压太高,多巴胺分泌量又太低,根据过去的统计,这种时候你的商业判断常常会出大错,所以最好一切先别下定论,别许下什么承诺或是签署任何合同——你是不是该直接让人工智能助理上阵谈判了?如果谈判双方都是人工智能助理了,那你还有什么存在的必要?!
机器人让制造业工人下岗了;无人驾驶让卡车司机、出租车司机失业了;律师、医生、股票交易员纷纷被各种算法取代……就连艺术这座最后的圣殿,也毫不费力地被机器人攻克了。加州大学圣克鲁兹分校的音乐教授戴维·柯普花7年时间写了一个会谱曲的程序:EMI。短短一天之内,EMI就谱出5000首巴赫风格的赞美诗。后来,它又通过更新学会了如何模仿贝多芬、肖邦、拉赫玛尼诺夫和斯特拉文斯基,并出版了自己的音乐专辑,几乎没人能分辨出哪个是机器作曲,哪个是作曲家的作品。柯普后来又写出了一个更复杂的程序安妮,她会随着外界新的音乐输入,不断变化发展曲风,甚至还爱上了写俳句。
随着算法将人类挤出就业市场,财富和权力可能会集中在拥有强大算法的极少数精英手中,造成前所未有的社会以及政治不平等。有钱人可以花费更多的金钱来升级自己的人工智能助理,可以负担更多昂贵的治疗和检测,让自己的基因更强大、智商更出众、生命更长久……
还记得20年前,美国派拉蒙制作的那部极具前瞻性的经典作品《楚门的世界》吗?有着标准中产生活的楚门突然发现,他之前三十年的生活居然只是一个事先设计好的故事。他居住的小岛不过是一个巨型的摄影棚,自从他出生之日起,他的日常生活、琐碎小事就已通过卫星传送到全世界的电视上,24小时不间断实时转播。楚门最后面临的困境是到底要不要走出这个伪造的世界?现代人同样面临着楚门的困境,要不要走出万物互联这张巨大的网?答案几乎是肯定的——不能!
毫无疑问,在未来,每个人都将会是整个巨型全球网络的一部分,无论你主动还是被动,你说的每一个字,做的每个举动,都是伟大数据流的一部分。实际上,许多人已经放弃了自己的隐私和个性,把许多生命的点滴全部放到网络上,将每个行动记录下来。新时代的座右铭是:“如果你体验到了什么,就记录下来。如果你记录下了什么,就上传。如果你上传了什么,就分享。”
每个人都必须汇入数据的洪流之中,而“算法”则像“老大哥”一样无时无刻不在看着你,“读心术”让你根本没有什么隐私可言,无论是你的行为举止还是头脑中的想法。可悲的是,这一切还都是我们自己免费奉上的。
从奥巴马竞选总统开始,我们就可以看到Facebook掌握了具有无上价值的政治数据。它知道数千万美国人的政治观点,还知道哪些人是关键的摇摆选民以及他们的倾向。它甚至知道每位候选人该说什么才能让天平倒向自己这边。它还知道,根据“峰终定律”,选民们会忘了绝大多数事情,只记得几件极端的事件,并对最近的事件赋予完全不成比例的高权重。所以,它很容易利用手中的数据为它的客户——各路候选人制定有针对性的对策。针对这样新的选举态势,选民们是不是需要让“谷歌”们来代表自己投上公正的一票呢?
更大的悖论还在于,人类发明那么多App的本意是想把人从爆炸的信息流中解放出来,让你在有限的时间内获得更多有效信息。可怕的是精准的推送信息又可能将你画地为牢,从而真正禁锢了你的思想和行动。
举一个简单的例子,很多年轻人现在都爱使用头条或者抖音之类的App,其实个人观看什么内容是极其私人化的事情,但是一旦你阅读或者观看了类似的文章和视频,你就会发现之后推送的内容都是类似的。这种有针对性的推送从好处上来讲,会让用户黏性特别强,打开率奇高,活跃度也奇高,所以现在已经有了“一看抖音一天误”的说法,各种手指舞、变装秀、美妆、萌宠、恶作剧……完全是停不下来的节奏。
可是从另外一个角度看,用户花了大量的时间在头条、抖音等App上阅读、观看的自己感兴趣的内容,所有这些操作都会生成数据,这些数据累积又会生成用户画像,信息流广告就会根据用户画像去推送,在这种精准投送的逻辑之下,越是针对性的推送,越是会固化这种阅读收看场景,会让人不由自主地花更多时间在这些垃圾信息上,让自己淹没在更多的数据泥沼之中。
随着数据量和流通速度的双双提升,以人工智能和生物科技为代表的新科技将彻底改变人类社会和经济运行模式。世界正在加速运转,基于大数据积累出来的“算法”将会让人类更加长寿、获得更多快乐以及更多超越人类极限的能力;与此同时,我们很可能最终生活在一个被“算法”统治的“楚门的世界”里。