■ 郭 慧
2018年3月16日,脸书宣布暂时封杀两家裙带机构:SCL(Strategic Communication Laboratories)和剑桥分析公司(Cambridge Analytica)。随后,据英国《观察家报》和《卫报》以及美国《纽约时报》同时报道称,数据分析公司“剑桥分析(Cambridge Analytica)”的共同创办人Christopher Wylie向媒体爆料,剑桥分析在未经授权的情况下,获取了社交媒体“脸书”大约8700万用户的信息,并通过海量的数据分析操纵社会舆论。紧接着,英国电视台ITN4 新闻频道连续发布了三段卧底视频,揭示剑桥分析公司利用在脸书获得的8700万用户的个人数据,在2016美国总统大选期间针对特定人群进行定向宣传,影响大选结果。受此事件影响,脸书遭到了来自多个国家的用户、分析师、投资者以及监管部门的强烈指责,并导致股价暴跌,市值迅速蒸发,“删除脸书”的活动在互联网上开始流行。更严重的是,美国联邦贸易委员会(FTC)发布声明,确认其对脸书的隐私保护措施已开展开放的非公开调查,一旦认定违规,脸书可能面临巨额罚款。
扎克伯格在2018年3月22日发表的声明中表示,脸书早在2015年就从卫报记者那里了解到剑桥分析违反规则获取脸书的用户数据。当年,英国《卫报》就曾有过相关报道。那么,该事件为何在此时再次被主流媒体曝出?由于该事件中的“主角”剑桥分析公司被爆与白宫首席战略师、总统首席顾问斯蒂芬·班农、美国对冲基金大亨罗伯特·默瑟以及俄罗斯石油公司Lukoil有关,所以该事件很难与“通俄门”撇清关系。甚至该事件中剑桥分析的合作者——剑桥大学研究人员Kogan也因其俄裔美国研究者的身份而被怀疑。目前,多数主流媒体的报道也正是从这一层面入手。但该事件的一个关键问题却被媒体忽视了:剑桥分析公司真的能够根据用户的个性特征,精准而有效的将信息投放给选民并改变其行为决策吗?
勒庞、弗洛伊德曾依据他们对人性的洞察揭示出大众传播的阴暗面,他们认为民众更容易被一个来自远方的符号操纵者所左右。在英国电视台广播第4频道Channel 4播出的卧底视频中,“剑桥分析”总经理Mark Turnbull告诉卧底记者,“…这些都必须很自然地发生,要让谁都看不出来这是为了宣传造势…必须处理得十分细致…”①这样的描述很容易令笔者联想到一百年前在美国发生的信息战。在一次世界大战期间,有大量宣传文章进入美国媒体,影响了美国民意。②庞松比在《战时的谎言》中指出,1914年到1918年期间,有意编造的谎言超过了历史上任何一个时期。③从战后披露的各种虚假信息来看,美国民众和美国政府都受到了英国精心策划的心理战的影响。然而,由于英国的宣传“注重实效”“手法灵活”、且“不受道德规则牵绊”,使得“美国公众对于英国的宣传的察觉远不如对德国的那么敏感。”④
通过对比分析发现,虽然一百年过去了,但是在宣传和虚假信息的传播的问题上,那些有效的手段也许始终没变。从媒介心理的角度研究这一事件是一个非常有价值的视角。因此,本文另辟蹊径,尝试从媒介心理学的角度分析这一事件。文章将主要就该事件的核心问题:剑桥分析公司究竟用了怎样的心理测验手段对27万用户进行心理测写?具体的步骤如何?这一操作手段是否真能对选民造成影响并改变其决策?这种做法对个人隐私、高科技企业发展及社会发展又会产生怎样的影响?
戈夫曼认为,自我呈现(Self-presentation)是指为了使他人按照我们的愿望看待自己而在他人面前展示自我的努力。自我呈现是人们自觉的印象控制过程,是人际互动中的一种普遍现象。⑤而且这种印象管理是通过多种语言和非语言线索进行的。⑥随着计算机网络技术的普及,自我呈现在网络交往中得到延伸,以计算机为媒介的网络传播为印象管理与选择性自我呈现提供了新的技术支持。⑦Erin E.和Hollenbaugha,Amber L.Ferrisb指出,“大五”人格因素、自尊、社会凝聚力和动机都会对自我表露产生影响。但是,由于人口统计的变量没有公开而使研究受到局限。⑧当然,也有不少学者对网络自我表露的心理和社会意义进行了深入的探讨。Sabine Treptea,和Leonard Reinecke关于自我表露的实证研究表明,用户个人的社会资本对其使用SNS类网站有重要影响。⑨而且从本质上讲,社会网络是一种关于信任的道德关系网。⑩Bernie Hogan认为,网络自我呈现已经从一种自我的“表演”发展为一种自我的“展览”。杨芳琳等提出,网络自我表露的内容不能仅局限于表露者本人的信息,还应包括表露者本人了解的非本人信息。在“脸书泄密门”这一事件中,剑桥分析公司的合作者Kogan所获得的个人数据正是基于用户在社交媒体中的自我呈现。换言之,用户的这种网络自我呈现为行为预测创造了数据基础。
2007年,kosinski的合作者David Stillwell在脸书上发布了一个第三方App,“my Personality”,用于性格测试。其中一部分用户同意捐出他们在脸书的行为数据供研究使用。David Stillwell将这些用户的心理性格测试与脸书的行为数据叠加,形成了“my Personality”的数据集并用于学术研究。2013年,剑桥大学的研究人员Michal Kosinski、David Stillwell、Thore Graepel共同发表了一篇关于脸书数据预测能力的文章,他们使用SVD技术将用户及其“点赞”归类并建了行为预测模型,预测用户的性格和其他特质。文章指出,通过脸书的“点赞”可以自动识别并准确的预测性取向、种族、宗教和政治观点、个性特征、年龄以及性别等一系列高度敏感的个人属性。同时,他们也对这种预测可能产生的负面影响表示担心,由于商业公司、政府机构甚至脸书上的朋友都可以使用软件来推断出个人可能无意分享的智力、性取向或政治观点等信息。那么,用户对平台的信任感会降低,甚至可能减少使用数字技术。2015年,他们在另一篇文章中比较了人类和计算机在人格判断上的准确性并指出,机器学习能够在人们给不同内容的“点赞”、人们性格测试的分值,以及其他个人数字足迹之间发掘出深层次的关联。机器学习在性格判断方面超过了人类,但在心理评估、市场营销和隐私方面面临巨大的机遇与挑战。
2013年,Kogan与剑桥分析合作,仿照Kosinski等人的设计,制作了一个第三方App“this is your digital life”放在脸书上,并以五美元的酬金吸引了27万用户参与测试并转让自己的脸书数据。当然,Kogan的程序同时还收集了这些用户脸书好友的数据,于是27万的“种子用户”变成了8700万用户。
那么,具体的步骤是怎样的呢?首先,他们利用参与测试的用户建立起精准的心理侧写数据库,同时,从各种不同的渠道购买人口统计学数据,充实并丰富数据库;其次,对比他们的回答、个人资料信息以及用户的电子足迹,建立起一个相关的算法模型,并将这些数据和共和党选民名册以及网上的其他数据相结合,进一步提升该模型的准确率;最后,利用剩下的好友数据,模拟预测其他用户的个人心理与行为模式,包括一个人的需求、恐惧和行动。
1.相同之处:相似的步骤与核心技术
通过对比不难发现,Kogan与Kosinski等人的预测方法有着相似的步骤:首先,占有数据;其次,通过心理测验和数据匹配获得人格测量的分数或相关的算法模型;最后,利用算法模型进行测算、预测其他用户的行为。
Kogan与Kosinski预测模型中的核心技术为SVD(Singular Value Decomposition)技术,这一技术是将Matrix Factorization Model和Baseline Predictor相结合的一种常用的矩阵分解技术。该技术在协同过滤中可以根据已有的评分情况,分析出评分者对各个因子的喜好程度和包含各个因子的程度,再反过来分析数据得出预测结果。也就是说,通过机器学习在人群和他们的喜好之间找到关联,这种方法通常称为降维或矩阵分解。其优势在于能够在有着大量残缺的数据集中良好的运行。而它的缺点正是kosinski所担心的,这些预测可以在个人不知情的情况下进行。同时,这一技术也是许多网站用来预测用户阅读、观影或购物的重要工具,在商业领域有着广泛的应用。Kogan虽然不承认自己采用了SVD技术,但也不得不承认自己的方法与SVD或其他矩阵分解方法相似。
2.不同之处:是否匹配人口统计学等其他要素
通过对比二者的预测方法,我们发现Kogan 的研究似乎“更接地气”,从心理测试的设计到用户数据的获取再到加入相关的统计学信息与之匹配等等,在整个过程中,Kogan使用了多种“手段”。重要的是Kogan的模型在预测人口统计学特征和政治变量时,比预测人格更准确。Kosinski等人的模型在预测党派关系时,准确率是85%。而Kogan的模型在添加关于朋友或用户的人口统计信息后,准确率高达90%以上。而对性别、种族、性取向和其他特征的预测,准确率大致也超过了90%。可以说,对脸书数据的降维是其模型的核心,Kogan将这一方法称为“多步骤共现方法”。
五因素取向人格测量是判别人格特质的一种有效手段。具体而言又可细分为基于词汇研究的“大五”结构模型和基于问卷研究的五因素模型,二者虽然来自于不同的研究线索,却表现出极高的同质性。有学者将形容词式与自陈式两类测查五因素人格的测验进行了比较,发现两种类型的测验内部信度与效度无明显差异,两者都可以很好地测量五因素人格特质。通过对比研究发现,五因素模型测量的维度与“大五”人格结构中的五维度基本对应。于是,许多研究者都将“大五”人格结构和五因素模型同等对待,Block还提议用“五因素取向”(Five-Factor Approach,FFA)统称之。现在人格五因素的测量已成为心理测验学的常规工具。该模型也常被用来预测行为,Kosinski等人在研究中正是采用了这种方法。同时,这一方法还能将相似的人格聚集在一起。然而,该测试的难点却在于数据收集。
人格因素对网络心理与行为是否有明显的影响,在心理学领域一直存在争议。Krant等人在不同人格类型中发现了网络对交流、社会参与度及心理幸福感的积极影响。Yang和Lester发现,在工业化国家中外向型而不是神经质型的人在使用着跨文化互联网。然而,Wastlund的研究小组发现情况有些不明朗,其他人重复了部分他们的实验却获得了一些不同的结果。Engelberg,E.和 Sjoberg,L发现,网络的使用与孤独感有关,且与个人的特别属性是强相关,而与工作和休息之间的平衡及情商为弱相关。但他们并没有发现与“大五”人格特质的关联。同时,美国北卡罗来纳大学教堂山分校的社会科学家Timothy Ryan也表示,在剑桥分析此前发布的诸多广告中“并没有体现‘大五’的明显应用”。
发展心理学认为,性别是自我感构建过程中最早的要素之一,此外,还包括年龄、种族、文化以及社会经济水平等要素。在网络中,这些要素同样影响着我们的体验。互联网很大程度上反映的是自我的主体,因此,“当控制了年龄和性别时,人格在决定互联网使用所产生的差异是较小的。”与脸书泄密门有所不同,共和党2017年的信息泄露事件所涉及的正是选民的人口统计学数据,这些显性数据覆盖约59%的美国选民,无论在广度上还是在精准度上都超过了剑桥分析公司所涉及的数据。在泄露的数据中,具体包括选民的出生日期、家庭住址、家庭与邮寄地址、电话号码、注册党派、自我报告的种族归属、选民登记状态、潜在选民的“种族归属”以及“宗教归属”等 。由此判断,共和党很可能是在掌握了大量人口统计学数据后结合对选民的网络心理分析,对选民行为做出更准确的预测。
剑桥分析不单从人口统计学层面或人格特质测量层面将选民分类,而是采用了将二者结合的方法有效提升了分类的准确性。在Kogan的研究中,用户个性等心理层面的信息只是其模型中的一部分。剑桥分析前CEO Alexander Nix也曾在2016年向美国国家公共电台表示,他们分析用户的方式除了向“成千上万”的美国人投放问卷调查,还会从其他媒介合法地购入有关过往投票记录、人口统计信息等大量数据。因此,Kogan是将人口统计学、社会影响、个性以及其他所有因素都归结为一个数据集中,用以提升预判的准确性。
沈粹华指出,在美国“赢者通吃”的大选制度下,能被广告影响并左右选举结果的选票数量微乎其微。为此,剑桥分析运用这个数据模型试图找出符合某种特定心理画像的选民。同时,为了给这一小部分选民施加影响。他们购买了大量的(虚假)广告对这些人进行精准投放,以期达到塑造并影响选民决策的目的。
关于行预测在商业领域的应用,我们可以从脸书说起。脸书到底是怎样的一家科技公司呢?它有着怎样的商业模式呢?据脸书2017年报显示,其2017财年广告业务的营收为399.42亿美元,占总营收比例的98.25%,同比增长49%。也就是说,脸书目前主要靠广告盈利。那么,这种商业模式的本质是什么呢?首先,收集用户数据,包括用户的背景、工作、收入、个性、爱好等等个人信息;其次,通过各种渠道完善用户信息,补充数据,使自身数据库的用户画像变得越来越精准,甚至“比你自己更懂你”;最后,利用自己的数据库为商业用户提供服务,帮助它们更精准地投放广告,从而达到影响用户行为决策的目的。
基于这样的商业模式,脸书究竟能为他的商业用户提供怎样的服务呢?其现有的“广告优化”能够通过数据来预测广告投放后的用户点击情况,以及引发其他消费行为的可能性;Lookalike可以根据商家对用户特征的要求,为商家筛选符合其条件的用户群体。更为重要的是,这种商业模式并非脸书独有,而是众多互联网公司的基础商业模式。也就是说,脸书提供的数据分析服务应该优于剑桥分析。
为什么长久以来人们能接受这些技术在商业领域的应用,却强烈排斥将同样的技术应用于政治领域?因为公众普遍认为,让权力掌握在少数拥有技术的人手中,有悖于民主原则。在2016年的美国总统大选中,共和党数据分析由Deep Root Analytics、Target Point、Data Trust三家公司共同负责。事实上“共和党的数据存储库最终获得了大约95亿个数据点,覆盖五分之三的美国民众,并通过先进的归属算法将选民划分为48个不同类别,掌握了1.89亿名潜在美国选民的政治偏好。”客观上讲,他们的数据分析服务理应优于剑桥分析。
尽管精准的数据分析技术在商业领域已经有了许多成功的经验,一些学者的研究证明了这类精准的广告能够对用户的购买行为产生重要影响。然而,也有研究者坚持认为,“以性格特征为引导的宣传有一定积极作用,不过这个作用的具体大小尚未被任何的历史事件或实例证明,也没有被量化地考量过。”
网络行为预测最重要的社会影响也许并不是改变美国大选或英国脱欧公投的结果,而是商业、政治领域行为预测发展对个人隐私的挑战,虚假信息(广告)的泛滥以及由此引发的全球性信用危机。
在计算机为媒介的网络传播活动中,一方面,作为个体的用户是以暴露个人的网络痕迹或隐私为代价参与传播活动的,用户数据已经成为互联网的重要资源;另一方面,以脸书、谷歌、亚马逊为代表的高科技公司同时以暴露用户的网络痕迹或隐私为代价改变了全球的经济格局,并且正影响着全球的政治格局。
众所周知,信用机制是高科技利益集团与国家发展的共同基石。马克思认为,信用不仅创造新的流通产品,还努力“赋予流通以时间价值,把这些时间定义为钱或者更广泛地说是资本”。高科技企业担心“与政府分享情报会影响企业信誉,阻碍其在海外开展业务”。当社会网络呈现松散化、复杂化,信任则成为社会网络参与的必要条件,信任关系的缺失会破坏社会网络结构的发展。在复杂网络条件下,参与者之间的信任状况不仅决定着“现代公共舆论的走向”,还影响着“政治权力机构的存在”。
政府对人口信息的系统性收集与利用由来已久(尤其是古罗马和古代中国)。斯诺登事件中用户个人信息的泄露表明,就国家监控而言,商业活动与个人隐私都必须服从于国家利益。当数字技术成为最好的监控方式,控制与权力呈现出对整个社会的“整体监控与管理”“公民正变得无以遁形”。数字技术在为个人的自由表达与交流创造条件的同时,也将个人的网络信息与行为转化为“可用的数据流”。我们身处的信息环境“吸收了个人化和流通性所带来的信息流”。也就是说,这种数字化的技术在“不断地媒介化我们的生活”的过程中,已经将“数字监控”“嵌入到我们的社会生活和关系中”。社交网络通过把“使用者的社会写作”纳入到网络中,成为“把社会关系变成资本循环的一种工具”。但是,对高科技企业而言,个人信息的保护同时又是其商业信任的基础。因此,努力寻求在国家监控与用户个人信息占有之间的平衡是高科技企业当前发展的主要目标。
网络信息的快速生产与传播深刻影响着人类生活,人类对信息接受的焦虑与张力随之被放大,用户想要实现完全知情同意的门槛非常高。因此,当用户指责脸书公司置用户的个人隐私于不顾的时候,更应当提升信息主体对自身数据的自我管控能力。当各国政府斥责脸书的时候,更应该深刻反思当前的数据应用以及隐私保护的相关规则,增强此类数据管理的透明度。
在信息数据自由流动与国家监控的矛盾之间,在跨国资本与国家发展目标的间隙中,在隐私与监控等关键问题的冲突中,虚假信息(广告)既是一种宣传的手段,也是矛盾双方相互攻击的武器。对商业与政府机构而言,在对庞大用户群体的行为进行预测后,必然要对其投放更多有针对性的信息,以便达到改变用户心理与行为决策的目的。
目前,高科技企业正积极通过事实核查网站的建立提升自身信息的准确性,寻求与主流媒体的合作并聘请大量媒体编辑为其背书,用以提升用户对他们的信任。2018年4月11日,在接受美国国会议员质询时,扎克伯格表示,预计到2018年年底,脸书将有大约2万员工从事安全和内容审查的工作。但笔者认为,这些举措或许只能作为一种策略性的仪式。
当前,无论是个人网络痕迹的暴露还是虚假信息的泛滥,都是源于网络传播的发展。因此,也只有依托网络才能化解这些问题。上文通过深入分析Kogan与Kosinski等人的行为预测模式,或许为解决这些问题提供了新的思路,是否可以尝试通过对虚假信源的心理与行为模式的研究获得相关的算法模型,自动识别社交媒体中的虚假信息?从而有效控制虚假信息在社交媒体的传播,这样既能提高信息分发平台的自我管控效率,又能降低互联网平台在内容监管方面的运维成本。
注释:
① 英国电视台广播第4频道Channel 4的卧底视频。
② Barry Alan Marks.(1957).TheIdeaofPropagandainAmerica,UnpulishedDoctoralDissertation,University of Minnesota,pp.1-4.
③ Arthur Ponsonby.(1928).FalsehoodinWar-Time:ContaininganAssortmentofLiesCirculatedThroughouttheNationsDuringtheGreatWar.New York:E.P.Dutton and Company.
④ 刘海龙:《宣传:观念、话语及其正当化》,中国大百科全书出版社2013年版,第51页。
⑤ [美]欧文·戈夫曼:《日常生活中的自我呈现》,北京大学出版社2008年版,第3页。
⑥ Jones,E.E., & Pittman,T.S..TowardaGeneralTheoryofStrategicSelf-Presentation.In J.Suls (Ed.)Psychological perspectives on the self.Hillsdale,NJ:Lawrence Erlbaum,vol.1,1982.pp.231-262.
⑦ Walther,J.B..SelectiveSelf-PresentationinComputer-MediatedCommunication:HyperpersonalDimensionsofTechnology,Language,andCognition.Computers in Human Behavior,23(5),2007.pp.2538-2557.
⑧ Erin E.Hollenbaugha,Amber L.Ferrisb..FacebookSelf-Disclosure:ExaminingtheRoleofTraits,SocialCohesion,andMotives.Computers in Human Behavior,30(1),2014.pp.50-58.
⑨ Sabine Treptea,Leonard Reineckeb..TheReciprocalEffectsofSocialNetworkSiteUseandtheDispositionforSelf-disclosure:ALongitudinalStudy.Computers in Human Behavior,29(3),2013.pp.1102-1112.
⑩ [美]理查德·桑内特:《公共人的衰落》,李继宏译,上海译文出版社2008年版,第202页。