计算社会科学中“守旧”与“维新”的方法论探讨

2020-10-22 06:11韩军徽
理论探索 2020年4期
关键词:方法论预测

韩军徽

〔摘要〕 基于对近年来出现的大规模人类行为数据的共同兴趣,社会科学家与计算科学家携手开拓了计算社会科学这一新的研究领域。然而,学科背景与研究经历的不同导致两者围绕计算社会科学中因果解释与预测的关系上演了一场“守旧”与“维新”的方法论之争。“守旧”的社会科学家认为计算社会科学应坚持对因果解释的追求,而不必将预测作为理论的评价标准。“维新”的计算科学家则认为社会科学应给予预测更多的重视,并提出通过对预测采取适当广义的理解,在计算社会科学中进行预测是可能的。因果解释与预测并非互不兼容,两者实际上是互为补充、相互促进的关系。未来计算社会科学的发展应以解决实际问题为导向,在解决实际问题的过程中实现因果解释与预测的结合。

〔关键词〕 计算社会科学,方法论,因果解释,预测

〔中图分类号〕C3    〔文献标识码〕A〔文章编号〕1004-4175(2020)04-0011-07

一、研究缘起:计算社会科学中的社会科学家与计算科学家的两大阵营

在过去的十余年中,随着计算机、互联网等信息技术越来越深地嵌入到人们的日常生活之中,越来越多的人类行为数据被记录下来。同时,计算机运算速度的提高和算法的进步使得人类有能力对这种海量数据进行有效地分析。这种对关于人类行为的大规模数据的收集与分析能力的提高导致了计算社会科学的诞生 〔1 〕。作为一个跨学科的研究领域,计算社会科学的兴起是近年来社会科学最为重要的发展动向之一。

目前从事计算社会科学的研究者大致可以分为两类,即社会科学家和计算科学家。其中,前者主要指在社会学、经济学、政治学、管理学、心理学等领域从事量化社会科学研究的研究者,而后者主要指在计算机科学、信息科学、物理学等领域从事数据科学研究的研究者。在计算社会科学兴起之前,两者几乎不存在交集。当前,对大规模人类行为数据的共同兴趣正在使两者之间产生越来越多的合作。然而,截然不同的学科背景和研究经历使得社会科学家和计算科学家在研究方式上存在很大差异,这导致两者在计算社会科学领域上演了一场“守旧”与“维新”的方法论之争。本文将分析这场方法论之争的焦点——社会科学中因果解释与预测之间的关系,并探讨计算社会科学的未来发展方向。

二、社会科学家面对计算科学冲击的“守旧”

就从事计算社会科学研究的社会科学家而言,计算社会科学的兴起在为社会科学研究带来大规模人类行为数据和各种新颖的数据分析方法的同时,也导致社会科学长期以来形成的研究传统受到来自计算科学的冲击。例如,前《连线》(Wired)杂志主编克里斯·安德森(Chris Anderson)认为,数据泛滥使得传统的科学方法不再适用,理论已经终结 〔2 〕。他指出,传统的科学研究寻求事物之间的因果关系,但在PB(Petabytes)数据时代,相关性已经足够。这种观点很具有代表性,在社会科学界尤其是计算社会科学领域引起了极大的反响。面对这种来自计算科学的冲击,社会科学家表现出了明显的“守旧”。

(一)坚持追求因果解释

在安德森等人的观点中,最根本的是认为大数据的出现和数据分析能力的提高使我们可以满足于相关关系,而放弃对因果关系的追求。但在社会科学家看来,计算社会科学仍应追求因果解释。例如,格拉默认为,仅海量数据无法提供各种社会问题的答案,社会科学仍需以因果解释为研究目标 〔3 〕。之所以如此,原因在于社会科学和自然科学对因果解释的理解存在很大差异。

在自然科学中,因果解释以预测为评价标准,甚至两者几乎是同义的。对此,亨普尔和奥本海默的阐述最为系统 〔4 〕。他们认为,除非解释项可以作为对被解释项进行预测的基础,否则这种解释是不充分的。实际上,预测也是自然科学追求对自然现象进行因果解释的主要目的。但若仅以预测为目的,可靠的相关关系也可以起到同样的作用。因此,在安德森等人看来,随着大数据的出现和数据分析能力的提高,我们通过分析数据所获得的相关关系的可靠性越来越高,预测能力也越来越强。正是在这种意义上,他们认为相关关系已经可以取代因果关系。

然而,社会科学对因果解释的理解并非是亨普尔和奥本海默意义上的。社会科学家认为,社会现象远比自然现象更为复杂,导致难以进行有效地预测。因此,社会科学不应将对社会现象的预测作为因果解释的评价标准。例如,利伯森和林恩认为社会科学应更多地借鉴生物学而非物理学的理论和方法体系,预测不必作为评估理论的标准 〔5 〕。赫斯特罗姆认为,对预测的关注反而会阻碍对因果解释的探索 〔6 〕。因为实际的社会现象往往包含多个机制,这些机制的作用可能会相互抵消,因此即使某种机制性解释是正确的,它所预测的结果在实际的社会现象中也未必会出现。还有学者认为追求预测将导致模型过于复杂,从而失去了可解释性,此外我们也缺乏进行预测所需的充足的数据 〔7 〕。

实际上,社会科学家对因果解释的理解是伍德沃德意义上的。伍德沃德所建立的因果解释的操控准则要求因果解释回答“如果事情本来不同“(What-if-Things-Had-Been-Different)的问题,即因果解释应能够说明如果解释项本来有所不同,被解释项會有何种变化 〔8 〕11。在伍德沃德的因果理论中,解释项的不同是通过干预实现的 〔9 〕。这种干预通常是一种理想的、无混淆的实验性操控,同时支持反事实假设 〔10 〕。这些都使得对实际社会现象的预测不必成为评估因果解释的必要性标准,也导致社会科学长期以来较少关注预测。正是基于对因果解释的这种理解,社会科学家认为计算社会科学研究仍应追求因果解释。

(二)吸收新的数据分析方法

在坚持追求因果解释的基础之上,社会科学家试图将当前出现的大规模人类行为数据和各种新颖的数据分析方法“收编”入传统社会科学的研究框架之中。大部分社会科学家将这种新型数据和分析方法视为社会科学数据来源的丰富和研究工具箱的拓展,认为通过恰当地运用将有助于对因果解释的探索。他们认为,大规模人类行为数据的获取和数据分析能力的提高能够在三个方面促进社会科学对因果解释的探索:第一,可以设计更好的实验;第二,能够在更精确的群体之间进行更好的比较;第三,便于对之前难以观察的行为进行观察 〔11 〕。这些也是目前从事计算社会科学研究的社会科学家主要的努力方向。

具体而言,第一,互联网的普及使得社会科学中的实验研究可以通过网络平台进行,产生了“虚拟实验室”(Virtual Laboratory)。与传统实验室相比,虚拟实验室有一些突出的优势。例如,虚拟实验室更容易开展大规模实验、实验成本更低、实验设置更方便等等 〔12 〕。在利用虚拟实验室进行的社会科学实验研究中,有些是通过已有的互联网平台进行的。例如,邦德等人通过控制脸书用户能否看到其已经投票的好友的数量来检验社会影响在投票率上的效果 〔13 〕。还有些是通过自己搭建网站进行的,其中最著名的是萨尔甘尼克等人通过建立“音乐实验室”(Music Lab)网站对社会影响在音乐爱好中的作用进行研究 〔14 〕。另外,以AMT(Amazon Mechanical Turk)为代表的众包平台也引起了社会科学家极大的兴趣。众包平台实验与传统的实验室实验不同的是,前者是通过网络平台发布实验任务、收集实验结果,而后者是将参与者召集到实验室中进行实验。研究发现,截至2015年基于AMT进行实验的论文已超过1000篇 〔15 〕。

第二,当实验不可行或者不道德时,如何基于观察数据进行因果推断成为社会科学家关注的重点。一般的做法是通过匹配将研究群体分为实验组和控制组进行比较,要求两组在实验要求的处理前尽可能相似。以往的观察数据由于规模有限,进行匹配后往往会导致子群体数据过少而无法进行有效的因果推断。当前出现的大规模人类行为数据由于其巨大的体量,使得在匹配后的每个子群体都仍有足够多的数据。例如,赫什利用数以百万计的数据研究了9·11事件对受害者亲属与邻居的影响 〔16 〕。

第三,间接的“痕迹性”数据可以提供可靠的信息。对于有些人类行为,传统方法难以直接获取准确的观察数据。此时,由于当前产生的大规模人类行为数据主要是间接的“痕迹性”数据,反而可以提供一些相对可靠的信息。例如,人们的种族倾向或政治观点等信息通常难以通过传统的问卷调查、访谈等研究方法直接获取。而利用谷歌搜索数据,史蒂芬斯-大卫德维茨在2008年美国总统大选期间研究了种族倾向对投票选择的影响 〔17 〕。他发现,人们所用的搜索词中包含了大量关于种族倾向的信息,例如很多人用带有种族意味的绰号和奥巴马的名字一起进行搜索。因此,通过算法设计,他基于用户对搜索词的运用得到了其种族倾向。

除了将大规模人类行为数据的获取和数据分析能力的提高视为数据来源的丰富和研究工具的扩展之外,社会科学家还试图将海量数据分析所利用的“数据驱动”(Data-driven)的研究方法与传统社会科学“理论驱动”(Theory-driven)的研究方法相结合。例如,一些社会科学家提出可以首先通过数据分析以数据驱动的方式形成研究假设,之后利用传统社会科学理论驱动的方式对假设进行验证 〔18 〕。

(三)完善方法论基础

当前出现的大规模人类行为数据与传统社会科学常用的调查数据在各方面都存在較大差异,这促使一些社会科学家深入挖掘其方法论蕴涵,通过完善社会科学研究的方法论基础来为计算社会科学研究提供方法论支撑。例如,迈克尔·梅西(Michael Macy)通过检视传统社会科学的方法论基础认为,伴随着海量数据和强大计算能力及算法的非但不是理论的终结,反而是因果探索新的开始 〔19 〕。

梅西指出,传统社会科学研究中的调查数据通常被认为是相互独立的,这虽然有助于获取有代表性的样本且便于估计标准差等统计量,却也造成样本具有原子化的理论偏差。具体而言,这样的调查数据一般包含调查对象的种族、性别、年龄、教育程度、职业、收入等属性信息及其对某些问题的观点,但不包含调查对象的朋友、同事、家人等对这些问题的观点。因此,研究者在分析调查对象观点形成的原因时就只能将其与调查对象的属性信息相关联。而且研究表明 〔20 〕,这样的关联几乎总能得到显著的统计结果。也就是说,对于调查对象的任何观点,几乎总能找到某个属性信息与其显著相关。另外,由于属性信息一般没有因果前项(Causal Priors,例如没有因素决定一个人的性别,同时还影响其观点),当根据显著性进行属性信息与观点之间的因果推断时避免了通常根据相关性进行因果推断可能出现的虚假因果性(Spurious Causation)。最后,基于属性信息的因果推断也是合理的。因为人们所持的观点确实与个人的性别、年龄等属性信息有关,而且用个人属性信息解释其所持观点与启蒙运动以来所建立的个人主义意识形态也是相契合的。简言之,这种原子化的理论模式逻辑可靠、经验合理,与启蒙运动以来的个人主义意识形态相契合且在以调查为基础的社会科学研究中有着坚实的实证支撑。

但是,梅西认为,由于社会网络的自相关效应,这种原子化的因果解释极有可能是虚假的。简单来说,社会网络的自相关效应是指个人的观点可能会受到其网络邻居的影响。传统社会科学研究中的调查数据通常不包含调查对象网络邻居的信息,导致无法研究这种自相关效应。而当前所产生的大规模人类行为数据主要就是关系型数据,可以通过网络分析建立关系型理论。与之前的社会网络分析集中于边界明确的小群体不同,海量数据的获取使大规模的网络分析成为可能 〔21 〕。梅西同样注意到虚拟实验室的出现对社会科学研究的重要作用。他认为,基于观察数据进行因果推断具有内在的局限性,海量数据也不例外,而建立因果解释的黄金法则是随机实验。在传统的社会科学实验研究中,实验参与者一般较少,且主要是大学在校学生,将基于这些参与者的实验结果推广到更大的人类群体中时会面临严重的外部有效性问题。而脸书、AMT等虚拟实验室的出现使得研究者可以基于数量更多、异质性更强的研究者进行实验,从而有效地提高实验发现的外部有效性。因此,梅西认为海量的关系型数据的产生和虚拟实验室的出现将使社会科学中的因果探索进入一个新的阶段。

三、计算科学家面对社会科学传统的“维新”

如前所述,从事计算社会科学研究的计算科学家大多是在计算机科学、信息科学、物理学等领域从事数据科学研究的研究者,他们从事计算社会科学研究主要是因为对当前产生的大规模人类行为数据具有浓厚的兴趣 〔22 〕。对这种数据的研究要求计算科学家必须形成对数据所反映的社会现象的理解,而这以往是社会科学家的研究领域。然而,由于学科背景和研究经历的差异,很多计算科学家对社会科学传统并不认同。由此,一些计算科学家呼吁在计算社会科学中对社会科学传统进行“维新”。

(一)强调预测的重要性

由于计算科学家主要在自然科学领域接受学术训练和从事学术研究,其对因果解释的理解是亨普尔和奥本海默意义上的,即认为因果解释应以预测为评价标准。此外,计算科学家的研究通常有比较明确的应用指向,而较强的预测能力是应用性的基础。这导致与社会科学家相反,计算科学家非常强调预测的重要性而较少关注因果解释。例如,金斯博格等人根据特定谷歌搜索词搜索量的变化预测流感趋势 〔23 〕;伊戈尔等人利用从手机中收集的位置、通讯等数据预测人们的朋友关系网络 〔24 〕;科辛斯基等人基于脸书的点赞数据预测个人属性信息,如性取向、种族、宗教和政治倾向等 〔25 〕。

与前述安德森的观点类似,他们认为,既然社会现象并不稳定,以往的因果模型又都是一种粗略的近似,那么与其费力建立预测效果很差且可能随着概念漂移而变得更差的因果模型,我们为什么不利用可以获得的数据建立具有最佳预测效果的模型并定期更新呢? 〔22 〕他们认同社会科学家的观点,即我们所观察到的社会现象背后必然有某种因果机制。但是,他们认为通常很难从观察数据中得到因果机制。另外,与自然科学中包括了所有相关变量的完全模型不同,社会科学中的因果模型通常只是包括了部分相关变量的不完全模型。这除了导致社会科学中的因果模型一般预测效果较差之外,还经常出现不同的社会科学家根据同一组观察数据得出完全不同的研究结论的情况。相反,如果模型有比较好的预测效果,那它们往往能够为因果探索指明方向。因此,他们认为社会科学研究应增加对预测的关注。

(二)敢于质疑社会科学理论的可靠性

除了认为社会科学研究应对预测给予更多的重视之外,一些计算科学家还对社会科学理论的可靠性提出了质疑。例如,邓肯·沃茨(Duncan Watts)认为,虽然社会科学家几乎都认为他们所建立的理论是伍德沃德意义上的因果解释,但其实际上经常是一种亨普尔和奥本海默所称的“移情解释”(Empathetic Explanation) 〔26 〕。移情解释经常被误认为是因果解释,但两者存在本质区别:因果解释需要按照因果准则进行评估,而移情解释主要基于其可理解性进行评估,即其将解释对象还原为人们所熟悉的想法或经验的能力。沃茨认为,之所以出现这种情况,是因为社会科学家对常识的依赖远比他们意识到的要严重。在日常生活中,我们认为个人或集体的行动可以用相关行动者的意图、信仰、环境和机会来解释,并用这种认识来预期和理解别人的行为。社会科学中关于行动的理论实际上是这种常识的变种,而关于行动的理论又是社会科学的基础性理论,导致社会科学中的很多理论在本质上都是建立在这种常识的基础之上。例如,理性行动理论,布迪厄的场域理论、格罗斯的实用主义理論等。

社会科学理论对常识的这种依赖源于社会科学家构建理论的方式。在日常生活中,当预期别人的行为,甚至是我们自己在某种未来或假想的情形中的行为时,我们采用的是一种心理模拟的方式,即在脑海里模拟对方,设想他们在那种情形下的行为。当然,我们模拟的“对方”,实际上是经过修正的“我们”,即我们根据自己的感知假设了对方对情形的理解,并且加入了我们认为与情形相关的其他信息,如对方的意图、信仰等。当理解别人的行为时采用的则是一个相反的过程,即根据我们自己对情形的感知和对方的行为推测对方的意图,并进而将对方的行为合理化。在日常生活中,我们通常理所当然地认为通过心理模拟所建立的移情解释的可理解性就等于因果性。社会科学家在构建理论时采用的实际上同样也是心理模拟的方式,只是更为正式。这就导致了社会科学家经常建立的也是一种移情解释,并根据其可理解性进行评估。然而,可理解性并非因果性。我们建立的移情解释所包含的因果关系经常是错误的,只是在日常生活中由于我们能够很快地根据反馈进行修正,导致通常意识不到这种错误。但在社会科学中,当把这种移情解释误认为因果解释时,将造成社会科学理论的错误。

(三)构建社会科学方法论的“维新”方案

针对社会科学传统的种种“问题”,计算科学家给出了自己的方法论“维新”方案。他们认为,既然社会科学家试图建立的伍德沃德意义上的因果解释经常沦为一种移情解释,那我们是否可以参考亨普尔和奥本海默的因果准则,以预测作为社会科学理论的评价标准。当然,预测的准确性并不能证明因果解释的充分性,而只是一种必要性条件。沃茨指出,当前大部分社会科学家拒绝将预测作为社会科学理论评价标准的主要原因在于对预测的狭义理解,即认为预测必须是决定论意义上的、关于未来的以及针对特定的事件。他认为,通过对预测采取适当广义的理解,社会科学家应当认同有效的因果解释可以作出预测。

具体而言,首先,预测不必是决定论意义上的,而可以仅是一种概率意义上的,即某因素X的出现增加或降低了事件Y出现的概率。这种概率意义上的预测当前在物理学、计算机科学、人工智能等领域有着广泛的应用。其次,预测也不必是关于未来的。实际上,严格的关于未来的预测更准确地说应称为“预报”(Forecasting),预报仅仅是预测的一种形式。预测其实可以更广义地理解为“样本外检验”(Out-of-Sample Testing),即用于预测的数据与建立因果解释的数据不能是同一组数据。这种做法在以预测为核心的计算机科学等领域几乎是一种标准做法,即首先基于训练数据建立模型,然后利用测试数据检验模型的预测效果。如此理解预测时,除了未来的事件,过去以及现在的事件都可以作为预测的对象。最后,预测也不必针对特定的事件或结果,而是可以仅对事件或结果的某种分布或者模式进行预测。例如,萨尔甘尼克等人在对音乐市场的研究中预测,音乐市场的不平等性随着社会影响程度的增强而提高 〔14 〕。他们对音乐市场变化的模式进行了预测,但并没有预测具体哪首歌曲会流行。

一些计算科学家认为,以预测作为理论的评价标准在计算社会科学中是可行的,但需要注意以下几方面的问题 〔7 〕:

第一,建立统一的任务框架和预测标准。在以预测为核心的计算机科学、人工智能等领域通常有统一的量化标准可以对不同研究的预测效果进行比较,而目前在社会科学领域所进行的预测研究则无法进行有效的比较。这种情况产生的主要原因在于,社会科学研究中通常存在所谓的“研究者自由度”(Researcher Degrees of Freedom)问题,即研究者需要做一系列的主观选择,包括研究任务、数据集、模型和性能指标等。对于同一问题,研究者的选择组合不同,研究结果也会完全不同。因此,研究者首先应就研究任务、数据集、性能指标等达成共识,形成“共同任务框架”(Common Task Framework),并基于此框架對预测结果进行评估和比较。

第二,区分不同社会现象的预测限度。与自然现象通常可以进行非常精确的预测不同,人类行为的可预测性有很大的差别。例如,一项对5万名移动手机用户的研究表明,在任意1小时的时间内,用户有70%的时间在他们最常去的地点 〔27 〕。因此,当我们作出“某人在他最常去的地点”的预测时,可以得到平均70%的准确率。但是另一方面,对于所谓的“黑天鹅”事件,我们无法用任何有意义的方式进行预测。这就要求我们在评估特定预测模型的准确性时,不仅要参考已有的表现最好的模型,还要考虑可能预测的最大限度。因为如果预测效果不理想,既有可能是数据或模型的问题,也有可能是现象本身存在不可预测性 〔28 〕。

第三,兼顾预测准确性与模型可解释性。如前所述,社会科学家反对预测的主要原因之一就是认为预测将导致模型过于复杂,从而失去了可解释性。计算科学家认为,对预测的强调确实会导致模型复杂性的提高,但并不意味着预测准确性与模型的可解释性相矛盾。机器学习领域的一些研究表明,我们可以在保证预测准确性的前提下寻找更为简单、可解释性更高的模型。另外,对社会现象的“理解”本身就应既包括从主观上将其合理化,也包括对客观事实进行说明,即预测。

四、结语

基于对大规模人类行为数据的共同兴趣,社会科学家与计算科学家携手开拓了计算社会科学这一新的研究领域。然而,学科背景与研究经历的不同使得两者的研究方式存在很大差异,这也导致社会科学家与计算科学家之间,围绕计算社会科学中因果解释与预测的关系上演了一场“守旧”与“维新”的方法论之争。“守旧”的社会科学家认为计算社会科学应坚持对因果解释的追求,而不必将预测作为理论的评价标准。他们努力将当前出现的新的数据与方法“收编”入传统社会科学的研究框架之中,并希望通过对方法论基础的完善为计算社会科学研究提供方法论支撑。“维新”的计算科学家则认为社会科学应给予预测更多的重视。他们还对社会科学理论的可靠性提出了质疑,认为社会科学家所宣称的伍德沃德意义上的因果解释在很多情况下其实是一种移情解释。针对传统社会科学的种种“问题”,一些计算科学家提出了“维新”方案,即对预测采取适当广义的理解,以使在计算社会科学中进行预测成为可能。

社会科学家与计算科学家的观点都有其合理性,但也都存在一定的局限。具体而言,单纯追求理论的新颖性和启发性造成了社会科学理论体系的混乱 〔29 〕。对于任一研究主题,几乎都有若干理论,而且这些理论往往是互不兼容的。由于没有基于预测的评价标准,这些理论可以长期并行地存在下去。通过更多的预测,有助于改善当前社会科学领域理论体系混乱的现状,使得社会科学可以以一种累积的方式持续进步。但与此同时,社会现象内在的复杂性和随机性使其不可能像自然现象那样进行精确的预测。更为重要的是,当前计算科学家所进行的通常为基于相关关系的预测,预测结果稳定性较差,可解释性也较低。

笔者认为,在计算社会科学中,因果解释与预测并非是互不兼容的,两者实际上是互为补充、相互促进的关系。一方面,预测可以为因果解释指明方向、提供评价标准,从而有助于建立更为有效的因果解释;另一方面,有效的因果解释可以提高预测的准确性和可解释性,从而使基于预测对社会现象进行的干预更为可靠。

在计算社会科学研究中,要克服因果解释与预测各自的不足,充分发挥两者的作用,应以解决实际问题为导向,在解决实际问题的过程中将两者结合起来。原因在于,要解决实际问题,既需要基于因果解释实现对社会现象的理解,也需要基于预测实现对社会现象的干预。因此,以解决实际问题为导向将“逼迫”研究者将因果解释和预测结合起来。具体而言,为解决实际问题,因果解释将不得不更多地以预测为重要目标和评价标准。虽然很多社会现象由于其复杂性难以进行有效的预测,但在计算社会科学中,随着关于人类行为的大规模数据的出现和人类分析海量数据能力的提高,越来越多的社会现象正在不同程度上变得可以预测。只有与预测结果相符时,因果解释作为对社会现象的理解才具有说服力。同时,解决实际问题也要求预测以因果解释为基础。当前,在计算社会科学中,基于相关关系对社会现象进行预测变得越来越可行,准确性也越来越高。然而,解决实际问题意味着对社会现象的干预,而如前所述,基于相关关系进行的预测是不稳定的,且可解释性较低,难以作为对社会现象进行干预的依据。因此,解决实际问题要求预测必须以因果解释为基础,基于因果解释指导预测模型的建立。

参考文献:

〔1〕Lazer D,Pentland A,Adamic L,et al.Computational Social Science〔J〕.Science,2009(01):721-723.

〔2〕Anderson C.The end of theory:The data deluge makes the scientific method obsolete〔J〕.Wired Magazine,2008(07):16-07.

〔3〕Grimmer J.We are all social scientists now:how big data,machine learning,and causal inference work together〔J〕.Political Science & Politics,2015(01):80-83.

〔4〕Hempel C G,Oppenheim P.Studies in the logic of explanation〔J〕.Philosophy of Science,1948(02):135-175.

〔5〕Lieberson S,Lynn F B.Barking up the wrong branch:scientific alternatives to the current model of sociological science〔J〕.Annual Review of Sociology,2002(01):1-19.

〔6〕Hedstr?m P,Ylikoski P.Causal mechanisms in the social sciences〔J〕.Annual Review of Sociology,2010(01):49-67.

〔7〕Hofman J M,Sharma A,Watts D J.Prediction and explanation in social systems〔J〕.Science,2017(6324):486-488.

〔8〕Woodward J.Making things happen:A theory of causal explanation〔M〕.NewYork and Oxford:Oxford University Press,2003.

〔9〕Woodward J.Interventionism and causal exclusion〔J〕.Philosophy and Phenomenological Research,2015(02):303-347.

〔10〕Woodward J.Explanation and invariance in the special sciences〔J〕.The British Journal for the Philosophy of Science,2000(02):197-254.

〔11〕Monroe B L,Pan J,Roberts M E.Sen M and Sinclair B.No! Formal theory,causal inference,and big data are not contradictory trends in political science〔J〕.Political Science & Politics,2015(01):71-74.

〔12〕Golder S A,Macy M W.Digital footprints:Opportunities and challenges for online social research〔J〕.Annual Review of Sociology,2014(01):129-152.

〔13〕Bond R M,Fariss C J,Jones J J,Kramer A D,Marlow C,Settle J E,Fowler J H.A 61-million-person experiment in social influence and political mobilization〔J〕.Nature,2012(7415):295-298.

〔14〕Salganik M J,Dodds P S,Watts D J.Experimental study of inequality and unpredictability in an artificial cultural market〔J〕.Science,2006(5762):854-856.

〔15〕Bohannon J.Mechanical Turk upends social sciences〔J〕.Science,2016(6291):1263-1264.

〔16〕Hersh E D.Long-term effect of September 11 on the political behavior of victims families and neighbors〔J〕.Proceedings of the National Academy of Sciences,2013(52):20959-20963.

〔17〕Stephens-Davidowitz S.The cost of racial animus on a black candidate:Evidence using Google search data〔J〕.Journal of Public Economics,2014(118):26-40.

〔18〕Kitchin R.Big data,new epistemologies and paradigm shifts〔J〕.Big Data & Society,2014(01):1-12.

〔19〕Macy M W.An emerging trend:Is big data the end of theory?〔EB/OL〕. https://doi.org/10.1002/9781118900772.etrds0410.

〔20〕DellaPosta D,Shi Y,Macy M.Why Do liberals drink lattes?〔J〕.American Journal of Sociology,2015(05):1473-1511.

〔21〕Park P S,Blumenstock J E,Macy M W.The strength of long-range ties in population-scale social networks〔J〕.Science,2018(6241):1410-1413.

〔22〕Dhar V.Data science and prediction〔J〕.Communications of the ACM,2013(12):64-73.

〔23〕Ginsberg J,Mohebbi M H,Patel R S,Brammer L,Smolinski M S,Brilliant L.Detecting influenza epidemics using search engine query data〔J〕.Nature,2009(7232):1012-1014.

〔24〕Eagle N,Pentland A S,Lazer D.Inferring friendship network structure by using mobile phone data〔J〕.Proceedings of the National Academy of Sciences,2009(36):15274-15278.

〔25〕Kosinski M,Stillwell D,Graepel T.Private traits and attributes are predictable from digital records of human behavior〔J〕.Proceedings of the National Academy of Sciences,2013(15):5802-5805.

〔26〕Watts D J.Common sense and sociological explanations〔J〕.American Journal of Sociology,2014(02):313-351.

〔27〕Song C,Qu Z,Blumm N,Barabási A L.Limits of predictability in human mobility〔J〕.Science,2010(5968):1018-1021.

〔28〕Risi J,Sharma A,Shah R,Connelly M,Watts D J.Predicting history〔J〕.Nature Human Behaviour,2019(09):906-912.

〔29〕Watts D J.Should social science be more solution-oriented?〔J〕.Nature Human Behaviour,2017(01):0015.

責任编辑 苏玉娟

猜你喜欢
方法论预测
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(A卷)答案与提示
选修2—2期中考试预测卷(B卷)答案与提示
如何构建系统的方法体系
论马克思主义社会科学方法论的建构
马克思主义社会科学方法论起源及发展探究
A Literature Review of Critical Discourse Analysis
浅谈马克思主义社会科学方法论构建
论西方哲学方法论之于马克思主义社会科学方法论的当代意义