计算社会科学与科学决策的未来

2023-11-30 18:56唐世平
国际政治科学 2023年3期
关键词:社会科学机器决策

【关键词】 计算社会科学 模仿 模拟 全数据计算 复杂决策【作者简介】 唐世平,复旦大学国际关系与公共事务学院教授,复旦大学复杂决策分析中心主任。

电子邮箱:twukong@fudan.edu.cn

自拉泽尔(David Lazer)等人在2009年《科学》杂志发表《计算社会科学》一文以来① ,计算社会科学(Computational Social Science)作为一个新兴的交叉学科领域已经在整个国际社会科学界引起了广泛关注。① 但是,对于计算社会科学到底能为我们理解人类社会带来怎样的价值,以及如何推进计算社会科学的进步,学界仍存在相当大的分歧。

一方面,“大数据学派”普遍认为,只要有了大数据,通过计算机的计算,特别是基于机器学习②(包括深度学习)的计算,就有可能识别出人类社会中的众多规律或至少是某些规律性模式(regular pattern),而这将为我们理解人类社会带来翻天覆地的革命。③ 这一路径的计算社会科学基本没有从既有的社会科学成果中汲取太多的理论和实证积累。甚至可以说,这一路径的计算社会科学的隐含目标之一就是抛开既有的社会科学,主要依赖数据规模、算法和算力来理解人类社会。另一方面,大部分传统的社会科学家认为,完全依赖大数据和计算并不能帮助人类理解某些重大经典问题,比如革命、民主化、内战、国家重建、经济发展等等,因为这些问题根本就没有很多数据。④当然,诸如当代社会中的不平等的根源及其后果这一类存在大规模数据的问题领域,基于大数据的计算社会科学还是可以带来许多新的理解。

本文持一个大致的中间立场。一方面,本文认为,通过大数据计算确实有可能识别出人类社会中的某些规律性模式。但这样的规律性模式恐怕并不如我们想象的那么多,而且也不一定具有普遍意义,因为人类社会一直都是一个在时空中演化的体系。同样重要的是,模式识别本身还是描述,而不是解释,因此识别出来的模式也不一定能够为决策,特别是为需要考虑可能的干预的决策提供太多的支持。另一方面,本文认为,尽管基于大数据的计算社会科学可能对理解绝大部分重大经典问题的因果关系帮助有限,但计算社会科学确实有可能给应用社会科学特别是决策科学(decision sciences)中的科学决策,带来巨大变革。

简单地说,计算社会科学与科学决策的结合,能够让国家和机构对不同国家和地区的发展态势有更加“及时的”(timely)但未必“实时的”(realtime)和精准的(precise+accurate)预测和预警。可以想见,如果一个国家和机构能够对重大事件有一定的事先预测和预警,那么,这个国家和机构至少可以规避重大损失。因此,将计算社会科学与科学决策紧密结合起来,将是世界各主要经济体在未来的重要竞争领域之一,是国家综合国力的一个重要的、甚至是核心的组成部分。

一、 计算社会科学与科学决策

计算社会科学是基于大规模计算,通常也基于大规模数据,对我们关心的社会行为和社会事件(作为社会结果)进行推演和计算的科学。计算社会科学以数学(特别是概率论、统计学等)、计算机技术、数据技术(如知识图谱)为核心技术平台,基于社会科学理论和实证研究为数理模型和程序设计提供核心思想。因此,计算社会科学是将社会科学、计算机技术以及数据技术结合起来的交叉学科。而决策科学是试图基于科学手段来帮助人类优化复杂决策的交叉学科。显然,由于人类的复杂决策主要是针对社会中的其他行为体的,因此决策科学是一门更偏向于社会科学的学科。决策科学的最核心的目标必然是如何更加科学地决策。

总体来看,决策者都面临两个根本的挑战:一是信息的缺乏;二是处理信息的能力,包括如何甄别和剔除干扰信息的能力。在相当长的时间里,这两个挑战几乎是无解的。因此,传统的复杂决策均高度依赖专家判断。随着自然科学和技术的发展,尤其是从数学(特别是概率论、统计等)到计算机技术的发展,决策科学也越来越多地借助这些技术手段。而计算社会科学的到来,将极大地缓解上述两个挑战所带来的压力。决策科学中的科学决策因而也就面临前所未有的变革机遇。因为计算社会科学完全有可能让人类的许多重大决策不仅能够更加基于客观数据和计算,且在数据(信息)的来源和规模上有极大提升,从而让传统的绝大部分依赖专家主观意见的决策行为变得更加科学。因此,在接下来的讨论中,本文将主要围绕关乎决策的计算社会科学进行讨论,并将用“决策计算社会科学”来描述这个领域。

在此,需要特别强调的是社会行为与社会结果之间存在根本性区别。①社会行为是指行为体的行为,且人们通常关注的是行为体的自主行为,而不是行为体的本能性行为。社会结果则是在一定的社会情境下,由行为体的行为相互作用以及行为体的行为与社会情境相互作用而造就的涌现性结果(emergent outcome)。显然,行为体的选择都受到社会和自然环境的约束。更重要的是,通常情况下,一个行为体的行为结果不完全由该行为直接决定,而是多个行为体的行为在一定的社会和自然环境下相互作用的结果。换句话说,任何社会结果都只是部分,而不是全部由行为体的行为驱动。

这个区分对于理解为何模拟要比机器学习的技术取向可能更适合预测结果非常重要。此前很多关于计算社会科学的讨论因为没有区分这两类不同的客体,都误以为机器学习的技术就足以解决我们关心的问题。事实上,只要我们承认社会行为与社会结果的区别,我们就不得不承认对社会结果的预测只能主要依靠模拟。而由于行为受到环境的约束且人类的自主行为都会受到其他行为体的影响,我们对行为的理解和预测可能也需要基于一定的模拟(加上机器学习),而不仅仅是机器学习。

二、 “决策计算社会科学”的技术取向

过去的20年,大数据驱动的机器学习和人工智能技术突飞猛进并得到广泛应用。但是将计算社会科学与大数据驱动的机器学习和人工智能等同起来,认为大数据驱动的机器学习和人工智能是计算社会科学的唯一技术取向,这种看法并不全面。实际上,计算社会科学至少有两大技术取向。更重要的是,这两大技术取向有着根本差别,各有优势和劣势。如果不能相对准确地理解這两大技术取向的差别以及它们各自的优势、劣势,对“决策计算社会科学”未来的把握就可能出现偏差。基于此,有必要对不同的技术取向给出一些初步思考。①

这里将具体讨论两个问题。一是“决策计算社会科学”的技术取向是以基于“模仿”的机器学习为主,还是以基于“模拟”的技术为主但也加上机器学习? 二是“决策计算社会科学”是主要依赖大数据,还是综合运用不同数据?

显然,要想对可能的决策问题进行计算,就需要预测和推演。因此,本文不讨论完全不以预测和推演为目标(或者中间目标)的计算社会科学。目前大部分社会科学杂志发表的属于计算社会科学的研究,都不是以预测和推演为目标的,而仍旧是以传统的因果推断(causal inference)为目标的。这些研究和传统的计量社会科学的研究没有根本区别,只是在数据的结构、规模和运用的算法上有差别。② 它们的目标仍然是确立某些要素对某些结果的影响。这些研究也许能帮助我们预测某些行为和结果,特别是相对线性的行为和结果,但这些研究都不以预测和推演为目标,更不以支持复杂的决策为目标。而本文将主要讨论以预测和推演行为或结果为目标的计算社会科学。

(一) “模仿”还是“模拟”?

本文认为,“决策计算社会科学”有两个大的技术取向:以“模仿”为目标的机器学习和以“模拟”为目标的计算模拟。① 基于决策问题的特殊需求,未来的“决策计算社会科学”应该以模拟技术为主要技术取向,但又融合模仿技术。

1. 作为模仿的机器学习

传统的计量社会科学主要依赖因果推断,而不是推演和预测。因果推断的核心基础之一是统计学,机器学习的核心基础之一同样是统计学,因此机器学习也是最早被用于计算社会科学的工具之一。

新兴的深度学习和早期的机器学习密不可分。但是,学界的一个趋势还是将(狭义的)深度学习和(狭义的)机器学习区分开来。② 今天的深度学习可以认为是自2006年杰弗里·辛顿(Geoffrey Hinton)等人推出无监督深度置信网络训练方法之后发展出来的机器学习。③ 在同一时期,计算机硬件快速发展,数据规模也不断扩大,深度神经网络开始广受欢迎。2012年,深度学习开始大爆发,卷积神经网络(CNN)、循环神经网络(RNN)、进化神经网络(ENN)等模型的优势逐渐显现,并且在模式识别、信息检索、自然语言处理等多个领域的应用都取得了重大突破。

在根本意义上,机器学习都是基于模仿,然后超越人类的计算和推理能力。从经典统计到机器学习,都要经历由训练集到预测集的过程。训练集主要用来训练模型,这部分工作主要依赖历史数据。而如果要检验模型的有效性,除了在训练集内训练之外,还需要在预测集中检验模型的有效性。而在预测集中,既可以是基于已知的历史数据“预测”历史上已经发生的行为和事件,也可以是基于推定的(projected)未来数据预测未来的行为和事件。

在基于模仿然后超越人类的计算和推理能力方面,计算社会科学在多个领域都取得了显著进展。比如,深度学习技术在自然语言处理方面的应用取得了很大的进步。而知识图谱则将复杂的领域知识通过信息处理、数据挖掘、知识计量和图形绘制,试图发掘人脑无法发现的关联甚至规律性模式。此外,图像识别也是一个重要的深度学习的应用领域。

对战略行为的预测,传统社会科学的一个主要工具是博弈论,具有代表性的是布鲁斯·布尔诺·德·梅斯奎塔(Bruce Bueno de Mesquita)所做的工作。① 梅斯奎塔的模型是基于期望效用(expected utility)的相对简单的模型。尽管他的模型有多个行为体,但是在求解的时候,他还是不得不将多个行为体的博弈简化成为两个行为体的博弈,因为一旦多于两个行为体,整个模型的均衡在数学处理方面将非常难解。不仅如此,其模型还包含非常多的主观赋值。因此,该模型到底有多少实用价值并不确定。从这方面的文献追踪来看,继承这个技术路径的学者并不多,而学界对基于博弈论来预测行为的批评也一直都没有停止过。②

从某种意义上说,深度强化学习似乎天生就是为智能决策服务的。深度强化学习通过结合深度学习和强化学习,让智能体在训练中试错,通过奖励和惩罚反馈神经网络,从而得到更好的策略模型,然后根据当前状态判断应该采取的行为。因此,有学者认为,计算社会科学就是基于大量数据,通过技术获得关于人类的更加精细的行为模式(pattern),并且基于此构建相关理论的科学。① 应当说,机器学习技术在分布相对稳定、跨时可比性高的行为方面的努力已经卓有成效。但在复杂且不稳定的战略性行为的预测方面,机器学习技术的成功应用案例还是罕见的。事实上,目前深度强化学习的主要应用都是针对个体水平的行为决策,如基于用户画像和模式识别的购物广告投放、社交媒体内容推荐等等。

基于机器学习技术对社会结果进行预测的比较典型的努力是基于历史事件数据以及新闻数据来预测政治不稳定,如政变、革命、内战等。② 在数据上,除了历史事件数据以及新闻数据,还包括结构因素以及外部冲击事件,比如石油危机、金融危机的数据等。在算法和模型上,这些努力均注重多种算法和模型的混合。由奥斯陆和平研究所(PRIO)的赫瓦德· 赫格里(H?vard Hegre)等人主持开发的政治暴力早期预警系统(Political ViolenceEarly Warning System,ViEWS)是这一类努力的最雄心勃勃的项目之一。③类似的项目还包括杰克·A.戈德斯通(Jack A.Goldstone)等人的“政治不稳定”(Political Instability Task Force,PITF)项目,以及《和平研究杂志》2017年的特刊文章。① 总体来说,学界认为这些对社会结果进行预测的努力,其效果并不好。②

造成这一结果的核心原因至少有3个。首先,目前的研究通常主要基于结构性因素。结构性因素的变化相对缓慢,因此这些因素构成的模型最多只能告诉我们某个国家和地区的稳定性如何,却并不能给出及时和精确的预测或预警。③ 其次,社会系统是一个演化的系统④,而基于机器学习的预测的核心假定之一是社会系统是相对线性的。另外,基于深度学习技术的预测社会结果的努力,其过程中的黑箱成分更多,也即它没有太多的社会科学理论和实证基础作为支撑。① 而这对于以预测战略行为和结果为目标的努力来说,还是有很大缺陷。最后是一个纯技术性问题,因为基于深度学习技术的预测社会结果的努力通常都基于历史數据,特别是新闻数据。而基于自动字段提取技术得到的数据集往往有不少数据质量问题,同样会加剧这方面的技术问题,尽管最近火爆的语言大模型肯定会有所帮助。②

2. 计算模拟(computational simulation)

模拟是计算社会科学的另一个技术取向。模拟的目标是模拟两个及以上不同行为体的行为以及这些行为的相互作用而导致的涌现性结果。最早的模拟大致包括格斗模拟和军事演习。格斗模拟主要用于提升单兵的战斗力(与战斗机飞行员的格斗训练类似),而军事演习(沙盘、兵棋推演,直到实兵实弹的演练)则主要用于提升整体的战斗力和优化战术部署。因此,从模拟的目标可以反推,模拟方能够以改变自身和对手的行为来改变结果。

计算机到来后,就有了计算(机)模拟。计算模拟技术本身也有很多种。因为社会结果都是由行为体的行为以及这些行为的相互作用在一定的环境下造就的,因此,本文认为,ABM 可能是最适合模拟基于战略行为的涌现性社会结果的一个技术路径。③

首先,模拟更关心社会结果,或者说是由行为与行为的相互作用在一定的环境下达成的结果。相比来说,博弈论模型中通常只能推演两个或至多3个行为体的行为,而ABM 则可以容纳多个行为体,并能够推演这些行为体的复杂行为选择。

其次,也是最为关键的,ABM 是一种由下至上的模拟技术。ABM 试图捕捉在一定的环境下,由行为体的行为以及它们的相互作用而造就的涌现性的、更高层次的社会结果。① 因此,ABM 特别适合以通过模拟来预测结果为目标的研究。

再次,基于ABM 的模拟,不仅可以模拟对比不同情境,而且可以回溯结果的成因(类似于围棋的复盘),从而大大降低黑箱的成分。因此,ABM 特别适合基于对结果的推演来反推行为体的多种行为。

这里还需要特别指出,ABM 与传统的沙盘推演及兵棋推演也有很大的不同。传统的沙盘推演、兵棋推演都是基于相对固定的场景(从行为体到规则、到环境),而且转换情境的成本相对高昂。ABM 则具有高度的可适应性,可以非常方便地迁移到不同的情境,而且成本相对低。更重要的是,ABM 中的行為体完全可以有独立面对特定状况的行为决定权,而沙盘、兵棋通常都是一方的指挥官指挥所有的下级单位行为体。

ABM 有3个核心要素:行为体、环境、行为规则。ABM 中的行为体可以是个人、社会群体(企业或其他群体)、政党、政府或者其他任何研究者感兴趣的行为体,只要这些行为体是基于某些规则做出决定的就可以。换句话说,这些行为体的行为不是完全随机的。系统内的行为体可以有各种特质,包括人口学特征(性别、年龄、族群等)、社会经济特质(比如婚姻状态、收入水平、从事的行业等)、政治倾向(比如党派)。这些特征都有可能影响行为体的行为。基于这些特质和其他数据,研究人员可以通过社会科学的研究或机器学习来提取行为体的某些行为规则。之后,行为体在系统中的行为以及它们的相互作用将造就出涌现性和更高层次的社会结果。通过多次且每一次模拟运算进程都不同的模拟,加入随机事件和冲击以及不同的非线性干扰,ABM 将能够看到这些行为体的行为的相互作用造就的社会结果是否具有一定的稳定性。如此,ABM 就能让研究者去考察社会结果的生成过程及其背后的因素和机制,而且这个过程可操纵和回溯。而这一能力是其他许多技术都不具备的。

最早的ABM 系统可以追溯到托马斯·C.谢林(Thomas C.Schelling)著名的关于居住的种族隔离的研究。① 但在相当长的时间里,ABM 都只能用来演示某些可能的结果以及检验某些可能的因素和机制的可靠性,而并没有在以预测和推演为目标的社会科学中有太多应用。② 其中一个主要的限制是计算能力:如果要模拟接近真实情形的社会结果的生成,通常需要很大的计算量。因此,在2000年之后,计算能力的日益强大,特别是云计算的出现,使得ABM 终于有了可以大显身手的机会。目前,ABM 已经被用来探索许多不同的问题领域,从恐怖主义到社会流动,到经济社会动态,到复杂社会网络,包括恐怖网络和毒品网络。③

3. 两个技术取向区别及优劣势比较

机器学习和ABM 这两大技术取向有许多重要的差别。这些差别一定意义上解释了它们面临的不同挑战,包括它们的应用范围。这些差别主要表现为七个大的方面。

第一,核心基础。机器学习的核心基础是统计学习。ABM 的基础则更为多元,统计学习只是ABM 的基础之一。

第二,方程的形式与实现成本。在机器学习中,方程的核心目的是单一的,即通过方程中的某些参数来直接捕捉结果。因此,机器学习的核心方程几乎都是一个形式:y=f(X )+ε。其中,y 为预测结果变量,ε 为误差项,X通常是多个解释变量的集合。即便是针对不同的问题领域,绝大部分机器学习模型的核心差别其实也不大。因此,一旦一个机器学习的算法被发展出来,其后的技术实现就变得相对容易了。这背后的一部分原因是机器学习对社会科学理论和实证以及专家知识的依赖性较低。

相比而言,ABM 系统中不同方程的目的不同。一个ABM 系统通常包括多个方程及其参数,用于刻画行为体、行为及行为规则、行为体与行为体之间的相互作用规则、行为体与环境的相互作用规则,以及最终如何驱动结果。很显然,这些不同方程几乎不可能有固定形式。因此,ABM 的技术实现比较复杂。在ABM 的建模过程中,需要参照和引入社会科学的既有理论和实证结果,包括专家知识,而不能只是让机器去从大数据中自我学习。因此,针对不同问题的ABM 模型通常需要非常不同的设计。换句话说,ABM的技术实现没有一个简单的通用规则。因此,相比基于机器学习来说,ABM的技术实现会更加费时费力,特别是构建模型的过程可能需要更多轮的试错。①

第三,机器学习的结果(y)都是数值。ABM 的结果不是某个数值,而是某个状态,尽管该状态可以用某些数值去刻画。

第四,结果与方程的关系。在机器学习中,方程均试图直接捕捉结果,即便是一组方程也如此。相比之下,ABM 的结果不能被任何一个方程,甚至被所有的方程加在一起而直接捕捉,因为结果是系统的涌现性结果。

第五,模型的改进与社会科学的关系。机器学习模型的改进主要依赖数据量和数据质量的提升来训练模型,努力减少误差项ε,然后依据多个解释变量的集合X ,来预测结果变量y。因此,机器学习通常高度依赖更多和更加完善的历史数据,并通过收集、处理文本、图片和视频等大规模原始资料为机器学习模型提供更多、更干净的数据集。总之,绝大部分机器学习的模型改进对社会科学的借鉴不多。不过,随着业界逐渐意识到有人工介入的有监督机器学习至少对于某些领域的机器学习模型的改进不可或缺,机器学习对社会科学的理论和实证的依赖在未来可能会上升。

ABM 模拟也需要将模拟结果与历史结果进行比对来不断改进模型,之后再用这些模型来预测未来的某些结果。但是,对ABM 模型的改进不仅需要依赖数据的数量和质量的提升,还必须基于对社会科学理论和实证结果的更好的把握。

第六,不同层次的数据整合(integration)。一般来说,在计量社会科学中,不同层次的变量之間的整合或者相互作用可以由多层次模型(hierarchical models)中的交互项来捕捉。在机器学习的算法中,基于决策树的模型可以被认为是一种交互项的算法。不过,决策树给出的结果却并不代表不同层次的数据整合,因而其结果也不容易被理解。而在其他的统计机器学习算法(如xgboost)以及神经机器学习中,交互项的使用更少。因此,总体来说,即便是在基于多层次模型的机器学习中,不同层次的数据之间的整合也相对较低。

相比之下,ABM 从一开始就建立在整合不同层次数据的理念之上。ABM 的核心理念就是通过让多个行为体在中观和宏观环境下选择行为,然后让这些行为相互作用,并与环境相互作用,然后来驱动最终的涌现性结果。因此,ABM 能够更好地整合不同层次的数据。

第七,社会系统是否演化? 机器学习的技术实现基于一个通用的原则,即基于训练集数据(包含结果变量和解释变量),不断优化模型,之后用优化的模型来预测未来的某些结果变量。因此,尽管机器学习本身允许模型的不断优化,但机器学习的基本假定是社会系统大体是线性的。也就是说,机器学习不太容纳社会系统的演化。

相比来说,从一开始ABM 就明确承认社会系统本身会演化,而且明确试图去捕捉系统的演化。从技术上,ABM 也可以非常容易地容纳非线性、非单向的行为和环境的变化;而且不仅行为体以及他们的行为和行为规则可以演化(包括基于自主学习的演化),整个系统的环境也同样可以演化。事实上,最早的几个ABM 应用案例,从谢林的“自动隔离”模型,到罗伯特·埃克斯罗德(Robert Axelrod)的“合作的演化”,都是以模拟演化结果的研究。①

4. 未来的发展方向: 整合了机器学习的计算模拟

如上所述,ABM 的3个核心要素是行为体、环境、行为规则。确立行为体、环境、行为规则的基础是统计和历史描述性知识。而机器学习在大规模数据提取和处理上,拥有传统社会科学所完全不能拥有的能力。因此,整合了机器学习的计算模拟是未来的发展方向之一,而ABM 则具有几乎无限的整合机器学习能力。具体来说,机器学习对于描述ABM 系统中的行为体的特征、环境以及行为规则都有重要帮助。① 另外,早期的ABM 中的行为体不能自我学习、自我演化,随着机器学习特别是深度学习技术的到来,ABM中的行为体的特征和行为规则完全可以自我演化。深思公司(Deepmind)发展的基于强化学习的“夺旗游戏”就是这样一种尝试性的努力。②

不过,尽管将机器学习和ABM 结合起来的思想很早就有(大致的技术实现路径见图1)③,但进展并不明显,特别是真正将两者结合起来并用于解决真实世界中的问题的尝试还不多见。可以认为,这样的整合可能有三个层次,或者说是分三步走。

第一个层次,主要是利用机器学习,帮助ABM 系统中的行为体、环境、行为规则进行调参和优化。目前已经发表的研究成果主要集中在这一个层次,但尚未应用于解决真实世界中的问题。

第二个层次,以第一个层次为基础,基于机器学习,让ABM 中的行为体特征和行为规则都可以自我学习、自我演化。目前的研究离该层次还有相当的距离。

第三个层次,在第一和第二个层次的基础上,让ABM 对环境的刻画都能够自我学习、自我演化,进而从深度和广度上让ABM 能够更好地捕捉真实的世界。目前的研究离这个层次还有非常大的距离。

(二) “全数据计算”,而不仅仅是“大数据计算”

如前所述,在绝大部分人的理解中,计算社会科学就是基于大数据的社会科学。事实上,拉泽尔等人在2009年的《计算社会科学》一文中几乎把“大数据(科学)”等同于“计算社会科学”。① 对于这样的一个立场,许多传统的社会科学家并不认可。① 本文亦对这样的立场持保留意见。

本文认为,基于“全数据计算”才是“决策计算社会科学”的正确方向。因为决策计算需要的是“全数据”思维,而不仅仅是“大数据”思维。也就是说,大数据只是一部分的数据,而不是全部的数据。全数据包含了大数据。

“全数据”思维是指首先要确立大致需要什么样的数据,然后才能够用相关数据解决一个复杂决策问题的思维方式。因此,“全数据”思维首先强调的是数据对解决一个决策问题的必要性和大致充分性,而不是一味强调数据的多少,或者说是数据维度越多越好,数据规模越大越好。换句话说,“全数据”思维是从需要解决的问题出发,而不是从数据本身出发。从这个意义上说,“全数据”思维也可以说是“充分数据”思维。

因此,“全数据”思维首先要回答的是“解决某一问题需要什么数据”的问题。② 很多时候,要解决一个复杂决策问题,仅仅依靠大数据是不够的,还需要和其他基础的人口、经济、政治等数据集合起来。仅靠大数据可能只能解决一些小的决策问题。事实上,如果不从需要解决的问题出发,研究者可能都不会去收集某些数据,甚至不知道某些数据是存在和可收集的。当然,研究者还需要对运用大数据辅助重要决策保持一定的警惕,因为大数据很容易被假数据和假信息污染。

“全数据”思维其次要回答的是“不同的数据有哪些不同的用处”的问题。比如,我们通常会认为,宏观和中观的数据对大格局的把握更加有帮助。而像社交媒体信息、酒店信息和电话号码等微观数据,如果准确,则有助于我们对某些特定的个体和群体行为作出更加准确的预判。也就是说,不同数据有不同作用,要恰当地综合运用以解决不同问题。

总之,面对具体的复杂决策问题,研究者需要不同的数据组合、不同的基础数据和不同的大数据。因此,“全数据”思维不是事先给定要解决一个具体复杂决策问题的数据范围,而是需要研究者根据具体的研究问题来探索不同的数据来源组合。面对具体的复杂决策问题,研究者既要以既有的社会科学的理论、实证研究和数据积累为基础,又要了解新大数据的来源以及处理技术,只有这样才能充分利用这些不同的资源。

三、 模拟决策: 问题与示例

要想达成“以计算为基础的科学的复杂决策”这一目标,研究者必须用社会科学的思维特别是社会科学的问题意识来规制计算社会科学。那么,计算社會科学到底能够帮助我们解决哪些决策者经常面临的问题? 本文认为,计算社会科学在以下几类问题的决策上将大有用武之地。一是对国家来说,计算社会科学能够对其他国家的基本政治走向特别是该国的国内政治稳定等问题做出预测;二是对企业特别是大型跨国企业来说,计算社会科学能够对投资对象国的基本政治经济走向作出预测,并就如何确定竞争战略、如何进行选址等问题的决策提供参考;三是对个人来说,计算社会科学能够协助个人就旅游、买房等试错成本相对高的问题做出决策。所有这些决策都不仅仅需要数据的支持,还需要社会科学的思维以及理论和实证积累。以下就国家层面提供两个具体案例,以说明计算社会科学如何为科学决策提供新的思路。

(一) 选举预测

预测选举结果并基于这些预测调整策略,是每一个政党、候选人以及利益相关国家需要面对的最重要的决策问题之一。传统的选举预测主要依赖民意调查或者是在综合不同民意调查的基础上进行相关数据处理,而基于社交媒体的大数据,原理上也是民意调查。但是,民意调查(以及社交媒体的大数据)有4个无法解决的偏误:抽样偏误(特别是在需要分层抽样的情形下),被调查者中的回答者的自我选择偏误,回答者的有意误导回答,个人的支持偏好不一定会变成真正的选票(如投票率问题以及自然灾害或恐怖袭击等突发事件)。①

为此,复旦大学复杂决策分析中心的研究团队发展了一个完全不依赖于选举前民意调查,而是基于ABM 计算机模拟的选举预测平台。同样重要的是,该预测平台也不依赖于社交媒体的大数据。在“剑桥分析”(CambridgeAnalytica) 爆出丑闻之前②,研究团队就已经对运用大数据特别是社交媒体的大数据来预测选举结果保持了警惕。因为大数据很容易被假数据和假信息污染,正如特朗普当选和英国“脱欧”两个事件告诉我们的那样。换句话说,互联网上相当多的信息是假消息或者是故意误导的信息。虽然针对如何处理假消息已经发展出一些识别和稀释其影响的算法,但数据的真实可靠始终是影响大数据预测准确性的重要因素。

具体而言,基于社会科学家的研究和某些特定数据,研究团队构建出了一个能够模拟选举结果的ABM 模拟平台。基于ABM 模拟的选举预测的实现分为六大步骤。

第一,基于公开平台收集历史数据。主要包括人口普查数据(人口的年龄分布、性别、教育程度、收入水平、从事行业、宗教信仰等),选举前一年和选举年的经济社会基本情况数据(经济增长率、通货膨胀率、犯罪率等),历史上选举实际参选人的特质,以及实际选举结果数据。最终的数据集包括近50个指标。基于政治学对选举的既有研究,研究团队认为这些数据应该基本可以满足预测选举结果的需求,因此达到了全数据。

第二,构建行为体,即选民。主要基于人口普查数据,在计算机模拟系统里随机生成实际人数的选民。随机生成的每一个选民都拥有一些特定的特征组合(比如男性、41~60岁、高中教育、从事制造业等等),但是整体的选民群体仍旧满足宏观统计分布(比如,男性为49.8%,女性为50.2%)。

第三,基于历史选举结果数据,通过简单的回归分析,获得不同特征的选民可能的投票倾向(比如,男性显著倾向于支持某个党派),并给出粗糙的投票倾向区间。特别需要强调的是,这些粗糙的投票倾向区间并不需要特别准确,因为后续的ABM 模拟运算能够筛选出能较好地重复出历史投票结果的模型。

第四,让这些选民基于他们的投票倾向在系统中投票。投票规则由3组方程描述。每一次模拟都会随机生成不同的选民群体,但是整体的选民群体仍然满足宏观统计分布。

第五,通过模拟多次投票(100次至300次不等),基于历史的选举结果数据,筛掉不能得到历史选举结果(在一定的误差范围内)的模型。其间会经过至少两轮筛选。第一轮的筛选阈值为10%的绝对误差,第二轮为5%,第三轮为2.5%~3%。其中会加入选举周期、政治丑闻冲击、候选人特征等。最终剩下的模型和历史选举结果的误差在2.5%~3%。通常来说,第一轮的模型在几千万到一亿多之间(选民的特征组合,而为了计算的可行性,用1∶10的比例来进行实际模拟)。经过两到三轮筛选,最终剩下的模型数量仅为几十个到几百个不等。显然,这些模型能够在比较小的误差范围内重现历史上的多次选举结果,一定是确实捕捉到了促成这些历史选举的最终结果的某些投票规则。

第六,用经过了筛选的模型(几十个到几百个不等),基于下一轮选举的推导数据(比如可预测的人口变化数据、经济增长数据等等),让选民在系统内进行模拟投票,预测下一轮选举结果。研究团队提前公布的预测结果是这些模型给出的结果的平均值。

从2016年起,中心已经连续5次比较精准地预测了中国台湾地区的地方领导人选举(2016年、2020年)、中国台湾地区的县市选举(2018年)、美国参议院选举(2018年)以及2020年的美国总统选举(6个州)。团队公布的是相对得票率,而不仅仅是谁输谁赢。在迄今为止的6次预测中,团队的预测得票结果和实际的选举得票结果的差别(误差)最低为不到1%,最高也仅为6%。① 不仅如此,基于ABM 的选举预测还能够提前几个月就给出这样的预测。而这样的预测是基于民意调查或者社交媒体的预测完全不可能实现的。最后,基于ABM 的选举模拟预测还能够大致给出某些突发事件对最终选举结果的冲击的范围。

在最新的一次预测中,研究团队于北京时间2020年11月1日12点(美国东部时间10月31日零点)发布了对美国总统大选在6个州的获得票数比例的预测。② 最终的选举结果表明,该预测是成功的。经过多次选举预测的检验,我们有理由相信,基于基础数据建模和大规模计算模拟的选举预测的技术不仅是可行的,而且是一个更为有效的技术路径。除此之外,ABM 模拟结果还能够帮助我们更加精准地理解选举行为和选举政治的隐藏动力学,即反馈增进社会科学研究。

(二) 打击毒品网络

对南美毒品网络和美国毒品贩运的计算模拟是学术界最近的一个非常有益的研究。③ 自从美国总统尼克松在1971年宣布“向毒品宣战”之后,美国一直试图阻断或者大幅削弱南美洲原产地和美国市场之间的贩运网络。但是经过几十年的努力,“向毒品宣战”的效果却非常不理想。事实上,尽管美国投入了大量的人力、物力、财力用于打击毒品走私,但是美国的毒品零售价一直在下降(意味着毒品供应一直在稳定增长),且整个西半球的毒品走私的地理区域从1996年的200多万平方英里扩展到了2017年的700多万平方英里。①

为找到“向毒品宣战”未达理想效果的原因,美国多所高校的研究团队共同开发了一个基于地理信息系统、整合了复杂社会网络的ABM 模拟平台,即“毒贩逻辑”(NarcoLogic)模拟平台,用来模拟毒贩在时空中应对阻断攻击的决策,并以这些决策与美国的打击措施之间的互动,探究阻断无效的根本原因。

该模拟平台整合了多个理论观点、实证研究、媒体报道,以及学者们在该地区多年的实地调查研究。参数和验证过程以现有最完整和权威的可卡因非法流动数据为基础。该模拟再现了毒贩与阻断力量之间的“猫和老鼠”游戏在时空下的动态变化。基于模拟可视化,该模拟平台还直观地呈现了毒品贩运网络的结构和功能,刻画了贩毒者和执法机关之间“斗智斗勇”所产生的涌现性结果。

该模拟平台包含3类行为体:贩毒网络(更具体地说是南美的“毒品卡特尔”)、转运网络(或者说是毒品批发和零售行为体,这些行为体本身显然也是小型的网络,但是他们可以和不同的“毒品卡特尔”合作)以及拦截者(特别是美国缉毒署)。每一个行为体都有一些特定的特征或属性,而这些属性可以用数据加以刻画。具体来说,贩毒网络有8个属性,转运网络有15个属性,拦截行为体有4个属性。这个模拟平台的环境则有9个不同的属性。系统中每一个行为体的行为都会视其他行为体的行为及环境因素来进行决策。而这些不同的决策由4个简洁的方程刻画。

该平台模拟了两个不同的大场景。一个场景是不同的贩毒网络和转运网络相互监测、相互渗透,甚至相互通气。换句话说,整个美洲的贩毒网络和转运网络都在一个更大的网络中决策与行动。另一个大场景则是不同的贩毒网络和转运网络各自为战。通过比较,研究人员发现,基于网络行为体的模型表现更好。这表明,不仅每一个相对独立的毒品走私团伙是一个社会网络,而且整个美洲的毒品贩运体系是一个大型网络。这背后的逻辑不仅体现了贩毒集团自上向下寻求平衡风险和收益,同时体现了贩毒集团和转运网络有全局观:他们不仅仅是从局部来考虑行动。这个模拟的另一个重要發现是:为躲避打击,在一定时间内,毒品走私集团的走私地域会变得更加弥散,走私方式更趋灵活和暴力。

基于ABM 模拟,NarcoLogic能够帮助美国缉毒部门对不同的毒品政策情境及其对贩运者行为的可能影响,以及与反毒品战争的军事化有关的许多附带损害进行更加系统的评估,从而能够帮助美国的缉毒部门制定更加有效的反毒品措施。不仅如此,该研究还通过模拟发现,不同贩毒集团并不是完全独立的行为体,而是在一个大型网络中既有竞争又有协同的行为体。因此,美国的缉毒行为也必须从局部和全局这两个层面出发,才能有效地进行拦截。

四、 基于计算社会科学,建设有中国特色的科学决策支持体系

以上的讨论表明,计算社会科学确实有可能给决策科学中的科学决策带来一些崭新的解决办法,从而为传统上主要依赖专家意见的科学决策带来巨大的变革。

主要依赖专家解读和判断的传统的决策咨询是前信息革命时代的产物。由于众多数据的缺失和缺乏足够的计算能力,决策咨询在很多时候只能依赖于专家的判断。这种传统的决策咨询几乎不可能有效地帮助现代国家和企业应对高度复杂且变化快速的环境。因此,随着数据收集能力和处理能力的大幅提升,世界主要国家都在投入大量的资源来建设基于数据和计算或者说是基于计算社会科学的决策咨询体系,以能够有效应对高度复杂且变化快速的环境。

在基于计算社会科学的战略咨询体系这一领域,美国居于领先地位。在计算社会科学到来之前,美国的核心决策支持体系以及一些重要部门就已经进入了计算时代。比如,最开始由美国空军支持的著名的兰德公司(RAND Corporation)一直都在开发基于计算的决策支持系统。事实上,世界上第一个人工智能项目“逻辑理论家”(The Logic Theorist)就是由兰德公司支持研发的。① 类似机构还有隶属于美国海军的海军分析中心(Centerfor Naval Analysis,CNA)。

更为重要的是,自20世纪六七十年代起,美国军方就通过其隶属于国防部的国防高级研究计划署(Defense Advanced Research Projects Agency,DARPA)一直在支持这类研究开发。经过几十年的积累和探索,2000年之后,美国国防部推出了新一代基于计算社会科学的整合危机早期预警系统(Integrated Crisis Early Warning System,ICEWS)。除了美国的情报系统之外,参与该系统研发的大学包括哈佛大学、宾州州立大学、马里兰大学、乔治·梅森大学等。尽管整合危机早期预警系统还有待改进,但它已经在美国应对不同地区和国家可能出现的危机、反恐以及支持阿富汗和伊拉克的军事行动中都发挥了重要作用。美国军方还支持了提出计算社会科学的拉泽尔的很多研究。② 显然,美国军方对这方面的发展一直都非常关注。③

美国政府支持的另一项研发是美国国务院下属的重建与稳定联合办公室(Office of the Coordinator for Reconstruction and Stabilization,S/CRS)的“国家重建和稳定”(Project of State Reconstruction and Stabilization,PSRS)项目。2011年,该办公室变成了美国国务院的冲突与稳定行动署(Bureau ofConflict and Stabilization Operations,BCSO)。冲突与稳定行动署支持的“国家重建和稳定”项目主要是针对美国的某些盟国或者美国侵略过的国家有可能出现动乱之后的重建和稳定。参与该项目研发的机构包括斯坦福大学、加州大学圣地亚哥分校、布鲁金斯学会等。该项目的研究为美国在伊拉克和阿富汗以及一些非洲国家的重建和稳定行动提供了重要的战略战术咨询。除美国之外,另一些发达国家也都在从事类似的研发工作。

总之,信息收集功能以及信息处理能力是任何一个决策支持体系的基本能力。就中国而言,目前的决策支持体系只具备基本的信息收集能力和相对初级的信息处理能力,总体缺乏严格意义上的计算支持,更谈不上复杂的计算模拟。因此,我国迫切需要建设一个基于计算社会科学的战略咨询体系,即构建一个集社会科学、数据技术、计算机模拟、机器学习及人工智能为一体的技术平台。与其他的关键技术一样,这样的技术平台亦将成为国家核心能力的重要组成部分。该技术平台最终应具备以下基础技术能力。

第一,能够整合数据、算法和算力。只有能够整合这3个要素的技术平台才可能是真正有用的技术平台。当然,针对不同类型的复杂决策问题,平台肯定会有所不同。第二,能够整合专家知识和判断,并能推演他们不同的理解和判断是否正确。基于计算社会科学的战略咨询体系,不是抛弃国别与问题专家的判断,而是使他们的知识的效用最大化,减少重大决策对专家判断的依赖程度,甚至帮助专家提升他们的理解和判断能力,从而可以更好地支持决策。

基于以上两项基础性能力,在应用层面,这些技术平台还需要具备以下3个特征。第一,广适性。一旦这样的技术平台被开发出来,研究者只需拥有某些特定国家的有关数据(包括情报数据),就能对这个国家有可能面临的高烈度战略风险进行评估预测,并且推演国家不同应对措施的效果。第二,即时性。平台最终应该能够自动抓取最新数据,并据此进行计算(包括模拟),从而能够让国家尽早掌握重大迹象和动向,规避风险。第三,一定时空内的精确性和实时性。人类社会的高度复杂性和人类的意识意味着人类不大可能在人类社会中实现分秒不差的预测,但是,我们发展的这些技术平台最终应能够实现对某些高烈度风险的行为和事件在一定时空内的预测,并且能够模拟防范手段,从而为提升国家的应对能力提供一定的知识保障。

要发展这样的体系,当然离不开国家和社会的投入和支持,具体措施至少应该包括以下六个方面。第一,国家必须从长治久安的战略高度深刻认识到计算社会科学对战略决策造成的广泛和深远的冲击。和高性能芯片一样,“决策计算社会科学”是国家硬实力的关键维度之一,国家必须高度重视。第二,逐渐提高国家对决策咨询的科学化要求,从需求侧提升对基于计算社会科学的决策咨询的需求,逐步提高以计算社会科学为基础进行推演和判定的咨询报告的占比。第三,基于高度的战略重视,加大国家对计算社会科学的研究投入,特别是加大对以预测和推演为目标的研究与开发的支持力度。第四,在相关人才的培养和学术团队建设上,应更加鼓励跨学科的学术培养体系和协作平台,尽快将计算社会科学确立为与学位挂钩的交叉学科或者专业。第五,计算社会科学的发展离不开大规模数据,更离不开数据及算法的共享。目前大规模数据的持有者主要是企业和政府,国家应该尽快要求企业共享那些不涉及用户隐私的数据(比如隐去了用户个人信息的出行数据、消费数据等),并鼓励不同政府机构和研究机构建立数据、算法和模型的共享资源平台。第六,鼓励相关民营企业加大研发投入,加强校企联合。

中国的计算社会科学还有很长的路要走,但中国是少数拥有足够人力、物力(特别是科技能力)、财力来大力发展基于计算社会科学的战略咨询体系的经济体之一。当然,要达成这样的目标,既需要数据技术和计算能力,也需要从既有的社会科学中汲取必要的理论和实证成果。换句话说,我们需要真正地将社会科学与计算机技术和数据技术结合起来。因此,计算社会科学与决策科学的结合并不是要取代专家知识,相反,社会科学家头脑里的知识对于计算社会科学的进步是不可或缺的基础。① 社会科学家应该和计算机科学家、数据科学家一起,与政府以及企业携起手来,为中国的科学决策乃至整个中国的决策科学的进一步科学化而共同努力。

五、 结语

可以想象,在未来的国际竞争中,完全不依赖数据和技术的传统预判决策模式将会面临巨大的劣势。

孙子曰:“故上兵伐谋,其次伐交,其次伐兵,其下攻城。”又曰:“昔之善战者,先为不可胜。以待敌之可胜。不可胜在己,可胜在敌。故善战者,能为不可胜,不能使敌必可胜。故曰:勝可知,而不可为。……故善战者,立于不败之地,而不失敌之败也。是故胜兵先胜而后求战,败兵先战而后求胜。”①在相当长的时间里,这样的境界只能是理想,且基本只能是依靠主帅和军师的天赋。而在计算社会科学已经蓬勃兴起的今天,尽管“主帅”和“军师”的判断依旧重要,但许多不确定性已经可以通过计算社会科学来大大降低。

基于此,中国的决策支持体系需要转变思想,更加坚定地拥抱技术,不能只依赖主要基于专家判断的传统的决策咨询模式。国家需要从战略技术的角度支持基于计算社会科学的决策科学的发展,而发展基于计算社会科学的决策科学也必将推动中国社会科学自身的进步。

猜你喜欢
社会科学机器决策
机器狗
《云南社会科学》征稿征订启事
机器狗
《河北农业大学(社会科学版)》2021年喜报
为可持续决策提供依据
决策为什么失误了
未来机器城
数学在社会科学中的应用
无敌机器蛛
社会科学总论