冯仕政,陆美贺
(中国人民大学 人口与社会学院,北京 100872)
社会计算如何可能?
冯仕政,陆美贺
(中国人民大学 人口与社会学院,北京 100872)
随着信息技术的飞速发展,无论在科学研究上,还是在公共政策上,“社会计算”(social computing)都日益成为一个热门话题。在很多人看来,利用社会计算,能够更好地监测社会运作、洞察社会规律、预测社会趋势、规划社会生活;社会计算具有无限广阔的发展前景。单从技术的角度来看,应该是这样。然而,任何技术都是在特定的社会关系和结构中运用的,技术固然拥有巨大的力量,可以不同程度地改变社会关系和结构,但社会关系和结构也不是完全被动的,同样会深刻地影响技术如何发挥功用,以及发挥什么功用。因此,本文将在全面理解社会计算的基础上,从计算什么、怎样计算、谁来计算三个方面,来剖析社会计算在当前面临的约束,以及相应而来的前景和风险。
要理解社会计算的前景和风险,首先必须厘清“社会计算”的含义。对于什么是社会计算,有很多说法,归纳起来,主要有两种理解:一种可以称为“社会的计算化”,另一种则可以称为“计算的社会化”。
所谓“社会的计算化”,是指随着互联网的普及,越来越多的社会活动都通过互联网进行,人类因此而在互联网上留下海量而且相互关联的数据足迹,基于这些数据足迹,大量原本不可追踪、检索、汇编、计量和运算的社会活动,变得可以追踪、检索、汇编、计量和运算。要知道,在此之前,人类社会中能够进入计算的素材主要是在高度控制条件下获得的实验数据,而高度散漫的社会现象和过程是难以形成数据,从而难以计算的。“社会的计算化”意味着,人类对社会现象的观察、分析、预测和规划,将更加系统、更加精密、更加实时。
社会的计算化主要有三个方面的应用和表现:一是社会建模,二是社会实验,三是人工智能。其中,社会建模是根据人类社会活动的特征,利用计算技术再现社会场景,为社会交往提供方便。最典型的表现是各种社交软件和网络社交平台,比如facebook、微信,等等。而社会实验则是利用计算技术构拟真实的社会环境,然后利用该环境对社会行为进行测试,以便掌握可能发生的社会现象及其后果。比起自然条件下的社会实验,基于计算技术的社会实验,具有参数控制更方便、情境设置更逼真、成本更节约、后果更可控等优点。最后,人工智能是利用机器训练和深度学习等信息技术,模拟、延伸和扩展人的意识和思维能力。语音识别就是一种常见的人工智能。
与“社会的计算化”相对应的是“计算的社会化”。所谓“计算的社会化”,是指互联网创造了一种环境、一个平台,使群众能够广泛地参与计算过程,从而使在数据的挖掘、分析和应用等方面,充分集中群众智慧成为可能。不言而喻,计算是社会分析中的一个必不可少的环节,但在相当长的时间内,计算都是一个高度封闭性的过程,只有少数在才情或地位上处于精英水平的人才能参与。而互联网,则创造了一个高度开放的环境,即使普通群众也能随时参与数据计算。在此过程中,尽管每个人的贡献是有限的,甚至是错误的,但不断迭代和累积的效果却是十分惊人的。易言之,信息技术使计算过程真正进入了众筹模式。
对于“计算的社会化”,大家最熟悉的形式可能要数人肉搜索和网络评级。在人肉搜索中,广大网民彼此素不相识,却能够不约而同地参与对同一个目标的搜索,不但免费贡献自己的智慧,并且相互激励、相互评鉴、相互启发,其中有冲突,有竞争,有合作,参与者可以随时进入,也可以随时退出。搜索是一个复杂的计算过程,但从参与计算的人数、参与者的特征、工作的方式来看,该过程具有强烈的社会性,这是以往的计算过程所不具有的特征。类似的情况还有网络评级,即在消费过程中,网民根据个人体验给商品或商家打分,最后汇总成该商品或商家的信用评级。在此过程中,网民们的意见相互参照、相互引用,也具有强烈的社会性,与以往的信用评定方式显然不同。
以往在讨论社会计算时,很少明确区分上述两个方面,甚至常常只关注前一个方面而忽略后一个方面。但从社会学角度来看,这两个方面都是社会计算的题中应有之义,因为它们均对社会学关注的两大主题,即秩序和发展,均具有显著的影响。与此同时,分类是分析的基础,清晰而合理的分类有利于更好地揭示事物发生和演变的机理,因此,在兼顾上述两个方面的同时,对两个方面做出合理的区分也很重要。
开展社会计算,面临的第一个问题便是计算什么。信息技术的迅速发展,使人类的计算能力前所未有地提高。然而,人类生活所构成的社会系统,无论在数据上,还是算法上都是无限复杂的,由于成本和时间等条件的约束,无论计算能力如何强大,都不可能计算一切,而必须有所选择。这样,就有一个如何设置社会计算的目标和任务的问题,也就是所谓“议程设置”的问题。显然,由于社会计算对社会秩序及发展可能产生的巨大影响,到底把什么社会需求纳入社会计算的议程、议程的优先次序如何安排,攸关不同人群和阶层的利益分配,相应地,基于受益程度的差异,不同人群和阶层对特定议程的态度也有区别。这就决定了社会计算的议程设置,不可能是一个纯粹的技术问题,而是具有显著的政治性。
最直观的表现是,在当前,“大数据与社会治理”是一个非常热门的话题。社会治理被认为是社会计算运用前景最现实、最广阔的领域之一,学界、政府都抱有很高的期待。然而,社会治理的内容林林总总,无论是从预算角度还是从技术角度考虑,都有一个从哪里入手,哪里开始的问题。从技术上说,舆情监控、社会信用体系建设、交通拥堵治理、社会治安管理、智慧养老服务、电子商务发展等领域都具备较好的条件。然而,上述每个领域的建设都不可能平等地惠及每个阶层和人群。那么,轻重缓急应该如何安排?不同部门和人群抱有不同甚至对立的期待:宣传部门希望舆情监控优先;而银行则希望信用体系建设优先;在城市里治理交通拥堵的问题更迫切,而农村由于地广人稀、警力调度困难,治安联防问题更突出;年轻人更看重电子商务,老年人更看重智慧养老。如此等等,都是矛盾。这些矛盾不解决,议程设置就搞不定,议程设置搞不定,社会计算就难以顺利展开。
事实上,这样的矛盾并非臆测,而是已经发生,那就是目前仍然热火朝天的网约车与出租车之争。近年来,滴滴、快的、优步等网络约车软件异军突起。网络约车便是社会计算在交通领域的一个实际应用。然而,正如大家已经看到的,对于网络约车应不应该发展、应该怎样发展,在政策上存在巨大争议。政府、市场、社会、公司、司机,公说公有理,婆说婆有理,对立十分严重。并且,这样的争议不仅存在于中国,而且存在于西方,可见是一个十分普遍的现象。你看,一个在技术上毫无障碍的社会计算应用,却由于社会关系和结构的原因而发生曲折。这就具体地体现了“计算什么”这个问题,对社会计算前景的强烈影响。
“怎样计算”的问题,对社会计算的前景同样构成影响。“怎样计算”确实是一个算术问题,然而,算术并不只是算术,算术里面也有政治。比如“消费者物价指数”,即CPI,是政府赖以制定经济政策的一个重要参数。从原理来说,CPI是综合各种商品的价格之后形成的一个指数,而信息技术的发展使商品价格的采集和综合更加广泛、实时和容易,社会计算当使CPI的形成和发布更加精确而快捷才是。然而,怎样将采集到的商品价格合成一个指数,却涉及一个统计算法问题。而这个问题,马上就涉及复杂的社会和政治因素。
近年来,国家统计局每次公布CPI,都会引起不小的社会争议。有人批评说,房价明显涨得这么厉害,CPI怎么总是那么稳定?国家统计局在骗人吧?国家统计局解释说,原因在于,在CPI的算法里,食品价格的比重比较大,而房地产价格的比重很小,所以CPI对食品价格变化的反映很敏感,而对房产价格的反映则比较迟钝。你看,CPI的统计构成表面上似乎只是一个算术问题,其实里面有政治。那些对房价上涨不满的人,要求CPI多反映房价,在计算CPI时要加大房价的权重;而那些更关心食品价格的人,则要求CPI多反映食品价格,在计算CPI时要加大食品价格的权重。国家统计局有没有错?从技术和数学上没有错。如果说有错,也是在政治上不敏感,即在设计CPI时没有充分考虑不同社会阶层的政治要求及其变化。那么,现在CPI的计算方式要不要改?面对汹汹民意,看来改是势在必行了。但是,即使改了,仍有可能发生争议:如果现在加大CPI中房价的权重,没准儿哪天房价不涨了,又有人出来责怪说,CPI里房价的权重设那么高干什么?反映食品价格更重要。
由是观之,在“怎样计算”这个问题上,除了计算技术问题,还有更复杂的社会政治问题。社会政治问题解决不当,计算技术再好也难有用武之地,甚至会引起新的社会政治问题。目前正在利用社会计算技术开展的社会信用体系建设就面临这样一个问题。信用的本质,是根据一个社会行动者(包括个人和组织)在过去的行为记录,判断其在未来可能的行为选择,从而决定在社会交往中对其是否任用,以及如何任用。相应地,信用体系建设和管理的基本问题,便是如何通过外在的、可观察的行为去推断一个行动者的意图,从而推断其在未来的行动方向。那么,问题就来了:到底把哪些行为数据纳入信用计算的范围?
众所周知,即使在信息化时代,同样存在社会不平等,即不同阶层和人群由于能力和偏好的差异,接触和使用网络的方式及频率是存在显著差异的,由此导致其行为被数据化和数字化的程度也存在显著差异。一般来说,弱势群体接触和使用网络的机会要小得多,相应地,其行为被记录的可能性也就低得多。接踵而来的一个后果是,由于没有什么行为数据可被采集,他们在基于社会计算的社会信用系统里难以评级或者评级很低。而没有信用等级或等级很低,将导致大量社会交易和交往对他们来说无法展开,从而加剧他们本已弱势的处境。相反,另外一些阶层却由于网络交易频繁和社会计算的算法,能够不断“刷”高自己的信用,甚至可以利用信息系统的漏洞伪造行为数据。如果这样,社会计算就非但没有增进社会公平,反而造成新的剥夺和压迫。这显然是令人难以接受的前景。
最后,还有一个“谁来计算”的问题。社会计算再高级、再智能,终归也是一种技术,所以总是要由人来运行的。即使一个系统一经设定之后就可以长期自动运行,但最初的程序和各种参数也都是由人设定的。宽泛地说,前面讲的“计算什么”和“怎样计算”两个问题都涉及“谁来计算”的问题,因为议程和算法都是由人制订的,但下面要说的“谁来计算”,主要是想讨论社会计算的第二个方面——计算的社会化,即群众参与社会计算的风险问题。
社会生活时刻涉及计算问题。可以说,自有人类以来,便有计算问题。但如前面已经讲到的,在相当长的时间内,人类的计算工作具有相当强的精英性,计算是一种局限于精英阶层的活动。尽管随着人类知识的普及,计算工作越来越平民化,但唯有到了互联网时代,计算才真正实现了社会化,标志便是群众可以随时、实时参与同一个计算过程,这在以前是不可想象的。
群众参与社会计算,优势是可以集中群众智慧,以众筹之力发现真相和真理。在这个意义上,它既有利于促进社会公平和正义,又有利于提高人类活动的效率。这也是许多人看好社会计算的重要原因。然而,这只是问题的一个方面。事实上,群众参与社会计算并不总是有好的结果,有时也会造成坏的甚至极坏的结果。即以上面提到的人肉搜索而论,迄今为止,人肉搜索尽管在发掘真相、惩治坏人方面发挥了一些作用,但侵犯隐私和人权、违反道德和法律的情况也多有发生。须知,即便是坏人,也有隐私和人权,如何惩治也有道德和法律界限,但人肉搜索过程中群众参与所产生的洪荒之力却难以驯服,以致常常突破这些界限,给当事人造成巨大的伤害,其责任却由于群众参与固有的匿名性、迭代性和累积性而难以认定和追索。
社会计算的群众性之所以可能造成严重的负面社会影响,原因在于,群众并不像许多人想象的那样是团结、统一和一致的,他们内部同样存在严重的利益和价值分歧。这使他们在参与社会计算的过程中,并不总是坚持正义和真理,而是常常从一己之私和一孔之见出发。而社会计算作为一种技术所具有的倍增能力,就如同一根力臂超长的杠杆,会急遽放大和强化这种私益和孔见的社会影响。正如大家所看到的,现在一个小小的谣言,也能引起轩然大波。所谓“蝴蝶效应”不再是一个神话。有人认为,社会计算的开放性等于给社会提供了一个公开、公平、公正的交流和切磋平台,通过个平台,不同观点汇聚在一起,会形成一种互相补充和纠错的关系,最终实现真相和真理的再现。近年来,恐怖主义、民族主义借助互联网获得前所未有的社会影响,证明这一观点纯属一厢情愿的、浪漫主义的想象。
除此之外,大量技术问题和社会问题具有极强的专业性,其专业程度之高,不是依靠群众广泛参与的社会计算就能理解和回答的。比如,中国要不要造超大粒子对撞机的问题在互联网上引起广泛讨论,尽管参与讨论的人很多,但真正懂的又有几个?这种专业问题,靠社会计算,恐怕若干年也得不到正解。可供参照的是转基因食品的问题,网上讨论足够广泛,时间也不短了,但实现“真相和真理的再现”了吗?笔者看还远得很。群众内部存在的利益和价值冲突,再加上专业能力的参差不齐,使他们在讨论大量社会问题时形成统一的意见已经很难,更不要说形成专业的意见。
事实上,社会学早就注意到“群众”现象,并且形成了非常丰富的研究。尤其是第二次世界大战后,关于“群众”和“群众运动”的研究一时成为显学,引起包括社会学、政治学、心理学在内的多门社会科学的关注。在这些研究看来,“群众”具有价值标准混乱且不稳定、心理敏感而脆弱、专业知识和技能缺乏,从而容易受蛊惑、被操纵等弱点,因此之故,“群众”纠合而成的“群众运动”虽然具有民主的外形,实际上却是民主的大知识,法西斯运动、极权主义运动便是明证。如果这些观点是成立的,那么可以说,社会计算在有利于真相和真理的显现的同时,也在一定条件下有利于“群众运动”的形成。因此,社会计算在为群众的政治和社会参与提供机会和方便的同时,如何防止走向反面,就成为一个严肃的问题。
总而言之,社会计算作为一门新兴技术,其发展需要社会条件,其社会效应很复杂。因此,在推广这一技术时需要社会学眼光,如此方能做到扬长避短,从而尽量减少发展过程的曲折。
2016-10-12
国家社科基金重大项目“大数据时代计算社会科学的产生、现状与发展前景研究”(16ZDA086)的阶段性成果。
冯仕政(1974-),男,重庆市忠县人,中国人民大学社会学系教授,博士生导师。研究方向,社会转型与社会治理;陆美贺(1989-),女,中国人民大学经济学院博士研究生。研究方向:经济社会学、世界经济学。