2008年以来,学术界逐步掀起了大数据的研究热潮。大数据时代的到来正在对传统社会科学的研究产生巨大冲击,同时也为我国社会科学发展提供了重要的历史机遇。适时启动对社会科学长远发展的关注,探讨大数据对社会科学转型的重大影响,发挥专家引领作用,汇聚、总结现有研究成果,梳理、激发未来学术创新,规划一定时期内我国社会科学研究的发展趋向,势在必行。据此,哈尔滨工业大学米加宁教授和西安交通大学边燕杰教授共同发起了“大数据与社会科学转型高端学术研讨会”,邀请全国社会科学领域从事大数据研究的知名专家学者共同研讨。清华大学陈国青、罗家德、孟天广、张小劲、张楠,北京大学杨竞霜,中国人民大学孟小峰,南开大学孙涛、锁利铭、张连增、段月姣,上海交通大学樊博,中国社会科学院王国成、陈华珊,上海社会科学院胡键,中山大学梁玉成,西安交通大学蔡萌,武汉大学罗俊,复旦大学郑磊,浙江大学吴超,北京邮电大学何元,北京理工大学徐磊,哈尔滨工程大学康伟,哈尔滨工业大学王健,桂林理工大学章昌平等专家学者作为特邀代表参加会议。
2019年1月12日至13日,“大数据与社会科学转型高端学术研讨会”在哈尔滨工业大学成功举办。会议主题为“大数据与社会科学转型:方向、方法与路径”,主题报告包括清华大学陈国青教授的“管理学‘遇见’大数据”、北京理工大学徐磊教授的“大数据与社会科学转型问题的思考”、北京邮电大学何元博士的“时空大数据技术、创新与应用”以及中国人民大学孟小峰教授的“社会计算的现状与展望”。在主题报告的引领和启发下,与会专家学者分为社会学组、公共管理组、综合组进行了深入而充分的观点阐述与学术交流,并在圆桌论坛环节进行了讨论组汇报和自由讨论。高端研讨会之后,专家学者们借助互联网平台,持续开展学术互动,推进“大数据与社会科学转型”这一学术主题的讨论进一步深化。
本文主要对研讨会的会议主旨以及与会专家学者的发言观点进行梳理,以期呈现社会科学各领域专家学者对数据驱动社会科学研究的应用与实践的分析与预测。
随着物联网、云计算、移动互联网、智能终端的应用与普及,人类社会逐步迈向大数据时代,人类社会经济活动和个人生活中的行为,正在以“数据”的形态被存储下来,人类社会产生的数据正在以指数级的方式快速增长,形成了海量的、多源异构的数据形态。
面对这样的发展态势,大数据时代对于管理学的影响可以分为两个阶段:第一个阶段是数据商务阶段,即所有的社会和经济活动及其涉及的要素在持续的数据化,并利用其进行数据分析;第二个阶段是算法商务阶段,即利用数据分析和大数据分析技术进行赋能和创新。(陈国青)
大数据是否带来认知方式的跨越性的根本变革?当今的大数据观念、平台和技术,高保真一对一映射,360度多层级通透可视,理论空间与现实世界可零距离无遗漏对接等,正促使着社会科学研究转型,有望从根本上突破传统思维局限和惯性。(王国成)
与此相近的,有学者认为,社会科学正在发生历史性转折,人类的社会生活由于架构于网络之上,可以随时随地获取、传输和处理数据,不仅认知社会的数据基础发生了根本变化,同时,社会网络理论和计算技术的发展,使得大数据可以得到有意义的解析。新的研究范式渐渐显露,一系列新的问题,如现象呈现和理论解释的关系,社会科学能否进行仿真实验,研究范式的理念基础等,需要进一步研究和讨论。(徐磊)
大数据发展对社会科学的整体影响表现为三个跨越,即对社会科学历史阶段的跨越,对研究者与被研究者之间的专业化差异的跨越,以及研究者与实践者之间分工的跨越。大数据的特点在于减弱人为设定“规律”的干扰,基于海量、异构、多源数据进行相关性研究,可以更真实地还原行为人的特征。这种特点就使得各个学科在底层上的差异性减弱,共通性增强,更加指向真实世界,使得实践分析者与理论研究者的鸿沟被有效填补。(锁利铭)
有学者指出了数据驱动社会科学研究转型的路径。当数据从理论的边缘走向理论的中央,由于数据的全域化和数据的泛在化,导致了社会科学研究正在出现急剧的变化:数据的全域化导致无处不在的数据,而数据的泛在化则导致无时不在的数据。大数据正在促使社会科学研究发生更本性的转型,主要表现在由理论驱动的社会科学研究向由数据驱动的社会科学研究转型。具体表现在预设研究向涌现解析的转型;定性分析与定量分析融合的趋势;从有限检验向仿真实验的转型;从小数据“验证逻辑”到大数据“发现逻辑”的转型;从“问题导向”的学科研究向“事件导向”的跨学科研究的转型。(米加宁)
与会专家学者对数据驱动社会科学研究的新技术与新方法进行了广泛的讨论,主要的学术观点如下:
(1)社会网络的大数据方法
相对于传统数据,社会网络大数据中的个体网数据可以测量行动者的网络规模和网络异质性,可以测量行动者的相互认知和关系互动,也可以获取历史数据,形成长久可靠的追踪数据。而将大数据技术应用于整体网,则体现出更为突出的优势,一方面可以获得历史数据、时序数据、即时行为数据等,可以反映整体网复杂系统的动态全貌;另一方面可以获得丰富的人际联系的动态内容,不仅包括行动者在互联网上的电子足迹,也包括文本数据、音频数据、基因数据,对于研究社群认同,建立话题模型,提取语义框架。特别是将数据结构化后可以进一步分析具有理论和现实意义的议题。此外,大数据能够建构出可以推论的预测模型,也可以指导数据挖掘的方向,大大扩展了传统社会网络分析用于对现实的解释和理论假设的验证的研究内容。(边燕杰)
(2)数据驱动的自主行动者建模方法
利用传统社会调查方法收集的数据所建立的模型无法满足研究者模拟复杂环境下的动态社会过程的需求,是基于主体建模方法(ABM)所面临的主要瓶颈。大数据可以有效解决数据缺乏的问题,将实证数据嵌入到ABM模型中,形成了社会模拟的新范式——数据驱动的自主行动者建模。通过这种方式,研究者可以模拟出更加接近现实的复杂社会系统。(梁玉成)
(3)人工智能的分布式机器学习算法
人工智能经过60多年的发展和积淀,随着机器学习、互联网、大数据、云计算和物联网等技术不断发展,人工智能正引发可产生链式反应的科学突破。基于目前人工智能算法的快速发展的现实,研究和设计一套基于隐私保护、促进数据交易、降低建模成本的分布式机器学习算法框架就显得非常重要,比如利用区块链、联合学习、同态加密等技术设计一个分布式机器学习的环境,并研究其在一些典型应用场景的实现。(吴超)
(4)社会计算的技术方法
万物互联的智能时代对整个社会现象和社会行为的描述将发生重大的改变,而构筑智能社会的核心技术在于社会计算。社会计算的根本任务就是借助信息技术的使用,测量个体的行为数据,构建计算模型,发现社会变化,进而分析人类行为。其最终目的是建立一套方法体系,帮助人类预测和解释社会现象。社会计算以它的强大的方法论的整合能力,可以促进社会科学的学科交叉和整体性特征,进而重建自然科学与社会科学的关系,有可能创立社会科学新的研究范式,可称之为第五研究范式。(孟小峰)
(5)算法社会科学的技术方法
在计算社会科学的基础上,进一步发展为算法社会科学这一新的社会科学研究类型。算法社会科学是基于海量、类型繁多、价值密度低、导入速度快的数据之上的社会科学,在数据处理过程中必须充分构筑与大数据的数据挖掘和数据分析功能。算法社会科学既是一种哲学思维的创新,也是基于大数据技术的国家能力的工具性创新。因此,大数据与社会科学的融合是有价值选择的,也就是在使用大数据技术的时候是有“我们应该做什么”“我们应该如何做”的规定的;与之相区别的,“计算社会科学”则是纯粹技术性问题,不含价值伦理的内容。(胡键)
(6)大数据对因果推论方法的改进
伴随着大数据方法在方法论层面日趋成熟、方法技术日益丰富、研究议题逐步拓展,且与传统社会科学方法逐步融合,大数据方法推进因果推论的能力逐步完善,革新着数据采集、概念测量、相关性分析、因果性与预测性分析等因果推论的各环节,形成了大数据与统计方法、大数据与小数据分析、大数据与实验研究、大数据模拟方法等多种生产和检验因果性知识的方法路径。(孟天广)
(7)时空大数据的技术方法
社会科学研究面临时空大数据带来的新的研究机遇。GIS地图、社交媒体、公共交通等空间信息数据对城市规划、城市治理等社会科学研究领域具有极大的价值。同时,社会空间在社会学中具有更加核心且独特的地位。在时间维度上,大数据为定量研究提供了大尺度的时间视角,使得历史文化研究成为可能;也能够实现针对智能设备记录的微观个体连续的行为数据或者使具有序列特性的非连续数据的数据分析与挖掘成为可能。(陈华珊)
从现有研究成果丰富性和实践领域、国家战略层面的大力推进来看,大数据对社会科学研究的影响是全方位的。
大数据正有力推动着国家治理体系和治理能力走向现代化,并日益成为社会管理的驱动力、政府治理的“幕僚高参”。从建立健全大数据辅助科学决策和社会治理的机制,并保障国家数据安全,打破信息壁垒、推动信息共享,再到利用大数据平台形成社会治理合力,有力提升了治理科学化、精准化、高效化水平,增强了社会治理和服务经济发展的能力。(杨竞霜)
数字孪生成为各行业需正视的现实情境,人机协作关系在日常管理中变得更为紧密。为应对大数据时代城市管理决策的实践需求,以数据为依托对虚拟世界探索、理解和操作,从而提升现实的公共事务和社会治理能力是未来的研究与实践的重点,这其中,微观思维、复合思维、语义思维和多向度思维等十分重要。(孙涛)
数字治理是未来公共管理学术研究的一个主流领域,其有三个核心任务:一是数据治理的功能,是研究高质量大数据的使能因素、因果机制和因果效应;二是整体政府的概念,研究大数据和互联网背景下的流程再造、制度变革、协作治理甚至机构重组等问题;三是大数据驱动的公共事务分析,发现隐藏在海量数据中的规律知识,发现更有突破性的创新理论,也为公共政策制定提供更为科学的依据。(樊博)
大数据驱动公共管理决策模式创新,以“公共管理问题提出—问题分析—策略生成—方案评价”为逻辑框架,遵循大数据思维下“真实世界—数据—策略”逻辑链,形成公共管理部门、社会公众、企事业单位等多主体参与下的策略生成机理,以及包含各领域公共问题融合分析、决策机制设计和具体行动方案的基于大数据的公共管理决策模式,从而实现公共管理问题分析的精准化、策略设计的精准化和方案评价的精准化。(王健)
在数据驱动的政府治理这一语境下,回应政府这一政治学的经典议题理应得到更充分的发掘。大数据及其相关技术为实现面向全社会民众诉求的“全面把握、快速分析和精准回应”的政府治理理念提供了技术基础。数据驱动的政府治理体现为对新技术的开放性包容。所以,政府部门应当充分利用大数据技术革新的时代机遇,以及大数据人才、技术和产业迅猛发展的本土优势,以全面提升基于“互联网+”的政府治理能力,推进政府决策能力、吸纳能力、整合能力的全面提升。(张小劲)
作为公共管理学科的重要领域,区域治理研究关注多个行政区之间由共同目标与共同问题产生的集体性政策行为与治理行为,其本质为集体行动问题。大数据的引入使得原有结构型模型向连接型关系模型的转型,后者是基于大数据思维的后验型模型,以观测区域之间的真实互动连接为主要目标,同时在实践中区域治理逐渐走向以数据为载体的治理网络。(锁利铭)
以金融和保险领域的研究为例,在互联网、大数据和人工智能的融合时代,金融风险监管部门的决策方式更应从大数据着手,通过对混杂大数据的总体把控、动态相关分析,得到准确甚至于精准的有效信息,从而达到精准施策的目标。因此,通过寻求全部可得大数据,借助机器学习算法与金融传统理论相融合,提出一套新的监管体系,实现系统性风险的早识别、早发现、早预警,是当前我国金融监管发展的第一要务。(段月姣)
借助于机器学习和深度学习算法,在保险行业已发展出了各种预测建模技术。以人工智能为标志的保险科技广泛应用于保险业务经营,大幅度提高保险公司的竞争力,提升工作效率,降低保险经营管理成本,强化风险管理,最终提升了保险行业的价值。(张连增)
研讨会上,学者们提出了应对数据驱动社会科学转型的科研工作者需要加强的自身能力建设的相关问题和解决方案。
大数据既冲击着传统社会科学的学术研究范式,也对传统的社会学科人才培养方案形成冲击,应该适应大数据时代数字治理的理论研究与实践需求,重新思考理论体系和方法论体系的布局,按照社会科学研究四个研究范式建立质性分析、量化分析和仿真分析大数据分析的课程体系,为学习者打造坚实的方法论基础。(樊博)
社会科学研究范式的转型对研究人员核心素养的转变提出了新的要求,需要具备对数据的确认、获取、评估、清洗、分析及可视化的能力,其基本要素由数据意识、数据能力及数据伦理三个部分构成。为提升社会科学研究人员的数据素养,适应社会科学第四研究范式带来的挑战,需要结合科研人员职业生涯、科研项目过程、数据生命周期来设计科研人员培养路径,形成数据素养模型构建与核心能力分析、数据管理与算法支撑的嵌入式发展。(章昌平)
同时,学界需要加强跨学科科研合作模式的开展。大数据背景下社会科学研究的新型模式,应由社会科学领域专家进行顶层设计,由相对缺乏对社会宏观思考的数据科学家或算法工程师作为专门技术研究人员主导实现技术方案,共同完成跨学科、融合式的数据驱动的社会科学研究,服务于大数据背景下的知识需求。(何元)
本次高端学术研讨会是我国社会科学领域在大数据问题上一次跨学科交流的尝试,从会议的过程和讨论的成果来看,可以说取得了初步的成效,为我国社会科学在大数据驱动下的研究转型和理论创新开了好头,希望今后有更多的理论工作者加入进来,共同完成这一历史使命。