陈阳
[内容提要]社会经济发展带来了频繁的社会流动,以及与流动人口相关的社会治理问题。而随着大数据时代的到来,流动人口在社会治理研究的方法和方式上也必然发生改变。因此,有必要从大数据本身的数据特质出发,讨论其对流动人口社会治理的影响及其拓展。
[关键词] 大数据 流动人口 社会治理研究
一、大数据对流动人口社会治理的影响
自1989年KDD(数据库的知识发现)概念被提出以来,大数据概念便成为了科学界追捧的宠儿。作为一种区别于传统小型数据类型的数据集合体,大数据在概念的内涵和外延上都对传统数据有所拓展和延伸。区别于传统抽样调查获得的数据,大数据具有公认的SV特性。即Volumn(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实)。这五个特点在与流动人口的社会治理关联时,也显著地影响了流动人口的社会治理,使新时代流动人口的社会治理发生三方面的改变。
1.能够获取更大规模的数据,使研究者不再依靠样本参数来推断总体特征。传统流动人口社会治理较多使用抽样调查获得数据,并以此推断总体的特征分市,但获得的数据量非常有限。而大数据在数据收集的渠道上则更加多元和现代。除了国家数据库之外,企业数据、物联网数据以及个人数据等都能成为大数据的来源。特别是随着手机等智能终端设备的流行,越来越多的和流动人口治理相关的数据,开始基于云计算平台进行汇总,成为超越所有传统流动人口社会治理模式中的数据集合体。而大规模数据的集合,将使研究者不再仅通过样本参数来推断总体特征。用一个比喻来形容就是大数据的使用可以使研究者不再“只见树木,不见森林”,而是直接从洞悉森林的整体局势进行统筹规划。同时,大数据也使得研究者能够随时从全局视角出发,审视某些特殊地区或个体所面临的问题。
2.能使研究者的反应更迅捷,并协助研究者对数据进行更智能的分析与判断。如在运用智能手机进行流动人口的数据收集时,可以通过移动网络即时地将数据上传到“云端”。只要移动网络畅通,数据便可以立刻完成从获取到保存的全过程。同时,在云端还可以部署数据处理代码,在保存完毕之后立刻调用程序对数据计算分析。如在收集流动人口的收入时,为了收集方便,将直接以“元”作为单位,对流动人口的具体收入进行输入。这种数据收集方法虽然精确,但是却不利于整理。而利用强大的云平台计算能力,将可以即时地根据输入的具体收入数据进行分类。如将月收入3000元以下的设定为第一档,将3001- 5000元设定为第二档,将5001- 8000元设为第三档,将8000元及以上的设定为第四档。通过这样的方式将加快流动人群社会治理相关数据的收集和转换。
3.能容纳多元的数据格式于一体,进而对流动人口社会治理相关问题的分析更加立体、真实。传统流动人口社会治理多使用定量化的数值数据,并运用统计学进行推断分析。而流动人口社会治理所涉及到的大数据不仅在容量层面上有所拓展,其格式也更是“有容纳大,百花齐放”。除了传统的数值型数据和文本型数据之外,流动人口社会治理相关的大数据还包含了诸如GPS位置、语音视频多媒体文件等多元格式的数据或文件。这些多元格式的文件使得流动人口的社会治理问题研究变得更加真实和立体,在研究过程中可以随时根据数据、声音和影像更加真实地还原问题的本源特质,进而得出更加具体和翔实的结论及解决方案。
二、大数据对流动人口社会治理研究的拓展
1.大数据拓展流动人口社会治理的理论框架。随着时代进步,越来越多的知识开始交叉并融。借助大数据,流动人口的社会治理将能够完成对群体社会组织等资讯信息的收集,并充分地利用计算机模拟“演化科学解决现实世界的问题”。计算数据科学将在“机器学习”的帮助上,进一步拓展流动人口社会治理的研究范畴和疆域。此外,随着云计算技术的日渐流行,流动人口社会治理也必然將采用全新的数据收集、整合及处理逻辑。而随着人工智能热度的日渐高涨,流动人口的社会治理也必然与其融合,凝集人类经验和人工智能双效能量。从目前发展的态势来看,最可能实现的便是基于集人工专家经验理论和人工智能迅捷判断于一身的全新智库系统。其可以有效地利用人工智能收集和流动人口社会治理相关的任何数据,并针对特定社会情境或问题进行趋势分析与判断,协助决策者作出有效的判断,并及时地提出问题的解决方案。
2.大数据成为传统流动人口社会治理问题的有效补充,提升了传统研究的生命力。虽然大数据拓展了传统流动人口社会治理的研究范畴和疆域,但是不能忽视大数据因其天生的缺陷很难以完全取代传统的流动人口社会治理研究。一是大数据的数据收集方式使其对普通研究者并不是很友好。由于大数据收集起来既费时又费事,很难让个人研究者或团队执行,因此现在的大数据收集工作往往由政府或较大的科技公司主导,导致了个人研究者难以直接获取到所需要的大数据。二是大数据涉及的方面较广泛,很有可能会触及个人隐私。当个人隐私和学术研究冲突的时候,将涉及学术伦理道德问题。对于何时使用大数据进行研究不违反伦理道德,目前还没有明确的标准界限。所以,这必然为实际操作带来困难。三是大数据存在“噪音”问题,这将使基于大数据研究的信效度受到质疑。由此可见,大数据虽然明显提升了流动人群社会治理研究的范式和疆域,但不可否认它现在仍不能够完全地取代传统调研方法。只有将传统研究方法和大数据研究方法合二为一时,才能有效地保证流动人口社会治理呈现出更强悍的生命力。
3.大数据拓展了流动人口社会治理的研究工具集合。大数据对流动人口社会治理的影响,不仅促使研究疆域和研究领域发生改变。同时,也在研究工具的层面有所丰富。原来,流动人口的社会治理研究更多使用单机版的SPSS作为主要的数据分析工具进行统计分析。但是,这类统计软件往往适用于抽样调查所获得的不多于10万条左右的数据集合。而当该类软件一旦遭遇到超过10万条以上的数据时,便会捉襟见肘,无法顺畅地运行。于是,一些基于计算机分布式理念设计的大数据处理框架自然地被引入到了流动人口的社会治理研究中来。如广为人知的Python语言在处理大数据时便会让研究者更得心应手,并在很多方面有取代SPSS成为学术统计标准的可能。同时,随着使用大数据工具人数的增多,一些python的开源包也应运而生。这些开源包由于目标是解决诸如流动人口社会治理等特定社会问题,因此它们在编写的过程中必然由计算机专家和社会学家通力合作完成,随着大数据技术不断地进入流动人口的社会治理中,社会科学的研究者也必将为开源作出贡献。