摘 要:和传统数据相比较,大数据挖掘和分析技术在各方面都有着很大的不同,具体主要表现在规模、质量、类型以及逻辑等,在这样的背景下,社会研究学在迎来更光明的前景同时,也迎来了更为严峻的挑战。其光明的发展前景主要表现在大数据能够给更多社会现象的探索创造相应的可能性,所以有很大概率可以出现暂新的社会学分支学科,这样便能够在社会现象的描述、社会发展规律的认识以及后续社会发展的趋势上创造了更多机遇。而大数据时代背景下社会学研究所面临的挑战主要有以下几个方面:样本偏差、相关公共数据整合困难等。本文主要对大数据时代社会学研究的机遇和挑战进行分析和探讨。
关键词:大数据;社会研究学;机遇与挑战
引言:近些年来,我国信息技术、计算机技术以及互联网技术发展的速度一直在不断地加快,伴随着各种高新技术的快速发展,人们也逐渐步入到了大数据时代。在这样的背景下,许多国内和国外的相关科学家分析和探讨了大数据给人们生活带来的改变以及其后续的发展趋势。
1.大数据时代社会学研究的机遇
大数据时代所具有的海量信息数据和分析方法为社会学的发展带了更加光明的前景,其在以下几个方面都能够促进社会学学科获得更进一步的发展。
首先,大数据时代在未知社会现象的探索上创造了更多的可能性,所以会有很大概率衍生出崭新的社会学分支学科。根据社会学研究的主要目标对其进行划分能够分为以下几个方面:探索性研究、描述性研究以及解释性研究。社会学研究基本上都是对相应一体的探究,从而对该议题有一个相应的认识,能够对新的社会现象有一个相应的了解。探索性研究的主要目的为以下几个方面:满足相关研究人员的好奇心和对事物了解的欲望;评价一个议题的可行性;探讨对其开展后续研究过程中的有效方法。大数据时代下,相关的社会学研究人员能够获得更多的社会数据以及信息,通过对所获取信息的深入探索,便能够更进一步地了解人类社会的复杂行为模式。
1.1 在社会现象的全面描述、社会发展规律的更进一步认识以及后续社会发展趋势的研究方面创造了更好的机会。描述性研究具体来说就是相关的社会学研究人员将自身所观察和感知到的社會事物加以描述,准确地表达出社会的现象以及社会的特征。对于传统的社会学定量来说,其所开展的研究工作主要是对社会相应的现象在研究总体当中表现出的情况进行调查和研究,并且从相应的抽样框当中抽取样本,利用描述或者是统计等相应的手段,来获取样本当中各个变量之间所存在的相应联系,将其作为主要的依据来进一步判断出变量的整体之间所存在的状况。而在当下的大数据背景下,和传统研究之间所存在的不同之处就是不涉及到传统社会学定量研究当中的随机抽样,而是直接将研究的总体规划到相应的分析框架当中,利用这样的方式所得出的变量关系便不需要进行任何的检验工作,其可以直接将总体之中变量的情况有效地反映出来。换句话来说,大数据下的样本数更加接近总体,这便为社会现象的系统化以及全面性的描述创造了更多的可能。
1.2 大数据背景下,公共政策和社会政策的制定以及完善方面也获得了相应的数据基础。并且大数据在现代化的国家治理能力、智能化城市以及政府的建立方面战略的实施上带来了更有效的数据支撑以及决策依据。社会学的重要使命主要在于对当前阶段国家战略的实施以及完善方面提供相应的力量和支持。大数据为相关的社会学研究人员提供了海量的有关社会各方面的动态数据,将这些数据作为主要的依据,便能够为国家治理能力建设以及智能型城市与智能型政府建设评估方面的科学性提供有效的保障。
2.大数据时代社会学研究面临的挑战
在当前企业、政府以及社会各界迎来大数据时代的背景下,对其开展更为深入和理性地探索和研究具有非常重要的意义。当前,怎样能够有效地突破社会学方法论以及所采用的研究方法方面的问题还是社会科学家所密切关注的话题。因此,大数据时代背景下,社会学科的发展在迎来更光明的前景同时,也迎来了较为严峻的挑战。
2.1 样本偏差问题
和传统的社会学定量分析做比较,大数据的样本在数量方面和总体之间的距离更小,但是所谓的总体还是具有相应的偏差性和局限性。在相关社会学研究者实际开展研究的过程中,通常都是将一个或者是几个门户网站后台所具有的相关数据作为主要的分析资料,实际上此种大数据单单是对此网站进行应用的用户数据,所以对其所开展的分析和探索结果和其他网民之间的联系并不大,所以将其推论全民缺乏合理性。所以,相关的社会学研究人员一定要意识到大数据总体的局限性和偏差性,对于不能够应用大数据而抓取的个体便不能够将其直接视为研究对象而将其规划到总体当中。所以,相关研究结论的推论只有其包含在总体当中才能够保证其有效性以及可靠性;另外,互联网网民的个人活跃度之间有很大的不同,并且其活动以及活动痕迹被抓取的概率也不一样,所以说互相网大数据的形成并不是抽样或者是随机,其存在着相应的偶然性。
2.2 重要变量的缺失问题
虽然在网站后台数据能够获取相关网民的有关信息,比如其姓名、性别以及年龄。但是这些所自我填报的信息很可能会存在相应的虚假成分。互联网和现实之间存在的一个非常重要的特征就是互联网具备较强的虚拟性。对于网络世界来说,网民身份的可靠性是不能够得到保证的。而开展社会学定量分析工作,如果其中的关键信息不够真实,那么最终所获取的结果的可靠性也是空谈。
2.3 相关关系解释性不强
依据相关关系分析之后所获取的结论,其在解释性研究当中所具有的效度并不高。存在很大一部分的大数据统计分析都为相关关系而并非因果关系。相关的统计学者或多或少都会了解到,相关的数据样本在达到一定程度之后,即使是本来没有任何联系的两个变量都很有可能产生较为密切的关联。因此在控制变量的应用上还存在相应的不足,当前的大数据社会学统计分析在高级统计模型的因果分析成果上还没有给予正式地应用。从实际上来说,除了相关关系分析之外,还存在着较多的因果模型同样能够在解释性研究当中发挥着非常重要的作用,比如中介模型、多元回归模型以及曲线模型等。
2.4 大数据的整合方面存在相应的困难
虽然当下公共数据的开放以及共享成为了一种非常重要的趋势,但是实际上的互联网门户网站以及相应的互联网公司开放的数据还是存在一定的粗放性以及有限性,存在许多的数据都是相关的研究工作人员直接在网络上所抓取的没有经过加工和处理的原始数据。这种现状的存在除了会导致出现数据资源浪费的情况之外,还很有可能导致对同类数据的反复挖掘以及分析,这在大数据整合方面增加了相应的难度。
结束语:总的来说,在当前大数据时代引起相关领域变革的过程中,相关的社会学研究者还需要在大数据技术在社会学研究方面所造成的影响进行更加深入的探索和研究,改变传统的社会学研究内容以及所采用的方式,使社会学认识论以及方法论获得更进一步的突破与发展。
参考文献:
[1]杨大威. 大数据时代社会学研究的机遇和挑战[J]. 黑龙江社会科学,2019(01):158-159.
[2]杨茗. 大数据时代社会学研究的机遇和挑战——评《社会学概论》[J]. 新闻爱好者,2019(09):110.
[3]张文宏. 大数据时代社会学研究的机遇和挑战[J]. 社会科学辑刊,2018(04):89-94.
[4]赵超越. 本体性意义与学科反思:大数据时代社会学研究的回应[J]. 社会科学文摘,2019,(07):62-64.
作者简介:
邹伟(1983-)男,籍贯:湖南株洲,学历:本科,职称:讲师,研究方向:社会学结合计算机。