蒋晨曦 牛敏
摘要:随着计算机技术、互联网技术以及物联网技术的成熟,当前大数据越来越广泛地被应用于社会各个领域,对于传统统计学带来了新的变革与挑战。本文主要分析了大数据技术对传统统计学的影响,分析了大数据技术给统计学带来的新发展。
关键词:大数据技术;传统统计学;挑战分析
一、引言
在社会经济活动过程中,统计学的应用非常关键,例如:客户对于产品的要求、数量、外观、规格等信息需要统计,企业在生产经营过程中,需要对产品原材料价格、产品的市场信息等进行统计调查与分析。在传统的统计学背景下,企业需要通过问卷调查和电话调查等成本较高的方式获取相关统计调查数据,而随着大数据技术的出现,通过互联网方式企业能够以更低成本获取相关调查统计数据,不仅如此,大数据技术在定义、思维方式、作用都与传统的统计学有着较大的区别。
二、大数据技术对传统统计学的影响
(一)样本概念的深化
在过去传统的统计调查过程中,除了普查之外,大多数的调查都是通过抽样调查的方式完成的,而抽样调查尽管能够大体反映相关群体的情况,但是其调查结果与实际往往存在一定的误差,这使调查结果往往并不十分精准,而大数据技术通过网络技术获取网络数据,能够获取相关群体中的每一个样本信息,因此大数据技术能够使统计调查的数据更加精准和详细,除此之外,大数据技术所使用的网络技术还能够帮助相关调查统计研究人员获取实时动态数据,帮助相关统计调查人员进行统计对比分析。
(二)数据类型的扩大
在传统的统计调查过程中,所获取的数据往往是结构性数据,是根据调查者所设计的问题流程所的出来的数据,而在大数据技术出现后,大数据技术所获取的统计数据不仅包含结构性数据,同时还会包含非结构性数据和异结构性数据等。
(三)收集概念的扩展
在传统的数据搜集过程中,需要进行问卷调查设计、严格控制问卷发放流程,最终输入和总结数据,这一过程,需要花费较多的时间,而且成本较高,而在大数据时代对于数据成本的获取则相对较低,通过对海量信息数据进行识别、整理与数据分析,就能够提炼有价值的信息,但需要注意的是这样获取信息的方式有一定的数据安全风险。
(四)数据来源的不同
在传统统计学中,由于数据通常是通过发放问卷的形式获取的,因此,传统统计学通常能够明确数据信息的获取来源,而在大数据技术背景下,数据的获取是通过网络途径获取的,而在网络环境,人们都以匿名的形式参与网络活动,因此大数据技术通过网络途径所获取的数据往往不能够明确数据的来源。
(五)量化方式的变化
在传统统计学中,所有的信息数据都是以结构性的形式存在的,当前统计学在对分析结构性数据已经形成了较为完善的研究方式,而在大数据技术背景下所获取的统计数据不仅存在结构性数据,同时还存在其他非结构性数据,而如何研究和处理非结构性数据,目前并没有得出系统性成熟的理论,仍有待进一步研究处理非结构化数据的技术。
三、大数据给统计学带来的发展
(一)统计质量得以提高
对统计数据质量的高低的评判主要是从适用性、准确性、时效性、平衡性几个角度来评价,首先在适用性方面,大数据技术的所调查和统计的范围明显大于传统统计学所能够覆盖的范围,能够更加全面地调查群体的相关信息,因此大数据技术所获取的数据具有更强的适用性;其次,在时效性方面,传统的调查统计过程中需要花费大量的时间经过调查设计、问卷发放、以及数据统计等一系列流程才能够获取数据进行分析,这导致统计数据的时效性较低,而在大数据时代,则能够通过对网络数据信息的实时获取获取当下相关统计对象的数据信息,并进行分析,而这无疑大大提升了统计数据的及时性;再次,在准确性方面,传统的统计数据在抽样过程中存在样本误差,除此之外,还可能出现分析,分析模型误差、人为误差等,而这多重误差重叠无疑会降低统计数据的准确性,而大数据时代,通过网络技术,相关调查统计者可以准确地获取用户的各类信息,例如:行程信息、各类消费信息等,这种信息获取方式显然比传统的统计方式更加精准;最后,在平衡性方面,由于数据的发布者与数据分析者之间对于数据理解不同等因素会降低统计数据的平衡性,而随着大数据技术的发展,数据发布者在统计框架内公布有关总量数据的分项,并公布有关数据的比较和核对方法与结果,便于数据使用者对于数据进行检验,从而提升数据的平衡性。
(二)统计成本得以降低
在传统统计数据过程中无论是调查问卷设计、调查问卷发放还是调查问卷的数据信息统计都需要耗费大量的时间与人力,而在大数据背景下,对于数据信息的获取无序经过这些繁琐的流程,通过网络通信技术即可实现对信息的获取,除此之外,大数据技术所获取的信息内容非常丰富,因此大数据背景下的信息数据能够被多次使用,而传统的统计学所获取的数据信息往往具有明显的针对性,难以重复使用,因此传统统计学下获取的统计数据,其使用价值也相对较低。
(三)统计学科体系得以延伸
在传统的统计学中,往往对统计数据的分析是按照既定统计学理论和模型进行分析的,而大数据时代由于信息数据并非都是结构性数据,且大数据信息技术所获取的信息是海量的,因此数据挖掘技术出现,进一步拓展和延伸了统计学体系。
参考文献:
[1]朱建平,张悦涵. 大数据时代对传统统计学变革的思考[J]. 统计研究,2016,33(02):3-9.
[2]耿直. 大数据时代统计学面临的机遇與挑战[J]. 统计研究,2014,31(01):5-9.
[3]魏瑾瑞,蒋萍. 数据科学的统计学内涵[J]. 统计研究,2014,31(05):3-9.