大数据时代统计学面临的机遇与挑战

2019-03-05 11:36阿尔孜古丽艾合买提
吉林广播电视大学学报 2019年2期
关键词:样本学科时代

阿尔孜古丽·艾合买提

(喀什大学数学与统计学院新疆维吾尔自治区,喀什 844000)

统计学是研究如何测定、收集、整理、归纳和分析的一门社会学科,可以反映客观现象总体数量的数据。在大数据时代的背景下,通过对大数据地统计推断,给统计界带来切实的利益,促进对自然和科学地深度理解。面临复杂数据的增多,大数据时代统计学在面临更多机遇的同时,也面临了众多的挑战。因此,这个时候就需要使用大数据,为统计学理论和方法构建提供更为广阔的发展空间。

一、大数据的意义

从一定程度上看,大数据时代充满了众多的信息,且其种类异常的繁杂,这就使得样本容量变得更加巨大。当出现这样的问题时,则可以利用统计学的知识,将其容量进行科学的减少,并按照具体的要求,使其达到自己想要的精确程度。在面对高维数的情况之下,则需要选择一个合适的变量,然后再对其进行压缩以及降维等。从另外一个角度来看,大数据涵盖的领域较为广泛,其所涉及的行业面比较多,在混合以及多源的数据基础上,实现对社会、自然等方面的数据叠加。从本质上看,各个领域间的数据并不是孤立的,他们之间也有着许多密切的联系。大数据的信息内容非常丰富,其中包括的语言、文字、声音、图像等。我们不仅需要对这些数据进行总结,还需要将这些数据进行集中并统计。从大数据的环境上看,第一,大数据快速的涌现,让存储设备与计算能力很难使用此种十分巨大的数据流。第二,目前形势上看,当前的磁盘存储还不能很好的实现硬盘存储。第三,大数据在分布存储的环境下,需要将海量的数据分布于更多的计算设备当中。第四,众多的数据储存在一台电脑中时,需要在多线条的环境之中,使用多个数据处理器实现内存的双向传输。总之,大数据的目的就是为了把繁杂的数据信息,转变为我们需要的知识。探究数据的产生机制,接着结合自身的实际情况,探究对应的对策与政策,提高预测性与预后性。大数据不仅可以实现纵向与横向的延伸,也可以在自然、经济、社会的现象上发现疾病疫情、科学与社会动态。例如:众多知名的搜索引擎就是利用频繁检索词条,进行搜索信息源来自哪里,其影响的范围等。

二、大数据对统计学的影响

(一)数据下的时代变革

从众多数据变化上来看,人们主要就是根据面临“问题”而去搜集相对应的“信息”。这个时候,我们在外出的时候,就可以查询到想要去的地方的天气与交通状况,其中还包含了宾馆的居住情况。接着就可以通过这些数据,对未来提出查询并作出决策。例如:现在有很多优秀的物理学家与统计学家,计算机专家,通过对大数据的把控与观察,就可以对数据进行敏锐的处理,并进入生命科学领域。

(二)大数据的研究动向

从数据时代所面临的难题来看,现在需要的则是对各类信息资源的处理,并追踪信息的源头,对核实的信息进行样本处理。展现对应的偏倚和异质性,按照其对应的格式与结构进行数据处理,实现分布式算法,保证数据的完整性与可视性、可扩展性。对海量数据进行有效分析时,已经超越了个体领域的范围,需要在社会整体层面上,实现计算机资源与数据源的实时性决策。除此之外,还需要该领域的专业人员,去研究统计推断以及算法的内容,并在此基础上提出合理化建议。

三、大数据时代统计学面临的挑战

大数据时代统计学,在回归预测方法的出现后,拟合优度检验的方式,并且深入的应用到社会各个方面。从当下的形势上看,人们在自主获得相应的数据时,也在从其他领域大量地获取信息,并对收集的大量数据进行观察与分析。此种情况的出现就让一部分人脱离了实验室,专业从事大数据的研究工作。但随着时间推移,信息的获得方式及其规模已经发生了根本的变化,这样就让统计学面临了新的难题和机遇。众多的数据都是多源异质的、且其覆盖范围也不尽同,为了整合这些信息,则需要对其来源、获取方式、描述等,作为支撑进行分析。科学技术的发展催生了大数据时代的变革。在科学的视角下综合分析处理信息,提供方便快捷的数据信息,促进统计学的发展。

统计学是一门传统性的学科,无论是其理论的领域,还是实践的领域,其研究的成果都有极高的价值。随着大数据时代的数据呈现了海量,分散式的特征,这样就对统计学的发展造成了一定程度的影响。这个时代的数据量,其规模已经超越了人们的想象,而它的“全”已经让人们对单一信息的认知变得更加连续、系统。信息的多样性,更是让样本与个体之间的关系得到了更好的优化。另外,新时代下的数据具有多样性特征,这也优化了传统统计学的主观臆断。以往的统计学更多追求的是“为什么”?而现代统计学追求的是“是什么”?因此,个体的选择标准会缺乏一个相应的标准,这样在选择个体数据时其难度更会上升。样本统计是一门极为重要的学科,利用该学科的知识,可以实现对客观事物的复杂关系等进行深入的研究。在这一时代下局部与整体的情况变化,造成了整体变化趋势的进一步变更。随着样本数量的增加,从一单数据源中收集到的信息,全部属于非结构化的信息,但是在之前的结构化的数据当中,需要进一步提升样本的数量,接着提升统计学的精确度。这样就会增加样本选取的工作难度。另外,随着计算机技术的不断提升,计算机的正常工作离不开统计学软件的支持,其软件的使用,不仅可以提升该学科对数据分析的效率,也可以提升精确度。从目前的形式上看,主要使用的统计学软件有Eviews、SPSS、SAS、Stata等。但是,还不能实现较强的传输与存储功能,还需要进一步的创新与研发。换句话说,就是需要在较短的时间内输出结果,但是实现这些软件的升级较为困难。在大数据时代下就需要提升数据的容量,增强更多的获取方式。我国相关统计软件相对缺乏,不少软件还处于英文版本的状态,对于初学者来讲需要花费较多的时间进行学习,这就给统计人员的需求带来了难度。那么,大数据时代在给相关人员带来意想不到惊喜的同时,也造成了不容小觑的挑战。

五、数据时代中统计学面临的机遇

(一)统计效率的问题

统计学的统计效率想要得到更好的体现,就需要在多元化的基础上保证及时性、弥补传统条件下的滞后性、提升统计学的效率。另外,大数据在高速发展的过程中,不仅可以提升统计动态数据的收集,还可以在反复的应用当中满足各式各样的服务需求。针对于采集数据采集的次数提升问题,需要使用大数据挖掘潜在价值,提升挖掘的全面性与整体性。在信息搜集的时候,其成本不会因为软件运行次数而出现上升,并且在其应用方面,其成本也出现了下降的趋势。

(二)统计单个体系的拓展

在大数据的引领下,统计学也得到了快速的发展。这个时候就需要在庞大的数据上,使用样本进行选取、按照标准进行划分。在新的变化中,传统统计学的样本统计会朝着一个方向进行发展,并在总体的概括中,实现对本门学科体系的构建,消除总体数据收集时的难度,弥补该学科数据采集不足的现象。并在有效的延伸过程中,对学科的体系进行统筹发展。

(三)统计学科的应用范围提升

以旧的理念为起点,在实践的过程中,需要了解一个结果或者是一个原因,统计学在数据时代的具体应用过程之中,展现惯有的“研究问题”来驱动“收集数据”。从数据时代的角度进行探究,此种功能并不是一成不变的,此种变化中,促进了统计学的进一步发展与扩大。例如:传统统计学一般会作为一种输血形式进行参考信息。但是,在大数据的背景下,展现了更多的多元化与多样性,并在海量的用户当中,开拓更多的信息,这些内容不仅涉及到了他们的生活各方面,而且还在进一步的挖掘过程中,衍生出来新行业。传统统计学结构存在着很多的局限性,在非结构或者是半结构的数据统计下,实现无数据化行业的进一步发展。

结语:

新常态的背景下,大数据时代下的统计学是科技与社会经济的主要价值体现,也是社会经济的运行模式与决策模式的构建。只有在日新月异的科技发展过程中统计学要与时俱进、统筹发展、完善统计学创新机制、建构统计学学科体系理论框架。并不断接受机遇与挑战,统计学才能适应大数据时代的发展潮流。

猜你喜欢
样本学科时代
【学科新书导览】
土木工程学科简介
用样本估计总体复习点拨
推动医改的“直销样本”
“超学科”来啦
随机微分方程的样本Lyapunov二次型估计
e时代
e时代
e时代
论新形势下统一战线学学科在统战工作实践中的创新