大数据背景下的统计发展问题研究

2018-12-21 19:11王小梅利津县统计局
数码世界 2018年5期
关键词:总体个体样本

王小梅 利津县统计局

随着信息技术、全球定位系统与计算机网络技术等各类技术的迅速发展,这将使很多以前难以收集到的数据信息可以很轻松地开展大范围的收集,其功能的实现主要归功于云计算。通过大规模的数据收集分析可以在很大程度上提升研究的视野,达到通过传统的样本分析时所不能企及的高度,并为统计学的发展垫定了良好的物质基础。与此同时,以样本为载体的传统的统计方式和理知识论已经无法满足现代统计学发展的需要,这就要求我们将大数据广泛地应用到统计学当中,并对统计学进行完善与改进,进而将从大数据中获取到的有效的数据信息,合理地应用于统计学的发展与进步。

1.完善统计学的总体、个体以及样本的定义

在传统的统计学分析中最重要的内容就是从总体中抽取一定数量的样本,并对抽取的样本进行分析探究,进而推断出总体所具有的共同特征,因为传统的统计学分析总是需要从总体中去抽取足够量的样本,即需要准确地掌握研究目标的整体范围,再采用分析抽取样本的方法来对总体进行分析探究。大数据的分析方式与传统统计分析是完全相反的,它要求我们要首先进行数据的收集与整理工作,然后将其整合成为总体,其不同于传统的统计学分析的最突出的一点是它不会对统计目标进行定义,它只是涵盖了某一时间段的全部数据所对应的具有整体性质的概念。由于单个个体具有很大的不确定性,对于数据来说,其同样也是一个动态的过程,这就决定了事前借助于数据库中的单位进行编制的不可实施性,相对应的上一时间段中与下一时间段中的数据信息总是存在着一定的差异性,即在事后识别单个个体也成为一件很困难的项目。在当今的计算机网络中,同一个个体能够有许多个称谓和符号,同一个称谓或符号同样也可以代表很多个体,而且个体呈现的形式多种多样且不易观察,所以通过对大数据的观察可以从整体上对总体数据进行把握,并明确整体数据的外在形态,但是大数据分析很难对于单个的个体进行探究。但是值得一提的是识别、考究单个个体的身份特性对于大数据分析来说是至关重要的,这就在一定层面上对传统统计学的总体和个体的定义提出了一些新的要求,而采用传统的样本定义方式在大数据中进行样本的提取终究是无法实现的。但是,由于大数据具有强烈地动态性,我们可以将大数据中任何一个时间段的整体视为界面样本。

2.积极有效地拓展统计学体系

处于以大数据为背景的时代,就要求我们时刻从辩证的、发展的角度来看待统计学的发展问题。传统的统计学应该积极地拓展以大数据作为基本框架的统计学体系,只有这样才能快速有效地适应统计学现实发展的需要。统计学应当将大数据的思想内涵和统计分析的方法纳入到学科体系当中,将传统的以样本统计为主的统计方式转变为总体统计与样本统计相结合的方式。传统的样本统计主要是通过对抽取样本的探究来达到探究整体的目的,其中抽取的样本具有很大的随机性和不确定性,这就决定了通过抽取的样本来推断整体的过程中可能会出现一些误差,甚至是失误。而在采用大数据统计分析之后则可以有效的避免这种不足之处。我们可以将统计学科分为样本统计和总体统计,其中总体统计主要被应用于“由简入繁”,而样本统计主要被应用于“以大见小”,有效地整合总体统计与样本统计可以让统计学更加快速地适应大数据的需求。

3.研发新的数据分类与梳理方法

传统的统计学一般是通过提前设置的计划方案来进行数据的梳理与分类。传统统计学在进行方案设置时所参照的标准和最终完成的分类项目都是隶属于结构化的,预处理数据的最重要的步骤就是数据的分类和数据的梳理。数据的分类与梳理对于统计学具有非常重要的现实作用。但是大数据的数据形式、来源和表示方式等方面都是多样化的,假如我们还是采用传统的统计分析方式来探究以前对于数据的类型、数据分类的标准、数据的标识之间的关系,区别类与类之间的程度等进行严谨的设置,终究是无法实现的,所以只有在对数据进行预处理之后,再借助于数据本身的属性来进行合理的调整和完善。显而易见的是,传统的分类和梳理数据的方式已经完全不适用现代的大数据统计分析的需求,所以我们应当积极地探究研发适用于大数据背景下的数据梳理和数据分类的方式,并且在这个前提下研发全新的分析数据的方式。

4.合理整合多种统计学方法

传统的统计分析主要采用归纳推理的方法来进行研究,通过分析抽取样本数据所具有的主要性质,并在此基础上对总体的性质进行推断。而对于大数据来说,归纳推理法也可以作为大数据分析统计的一个重要的方法,依赖于所选取的具体的个体的性质进而判断总体的特征,其中最重要的一点为在对总体的特征进行分析归纳的同时,还需要从个体所展现的信息中不断的提取发现全新的知识。针对于大数据分析,如果在分析的过程中只侧重于个体或者是整体的性质的归纳,则势必会造成很大程度上的浪费。个体或者是部分类别,甚至是一些异常数值,都可以被用来推断一些新的结论或者是预测一些现象。因此,在进行统计分析时还应当对个体所包含的信息进行更加深入的考究,与此同时,还要借助于现有的专业的知识与实践经验及位置分布特征来对其他更加显而易见的具体规律进行分析推理,更加准确的把握事物之间的内在联系,并且可以以此作为判断新事物的方法,我们将其称为演绎推理法。演绎推理法不仅可以帮助我们积累现有的知识经验,还可以加深对过去学习的知识经验的理解程度,有助于我们实施进一步的研究工作,有效避免探究的过程中经常会出现的关键、细微的特点。将演绎推理法和归纳法进行有效的整合,可以帮助我们在进行大数据的探究过程中从一些偶然性的事件发现一些必然性的规律,再通过总体数据当中必然会出现的现象来认识偶然性、探究偶然性、运用偶然性,并且有效提高驾驭偶然性的能力环境。

5 结语

总的来说,大数据不仅对于传统的统计学的发展提出非常严格的要求,同时它还为统计学的发展提供了不竭动力与良好的机遇。处于大数据迅猛发展的新时代,我们必须树立大数据是传统的统计学的延伸而不是替代品的意识,其主要表现在传统的统计学现在仍然在社会统计、社会经济分析等领域发挥着巨大的作用。

[1]祝丹,陈立双.大数据驱动下统计学人才培养模式研究[J].统计与信息论坛,2016,31(12):87-92.

[2]张帆,李浪,廖宁,等.大数据时代背景下医院统计工作模式改进的探讨[J].中国卫生信息管理杂志,2016,13(6):635-638.

[3]潘莉.大数据背景下统计应用型人才高等教育教学改革研究[J]. 现代经济信息, 2016(22).

[4]孙雪琴.大数据背景下对统计学发展的思考[J].科技、经济、市场,2016(5):184-184.

[5]宗义湘,石会娟,杨江澜,等.大数据背景下经济统计专业人才培养模式创新研究[J].河北农业大学学报:农林教育版,2017, 19(2):32-36.

猜你喜欢
总体个体样本
2020年秋粮收购总体进度快于上年
关注个体防护装备
外汇市场运行有望延续总体平稳发展趋势
明确“因材施教” 促进个体发展
规划·样本
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
How Cats See the World
“官员写作”的四个样本