适应大数据时代的统计学专业课程体系重构初探

2015-03-17 18:51:11吴学品
海南开放大学学报 2015年4期
关键词:应对措施大数据统计学

吴学品

(海南大学 经济与管理学院,海南 海口 570228)



适应大数据时代的统计学专业课程体系重构初探

吴学品

(海南大学 经济与管理学院,海南 海口 570228)

摘要:大数据给统计学带来机遇和挑战。通过描述大数据特点,分析并探究了现行统计学课程体系应对数据爆发性增长、内容体系和课程设置上的不足之处。并针对性地提出了大数据背景下未来统计学课程教学改革策略:重视培养学生的数据挖掘能力、现代计算技术能力、不同类型数据分析能力、数据复杂性和不确定性系统建模能力。

关键词:大数据;统计学;应对措施

引言

随着云计算、互联网+、物联网及存储等技术发展,全球数据呈指数型的爆炸性增长,大数据发展将给社会和个人带来深远影响。大数据有着数量体量巨大(volume)、类型繁多(variety)、价值密度低(value)和处理速度快(velocity)的4V特点,把握好大数据的特点是利用好大数据的关键,也只有有效掌握大数据特点,才能对海量数据进行分析,才能挖掘大数据有价值的信息,更好地为社会服务。因此,大数据给统计教育带来了全新机遇和挑战,对统计专业人才提出更高要求,结合大数据特点对统计教育进行改革是当务之急,本人将就大数据背景下统计学专业课程建设谈谈自己的想法。

一现行统计学课程体系存在的不足

(一)应对数据爆发性增长的不足

统计抽样理论得以迅速发展,是因为人们在大多时候无法观察到总体,需要抽取样本数据推断总体,这同时也是传统统计学方法的基础。实现这个目标关键在于从总体中抽取的随机样本,样本随机性是减少统计推断误差的必要条件。在传统统计学课程中,统计学是通过随机收集等手段,以达到推断研究对象本质的目的。许多课程围绕如何得到代表总体的随机样本数据开设。如《社会调查方法》《抽样技术与应用》等,这些课程作为统计专业核心课程,在学分、学时等方面所占比重较大,从理论和方法上阐述了如何收集随机样本并进行统计推断。而在大数据时代,数据量爆发式增长和存储技术发展使得数据从“体量”、“类型”、“速度”与“量化”上发生了巨大变化。从数量上来看,所得到样本就是总体。由于是全体数据,因而不再有抽样误差问题,只有非抽样误差问题,在某种意义上来说,大数据对统计推断更具有全面性和准确性。虽然在一定程度上,这对传统统计抽样技术来说,巨量数据的出现在某种程度上并不是针对特定统计研究目的而产生,并且有价值低的特点,但大数据类型繁多,包含信息量巨大,可以满足多层次、多角度统计分析需要,这大大提高了人们从数据中获取信息能力,使得人们更加了解总体。从这一点来看,在大数据时代,针对某种特定研究目的的随机抽样技术的作用会大大减弱。然而,面对大数据时代巨量数据,传统统计学现有的应对方法显得不足,无论从数据整理、分类、取舍,还是不同类型数据间信息转换的角度,现有统计仍存在极大不足。

(二)内容体系上的不足

从统计学内容来说,传统统计学是应用数学的一个分支,内容体系主要为随机理论体系,其大部分统计推断方法也是在随机理论基础上建立起来的,即主要通过利用随机理论,收集所观察系统的数据,进行量化分析、总结,作出推断和预测,为相关决策提供依据和参考。从研究特点来看,统计学的数量性表现在用规模、水平、速度、结构和比例等去描述和分析社会经济现象的数量表现、数量关系和数量变化,揭示事物本质,反映事物发展规律,推测事物发展前景。而在大数据时代,大部分数据并非来自随机抽样,探知总体分布类型、数字特征或发展规律和本质完全可不通过由随机抽样建立起来的统计推断方法。大数据强调的是全体数据,有关总体分布假设和总体特征等不再需要根据分布理论进行推断,只需进行计数或归纳分析即可。有了全体数据以后,有关总体的一切统计应用将变得非常简单,包括发生概率大小、趋势预测等,这些应用只需要做一些简单定量分析和总结即可。另外,大数定律、中心极限定理等的作用也将弱化。大数定律阐明了当样本容量足够大时,“频率”靠近“概率”的理论证明以及随机变量序列依概率收敛于常数的问题。在大数据时代,巨量数据的出现使得这些客观存在的现象可以直接通过总体数据得到,而不必再局限于原来的有限样本数据的推理和比较。值得一提的是,作为统计推断工具,统计量也没有存在的必要。因此,在大数据背景下,现有统计学理论缺乏对来自非随机抽样的全数据统计方法,建立基于全数据的统计推断方法显得极为重要。

(三)课程设置上的不足

从统计学课程设置来看,目前统计学教学体系主要由公共课程、学科基础课、专业课、必修课和专业选修课构成。公共课程主要为一些通识类课程组成,而学科基础课由数学类和经济类课程组成,专业必修课和专业选修课则由以随机理论体系的课程和数据分析应用类的课程组成。在大数据时代,数据种类繁多,并具有物联网、存储技术、信息化和非结构化等特点,现有统计学课程设置远远不能满足数据整理、识别和分析需要,也难以应对这些新数据技术挑战。统计课程体系中公共基础课和专业基础课内容较为狭窄,缺乏计算机技术、存储技术、云计算等内容的覆盖,专业课中也缺乏对信息化内容的设置,选修类课程中更应该具有针对非结构化数据处理方法的培养。

二重构统计学课程体系提升学生适应时代能力

随着大数据时代来临,统计教育教学将面临着严峻挑战。一方面,在大数据环境下,数据巨量增长和数据类型多样化等特点均对传统统计方法和理论提出新要求,对大数据处理必定会需要挖掘新数据和计算技术;另一方面,我国现行统计教育教学理论模式都是按随机抽样理论体系建立起来的,理论结构比较固定,数据类型相对较少,统计方法单一,难以适应大数据时代数据量巨大、类型多变的统计要求。为使现行统计教育从数据思维、分析评价和实证逻辑等方面适应大数据要求,满足统计学对大数据时代建设需要,提出从以下方面去积极应对大数据,促进统计学教育跟上时代步伐。

(一)重视学生数据挖掘能力培养

在大数据时代,数据并不等于信息,大数据具有两个明显特点,第一,大数据量很大、速度快,但这些数据都是自动收集的,这也意味着数据中有很多噪音信息;第二,现有统计方法大部分都局限在处理数字数据上,较少针对其他数据类型,但大数据类型种类繁多,包括函数数据、文本数据、信息化数据等不同类型数据。应改变对传统数据形式认知,培养学生从不同结构数据挖掘有用信息的能力,剔除噪音数据,加强学生对不同类型数据处理的能力培养。此外,应增设信息处理类、计算数学类等课程设置,以培养学生应对大数据时代数据信息化挑战,提高学生对信息化数据挖掘能力。

(二)重视现代计算技术能力培养

无论从数据容量还是数据种类上,传统统计学方法所能处理的数据都非常有限。但在大数据时代,面对巨量非结构化数据,更需要依靠云计算技术才能应对,特别是云计算中的虚拟化、云终端、云管理,以及编程模型、数据存储、数据管理、云计算平台管理等内容,只有这些计算机技术和统计技术结合起来,才能使得统计学在大数据时代大显身手,有所作为,统计思想才能在大数据分析中得到体现。因此,应加强对计算机类、数据库管理类、语言编程类等课程设置,以培养学生计算机技术能力、数据库管理能力和计算技术能力。

(三)重视对不同类型数据分析能力培养

与传统统计数据相比,大数据是一个数量巨大和高维变量的数据集合,覆盖类型也多种多样,包括文本或语言、图像、网络和图形等。无论从数量还是类型上,大数据具有半结构化和非结构化特点,传统统计分析方法很难胜任分析大数据的重任,这需要来自包括数学、经济学、社会学、计算机科学和管理科学在内的多学科交叉运用。因此,在现有课程设置中,加强对通知类教育课程设置,增强学生对不同数据识别能力,并教授基于多学科的统计分析方法,组成强大分析工具,才能轻松对大数据进行整理、归类、分析和预测。

(四)重视数据复杂性和不确定性系统建模能力培养

大数据具有复杂性和不确定性。为应对大数据的个体复杂性和随机性挑战,未来统计学人才应掌握最优化、数据包络分析、期望理论、管理科学等理论方法。因此,在专业选修课设置中,加强对系统课程类及不确定性科学类课程设置,以帮助学生掌握系统建模方法,从而增强学生从种类繁多的数据类型中获取与研究目的有关资料数据的能力以及定量统计分析能力。

结论

综上所述,大数据给统计学科带来新的生命力,同时也提出了新挑战,将给现有统计教学体系内容、教学大纲及培养方案带来大的变革。新的统计学教学体系需要数学、系统科学、计算机、统计学及信息学等学科的紧密结合,从教学大纲、教学内容、教学体系以及培养方案上作出相应调整,才能顺应大数据本质及特点,展现统计学新的生命力。

(责任编辑:王珏)

The Discussion on Reconstruction of

Statistics Course System in the Big Data Era

WU Xue-pin

(School of Economic and Management, Hainan University, Haikou 570228,China)

Abstract:The big data brings opportunities and challenges for statistics. This paper describes the characteristics of big data, and analyzes the shortage of statistics for dealing with the explosive growth of data、content system and curriculum under the big data background. and puts forward the coping strategies of statistics teaching reform in the future, it should pay attention to data mining capability、modern computing technology capability、analysis capability on different types of data and data modeling capability of complexity and uncertainty system.

Key words:big data; statistics; coping strategies

基金项目:2013年海南大学资助项目“中西部高校综合能力提升计划项目”成果之一。

作者简介:吴学品,男,汉族,海南儋州人。经济学博士。海南大学经济与管理学院副教授。主要研究方向:统计方法、应用计量模型等。

收稿日期:2015-11-29

DOI:10.13803/j.cnki.issn1009-9743.2015.04.026

中图分类号:C829.2

文献标识码:A

文章编号:1009-9743(2015)04-0117-03

猜你喜欢
应对措施大数据统计学
关于投稿的统计学要求
统计学符号使用的说明
统计学符号使用的说明
本刊对来稿中统计学处理的有关要求
手机通讯行业消费者权益保护研究
科技视界(2016年21期)2016-10-17 18:43:20
施工企业营改增对会计核算的影响与应对措施
浅析高职院校学生厌学现象及应对措施
考试周刊(2016年77期)2016-10-09 12:17:14
基于大数据背景下的智慧城市建设研究
科技视界(2016年20期)2016-09-29 10:53:22
中小企业如何应对“营改增”