大数据时代经管类本科专业统计学教学内容完善的思考

2019-04-22 09:42李冠军
科教导刊 2019年3期
关键词:统计学教学内容大数据

摘 要 当前大数据发展对经管类本科专业统计学教学已经带来一定影响,传统的统计学教学内容不能很好的反应时代变化带来的新要求。本文从数据性质差异、获取数据方式的不同、研究对象重点的差异和统计分析思路差异四方面,阐述了传统统计学教学内容对大数据的不适应。最后提出应在相应的教学内容部分增加补充有关大数据的基础知识,完善教学内容。

关键词 大数据 统计学 教学内容

统计学是教育部规定的经济管理类专业的核心课程之一,是所有经管类本科专业的专业必修课。统计学课程主要是培养学生的统计思维和基础的数据统计分析能力,同时为其他专业课程的学习做好知识准备。

大数据的量、数据获取方式以及数据分析的方式等方面对传统的统计学教学带来不小的影响,尤其是近两年在教学过程中学生对所学内容的有用性产生质疑,无疑使得对经管类本科专业统计学教学内容的改革和完善变得迫切和必要。但是具体探讨统计学教学内容中增加关于大数据相关内容的研究还比较缺乏。

1 大数据及应用对社会发展的影响

大数据从“Big Data”直译过来,是“海量数据”的升级版,最初主要指数据量庞大和复杂。维基百科给出的定义:“大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数据集。”相对于传统数据而言,大数据具有:数据量大、数据类型多、数据价值密度低、数据增长速度快和時效性高、能随时调用和计算等特征。当前“大数据”一词的内涵延展至“大数据时代”:代表大数据带来的技术挑战和困难;大数据处理的技术和方法;大数据分析和应用带来的新发明、新服务和新的发展机遇。

从理论来讲,大数据发展能惠及所有产业。目前我国的零售业、金融业、政府政务、医疗行业、能源行业、制造业、物流行业以及媒体传播等领域已经有很多具体的大数据应用。大数据的应用呈现出较快的发展趋势。伴随着云计算、物联网、人工智能等技术发展的深化,大数据应用将会成为影响社会发展的重要因素。

2 统计思维的建立对经管类专业学生培养的重要性

统计思维是人们主动运用数据对客观事物进行描述、分析、判断和推理,进而发现事物发展规律的思维方式,是比形象思维和逻辑思维更为复杂的一种思维方式,本质上属于创造性思维。大数据时代,人们对数据的重要性认识已经上升到一个新的高度,而统计思维是在对数据不断的分析和应用中逐步培养形成的。

从专业角度讲,经管类专业的学生未来大部分将会从事经济管理类的工作,而经济管理类的许多工作需要一定的数据理解能力和分析能力。在大数据时代,这种要求会更加广泛。

从素质培养角度来讲,统计思维本质上属于创造性思维,统计思维的建立过程是对经管类专业学生学科知识融通能力、观察能力和抽象能力的综合培养。

从统计学课程教学角度来讲,教学的主要目的就是帮助学生建立统计思维,培养学生的数据解读和数据分析应用能力。以提高学生自主利用统计分析方法解决专业学习以及日常生活遇到的经济和管理实际问题的能力。

3 大数据发展对传统统计学教学的影响

3.1 数据性质差异

传统统计学所涉数据以结构化数据为主,对于非结构化数据需要先转化为结构化数据;另外,对于传统统计对数据错误容忍度很低。在教学过程中很明确地告诉学生对于不能转化为结构化的数据,是无法处理的;对于有错误的数据,统计分析结果是不能采信的。

大数据则包含结构化和非结构化数据,其中绝大部分数据为非结构化数据,而且很多用传统统计方法是无法转化为结构化数据的。另外,大数据分析有高度容错机制,更为接近现实世界存在大量错误和混乱数据的实际。因而,大数据预测比传统统计预测有更高的精度。

3.2 获取数据的方式不同

传统统计学教授的数据获取方式为定向式搜集,不论是一手的调查和实验数据,还是二手资料的获取,都是为了明确目的而去主动搜集获取的,对数据来源的可靠性有很高要求。

大数据属于多源数据,对数据来源和产生没有过多要求,也不是为了特定的目的才产生的数据。大数据产生于互联网和移动互联网的应用普及,数据实时产生。随着物联网和人工智能的发展,数据增速大幅提升,主动连接、定向汇集和数据共享将更加明显。

3.3 研究对象重点有差异

传统统计学教学内容中有关抽样分析的比重很高,这与数据的可获得性有极大关系:随机样本数据较总体数据更容易。通过较低成本的随机抽样,实现以样本数据窥探研究总体的面貌。但是要从实际总体中进行完全随机抽样又是相当困难的,结果往往不能很好反映总体全貌,调查分析结果缺乏延展性。

大数据的多源性、实时性和可被共享性等特征使得大数据分析可以不再依赖随机抽样,实现“样本即总体”的全数据分析模式。避免了传统统计中样本代表性不强产后的“后遗症”,也不再需要根据分布的假设来推断总体特征。

总结来讲,传统统计学是先直接研究样本,在间接研究总体;大数据分析则是直接研究总体。另外,大数据分析更注重不同总体间相关关系的研究,而传统统计对因果关系更为看重。

3.4 统计分析思路有差异

传统统计分析思路是先假设再进行验证。具体来说,就是先根据研究目的提出假设,然后在通过收集来的数据进行验证假设是否成立。传统统计研究方法较为单一,主要是依据统计方法和相关理论建立模型,而后进行分析。如果假设本身存在问题,或者样本数据有问题,那么统计模型必将产生偏差,影响结果分析。

大数据直接研究总体,分析思路是先发现再总结。具体来说,就是通过数据挖掘和智能算法,对海量数据进行分析发现,找出有用的特征和关系,进而发现事物或现象的规律,然后指导决策和判断。大数据分析不需要先提出假设,也不需要理论模型,快速、高效,而且对数据有高的容错度。

4 统计学教学内容应增加对大数据基础知识的补充

基于前节的分析和教学实践反馈,现在统计学教学内容急需补充大数据分析的一些基本知识,让学生更好认识统计思维的重要性,数据量的变化带来的只是统计分析方法的进步。在大数据时代对传统统计的学习仍是必要的,两者在现实世界都有重要价值。笔者认为可在以下教学内容中进行补充:

4.1 统计数据类型

在以往统计数据类型的不同分类中,增加按照数据量和处理方法不同,可将统计数据分为:传统数据和大数据。完善以前按计量尺度不同、按数据来源的不同、按数据的收集方法不同、按数据描述的现象与时空关系不同等数据类型分类方式。

4.2 统计数据的收集

过去教学内容中,这部分主要讲第一手和第二手数据的搜集。大数据的搜集方式与其传统数据收集显著差异,但也有第一手(利用网络技术直接收集获取)数据和第二手(间接收集获取)数据。

4.3 统计数据处理

传统统计学教学中数据处理部分主要讲述数据的预处理和数据的图表可视化。在此部分可增加大数据处理的基本知识,如数据清洁、大数据可视化处理等内容。

4.4 统计分析方法

在统计分析方法部分,传统统计学教学内容主要分描述统计和推断统计两部分内容,重点讲授推断统计。推断统计从基础的参数估计和假设检验出发,到方差分析、相关及回归分析、聚类分析、因子分析等应用方法。

大数据分析也要用到描述统计的内容,但重点在数据挖掘。由于大数据使用全数据分析模式,所以假设检验及应用方法就不在适用,但聚类分析等方法的原理仍然适用。另外,关联分析、决策树分析(原理在管理学课程有讲授)、随机森林、人工神经网络等数据挖掘算法也可做简单介绍。

4.5 应用软件介绍

传统统计学教学会介绍一些常用的统计应用软件,如Excel、SPSS、Eviews等。那么在这部分,也可以增加一些大数据研究常用的应用软件介绍,如做海量数据处理有优势的Python软件和进行数据分析有优势的R软件,引导和鼓励学生自己探索学习。

5 结束语

大数据正在影响和改变着我们的工作和生活方式。统计学作为经管类专业基础的数据分析类课程,其教学要能跟得上时代的发展,使学生统计思维的学习和培养能较好适应时代的变革。传统统计学仍有很大价值,大数据的发展将会促进和推动统计学科的更好发展。

参考文献

[1] 游士兵,等.统计学(第三版)[M].武汉:武汉大学出版社,2018.

[2] 李金昌.大数据与统计新思维[J].统计研究,2014(1).

[3] 惠琦娜.统计思维是创造性思维[J].中国统计,2009(8).

[4] 陈超,沈思鹏,赵杨,陈峰,魏永越.大数据思维与传统统计思维差异的思考[J].南京医科大学学报(社会科学版),2016(12).

[5] 徐德义,林志恒.對大数据时代大学统计教学的认识与思考[J].大学教育,2015(11).

[6] 李冠军,贺世红.对大数据时代物流专业统计学课程教学内容改革的思考[J].广西师范学院学报(哲学社会科学版),2015(9).

[7] 刘素荣.大数据思维下经管专业统计学课程教学改革研究[J].高教学刊,2018(10).

猜你喜欢
统计学教学内容大数据
新冠疫情期间小学信息技术在线教学内容的选择和实践
大数据的统计学基础分析
统计学教学与实验实践的一体化整合初探
等差数列教学内容的深化探究
省属地方高校应用统计学专业人才培养模式研究
基于大数据背景下的智慧城市建设研究
难以一致的统计结果