大数据背景下应用统计学专业改革探讨

2016-11-22 08:03吴群英蒋远营张浩敏王想王彬邓光明
教育教学论坛 2016年43期
关键词:大数据教学改革

吴群英 蒋远营 张浩敏 王想 王彬 邓光明

摘要:大数据给应用统计学专业带来机遇与挑战。本文针对应用统计学专业的自身特点和大数据下的新特点,剖析了现有教学体系中存在的问题,探讨和改革了应用统计学专业人才培养目标定位、课程调整与设置、教学内容、教学手段等。

关键词:大数据;应用统计学;教学改革

中图分类号:G642.0    文献标志码:A    文章编号:1674-9324(2016)43-0101-03

一、研究背景

自2002年桂林理工大学在广西开办了第一个统计学本科专业以来,针对当时理学学位的统计学专业培养的学生虽然数理基础相对扎实,但普遍统计思想不够,实际应用能力较弱的现状和特点,对统计学专业进行了全方位的改革研究,确立了"数学与统计学相融,从培养学生扎实的数理基础和极强的统计分析应用能力有机相结合的理念出发,构建了新的課程体系和教学内容,取得了系列研究成果。2009年研究成果开创“应用性、实验性、案例性”一体化的统计学专业课程体系和教学模式,获得广西高等教育自治区级教学成果二等奖[1],并在其后分别把统计学学科建成广西重点学科和广西高等学校优势特色专业,以及把应用统计实验室建成广西高等学校重点实验室。

虽然我校统计学专业的教学改革和建设取得了许多成果,但近几年,我们也逐渐感觉到在大数据新形势下,我校应用统计学专业的教学体系还有一些不适应的地方,且某些问题还有日益凸显的趋势,我们原来的某些研究成果已不再适应新时代的要求,这就迫使我们继续进行改革研究,探讨在大数据背景的新形势下,如何培养统计学专业复合型和应用型人才,如何准确把握统计学的发展方向与发展形势,如何调整人才培养模式,如何调整相关课程和课程内容,以培养适应大数据背景下社会经济发展需要的统计学专业人才。

许多国家越来越重视数据在大数据时代重要作用,我国也不例外,2012年9月,国家统计局第7次局务会提出,尽快开展在政府统计中应用大数据的研究。2013年可以看作是我国政府统计之大数据元年。2015年9月《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)[2]颁布,标志着我国正逐步进入大数据建设的新时代,为此,国家统计局积极推动大数据在各方面的应用与实践。而大数据的核心是数据,应用统计学学科是与数据分析处理联系最为紧密的应用性学科,因此,应用统计学专业的教学体系应顺应大数据发展的趋势。在大数据背景下,应用统计学专业在继承传统数据分析技术的基础上,对所需的数据处理技能提出的需求更高了。这就是说,大数据对应用统计学的培养目标,以及教学内容等的冲击无疑是最大且不可避免的,这给应用统计学专业带来了巨大的挑战,同时也为应用统计学学科的发展带来了前所未有的机遇。

大数据逼迫人们改变分析、处理数据的手段、思维和理念,这就逼迫应用统计学专业改革必须引入新手段、新思维和新理念。培养应用统计学人才必须与时俱进,才能不断适应大数据新时代的要求,这关系到应用统计学专业培养的人才能否适应和满足社会的需求,因此,这一研究是十分必要、十分迫切且有着重要的理论和实际应用意义。

二、大数据背景下应用统计学专业的改革探讨

1.培养目标的转变。大数据时代给应用统计学带来机遇与挑战,同时引发了对应用统计学培养目标的新思考。目前应用统计学专业教学体系的培养目标是,培养学生收集、整理和分析数据的能力的“应用型”专业人才。然而,在大数据背景下,除了要求学生具备数据收集、处理和分析的能力外,还要对其应用领域的背景知识有所了解,这就要求应用统计学培养“复合型”专业人才。因此,如何从培养“应用型”向“复合型”人才进行转变,是在大数据背景下应用统计学专业培养目标必须解决的首要问题。在定位应用统计学专业的人才培养目标是培养“复合型”专业人才后,就得重新探索教学体系的调整和设计。传统的应用统计学专业教学体系专业的主干课程有数理统计、抽样技术与方法、回归分析、计量经济学、多元统计分析、统计软件等。而在大数据下,强调对全数据开展分析,不需进行随机抽样,即不是在给定的精确下,利用样本推断和分析总体;同时,大数据注重数据之间的相关关系,而不是像传统统计那样强调数据之间的因果关系。现有的教学体系没有涉及这些内容,与大数据时代的要求有些不相适应。因此,我们必须创新传统的应用统计学专业教学体系,重视大数据的不同的分析方法、分析技术,在课程设置、教学内容等都要围绕着数据的分析方法和技术展开。

2.教学内容改革探讨。虽然在大数据时代下,必然要对数据收集、分析方法等进行改革和创新,但与此同时我们也清楚地意识到,对大数据的搜集、分类、分析等都仍需要依赖传统的统计学方法,因此,大数据分析离不开传统统计学,大数据分析是对传统统计学的补充而不是替代,建立在样本统计和预测分析之上的传统统计学仍发挥着主导作用。所以,在应用统计学专业的改革中,我们强调深化基础,培养拥有厚基础、宽口径的学生。加深应用统计学基础理论知识学习,夯实数学基础知识,让学生学好数学分析、高等代数、概率论、数理统计等基础课程,打好理论基础,通过这些课程的学习不但打好学生的数理基础知识,培养他们的抽象思维能力和逻辑推理能力,因为只有理论基础打牢了,才有后劲,才能更好地学习新知识,适应新形势下的要求。同时,在大数据背景下,应用统计学专业课程教学要培养宽口径的统计学复合型人才,由于一些大数据充满了各种随机的、非随机的误差和偏倚,不满足传统的统计方法和理论对数据的苛刻要求,不能用传统的统计方法进行分析。因此,必须对现有的应用统计学专业的课程体系、教学内容等作出相应的调整和改革。这就需要对应用统计学专业课程内容进行协调和整合,在精选知识、内容衔接与交叉融合上狠下工夫。探索在一些课程中,增加介绍一些大数据方面的概念和应用,例如在时间序列分析、多元统计分析、统计预测与决策分析等课程内容中引入大数据分析的理论和实践案例。大数据对统计学专业人才提出了更高的要求,除了应具备数据收集、处理和分析的能力以外,还应具备很强的自我学习、自我提高的能力,以适应大数据时代数据量大、总类繁多、时效性高等发展特点。这就要求学生自主学习、阅读大数据等相关资料,掌握国内外最新动态和进展,这可通过布置课外作业、课外读书报告和课外论文检查学生自主阅读学习的效果。同时,特别要注重课程的开放性教学和研究,以适应大数据时代的要求。(1)样本概念的深化。全样本(总体)研究是大数据方法的重要特点。过去,由于缺少收集和分析数据的各种工具,数据收集、处理能力受到限制,因此,产生了随机抽样的理论方法,从而达到用较少的样本推断、预测总体的目的。然而,大数据时代数据收集、处理的方式和技术都发生了翻天覆地的改变,现在我们可以通过数据库、互联网、各种通讯工具等获得各种各样的海量数据。这时,随机抽样在某些情况下就失去了它原有的意义、地位和作用。方便、廉价的数据收集,数据处理、存储能力的提高,使得全数据分析模式成为可能。因此,大数据背景下不需随机抽取,可用总体进行分析,也可用与分析目的相关的数据进行分析。所以,在大数据时代,传统应用统计学面临着新的任务和挑战,首先要改变对样本、对不确定性等的重新认识,转变抽样调查的功能和地位,建立新的收集、梳理、分类数据的方法。大数据的分析和处理与传统样本数据的分析和处理的方法有许多不同,传统的统计学的理论和方法是以随机样本来推断总体,即它的理论和方法几乎都是建立在样本的基础上的,是建立在随机抽样基础之上的统计推断,其理论基于"样本数据-分布理论-概率保证-总体推断",这种用样本推断总体的理论和方法,不可避免的会出现误差。而大数据时代的特点是信息处理迅速、获得途径广泛、价值密度低,这样在处理数据时就不需要进行随机抽样,可以全体数据作为样本,而即大数据关注的不是随机样本,而是总体,这不同于传统的统计推断分析,大数据时代可以收集全数据进行分析,这一特点刚好能弥补样本统计必然会带来误差的劣势。因此,应用统计学应该补充、适应大数据时代的全数据分析模式,将大数据总体统计的思想、思维和方法纳入到教学体系和教学内容,从传统的样本统计转向样本统计和总体统计相结合,这是应用统计学发展的必然趋势。探讨在什么课程、如何引入全样本统计尤其重要。我们研究实践了在抽样技术与应用等课程教学中,新增大数据背景下的全样本理念,阐明样本统计和总体统计的差别、如何搜集大数据,以及大数据样本常存在缺乏代表性、信息冗余、存在噪声、呈现重尾分布、长相依和不平稳性时如何选用合适的统计分析方法,以尽量避免分析结果的系统偏差等。(2)相关分析与因果分析并重。在传统统计分析中,因果关系占据重要的地位。我们可以根据概率P值进行因果关系检验,从而确定两个变量之间是否存在着显著的因果关系。即传统统计分析是建立在假设的基础上揭示数据相互之间是否存在因果关系,因此,传统统计分析比较注重因果分析。但大数据时代由于数据海量、结构复杂、要求数据处理速度快等特点,造成因果分析往往不可行。而相关关系分析不需要建立在假设的基础之上往往可行,且相关关系分析不易受偏见的影响而发生错误。因此,大数据改变了传统统计注重因果关系检验的思维,注重相关关系分析,而不是因果关系分析,大数据时代的重要特点是注重相关分析,以及建立在相关分析基础上的预测分析。侧重相关性研究的思想是大数据方法的重要特点,大数据时代相关分析方法的重要性日益凸显。大数据时代,相关分析的运用范围之广、重要性之大引起了我们的重视和研究,我们在教学中从传统的注重因果分析向相关分析与因果分析并重转变。传统的相关分析基本上是线性相关分析,大数据研究的相关分析不仅是线性相关,更多的是非线性相关关系。传统的统计研究方法,如建立各种回归方程、估计模型参数、假设检验等因为大数据的特点而无法实施。针对大数据的相关关系分析不同于传统的相关关系的分析,我们在教学中重点不是做传统的逻辑推演,而是重点阐明如何搜索、分类、归纳、分析大数据,以及如何找出数据之间的相关性并据此进行预测。阐明大数据时代相关分析思维的重要性,以及相关分析在特征选择、变量依赖关系识别中的实用性。

3.创新实践教学模式,加强实践教学。虽然我校应用统计学专业在上一轮的教学改革中,已十分重视增强了实践教学环节,增加了许多实践教学内容。但是,我们仍然意识到在大数据背景下,我们的实践教学体系、实践环节、实践内容、实践工具等仍有许多需要改革的地方,因此,我们对实践教学进行了梳理并加以改革。

我们原来的实践教学以统计模型和软件为基础进行数据分析处理,对数据间的数量关系构建统计模型,通过寻求一些适合模型的数据来说明统计模型的意义,即是以模型驱动为主的实践教学模式。但这种模式已不太适应大数据时代的要求,大数据时代数据是海量的、复杂的,在处理数据的时候,必须根据数据的特征选择适合的统计模型,加强统计建型之前对数据进行检验、识别的实践教学。随着对统计模型越来越精细刻画的要求,以及大数据愈来愈趋于更加复杂的模式,这种统计建模前事先的检验与识别将越来越凸显出其必要性和重要性。因此,我们加强了培养学生如何通过探求数据可能的潜在结构,让数据本身寻找一个适合的统计模型来描述和刻画,利用数据自身的特点寻找最合适的模型表达形式的能力,这是大数据建模必然要求的能力。我们从数据出发开展实践教学,培养学生以数据驱动而不是以模型驱动的思维方式,探讨和实践了从以模型驱动的实践教学模式轉变为以数据驱动的教学模式,并辅以课后项目式训练、校外实习基地锻炼的创新型实践教学模式,让学生了解和掌握整个数据分析实践的流程,激发学生学习的兴趣,培养学生学以致用的思维和解决实际问题的能力。

统计软件是分析和处理数据的工具,原来我们主要讲授的是SPSS和Eviews这两种统计软件,因为它们处理一般的计量模型和时间序列比较方便。但是,大数据的海量性和复杂性,一些大数据已无法用这两种软件处理。而R软件和SAS软件有强大的数据处理和数据分析功能,因此,我们把R软件和SAS软件融入到专业课程的大数据实践教学环节中,将统计软件与课堂教学相结合,强调统计数据、计算机编程以及统计软件分析相结合。为了进一步激发学生学习、研究统计软件的热情,我们还在学生中成立了R软件协会,将R软件与大数据结合起来,同学们在R软件协会处理、分析大数据,根据数据的特征编译、创造出新的计算方法,以及根据数据的特征选择建立适合的统计模型,以满足、适应实际需要,他们在R软件协会中相互学习、相互交流、相互提高,积极性很高,成效显著。

综上所述,针对大数据时代对统计学人才的需求,我们对应用统计学专业的培养目标、教学内容以及实践教学都进行了改革探讨,采用增强应用统计学专业课程的开放性、交叉性以及教学、实践方式多样性的新型教学模式,切实提高学生处理数据的动手能力和创新能力,培养适应大数据时代的应用统计学人才。

参考文献:

[1]吴群英,林亮,徐海云,邓光明,王远清.开创“应用性、实验性、案例性”一体化的统计学专业课程体系和教学模式[J].桂林理工大学学报,2010,30(高教研究专辑):122-125.

[2]国务院.国务院关于印发促进大数据发展行动纲要的通知,国发〔2015〕50号[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

Applied Statistics Reform under the Background of Big Data

WU Qun-ying, JIANG Yuan-ying, ZHANG Hao-min, WANG Xiang, WANG Bin, DENG Guang-ming

(College of Science, Guilin University of Technology, Guilin,Guangxi 541004 ,China)

Abstract: Big data era brings opportunities and challenges for applied statistics rofessional. Aiming at the characteristics of applied statistics and new features under the big data, analyzes the existing problems in the teaching system, we explore and reform professional talent training target, course adjustment and setting, teaching content, teaching means of the applied statistics.

Key words: big data;applied statistics; teaching reform

猜你喜欢
大数据教学改革
大数据环境下基于移动客户端的传统媒体转型思路
中职学校“生本课堂”的调查研究与实践
高校三维动画课程教学方法研究
基于人才培养的技工学校德育实效性研究
现代信息技术在高职数学教学改革中的应用研究
以职业技能竞赛为导向的高职单片机实践教学改革研究
微课时代高等数学教学改革的实践与探索
基于大数据背景下的智慧城市建设研究