王想(桂林理工大学 理学院,广西 桂林 541004)
大数据对统计学本科专业课程设置的影响分析*
王想
(桂林理工大学理学院,广西桂林541004)
摘要:在市场信息化和数据化时代下,统计学科得到了更广阔的发展平台。随着大数据时代的推进,政府和企业对统计人才的要求更加严格、标准更高。那么,统计学本科专业课程的设置势必要体现并满足大数据时代对统计人才培养的要求。本文基于大数据对统计学课程设置的影响,探讨了目前统计学本科专业课程设置中存在的一些问题,并提出了一些相应的改革建议。
关键词:大数据;统计学;课程设置
近年来,随着博客、微博、社会化新闻和网络论坛为主的社会化媒体迅速充斥整个互联网空间。互联网从一个简单的信息发布技术平台演变成为社会化媒体的主要载体,发展为一个交互式的信息发布、共享、交流与协作的社会化网络。数据正在以一个前所未有的速度产生着,数据量以爆炸式的方式增长着。大量的事实表明我们已经处在了一个以“大数据”命名的时代。与此同时,政府也意识到数据信息的经济开发价值,并在《“十二五”时期统计发展和改革规划纲要》中明确提出:“建立现代统计体系就是建立以现代信息技术为支撑的方案设计、任务布置、过程控制和行为监督的统计系统。”2015年3月3日在北京召开的“数字两会”让老百姓实实在在地通过数据的对比感受到了生活的变化和时代的变迁。可见,政府、企业乃至老百姓都已经认识到大数据的价值,所以大数据相关人才也成为社会各界争抢的对象。如何培养符合大数据时代背景下所需要的人才?这使得各大专院校统计学专业如何适应大数据时代的要求有针对性地进行课程设置而不得不面临较大的机遇和挑战。
“大数据”一词最初由统计学家提出,是随着社交网络、云计算、物联网等的兴起而产生的。它不像我们过去那些数值型数据那么简单,但至今它也尚无确切、统一的定义。有人用“4V+ 1C”来形容大数据的特征,即前所未有的数据规模(Volume)、变化多样的数据结构(Variety)、讲究时效性的快速数据处理(Velocity)和包含有限价值的数据信息(Value)以及分析处理数据的巨大难度(Complexity)[1,2]。最根本之处就是数字化基础上的数据化。通俗地说,大数据就是一切可记录信号的集合。2014 年11月,美国统计学会发布的统计学本科专业指导性教学纲要,就是在大数据背景下对2000年首次发布的指导性教学纲要进行的一次全面修订和更新,主要强调了统计理论和统计计算及编程的重要性、数据的真实性、统计模型和方法的多样性以及数据分析结论的可视化和可理解性等四个方面的内容[3]-[7]。通过参照多方对大数据概念的理解,作者认为大数据的概念是指除了对海量数据进行挖掘、收集、处理和分析以获得凭直觉难以发现的有用信息,从而揭示数据隐藏的统计规律和发展趋势外,还应充分理解数据的产生机理和运行机制以揭示数据的自然属性和应用背景,为相应领域决策者所用,它代表了大一统的信息资源,却也预示着信息资源的复杂多变性,当然也就意味着需要多学科方法的交叉使用以保证信息资源快速处理分析的时效性。
大数据时代的来临,对于统计教育工作者而言,为了更多更好地培养符合大数据时代所需要的统计专业人才,最大的考验和“本领”就是如何让学生熟悉了解海量数据信息的背景知识以及掌握深度开发和利用海量数据信息的分析方法,这就要求统计学既要从理论上又要在方法上进行教学改革。然而,无论是理论还是方法上的教学改革均可以通过统计学专业课程设置得以实现。目前,统计专业的课程设置注重学生统计思维的养成。因为统计学是一门方法论科学,在长期的发展过程中,形成了很多具有特色的统计思维,这些统计思维对处理不确定现象、分析数据和解释数据等都有巨大的影响,成为统计教学的核心内容。但在大数据时代背景下,由于数据分析直接针对总体,而且具有复杂性和混杂性,因此,有些统计思维可能用不上,就必须摒弃掉,但也需要统计学随着环境的变化不断创新出新的统计思维。目前统计专业课程设置中存在以下几个主要问题。
(一)专业课程设置重理论而轻应用
目前的统计专业必修课程设置一般包括专业基础课程和专业核心课程两大类。专业基础课程主要是指数学类的基础理论课程(如数学分析、高等代数、概率论和数理统计等),而专业核心课程则包括许多统计应用主干课程(如实用回归分析、应用时间序列分析、多元统计分析、抽样调查和统计软件等)。然而,即便是专业核心课程,其课程设置还是理论课和实验课的标配形式,其课时数的配比一般为3:1。因此,无论是基础课程还是核心课程,其教学模式一般采用的还是以理论教学为主,虽然也辅之以很少课时量的上机实验,但是教师主要还是依托于教材,对统计专业课程相关理论和方法逐一进行介绍和论证,对涉及到的公式和定理进行推导和演算。学生听和记,真正理解的内容并不多,真正付诸于实际应用的就更少了。在如此专业课程设置下,学生对专业课程的学习不仅兴趣不高,而且容易对课程产生抵触心理。
(二)统计相关软件课程设置参差不齐
现在各高等院校统计专业软件课程设置不尽相同。核心课程里专门设置了统计软件课程,专业选修课里则呈现出相当的不确定性,有些开设了R语言程序设计,而有些则开设的是SAS语言统计分析,也有些专门开设Eviews操作课程。然而,这些软件课程由于选修性质的限制是否开设完全取决于选课人数,而且,这些软件课程的教学往往注重于软件现有模块的应用而忽略软件本身程序语言和函数的应用以及编程设计。另外,所有应用主干课程都配备有应用专门统计软件进行数据分析的上机实验。由于应用主干课程教材的多样性和难易程度不同,不同的教材都附有不同软件的程序命令以供教学使用。但是,很多教学都基于“就易不就难、从简不从繁”的原则选择教材,从而导致上机实验课程仅限于Excel和Spss菜单式和模块式的操作,这显然满足不了大数据时代数据分析的要求。
(三)实践实习课程设置过于单一
就我国国情而言,有一部分高等院校应用统计专业学生能够参与到当地政府部门承接的农业人口调查、人口普查和经济普查等社会性调查实践当中,但终究创造不了效益。而大多数高等院校应用统计专业与企事业单位之间很难找到利益共同点,所以实习课程的设置就受到限制,使得大多数高等院校应用统计专业在安排实践实习课程时更偏重于校内实习,对开展社会调查的活动仅仅局限于本校学生,并没有跨出校门。因此,实践实习课程设置的单一化直接导致了学生在学习统计和运用统计之间不能较好地衔接。
(四)统计计算的不够重视
传统的统计教育比较重视统计思想的理解和统计理论的数学推导,而对统计计算不够重视。随着计算机技术的不断发展,用直观的数值模拟代替复杂的数学推导,在许多情况下不仅不会降低精度,而且结论更加容易理解,这对应用统计专业的学生而言无疑是非常行之有效的学习方法。但是,很多高等院校应用统计专业本科教学并未有统计计算课程的设置。
在大数据时代背景下,企事业单位对统计人才的规格要求较高,不但要求具备一定的统计理论与方法,而且更重要的是要求能够运用现代化的信息处理技术来解决大数据带来的新问题,以给决策者提供作出决策的理论依据。从而,对于统计教育从业者而言,如何培养适应大数据时代的需求和要求的统计人才是亟待解决的问题。而课程设置作为统计专业人才培养的基础就必须要尽量做到全面、合理和协调。为此,作者结合十来年的统计教学经验,对统计学本科专业课程设置提出以下几个方面的思考。
(一)强调统计应用课程的设置以及统计方法的应用
除了在统计专业核心课程中设置统计应用主干课程外,还可在专业选修课程中开设尽可能多而且广的统计应用课程,以供学生可以不受学分限制而仅凭兴趣选择。而且,无论是核心应用课程还是选修应用课程,由于课时的限制应该着重介绍统计方法从实践中的应用强化上机实验过程,以加强统计方法的实用性,进而提高学生的专业学习兴趣。
(二)加强和规范统计软件课程,强化统计计算
作为统计教育者,在教学上能够让学生熟练掌握一款统计软件的程序语言并进行编程操作,那么学生在实践当中就能得心应手地进行数据的处理和分析。目前应用最为广泛的统计应用软件当属R和SAS。SAS软件被许多公司和企业用于大型数据管理和数据分析,在实际应用领域尤其是工程领域具有长期而深远的影响。而R则是免费软件,统计建模和统计计算功能强大,也是最新统计计算方法发布的主要平台,非常有利于培养学生的编程能力和知识更新能力。当然,教学中也可以尝试使用其他专业统计软件,如Stata和Eviews等。因此,受制于学时和学分可以考虑开设某一款足够灵活强大的统计软件语言程序设计课程。同时,应用主干课程则可考虑配套该统计软件进行上机实验或实践。但总而言之,基于EXCEL讲授统计方法的时代应该早已结束。
(三)实践实习课程的多元化设置
在现有的实践实习课程中,数据的收集与整理、数据处理分析实践和统计软件包设计等实习课程可以发动学生参与到政府统计部门的社会专项调查以及企业单位的项目市场调查当中,并与这些企事业单位成立联合教育培养基地为以后的学生提供更好的实践实习平台。另外,为了顺应某些经济部门和金融行业必须时常进行效益分析、风险分析以及市场满意度调查分析等的需求,可以为学生增设和建立相应的实践实习课程或平台。如商务数据实验室平台、金融数据分析实验室平台和电话调查访问系统实验室平台等。
大数据时代是一个以数据为中心的时代,统计专业人才不仅要揭示数据隐藏的统计规律和发展趋势,还要充分理解数据的产生机理和运行机制以揭示数据的自然属性和应用背景。2013年,我国统计类本科专业进行了一次较大幅度的调整,把原来的一个统计学专业拆分成现在的统计学、应用统计学和经济统计学等三个本科专业。全国各大院校随后都相应地进行了人才培养方案和课程设置方面的修改。比如,许多高等院校增设了大数据背景下数据管理、分析与挖掘的技能与方法类课程,尤其增加了一些有关大数据的统计实践类课程。在这种情况下,统计学本科专业课程设置如何体现并满足大数据时代对统计人才培养的要求亟待解决。然而,作者认为,统计学本科专业课程的设置是一个不断探索、不断更新、不断完善的长期过程。
参考文献
[1]张海波,黄世祥.统计学专业学生大数据分析能力的培养方式选择[J].统计与决策,2014.
[2]李金昌.大数据与统计新思维[J].统计研究,2014,6.
[3]张维群.大数据时代统计学科建设与教学改革专家研讨会纪要[J].统计与信息论坛,2015.
[4]孟生旺,袁卫.大数据时代的统计教育[J].统计研究,2015,4.
[5]American Statistical Association.2014 Curriculum Guidelines for Undergraduate Programs in Statistical Science[EB/OL].http:// www.amstat.org/education/curricu-lumguidelines.cfm,2014-11-15.
[6]American Statistical Association.2000 Curriculum Guidelines for Undergraduate Programs in Statistical Science[EB/OL].http:// www.amstat.org/education/2000curriculumguidelines.cfm,2014-11-15.
[7]G.Rex Bryce,Robert Gould,William I. Notz,etal.Curriculum guidelines for Bachelor of Science degrees in statistical science [J]. The American Statistician,2001:7-13.
Abstract:Under the market information and digital era, the statistics got a broader development platform. With the advance of the big data era, the government and the enterprises even strictly require statistical practitioners to have higher standards than before. Then, the offering of statistics courses must reflect and meet the requirements of statistical personnel training in the era of big data. Based on the influence of the curriculum setting, this paper discusses some current problems existing in the undergraduate courses setting of statistics, and proposes some suggestions on curriculum reform.
Keywords:big data; statistics; curriculum setting
中图分类号:G642
文献标志码:A
文章编号:2096-000X(2016)05-0199-03
作者简介:王想(1981-),男,广西桂林,硕士,讲师,主要从事统计专业课程教学工作。
*项目:广西高等学校优势特色统计学专业建设点,桂教高教(2014)52号;统计学广西重点学科,桂教科研[2013]16号。