田国华
[摘 要]大数据时代,传统统计学课程的教与学都发生了深刻变革。明确什么是大数据,厘清大数据和统计学的关系对学科发展至关重要。文章主要从教学内容、教学方法和教学手段3个方面探索教学改革的实施路径,以期学生能更好地运用统计学分析和解决工作和学术科研方面的问题。
[关键词]大数据;统计学课程;应用导向;实践导向
doi:10.3969/j.issn.1673 - 0194.2020.22.110
[中图分类号]G642.3[文献标识码]A[文章编号]1673-0194(2020)22-0-02
1 绪 论
随着大数据和人工智能时代的到来,人们对数据的关注度越来越高,大到国家政府,小到企业个人,都处于这个深刻变革的数据时代,无论情愿与否,都无法逃避。大数据时代赋予数据分析前所未有的使命,但也对其应用提出了严峻的考验。目前,人们对大数据的理解和认识存在很多方面的误区。其中,很突出的一个表现就是凡是数据都冠以“大数据”之名。另一个表现是国家将大数据产业发展作为战略布局和顶层设计后,各地纷纷成立了大数据中心、大数据机构以占领大数据产业高地。加强基础设施硬件建设的同时,还在加强“软件”建设。大数据概念的界定取决于定义者的观点和学术背景,归结起来,大数据指在一定的条件和合理的时间内,可以通过现代计算机技术和创新统计方法,有目的地设计、获取、管理和分析数据,揭示隐藏在其背后的有价值的模式和知识。
2 传统统计学与大数据概述
统计学是一门搜集、整理和分析总体的数据资料的理论和方法的科学。统计学作为社会经济管理等领域的方法论学科,是分析问题、解决问题的重要方法,在经济学、管理学、医学、生物学等学科应用十分广泛。传统统计学与大数据的主要区别分为以下7个方面。
2.1 样本概念的转变
传统统计学中的样本概念至关重要,只有在明确了总体和样本的概念后,才能根据研究任务和研究目的确定样本框和样本容量。在这种情形下,依据随机原则抽取的样本数据是稀缺资源,通过对该样本数据进行详尽的分析研究,可以实现样本最大价值,进而做出科学推断。而在大数据时代,大部分数据是网络数据,可以进一步分为静态数据和动态数据。
2.2 数据结构的变化
传统统计学中分析的数据为结构化數据,是通过统计调查依据事前设计而搜集整理的数据,可以用统计图和统计表呈现。大数据不仅包括传统统计学中的结构化数据,更常见的是半结构化数据、非结构化数据,甚至是异构数据,可以挖掘出比传统统计学更有价值的信息。
2.3 搜集概念的扩展
传统统计学中的数据分为一手数据和二手数据(统计图或统计表)。前者是通过统计设计、统计调查获取的数据;后者是经过整理可以直接进行分析的数据。大数据搜集需要经过以下3个步骤:先进行数据预处理,即数据清洗(识别与整理),再进行数据分析,从繁冗的数据中根据研究目的筛选出相关性较高且兼具价值的数据,最后进行数据存储。
2.4 数据来源不同
传统统计学中的数据无论是直接调查获取的一手数据还是借用经整理后的二手数据,共同的来源都是实地调查,区别仅仅是调查主体是否为数据需求者。由此很容易对数据进行事前安排、事中控制以及事后核对。如果大部分数据来源于网络,就无法做到事前安排,也很难做到事中控制,且数据很多时候是发散的,更不可能进行事后核对。
2.5 量化方式的变化
传统统计中的数据是结构化的数据,且量化方法日渐成熟。而大数据多为半结构化、非结构化数据,对其进行量化还存在技术瓶颈。目前,将半结构化及非结构化数据进行量化或者转化为结构化数据是一个非常重要的研究领域。
2.6 分析思维的改变
传统统计学中的数据分析思路为定性到定量再到定性;而大数据分析思路是从定量到定性。前者主要运用归纳法,这一方法依然是大数据分析的主要方法,后者仍然要通过个体的特征归纳出总体的特征。但对异常值的分析和研究往往更具深意,运用的是演绎法获取更细小的特征。
2.7 统计软件增多
传统统计学需要运用统计软件建立模型进行分析。常用的统计软件较多,依据是否需要编程可分为两类:一类是具备可视化菜单操作的软件,如SPSS,这些软件兼具编程功能,但相对而言,菜单操作功能更强大;另一类是编程软件,需要具备一定的计算机语言知识,如R语言、EViews编程、Stata语言。
3 大数据时代统计学课程改革的方向
统计学作为经济管理类专业学生的专业必修课程,各大高校和学者都在探索研究改革的方式和策略。东北财经大学的崔瑛认为在高等财经院校(系)非统计专业开设统计学课程时应开设“国民经济统计学”,其中,包括统计基本知识和国民经济统计两部分。惠琦娜认为只有将统计思维能力培养作为今后统计专业教育的重点,才能真正实现统计教育的可持续发展和统计市场供给和需求的长期平衡。王德劲认为将统计学教学内容进行“模块”设计,针对各专业需求,选择不同统计“模块”,可以充分调动统计学教师、各专业教师和学生的积极性和能动性,将统计学知识和方法教学与各专业存在的实际问题紧密结合。白日荣等认为统计学改革应侧重统计思想的传递与挖掘,多组织学生进行实践、实验活动,让学生在应用中学习。游传新同样是对教学内容进行模块设计,并提出了课程考核方式的改革。周国富则通过问卷调查的方式了解学生对统计学教学过程中的意见和建议。
统计学课程内容主要包括:统计概述、统计调查、统计整理、抽样推断、参数估计、假设检验、时间数列、统计指数、相关于回归分析。就目前的教学状况看,针对非统计专业开设统计学及相关课程教学时,应在教学内容、授课方式、教学手段和教材选用等方面进行改革。
3.1 教学内容的应用导向型变革
经典统计学课程内容仅涵盖最基本的描述性统计,很少涉及数据分析实践中必需的推断统计。无论是统计学的哪个模块,都应以应用为导向,重新整合内容,将课程设置为应用统计学的统计调查部分。学生在理解普查和非全面调查方法的基础上,基本可以依据给定的项目选择适当的方法。但统计调查绝不是单一的选择调查方法就可以搜集到数据,还涉及统计方案撰写等内容。即在调查阶段有调查方案,在整理阶段有整理方案,分析阶段相应也需要分析方案。这些方案的撰写和设计不是在调查事后确定的,相反,为了不偏离研究任务和研究目标,在事前就要制订完备的方案。尤其是调查方案中的问卷设计,是整个调查方案中最核心的部分,但目前的教学只能纸上谈兵,给定项目或自选项目,无法制定具有可行性和价值的问卷。想要打破这一局面,切实提高学生的应用能力,还需要学生在实践和应用中找到问卷设计的核心和要领。
①统计整理部分。学生掌握最多的是给定分组标志,从而进行统计分组,绘制简单的直方图和折线图。但不以应用为导向的学习必然无法根据项目的研究任务和研究目标自主选取恰当的标志,从而挖掘有价值的信息。②统计分析部分。统计学中诸如抽样分布、参数估计、假设检验、方差分析等内容是理解统计分析的关键,然而这部分内容在多数高校中放在概率论与数理统计课程中讲解,更多是从复杂的数理推导角度进行诠释。统计学原理课程因内容上具有重合性,一般不会再次讲解,然而从抽象的数理推导过渡到运用,还存在巨大的鴻沟,需要教师着重解决该问题。
3.2 教学方法的问题导向型变革
要改变传统的“教师讲、学生听”的授课方式,根据课程内容设计相应案例,同时采用互动教学方式。教材大多选用理论性强、但缺乏应用内容的教材。基于此,相关单位可从多种教材中博采众长,汲取精华,适时编写适用于应用型本科非统计专业使用的教材。此外,在提高学生对新知识的求知欲,保证他们学会经典统计方法的同时,要根据大数据发展的最新形势,运用恰当的方法搜集、整理、分析数据。
3.3 教学手段的实践导向型变革
学校应从实践角度出发培养学生的基本软件操作能力。统计学涉及的软件较多,如可视化的SPSS、ExceLR;程序化的EViews、SAS、Stata、Matlab等,本科阶段应至少掌握SPSS和Stata,应依托项目搜集数据,分析数据类型和结构,选取恰当的分析方法进行数据分析。
主要参考文献
[1]朱建平.大数据认知的误区[J].中国统计,2016(12):24-26.
[2]朱建平.大数据时代对传统统计学变革的思考[J].统计研究,2016(2):3-9.
[3]朱建平.大数据时代下数据分析理念的辨析[J].统计研究,2014(2):10-19.
[4]邱东.大数据时代对统计学的挑战[J].统计研究,2014(1):16-22.
[5]崔瑛.财经类非统计专业统计教学的改革[J].高教学刊,2015(20):28-29.
[6]惠琦娜.从统计思维能力培养看统计教学改革[J].统计与决策,2010(3):168-170.
[7]王德劲.非统计专业本科《统计学》课程“分块”教学与管理模式改革设想[J].统计与咨询,2008(5):70-71.
[8]白日荣,苏永明.非统计专业统计学教学的改革与创新[J].统计教育,2007(12):25-26.
[9]游传新.经济管理类专业统计学课程教学改革模式研究[J].长江大学学报:社会科学版,2009(4):246-247.
[10]周国富.高校非统计专业《统计学》课程教学内容改革应注意的几个问题[J].统计教育,2008(3):33-34.