崔连标,宋马林
(安徽财经大学 统计与应用数学学院,安徽 蚌埠 233030)
随着大数据时代的来临,如何搜集和处理数据资源变成一种非常重要的能力,并受到越来越多用人单位的青睐。可以预见,在未来的市场竞争中,那些既深谙领域内专业知识,又熟练掌握数据分析技术的人才无疑会成为大数据时代的宠儿,并在工作中获得更多的晋升和发展机会。统计学作为一门以数据为研究对象的方法论科学,在提升统计素养、培养创新能力方面有着先天的优势。现如今,愈来愈多的人通过学习统计学掌握数据分析的基本方法,借以提升自身的数据分析能力。如何提升统计学教学效果使之更加契合大数据时代要求,是该学科面临的一个重要问题。
作为为社会输出所需人才的教育机构,高等学校特别是财经类院校一直注重统计学教育,统计学也是经管类专业普遍开设的基础课程之一。近年来,财经类高校一直在加强统计学课程改革,通过对不同专业的学生开展统计教育,提升他们的数据分析能力,积极培养社会发展所需的高素质复合型人才。然而,目前我国的统计学教学存在同质化倾向,迫切需要加以改革。具体表现为,随着统计学教育由精英化向大众化方向演变,受教育对象专业背景和知识结构呈现出较大的差异性,但目前国内大多数财经类高校在统计学课程设置方面却千篇一律,不同专业大都沿用同样的教材、选用相似的授课方案和考核方式等,教师在知识传授时也未能区分不同学生的专业特点,导致学生厌学情绪严重,教学效果并不理想。如何破除同质化教学倾向,充分考虑不同受教育者的专业背景,是当前乃至未来一段时间统计学课程改革的重要方向之一。
鉴于统计学在高校经管类专业课程体系中的重要地位及其在学生能力培养中的重要作用,学术界对统计学课程改革进行了大量研究。
首先,诸多学者讨论了统计学在大数据时代面临的机遇、挑战和发展趋势等。例如,邱东从大数据能否淹没整个世界、统计学与数据科学究竟是何关系、大数据潮流对统计学产生怎样的影响等方面论述了大数据对统计学的挑战[1];朱建平等在剖析了国内外大数据研究和应用现状的基础上,提出了大数据时代的定义,并从统计学的角度界定了大数据概念[2];耿直分析了大数据时代统计学面临的机遇与挑战,探讨了国内外有关大数据的研究动向[3];赵彦云提出了大数据发展的统计设计观点,从理论和实践上做出了论证分析,探讨了我国大数据发展中的统计设计理论和内容要点[4];朱建平和张悦涵在大数据时代背景下,将统计学与大数据有机结合,剖析了大数据时代给统计学带来的变革,阐述了大数据为传统统计学带来的发展机遇[5]。
其次,也有一些学者就大数据背景下如何加强统计学教学改革进行了探讨。例如,朱怀庆分析了大数据时代对本科经管类统计学教学的影响及对策,认为统计学的教学应突出基础性,凸显应用性,着重培养学生的统计应用能力[6]; 薛艳从统计学专业发展的新特点出发,剖析了现有教学体系中存在的问题,提出了明确专业培养目标,重新设计主干课程内容等建议[7];王想基于大数据对统计学课程的影响,探讨了目前统计学本科专业课程设置中存在的一些问题,并提出了一些改革建议[8];刘帆围绕大数据时代对管理统计的影响,结合微课、慕课和翻转课堂新教育技术,对现代经管类管理统计学授课现状进行分析,提出了以培养学生数据分析能力为目的的教学改革[9];陈兆荣和雷勋平则从统计学教学模式存在的问题出发,分析大数据背景下统计学课程的教学目标,并从教学内容、学生动手能力培养、统计软件操作和考试考核方式等对统计学教学进行探讨[10]。
综上,尽管学术界对统计学教学改革展开了大量研究,但相关分析大都为定性分析,且主要集中在大数据对统计学发展的机遇、挑战以及统计学如何进行教改等方面,目前鲜有研究讨论异质化专业背景下统计学课程怎样加强改革。迄今为止,专业因素在我国统计学教育中还一直被忽视。那么,现有研究缺乏是否因为专业因素在统计学教育中并不重要?在异质化专业背景下,统计学教改又该注意哪些问题?基于此,我们采用方差分析方法,以安徽财经大学全校3 113名同学统计学期末考试成绩为分析样本,从实证层面探究专业背景与统计学学习效果之间的紧密联系,试图回答不同专业学生统计学学习成绩会否存在显著性差异,基于结果对未来统计学教改提出若干建议。
主要采用方差分析方法(Analysis of Variance,ANOVA)检验不同专业学生统计学学习效果是否存在显著差异。方差分析的基本思想是,从观测变量的方差入手,研究不同来源的变异对总体变异的贡献程度,从而确定可控因素对研究结果的影响。假设研究对象包含n种不同的学科专业,专业i有ni名学生参加统计学考试。用xij表示专业i第j名学生统计学考试成绩,xi表示专业i平均考试成绩,x..表示所有学生统计学平均成绩。则总离差平方和SST、组间离差平方和SSA和组内离差平方和SSE可以表示为:
SST=∑ni=1∑nij=1(xij-x..)2
(1)
SSA=∑ni=1∑nij=1(xi.-x..)2
(2)
SSE=∑ni=1∑nij=1(xij-xi.)2
(3)
可以证明,SST、SSA和SSE满足如下平衡关系式,即总变异性由组间变异和组内变异两部分组成:
SST=SSA+SSE
(4)
组间离差平方和除以其自由度得到组间均方误差MSA,组内离差平方和除以其自由度可得组内均方误差MSE:
MSA=SSA/(n-1)
(5)
MSE=SSEm-n,m=∑ni=1ni
(6)
根据方公式(5)和(6),可以构建检验统计量,如公式(7)所示:
F=MSA/MSE
(7)
可以证明,在原假设成立的情况下,即不同专业学生统计学考试的平均成绩都相等,那么上述统计量应该服从F(n-1,m-n)分布。假设检验水平为α,可知若公式(7)所得样本统计量大于临界值Fα(n-1,m-n),则拒绝原假设,否则将不能拒绝原假设。
分析数据来源于安徽财经大学2015—2016第二学年3 113名学生统计学期末考试成绩。统计学是安徽财经大学经管类专业开设的基础课程之一,也是传统的优势专业和教学改革示范专业。目前,安徽财经大学统计学课程选用的教材为曾五一和肖红叶主编的《统计学导论》,这也是“十二五”普通高等教育本科规划教材。统计教研团队统筹全校统计学授课任务,在教材选取、课程进度安排和课程内容设置等方面执行相同标准。统计学课程期末考试为计算机机考,题目类型涉及单选题、多选题、判断题和填空题,主要考察学生统计基本概念的掌握情况以及统计方法的应用情况。目前,安徽财经大学已构建较为庞大的统计学考试题库,每年期末之前都会聘请专业老师利用计算机随机组题,使得临近考生题目雷同几率大大减小。
在2015-2016第二学年,安徽财经大学共有3 144名学生选修统计学,但由于请假和缺考等各种原因,约有31名学生未参加最终的期末考试,比例接近1%。图1是3 113名统计学考试成绩的统计分布直方图。采用组距式分组方式,共设置50分以下、50~60分、60~70分、70~80分、80~90分以及90分以上六组。需要说明,由于期末成绩仅占最终成绩的80%,即便任课老师平时成绩给得再高,50分以下的学生也没有及格的可能;而50分以上的学生则可能因为平时成绩较高而及格,因此组距式分组的第一组选取50分而非60分作为边界。图1显示,50分以下的有238人,表明不及格学生占比7.65%;而90分以上学生有181人,在所有考生中占比5.81%,可见不及格比率略高于优秀率。由图可知,绝大多数考生成绩位于70~80分,该组共有876人,频率接近28.14%。总的看来,3 113名考生统计学考试成绩近似服从正态分布。
表1展示了统计学考试成绩的描述性统计分析结果。由表1可知,平均成绩为69.32分,小于中位数70.00分和众数72.00分,意味着3 113名考生成绩并不是严格对称,而是呈现左偏分布,即由于低分学生较多而拉低了平均考试成绩。此外,平均成绩、中位数和众数三者间近似满足Pearson经验公式,即(平均成绩-众数)≈3(平均成绩-中位数),表明成绩分布呈现轻微偏态。在3 113名考生中,最低分为26分,最高分为100分,标准差为13.15分,表明试卷区分度良好。偏度系数为-0.27,揭示成绩轻微左偏,即高分学生相对较少。峰度系数为-0.32,揭示成绩分布曲线相比正态分布曲线略微扁平,成绩分布相对均匀。
图1 统计学考试成绩总体分布
表1 统计学考试成绩描述性统计分析
在2015—2016第二学年,共有12位来自统计与应用数学学院的教师承担了全校统计学的授课任务。表2对不同教师统计学教学效果进行了比较分析。由表可知,尽管采用同样的教材、同样的教学方案以及同样的考试系统,不同教师教学效果存在一定的差异,其背后原因不仅与教师授课水平有关,也与不同教师所带的专业不同相关。具体的,从平均成绩来看,教师12所带学生平均成绩最高,为71.37分;教师4所带学生平均成绩最低,为66.82分,前者比后者高4.55分。从成绩波动性来看,教师6所带学生成绩分布相对集中,标准差为11.56分,而教师12所带学生成绩波动性较大,标准差为14.31分。从不及格率来看,不同老师教学水平差异较为明显,教师6所带学生不及格率最低,为5.50%;而教师2所带学生不及格率最高,为14.16%,后者约为前者的2.57倍。
表2显示,由于教学能力的差异,外加上不同老师所带学生的专业不同,12位老师的统计学教学效果并不完全相同,但是这种差异未能通过统计检验,如表3所示。由表3可知,组间离差平方和为3 022.14,组内离差平方和为533 436.97,组间均方误差为274.74,组内均方误差为172.02。假定显著性水平为α=0.05,由于检验统计量F取值1.60,小于临界值1.79,表明没有强有力证据拒绝原假设。因此,在置信水平95%的条件下,没有足够的把握说明不同老师教学效果存在显著差异。
专业背景也是统计学教育的一个重要影响因素。2015—2016第二学期,共有36个专业的学生选修了统计学课程,考虑到样本容量的约束,我们选取19个专业作为分析对象。这是因为,部分专业选修统计学课程学生人数过少,如产品设计和秘书学均仅有2人、行政管理和新闻学均仅有4人、广告学仅有6人和法学仅有8人。考虑到样本容量太小,若将这些专业纳入分析框架将会降低检验结果在统计层面的可信性。我们以10人作为界限,若某专业参加统计学考试学生人数超过10人,则该专业将被纳入分析框架,否则不予考虑。经过筛选,共有19个专业满足条件。
表2 不同教师统计学教学效果比较
表3 统计学考试成绩对教师因素方差分析表
表4对19个专业统计学期末考试成绩进行比较分析。由表可知,专业背景的确是统计学教学过程中需要考虑的重要因素,不同专业的学生由于知识结构和数理基础的不同,其统计学课程学习效果也存在较大的异质性。从平均分来看,FRM实验班平均成绩最高,为78.78分,商务英语专业平均成绩最低,为54.47分,前者比后者高出24.31分。从波动性来看,FRM实验班标准差8.73分,成绩波动性最小;国民经济管理专业标准差14.38分,成绩较为分散,后者是前者的1.65倍。从偏斜程度来看,财政学、工程管理和工商管理等6个专业偏度系数为正,显示这些专业高分学生相比较多,而其他13个专业偏度系数为负,成绩分布表现为左偏,即低分的学生相对较多。
表5是专业因素对统计学考试成绩的方差分析表。由表可知,组间离差平方和为19 831.38,组内离差平方和为507 161.63,组间均方误差为1 101.74,组内均方误差为167.10。假定显著性水平为α=0.05,则检验统计量F为6.59,远大于临界值1.61,此时P值为1.74E-16,表明有强有力证据说明原假设失真。因此,在置信水平95%的条件下,不同专业统计学学习效果存在显著差异。可见,专业因素是统计学教学效果中需要考虑的一个重要因素。
表4 不同专业学生统计学学习效果比较
表5 统计学考试成绩对专业背景方差分析表
本文讨论了异质化专业背景下统计学课程教学改革问题。研究采用方差分析方法,以安徽财经大学全校3113名同学统计学期末考试成绩为分析样本,从实证层面探究专业背景与统计学学习效果之间的关系。结果显示,在95%的置信水平下,不同老师教学水平虽略有不同,但差异并未通过显著性检验,而不同专业学生统计学学习效果的确存在显著差异。研究揭示了专业因素在统计学教学中的重要性。基于此,本文提出未来统计学教改应从以下四个方面加以完善:
一是编写专业性教材,制定个性化培养方案。由于不同专业学生学科背景和数理基础不同,对统计学相关知识可接受程度也不相同,为切实发挥统计学的教学效果,需要根据专业背景编写有针对性的教材,制定个性化的培养方案。教材编写应注重理论与实践的权衡,对大多数经管类专业学生而言,应淡化枯燥的概念论述和艰涩的公式推导,重点讲述统计分析方法的应用。同时,还需根据专业背景编写与之相对应的统计案例,增强统计学学习的趣味性。
二是变革统计学考核模式,突出应用能力的培养。现如今统计学考核还主要以笔试为主,虽然也实行计算机机考等改革探索,但考试内容还多偏向于基本概念的理解和理论公式的推导,对统计方法的应用能力考查不足。作为传统考试的有效补充,可借助统计建模的比赛形式,将学生划分若干不同小组,根据专业背景设置考题,重点考察学生利用统计分析软件和统计分析方法处理实际问题的能力。
三是从专业背景出发,增加统计案例教学量。统计学既注重理论,又强调实践,而案例教学正是连接理论与实践的纽带。案例教学通过把学生引入具体事件,使学生直接从现实问题出发,运用各种统计方法寻找问题的解决方案。为充分调动学生的主观能动性,统计学教学应该增加案例教学量,尤其是针对不同专业制作不同的统计案例库。
四是加大师资培养力度,培养适应不同专业需求的统计学教研团队。作为课堂知识的主要传授者,教师教学水平直接影响学生的学习效果。应该加大师资培养力度,统计学老师不能仅仅深谙统计学,还应对其他专业如经济学、管理学和会计学等有所了解,通过不断丰富自己的知识结构进而提升统计学教学效果。