南京邮电大学管理学院 楚永杰
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学的应用范围几乎覆盖了社会科学和自然科学的各个领域。因此,统计学一直也是大学里教授最广泛的学科之一。伴随“互联网+”和新媒体技术的快速发展,大数据时代已然来临。从数据到大数据不仅是量的积累,更是质的飞跃。海量的不同来源、不同形式、包含不同信息的数据可以很容易地被整合、分析,原本孤立的数据变得互相联通。这使得人们通过数据分析,能发现小数据时代很难发现的新知识,创造新的价值。源源不断产生的数据一方面为统计学学习提供了丰富的数据素材和基础,另一方面,复杂多样的大数据使得传统的统计学方法面临局限和挑战。在数据丰富的数字经济时代,为了避免“数据充足而方法匮乏”导致的理论方法与实践应用严重脱节的现象,分析大数据时代统计学教学面临的挑战,探讨如何跟进社会对数据分析人才的需求,与时俱进地改革完善教学方法,对统计学的发展以及学生数据分析能力的培养有着重要的意义。
统计焦虑是指学生对统计学课程的担心或者恐惧引起的心理焦虑状态,由华威大学的Cynthia Siew教授等提出。回顾统计学的教学过程,通过与学生交流以及课上的观察,对于包含了较大比例文科生的经管类专业学生,笔者确实感受到学生对统计学的学习存在着焦虑,主要表现在以下三个方面。第一,由于数学知识引起的焦虑。统计学依赖微积分、概率论等数学类先修课程,学生对于数学课程的恐惧自然延伸到统计学的学习;学生对统计学的学习态度、动机水平与对数学的普遍厌恶有关,可能担心自己缺乏数学技能,这反过来会使统计学难以理解。第二,对于学习内容的焦虑。统计学教学的内容广、概念多,但是学习时间一般在50课时左右,给学生消化、吸收所有的知识提出了较高的要求,导致学生对统计学学习的焦虑。第三,由于数据引起的焦虑。统计学的目标是探索和解释数据,但是数据的多样性,特别是大数据的复杂化、异构化,让学生对处理数据产生惧怕感。
目前,本科生统计学教学内容基本包含三大模块,即描述统计、推断统计以及相关统计的应用。描述统计注重利用一些概念或者指标对数据进行分析和探索,比如考察数据分布的集中/离散趋势、偏态、峰态等,以为统计推断选择模型和方法提供基础;而推断统计的范式则是选择模型进行计算和验证。因此,描述统计和推断统计学习逻辑存在较大差异,同时这两部分内容涉及的概念很多。尽管所有的概念从整体上看它们之间的关联是很强的,但是由于相关概念是循序学习的,学生理解这些概念很难从整体上厘清它们之间的关联,以及这些概念的意义和用处,对概念的理解碎片化,给统计学的学习带来一定障碍。另外,统计学中涉及一些相似概念,比如拟合优度与判定系数,尽管它们的计算公式是一致的,但是在不同的场景下,他们表达的含义有所区别。概念理解的碎片化会进一步造成对这一类概念的混淆,提升统计学学习的难度。
相较于微积分、概率论等课程,统计学是一门偏向应用的课程。受限于课程体系的设置、统计学教学时间的安排等因素,本科生统计学教学和考核更加偏向理论,而忽略了相关理论的应用。比如,在单因素方差分析这一小节,目前的教学侧重从理论上明确单因素方差的适用条件,即数据服从正态分布时才能使用单因素方差分析,但是在实践应用中,服从正态分布的条件几乎是不可能实现的,当数据不完全服从正态分布时,单因素方差分析的效果如何、得到的结论是否可靠等,是学生很难通过理论学习明确的。因此,实践性不足是学生学习统计学面临的一个问题。同时,因为缺乏实践,学生不理解统计学与自身学习的相关性,或者认为自己无须具备统计学方面的技能,缺乏参与统计学学习的动机。
改善统计学教学效果的第一步是努力提高学生参与统计学学习的动机。这主要包含两个方面,一是减少学生对学习统计学的忧虑,二是培养学生对统计学的个人兴趣。在设计统计学课程时,应该考虑经管类专业学生对数学和统计学的焦虑,实施一系列创新的教学策略降低学生的焦虑。首先,要承认和关注学生的焦虑并提供鼓励,教师可以利用灵活的办公时间对学生提供额外支持,及时解决学生的疑问和困惑。其次,在统计学考核中,可以采取等级评分制度而不是百分制,在考核层面降低学生的焦虑。最后,鼓励学生积极思考和总结所学内容及存在问题,并在课堂上进行讨论,通过促进学生与教师之间的对话减少统计焦虑。调查发现,很多学生认为学习统计学是困难和枯燥的。要提高学生参与统计学习的动机,教师必须努力改变这种看法,让学习统计学变得既简单又有趣。具体而言,可以通过以下方式:第一,选择真实的数据并将其与实际背景和目的结合起来,体现统计学的实际应用价值;第二,借助统计软件快速分析数据,减少理论推导,降低学生数据分析的难度。
统计思维和统计素养,是大数据时代经管类专业学生应具备的技能和素质。教授统计思维,首先应该在统计概念层面帮助学生建立完整的统计学面貌。错误的概念理解(如机会、概率、假设等)会阻碍学生学习,尤其是当学生错误地认为他们已经理解了这些概念时。教师在强调不同概念时,应该解释其如何与统计学相关,帮助学生以一个连贯的整体体验统计学,而不是试图掌握一堆孤立的事实。教师应该制定一套有关统计技术的概念和原则,提高学生的概念应用水平。例如放弃使用统计表,转而使用应用程序查找p值,从而将重点放在p值的解释上,而不是寻找p值。其次,统计学是解决问题和决策的调查过程,在处理大数据时,本质上是对多变量的理解,因此在统计学授课中,教师要对实际问题进行拆解,以多变量的视角分析问题,从而在统计学教学中培养学生的多变量思维。统计素养是指理解和批判性评价日常生活中统计所涉及问题的能力。教师应该善于从日常生活中发现和提取统计学相关的案例,借助案例讲解和分析提升学生理解和评估统计数据的能力,使学生不仅成为统计学的实践者,也成为有统计素养的公民。
面对海量、多样的大数据,学习统计学的主要目的是学习数据分析能力。第一,鼓励学生利用互联网寻找有用的统计学资源,包括统计学教学课程、统计数据和案例等,提升自主学习能力。第二,加强统计推理的理解,着重培养学生学习如何制定合适的研究问题、如何设计研究和收集数据、选择和应用合适的统计数据,以及总结和解释研究结果。比如通过数据分析,让学生明确因果关系、统计显著性与实际重要性之间的差异,以及发现无效果与发现无统计显著性效果之间的差异。第三,采用问题导向的教学方法,着重培养学生的选择技能,使他们能够根据给定的问题进行实验设计、制定假设并选择适当的统计分析程序。比如,鼓励学生利用天池、Kaggle竞赛中赛题,从数据探索到数据推断,锻炼自己数据分析的能力。学生以小组形式解决真正的问题,教师扮演促进者的角色,侧重培养学生对实际研究数据的分析,以及对统计结果的批判性解释。通过这种方法培养学生独立学习的意识和学习的责任感,提高学生在新情景中理解和应用统计数据的能力。第四,尝试增加基于R、Python等工具的编码,这在处理更大、更复杂的数据集时是必要的。虽然编程对经管类专业学生也是一个挑战,但是这些工具的引入不需要太高的学习曲线,而且它们可以适应未来学生可能遇到的更大、更复杂的数据。