朴锦 具红光 吴松权
摘 要:高级生物统计学是生物学相关学科的研究生学位基础课程,对研究生的试验设计、统计分析和书写毕业论文有着重要意义。文章以协方差分析为例,介绍SPSS统计软件在高级生物统计学课程教学过程中的应用,以激发学生对该课程的学习兴趣,提升研究生的设计试验、整理和分析数据、解决问题的能力,对今后独立承担科研项目,书写科研论文打下良好的理论基础。
关键词:生物统计学;协方差分析;研究生教学;SPSS统计分析软件
中图分类号:G642 文献标志码:A 文章编号:2096-000X(2022)19-0103-04
Abstract: Advanced Biostatistics is a basic graduate degree course in biology-related disciplines, which is of great significance for graduate students' experimental design, statistical analysis and writing thesis. The paper introduces the application of SPSS statistical software in the teaching process of Advanced Biostatistics with the example of analysis of covariance in order to stimulate students' interest in the course, enhance graduate students' ability to design experiments, organize and analyze data and solve problems, and lay a good theoretical foundation for independent research projects and writing scientific research papers.
Keywords: Biostatistics; Covariance analysis; undergraduate teaching; SPSS software.
高級生物统计学是生物学相关学科的研究生学位基础课程[1],以线性代数及概率论、生物统计学、试验设计等课程为先修课程,主要讲授回归分析、协方差分析、正交设计、聚类分析、主成分及因子分析、回归旋转设计等内容,包含各类生物科研人员必需掌握的试验设计和数据分析方法[2]。高级生物统计学课程涉及的试验类型多,公式推导和计算繁琐,容易导致学生注意力分散,产生视觉、听觉和思维疲劳,且学习兴趣不高[3-4]。因此,大部分专业都把SAS、SPSS、Stata、Splus、LINGO、MAPLE等统计分析软件引用到该课程的教学过程,作为辅助计算工具,缓解其计算压力。
SPSS公司自1972年正式成立以来,不断推出新版本,从最初的SPSS/PC+forDOS[5]、SPSS 6.0for windows到SPSS 25.0for windows,其软件功能不断完善,操作也越来越简便。SPSS软件具有强大的数据操作功能、和其他Windows应用软件相同、用户界面具有亲和力等特点,同时具有丰富的指导协助功能,是一种易学易用的数据分析软件,在教学及科研过程中很受欢迎。
一、高级生物统计学教学过程中存在的问题
本课程团队承担高级生物统计学教学任务后,把传统形式的“理论教学课堂”转变为“上机操作型课堂”。课堂组织形式:首先,讲授相关试验设计的理论知识、应用范围及具体案例;其次,用SPSS统计分析软件演示其分析过程;最后,让学生上机操作得出分析结果,并与学生一起探讨输出结果。这种“上机操作型课堂”,可以降低教师理论授课的比例,增加学生动手操作和思考的时间,真正实现以学生为主的课堂,可以激发学生兴趣,提高学习效果,贯彻“以学生为中心”的教育理念[6]。
在运用SPSS统计分析软件,完成“上机操作型课堂”过程中发现以下几点问题。
(1)研究生对本科阶段生物统计的统计推断、方差分析、回归与相关等基础内容的理论知识掌握的不够牢固,难以实现由理论到应用SPSS统计分析软件的突破。如大部分学生只学会SPSS的操作过程,但不会解读其分析结果,综合运用知识的能力、分析和解决问题的能力差。
(2)部分研究生在制定试验方案、实施试验时没有充分考虑到统计分析的过程,往往收集完数据、书写毕业论文时才发现试验安排上的缺陷和问题。如有些学生利用正交试验设计时不设重复,无法进行方差分析;协方差分析的试验,因没考虑协变量的影响,没做协变量调查,无法完成正确的数据分析;正交回归设计时没安排零水平试验,无法完成失拟性检验等,试验设计上的漏洞频频出现,缺乏严谨的试验设计能力和逻辑思维能力。
(3)利用SPSS分析试验数据时,往往忽略所选试验设计类型的基本假定。如方差分析时,原始数据得满足效应的可加性、误差的正态性和误差方差的同质性的三个基本假定[7],但大部分学生不考虑这些假定,直接进行方差分析,缺乏严谨的统计分析过程。
(4)学生对统计分析软件的依赖度高,没有充分认识到统计分析软件仅仅是试验设计或数据分析时的辅助手段,解决实际问题不能仅靠软件分析的结果。如讲解主成分分析时,SPSS统计软件只提供若干个主成分和主成分得分系数矩阵,未能给出主成分分析的最终结果,即综合得分排名。理论教学时,多次强调根据成分矩阵或得分系数矩阵,计算得分后排名的方法,但部分学生仍然嫌麻烦,只提取主成分,未能充分地挖掘数据信息就草草结束其分析过程。C544B964-F237-44D6-BA8A-84D4E78DD619
在高级生物统计学课程中利用统计分析软件时,首先要掌握好相关试验设计的理论知识,方法及应用范围,避免“只会软件操作,不懂结果”的现象出现。教师在理论教学的过程中适当引用分析软件,不能全部依赖于软件操作过程的传授,应注重培养学生的统计思维能力和或然性推理能力,提高综合运用知识、分析和解决问题的能力。
二、以协方差分析为例的SPSS统计分析
协方差分析是通过反应变量与协变量之间的线性关系,调整反应变量后对此反应变量进行的方差分析[8]。协方差分析与方差分析相比,充分考虑到协变量对因变量的影响,可降低试验误差,充分表达自变量的各水平对因变量的影响;协方差分析与回归分析相比较,可以克服回归分析只能被动进行数据处理和分析,不涉及试验设计的缺点,因此,协方差分析集合了方差分析和回归分析的优点,是两种分析的结合。
下面举例来理解协方差分析的优点,同时掌握其SPSS统计分析的过程。
例:为研究A1-A4四种不同肥料配方对苹果单株产量的影响,把32棵苹果树随机分4组,每组8棵,施用一种肥料。试验前调查各株苹果树的干周X(单位cm),到秋季测苹果树单株产量Y(单位kg),结果见表1。试检验A1-A4四种肥料对苹果树单株产量的影响是否有显著差异。
(一)SPSS数据创建
打开SPSS统计软件后,点击左下角的“变量视图”窗口,命名“肥料”“干周X”及“产量Y”三个变量,其中“肥料”的“值”要定义,用1、2、3、4依次表示A1-A4肥料种类;回到“数据视图”窗口,输入试验数据,其格式如图1所示。
(二)检验协方差分析的基本假定
协方差分析的应用需满足下列3个基本假定,即各组反应变量的误差方差同质、自变量和协变量间无交互作用、反应变量和协变量间存在线性回归关系[9]。因此,在进行数据分析之前先检验其基本假定。检验过程为,依次单击菜单中的“分析-一般线性模型-单变量”,打开“单变量”主对话框,把“产量Y”引入“因变量”框内,把“肥料”引入“固定因子”框内,把“干周X”引入“协变量”框内,如图2所示。
单击“模型”,选择“设定”,把“肥料”“干周X”分别引入“模型”框内,又同时选中“肥料”和“干周X”引入“模型”框内,检验其交互作用效应,如图3所示。
单击“继续”按钮,回到“单变量”主对话框;点击“选项”,把“肥料”变量引入到右侧“显示均值”框,勾选“比较主效应”,在“输出”项中,选中“方差齐性检验(H)”和“参数估计”;点击“继续”,回到主对话框点击“确定”按钮,即可输出分析结果,其结果见表2。
在表2,首先要确认误差方差等同性的Levene检验结果,其F=1.055(P>0.05),表示各组因变量的误差方差同质,因此,可以确认试验数据满足协方差分析第一个假定。其次要确认“肥料*干周X”交互作用是否显著,其F=1.042(P>0.05),表示自變量“肥料”和协变量“干周X”之间无交互作用。因此,可确认满足协方差分析第二个假定。最后要确认“参数估计”中,协变量“干周X”与因变量“产量Y”之间的回归系数是否显著,其b=1.693,t=3.397(P<0.01),表示回归系数的t检验极显著,表明苹果树的协变量“干周X”与“产量Y”之间存在线性回归关系。因此,满足协变量和反应变量之间存在线性回归关系的第三个基本假定。
(三)协方差分析
在“数据视图”,依次点击“分析-一般线性模型-单变量”,进入“单变量”主对话框后,点击“模型”把“设定”改为“全因子”后点击“继续”按钮;点击“对比”,“更改对比”中选择“简单”后点击“继续”;点击“选项”,把“肥料”引入到“显示均值”栏,在“比较主效应”框内打钩,在下面“输出”框中,选中“描述性统计”和“参数估计”,点击“继续”,回到主对话框点击“确定”按钮,即可输出分析结果,其结果见表3。
从表3可知,协方差分析的误差项的回归系数be=2.166(P<0.01),表示误差项回归系数极显著。因此,用“干周X”和“产量Y”间的误差项回归系数来调整“产量Y”,对调整后的“产量Y”进行方差分析,其结果F=19.603(P<0.01),说明肥料种类之间有极显著差异。
对反应变量“产量Y”调整前后的变化及多重比较的结果见表4。调整之前的苹果树单株“产量Y”的大小顺序为A1>A3>A2>A4,而调整以后,即扣除协变量“干周X”对“产量Y”的影响后,其大小顺序发生变化,变为A1>A2>A3>A4。从多重比较结果可知,肥料A1处理时苹果树的单株产量均值最高,可达76.75 kg,与A2处理的产量间有显著差异,与A3和A4处理的产量之间有极显著差异。
通过以上分析,可知协方差分析的优点是可以把协变量对反应变量Y影响从随机误差中分离出来,减少随机误差平方和,准确评价自变量(不同肥料配方)各水平对因变量的影响。
三、结束语
近年来,随着生物统计软件的不断更新和升级,探索统计软件来辅助理论教学的模式,已成为高校生物统计类课程的主要授课形式。在高级生物统计学课程教学中引入SPSS统计分析软件后,其教学模式、方法及考核形式等发生了以下几点变化:第一,改变教育教学方法,从传统教学方法过渡到传统教学方法与现代化手段有机结合,增强学生对课程实际应用能力的培养,真正实现学以致用的教学目标。第二,改变课堂教学方式,从“以教师为主”理论教学过渡到“以学生为主”的“上机操作型”课堂,增强学生对该课程的学习兴趣与参与度。第三,实践性教学所占的比例增加,充分体现生物统计学实用性强的工具课特点[10]。第四,改变课程考核方式,实例分析占卷面的40%,以此重点考核学生分析和解决问题的能力。
高级生物统计学是研究如何在科研和生产中合理有效地获得试验数据,并对数据进行分析、推断的一门课程,不仅有很高的理论要求,又有很强的实用性。随着科学技术的发展,试验设计和统计分析方法也在不断发展和丰富,如混料设计的提出、统计模型的建立、各种人工智能的算法都广泛应用于数据分析,因此,课堂教学也需要借助于SAS、SPSS、Stata等统计分析软件来设计试验,分析数据。现代教学要注重学生对课程实际应用能力的培养,特别是生物统计类实用性强的课程更是如此。因此,教学过程中应积极探索对某一试验设计的专题实训式教学模式,课堂以“讲授理论知识与方法-设计试验-学生实际操作-解读分析结果”的形式,激发学生的学习兴趣,让学生能熟练运用生物统计学原理和方法,解决科研和生产中面临的各种问题。
参考文献:
[1]栗现芳,谢维娜,赵富强.研究生“生物统计学”专题实训式教学模式的研究与探索[J].陕西教育(高教),2019(11):21-22.
[2]马寨璞.高级生物统计学[M].北京:科学出版社,2016.
[3]陈莉,马沛勤,苏仙绒,等.生物统计教学、科研、实践一体化教学模式探索[J].运城学院学报,2015,33(6):54-56.
[4]谭启玲,任涛,党丽娜,等.SPSS统计软件在提高生物统学课程教学效果中的应用[J].安徽农业科学,2016,44(31):245-246+251.
[5]王颉.试验设计与SPSS应用[M].北京:化学工业出版社,2017.
[6]周海林.“以学生为中心”的本科教学改革刍议[J].高等理科教育,2016(1):102-106.
[7]宁海龙.试验设计与统计分析[M].北京:中国农业出版社,2016.
[8]孙文清.协方差分析在教学评价中的应用及SPSS的实现[J].河南工程学院学报(自然科学版),2010,22(2):19-21+43.
[9]马晓君.协方差分析在SPSS教学中应注意的几点问题[J].统计与咨询,2009(4):46-47.
[10]李昆太,程新.生物统计学教学改革初探[J].大学教育,2013(14):93-94.
基金项目:吉林省研究生精品示范课程建设项目 “《高级生物统计》”(无编号)
作者简介:朴锦(1973-),女,朝鲜族,黑龙江宁安人,博士,副教授,研究方向为本科生生物统计与田间试验和研究生高级生物统计课程的教学与改革。C544B964-F237-44D6-BA8A-84D4E78DD619