胡典顺
(华中师范大学数学与统计学学院 430079)
近年来,实证研究愈来愈受到教育研究者的重视,因为这是提升教育科学研究水平并且与国际教育研究接轨的必由之路[1].数学教育实验研究中有一类应用很广泛的研究——对比研究,可以是样本之间的对比,不同水平的对比,教学干预后的对比分析,也可以是不同教学方法实施后的教学效果对比等.对比研究不仅是数学教育研究者喜欢的一种研究方式,而且也是中小学数学教师方便实施的一种研究方式.但不少人在进行对比研究的时候,研究结论的得出仅从主观感知的角度去辨析,凭经验,随意性很强,不是科学地、规范地通过数据分析,导致研究结论泛化,没有反映研究问题的特质.研究推理过程也没有层层递进的逻辑关联,研究结果往往不能让人信服.科学的、规范的数学教育实验研究应该基于数据,基于对数据的正确解读,这样的研究不仅结论可信,他人也可以进行实验验证.张奠宙先生在评价范良火教授的论著《教师教学知识发展研究》时称:“论文得出的是科学结论,并非凭空想象.这种学术研究得出的科学结论,是不能随便推翻的.”[2]正是因为科学的结论并非凭空想象,不能随便推翻,数学教育研究要体现“科学化”,提倡研究范式的改变是十分必要的.
本文选取的三个案例中,配对样本t检验要求差值符合正态分布,方差分析的条件是独立性、正态性和方差齐性.在讨论三种分析方法的过程中可能并未涉及这些条件的验证,另外数据样本较少,均是为了节省篇幅.本文重点介绍SPSS26.0软件操作、结果显示及数据解读.
在对连续变量的推断统计中,最常用的有t检验和方差分析.t检验又有单样本t检验,独立样本t检验以及配对样本t检验,它们都可以用于检验两个总体间连续变量.例1是一种典型的干预前后配对设计,在数学教育实验中经常遇到.
例1某教师采用教学干预减轻12名学生的数学焦虑,教学干预前后的数学成绩数据如表1所示,问教学干预是否有效果?
表1 前后测数据
操作步骤:
(1)根据表1在SPSS26.0中构建数据文件.
(2)点击【分析】、【比较平均值】、【成对样本t检验】,弹出【成对样本t检验】对话框,将左侧框中的前测,点击添加到右侧框中配对1中【变量1】.将左侧框中的后测,点击添加到右侧框中配对1中【变量2】中.
(3)在主对话框中点击【确定】按钮.
主要结果显示与解读:
配对样本统计平均值个案数标准 偏差标准 误差平均值配对 1干预前59.501211.3343.272干预后68.50128.5762.476
配对样本统计中,显示了教学干预前后的平均值、个案数和标准差,从平均值主观感知教学干预可能有效果,但有待假设检验进行验证.
配对样本相关性个案数相关性显著性配对 1干预前 & 干预后12.614.033
配对样本检验配对差值平均值标准偏差标准误差平均值差值 95% 置信区间下限上限t自由度Sig.(双尾)配对 1干预前- 干预后 -9.0009.0852.623-14.773-3.227-3.43211.006
配对样本相关性和配对样本检验中0.033,0.006,均小于0.05,说明数据一致性好,差异有统计学意义,并且差异的产生就是教学干预因素作用的结果.
重复测量是指对同一批受试对象的同一观测指标在不同时间点上进行多次测量,其目的是观察不同时间点的动态变化趋势特征.[3]在数学教育实验研究中,由于各种原因需要对观察样本进行多次观测,而不仅仅只有前测和后测.重复测量在数学教育实践中是大量存在的.例2讨论两因素重复测量,对单因素重复测量,不等距重复测量等本文不作讨论.
例2某教师为了调查某种新的教学方法对数学成绩的影响.该教师在两个学习小组随机抽取了12名学生,第一个学习小组按新的教学方法教学,第二个学习小组不用新的教学方法,并于实验开始的第1、2、3个月分别测量学生的数学成绩,数学成绩如表2所示,问新的教学方法是否有效果?
表2 三次测量成绩
操作步骤:
(1)根据表2在SPSS26.0中构建数据文件.
(2)点击【分析】、【一般线性模型】、【重复测量】,弹出【重复测量定义因子】对话框,将【主体间因子】中的【因子1】改为【time】.
(3)【级别数】框中输入重复测量次数【3】,点击【添加】按钮.
(4)点击左下角的【定义】按钮,将3次测量变量one,two,three按照框中测量的顺序,逐个放入右侧框中,次序不能出错.
(5)将单变量group放入【主体间因子】框.
(6)点击【模型】按钮,在弹出对话框中,选择【全因子】模型,点击【继续】按钮.
(7)点击【选项】按钮,在弹出对话框中,勾选【描述统计】、【齐性检验】,点击【继续】按钮.
(8)在主对话框中点击【确定】按钮.
主要结果显示与解读:
多变量检验a效应值F假设自由度误差自由度显著性time比莱轨迹.964121.437b2.0009.000.000威尔克 Lambda.036121.437b2.0009.000.000霍特林轨迹26.986121.437b2.0009.000.000罗伊最大根26.986121.437b2.0009.000.000time * group比莱轨迹.3692.637b2.0009.000.126威尔克 Lambda.6312.637b2.0009.000.126霍特林轨迹.5862.637b2.0009.000.126罗伊最大根.5862.637b2.0009.000.126
多变量检验.多变量检验是一种多元分析方法,其中采用了4种检验方法进行计算.表中P=0.000<0.05,多变量结果认为,数学成绩随时间发生趋势性变化,存在差异性.time * group交互作用中,P=0.126>0.05,group与time不存在交互作用.
莫奇来球形度检验a测量: MEASURE_1 主体内效应莫奇来 W近似卡方自由度显著性Epsilonb格林豪斯-盖斯勒辛-费德特下限time.895.9942.608.9051.000.500
主体内效应检验测量: MEASURE_1源III类平方和自由度均方F显著性time假设球形度9050.88924525.444165.229.000格林豪斯-盖斯勒9050.8891.8114998.696165.229.000辛-费德特9050.8892.0004525.444165.229.000下限9050.8891.0009050.889165.229.000
续表
球对称与主体内效应.显著性P=0.608>0.05,符合球对称性.既然符合球对称,可以进行单变量重复测量方差分析.因为符合球对称,主体内检验看“假设球形度”结果,F=165.229,P=0.000<0.05,认为数学成绩变化具有时间变化趋势.time * group交互作用中,F=1.984,P=0.164>0.05,group与time不存在交互作用.这里的结果与多变量结果一致,更加说明结果可靠.
主体内对比检验测量: MEASURE_1源timeIII类平方和自由度均方F显著性time线性9048.16719048.167259.136.000二次2.72212.722.137.719time * group线性10.667110.667.305.593二次98.000198.0004.934.051误差 (time)线性349.1671034.917二次198.6111019.861
主体内对比检验.既然不同时间存在差异,那么会存在什么趋势性的变化呢?对于time,P=0.000<0.05,发现线性有意义,P=0.719>0.05,发现二次无意义.对于time * group,P=0.5934>0.05,P=0.051>0.05,线性、二次都无意义.因此,可以认为数学成绩变化符合线性关系.
误差方差的莱文等同性检验a莱文统计自由度 1自由度 2显著性one基于平均值1.538110.243基于中位数1.290110.282基于中位数并具有调整后自由度1.29019.057.285基于剪除后平均值1.534110.244two基于平均值.523110.486基于中位数.500110.496基于中位数并具有调整后自由度.50019.780.496基于剪除后平均值.553110.474
续表
主体间效应检验测量: MEASURE_1转换后变量: 平均 源III类平方和自由度均方F显著性截距124373.7781124373.778285.661.000group81.000181.000.186.675误差4353.88910435.389
需要指出的是,本例中,由于time * group无交互,分析较为简单,只要得到time有无统计意义,group有无统计意义,基本就能达到分析的目的.但当time * group存在交互时,time、 group都受另一因素的影响,因此分析就要复杂得多.限于篇幅,这种情形的分析本文不作讨论.
当考虑的因素之间存在层次性结构,即嵌套结构的每一层次都是上一层次的细化,或者各个实验因素的影响根据专业知识有主次之分,次要因素的各个水平嵌套在主要因素的水平下时,这时所做的设计常为嵌套设计.[4]在数学教育研究中,有二因素嵌套设计、三因素嵌套设计等.例3是三因素嵌套设计,有“学校”和“班级”两个嵌套变量,8个“班级”嵌套在4个“学校”中,4个“学校”双嵌套在两种“教学方法”中.
例3某研究者为了研究两种教学方法的效果,随机选择了4所学校,每个学校选择2个班级,随机分配2个学校的4个班级用第一种教学方法,另外两个学校的4个班级用第二种教学方法,表格中数据是学生成绩,数据如表3所示,试对教学方法做差异分析.(此例根据武松编著《SPSS实战与统计思维》一书P174页例子改编而成)
表3 两种教学方法效果比较
续表
操作步骤:
(1)根据表3在SPSS26.0中构建数据文件.
(2)点击【分析】、【一般线性模型】、【单变量】,将成绩放入【因变量】对话框,将教学方法、学校和班级放入【固定因子】框中.
(3)点击【模型】,选定【构建项】,将教学方法、学校和班级放入【模型】框中,将【类型】中的【交互】改为【主效应】,点击【继续】.
(4)点击【选项】按钮,勾选【描述统计】、【F检验】,点击【继续】.
(5)点击【粘贴】按钮,得到操作的程序,将原来的程序(左)修改为程序(右):
DATASET ACTIVATE DataSet1.UNIANOVA成绩 BY 教学方法 学校 班级 /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /PRINT F DESCRIPTIVE /CRITERIA=ALPHA(.05) /DESIGN=教学方法 学校 班级.DATASET ACTIVATEDataSet1.UNIANOVA成绩 BY 教学方法 学校 班级 /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /PRINT F DESCRIPTIVE /CRITERIA=ALPHA(.05) /DESIGN=教学方法 学校(教学方法) 班级(学校(教学方法)) /TEST=教学方法 VS 学校(教学方法) /TEST=学校(教学方法) VS 班级(学校(教学方法)).
修改完毕,点击菜单【运行-全部】,运行程序.
主要结果显示与解读:
主体间效应检验因变量: 成绩 源III类平方和自由度均方F显著性修正模型3571.175a7510.168165.237.000截距229371.0251229371.02574290.211.000教学方法1890.62511890.625612.348.000学校(教学方法)1590.6502795.325257.595.000班级(学校(教学方法))89.900422.4757.279.000误差98.800323.088总计233041.00040修正后总计3669.97539
主体间效应检验中,只反映不同班级的成绩有无统计学意义.由于F=7.279,P=0.000<0.05,因而,不同班级之间差异有统计学意义.
定制假设检验指标1假设项教学方法误差项学校(教学方法)2假设项学校(教学方法)误差项班级(学校(教学方法))
定制假设检验 1
检验结果因变量: 成绩源平方和自由度均方F显著性对比1890.62511890.6252.377.263误差a1590.6502795.325
定制假设检验1中,反映不同教学方法学生的成绩有无统计学意义.由于F=2.377,P=0.263>0.05,因而,不同教学方法学生的成绩差异无统计学意义.
定制假设检验2
检验结果因变量: 成绩源平方和自由度均方F显著性对比1590.6502795.32535.387.003误差a89.900422.475
定制假设检验2中,反映不同学校学生的成绩有无统计学意义.由于F=35.387,P=0.003<0.05,因而,不同学校学生的成绩差异有统计学意义.
数学教育研究中,不能否认的是,无论是硕博毕业论文的撰写,还是教研论文的发表,依然存在经验描述和概括总结、缺乏证据的空泛讨论,理论移植加数学实例,泛学科的空洞议论等现象,导致的后果是理论泛化,证据缺失,偏离学科研究特质.数学教育研究要真正做到“有理有据”“言必有据”,在研究中就始终要有“数据与证据”意识.在研究过程中不断追问自己——我是如何进行研究设计的?采用的研究方法是什么?数据是如何收集的?收集了哪些数据?论证过程是不是基于证据的推理?有没有层层递进的逻辑关联?研究结论有哪些支持证据?等等.这样的数学教育研究才是科学的、规范的,才应该是数学教育研究所倡导的研究范式.