青少年学习倦怠量表的多元概化分析 *

2018-09-22 06:45赵守盈
心理与行为研究 2018年5期
关键词:测验方差全域

罗 杰 周 瑗 陈 维 潘 运 赵守盈

(1 贵州师范大学教育科学学院,贵阳 550001) (2 贵州省普通高校基础心理与认知神经科学特色重点实验室,贵阳 550001)

1 引言

倦怠(burnout)一直是心理健康领域的热点话题。心理学中有关倦怠的研究最初起始于工作领域(Ammondson, 2000; Maslach, Schaufeli, &Leiter, 2001),如今已扩展和细化到学习领域,主要涉及学习倦怠的研究(Schaufeli, Martínez, Pinto,Salanova, & Bakker, 2002; Steele & Fullagar, 2009)。学习倦怠是一种主要发生在学生身上持续的、负性的、与学习相关的心理状态(吴艳, 戴晓阳, 温忠麟, 崔汉卿, 2010),这种状态主要表现为身心耗竭、学业疏离和低成就感等方面。研究表明,学习倦怠对学生反社会行为及其严重程度存在显著影响(Kokkinos, Panayiotou, & Davazoglou, 2005)。因此,探讨学习倦怠及其影响因素,对维护学生的心身健康具有重要意义。相应地,在客观实际中为了提高学习倦怠的研究水平,编制具有良好心理测量学性能的测评工具势在必行。

国外对学习倦怠进行测评的工具主要有三种:(1)将Maslach倦怠问卷(Maslach Burnout Inventory, MBI)进行修改后施测于学生(Fimian &Cross, 1986; Jacobs & Dodd, 2003);(2)直接使用MBI公共服务版(Maslach Burnout Inventory for Human Service Surcey, MBI-HSS)(Ross et al., 2002);(3)在Maslach问卷的基础上编制学习倦怠量表(Schaufeli et al., 2002)。在国内,学习倦怠的测评工具主要有两种:(1)直接修订国外研究者所编制的学习倦怠量表(张莹, 甘怡群, 张轶文, 2005;方来坛, 时勘, 张风华, 2009);(2)编制适用于我国学生群体的本土化学习倦怠量表(连榕, 杨丽娴,吴兰花, 2005; 许清鹏, 张建新, 刘普强, 王晶, 王宝军, 2006; 胡俏, 戴春林, 2007; 吴艳等, 2010)。其中吴艳等(2010)以Maslach的工作倦怠三因素理论(心身衰竭、玩世不恭、低效能感)为基础所编制的青少年学习倦怠量表(Adolescent Student Burnout Inventory, ASBI)在小学生、中学生和大学生群体中均具有较好的信效度,为青少年学习倦怠的测评提供了良好的量化基础。然而该量表的编制以及信效度检验均采取经典测量理论(Classical Test Theory, CTT)的方法。在心理测量学中,CTT用于检验信效度指标时存在一定的不足与缺陷(Shavelson & Webb, 1991; Brennan, 2001a; 杨志明,张雷, 2003a; 漆书青, 2003; Suen & Lee, 2007;Brennan, 2010):如对测验信度的估计不够精确;不能辨别测验过程中可能产生的各种变异来源及其大小;无法提出减少测量误差的策略与方案等。因此,测量学家们一直在寻找客服这些不足的方法与技术,其中一个研究方向就是注重测验的宏观层面,继续沿着随机样本理论的思路,考察测评工具的测量条件与结论推广应用范围之间的关系,沿着这条思路最终导致概化理论(Generalizability Theory, GT)的出现与发展。

GT是在CTT的基础上,引入实验设计和方差分析技术,对测验情景中的各类误差进行分解和控制的一种测量理论(Brennan, 2001a, 2010)。GT包含两个研究阶段,即G研究和D研究(Brennan,2001a; 杨志明, 张雷, 2003a)。其中G研究通过估计测量目标和测量侧面的方差协方差分量,来确认测量目标与测量侧面的关系。D研究则是通过对信度变化的评估来确定哪种决策更好,从而为测验的改进提供依据。与CTT相比,概化理论可以根据测量误差的来源把总误差划分为多个分量误差,在同时考虑多个误差来源的基础上进行信度估计,因此GT的信度估计比CTT更为细致和准确(杨志明, 张雷, 2003a)。当前GT的应用主要涉及两大方面:其一是教育测量与评估方面(杨志明, 张雷, 马世晔, 2004; Yin, 2005; 蔡艳, 陈抚良,2007; 王晓华, 文剑冰, 2010; 关丹丹, 王博, 车宏生,2011);其二是心理测验的编制与开发(安哲锋,骆方, 张厚粲, 2008; Føllesdal & Hagtvet, 2009; 骆方,刘红云, 张月, 2010; 孙颖, 张慧, 曹小燕, 2012)。此外,GT也常用于表现性评价中评分者信度的评估(孙晓敏, 张厚粲, 2005; 徐思, 张敏强, 黎光明, 2009;康春花, 姜宇, 辛涛, 2010)。

一般而言,GT分为一元概化理论(Univariate Generalizability Theory, UGT)和多元概化理论(Multivariate Generalizability Theory, MGT)。MGT中G研究的目的是明确测验设计,包括对测量目标、测验结构、测量对象、测量模式以及测量题目进行分析。其方法是采用方差分析技术对测验总分的变异进行分解,从而明确各种因素之间的关系,估计各效应在各个潜在因子上的方差与协方差分量矩阵等。而D研究则是考察概化系数和可靠性指数与测量目标或各个测量侧面之间的变化关系,准确地估计各种决策下测量结果的信度,从而为改进测量设计,提高测量质量提供必要依据。D研究涉及到的内容是先分别估计被试在各个潜在因子上的全域分数及相应的相对误差和绝对误差,概化系数和可靠性指数等。接着利用协方差贡献率等方法确定各个因子全域分数的权重系数,合成一个全域总分,并估计其相应的相对误差,绝对误差,概化系数,可靠性指数,相对信噪比和绝对信噪比等。最后根据估计出的结果做出相应的决策。较UGT而言,MGT在处理那些涉及到多个相关的潜在因子的测验时具有其独到的作用(杨志明, 张雷, 2003b)。Nuβbaum(1984)研究发现MGT更适宜处理多维度问卷的信度问题,可发现总体信度较高而维度信度较低的问题,并提供改进意见。

鉴于此,本文拟采用多元概化理论(MGT)对ASBI及其分量表的测量学性能进行分析,以期为改进ASBI的测验结构与提高测验精确度提供参考。

2 研究方法

2.1 被试

采用方便取样原则,以贵阳花溪大学城在校学生为调查对象,共发放问卷700份,最终获得有效问卷660份,有效回收率为94.3%。其中男生360人(54.5%),女生297人(45.5%),3人未注明性别;文科188人(28.5%),理科155人(23.5%),工科317人(48.0%);大一278人(42.1%),大二213人(32.3%),大三169人(25.6%);年龄(20.27岁±1.60岁)。

2.2 研究设计

采取多元p×i随机测量模式,其中测量目标为被试者(p),测量侧面为测验条目(i)。

2.3 研究工具

青少年学习倦怠量表 该量表由吴艳等(2010)编制,包括3个因子:身心耗竭(4个条目)、学业疏离(5个条目)和低成就感(7个条目),共16个条目,采用Likert-5点记分,1代表“很不符合”,5代表“非常符合”,量表总分反映了个体学习倦怠的总体状况。根据量表已有的理论结构,使用Mplus6.11对量表的结构效度进行验证性因素分析,三因子模型得到了数据的有效支持,各项拟合指数分别是χ2=435.30, df=101, χ2/df=4.31,RMSEA(90% CI)=0.07(0.06, 0.08), NNFI=0.89,CFI=0.91, SRMR=0.07。本研究中各因子的合成信度分别是0.73,0.78和0.84,95%的置信区间分别是[0.70, 0.75],[0.76, 0.81]和[0.82, 0.85]

2.4 共同方法偏差的控制

由于本研究各变量均采用量表测量,并且由同一被试提供信息,故在进行数据分析之前对样本数据进行了共同方法偏差的检验(Podsakoff,MacKenzie, Lee, & Podsakoff, 2003; 周浩, 龙立荣,2004)。本研究主要采取Harman单因素检验法(Malhotra, Kim, & Patil, 2006),单因子模型的各项拟合指标如下:χ2=1281.44, df=104, χ2/df=12.32,RMSEA(90% CI)=0.13(0.12, 0.14), NNFI=0.62,CFI=0.67, SRMR=0.10。这表明本研究未发现明显的共同方法偏差问题。

2.5 数据处理与分析

运用SPSS16.0对数据进行了录入和整理。数据处理时是以各因子的原始得分为基础,多元概化分析在mGENOVA2.1统计软件(Brennan, 2001b)上运行。

3 结果

3.1 G研究

根据量表的3因子模型,使用mGENOVA2.1程序可得到被试者(p)、测验条目(i)以及被试与测验条目之间的交互效应(p×i)在3个因子上的方差协方差分量的估计矩阵(见表1)。

表 1 3 因子模型的 G 研究结果

表1结果显示,被试在3个因子上得分的协方差不是很高,各因子之间呈中等程度的相关关系;各因子本身的方差分量(被试者p的方差分量)较大,而测验条目的方差分量相对较小,与被试有关的效应(被试者与测验条目间的交互效应)也相对较大。

3.2 D研究

依据G研究结果估计的方差与协方差矩阵,可得到被试在3个因子上的全域分数以及相应误差的方差分量,进而估计出各因子的概化系数、可靠性指数、相对信噪比和绝对信噪比。另外,根据各因子条目数所占比重可得出权重系数(W系数),通过对3个因子全域分进行合成,可估计全域总分的方差以及相应误差的方差分量,进而得出全域总分的概化系数、可靠性指数、相对信噪比和绝对信噪比(见表2)。

表2结果显示,3个因子的概化系数与可靠性指数均达到较好水平,ASBI分3个因子是可行的,并且分为3个因子后量表的拟合优度较好;同时,量表全域总分的概化系数和可靠性指数明显高于各因子的概化系数和可靠性指数,且全域总分的相对误差方差分量和绝对误差方差分量均小于各因子的相对误差方差和绝对误差方差。

表 2 3 因子模型的 D 研究结果

3.3 各因子对总方差贡献率的分析

根据上述结果,可以得到各因子对全域方差的贡献情况,结果见表3。

表3结果显示,身心耗竭、学业疏离对全域总分的贡献均略高于各自在全量表上的分值比重,而低成就感对全域总分的贡献则略低于它在全量表中的分值比重;低成就感对相对误差方差的贡献最大,而学业疏离对绝对误差方差的贡献最大。

表 3 各因子对全域总分的贡献比

4 讨论

本研究对青少年学习倦怠量表进行多元概化分析,G研究结果显示,对被试在3个因子上得分进行方差协方差分量估计,各因子之间呈中等程度相关,这说明3个因子之间既有相对的独立也存在一定的关联性,但能否将3个因子合成为一个总分还有待于D研究的结果;另外,在各因子中被试者的方差分量均较大,这说明被试者以及与被试者有关的变异在测验分数变异中所占的比重较大,而测验条目的方差分量则相对较小,这说明测验条目引起的变异在测验分数变异中所占的比重较小,表明测验条目有较好的难度和区分度。

D研究结果显示,3个因子的概化系数和可靠性指数均达到较好的水平,这表明ASBI既可用于常模参照测验,也可用于标准参照测验。ASBI分3个因子是可行的,且提取3个因子后量表的测量优度较好。另外,全量表全域总分的概化系数与可靠性指数都达到0.85以上,且都高于各因子的相应指标。全域总分的相对误差方差分量和绝对误差方差分量均小于各因子的相对误差方差分量和绝对误差方差分量,因而将3个因子合成为一个总量表是合理的,3个因子合成为一个总量表使用时能更好地发挥量表的功效。对全域方差的贡献率(即对全域分数的重要性)由大到小依次为:低成就感、学业疏离和身心耗竭。身心耗竭、学业疏离对全域总分的贡献均略高于各自在全量表上的分值比重,而低成就感对全域总分的贡献(仅占41.37%)略低于它在全量表中的分值比重(占43.75%)。这表明它在总量表中的实际影响没有达到应有的水平。而在对相对误差方差的贡献率和对绝对误差的贡献率最高的分别是低成就感和学业疏离。另外,身心耗竭因子的概化系数(0.72)和可靠性指数(0.69)相对于其它2个因子均最低,这可能与它所包含的条目数相对较少(共4题)有关。因此今后对该量表进行修订时,可考虑对学业疏离和低成就感因子的条目质量进行修订,也可考虑适当增加身心耗竭因子的条目数以提高其测验信度。

总之,多元概化分析结果表明,基于本土文化环境编制的青少年学习倦怠量表的结构符合其编制理论的假设,支持原编者运用CTT所得的结果。该量表及其分量表(因子)既可以作为常模参照测验使用,也可作为标准参照测验使用,值得在实际中加以推广与使用。

5 结论

(1)ASBI的各因子和总量表的信度较高,既能作为一个总量表使用以了解个体的总体学习倦怠状况,也可以各因子为基线了解个体在学习领域中的倦怠状态。

(2)ASBI的概化系数和可靠性指数均达到较好水平,表明其该量表及其分量表(因子)既可以作为常模参照测验使用,也可作为标准参照测验使用。

(3)ASBI在决定各因子的分量比例方面还不尽完善。今后的修订工作,可考虑改进学业疏离和低成就感因子条目的质量,适当增加身心耗竭因子的条目数以提高其测量学指标。

猜你喜欢
测验方差全域
用一粒米撬动全域旅游
概率与统计(2)——离散型随机变量的期望与方差
方差越小越好?
计算方差用哪个公式
方差生活秀
“全域人人游”火爆周宁
全域旅游向更广更深发展
旅游如何从景点走向全域
两个处理t测验与F测验的数学关系
数字测验