曹 茜,王贵荣,王宇潇,龚美琪,杨 林,贺 鹭
(山西医科大学公共卫生学院,山西 太原 030000)
近年来,大学生面临的心理、情感、学业、就业等各方面压力和困境越来越多,对大学生生命质量的研究有必要系统全面地进行展开,为进一步改善学生生命质量找寻理论基础与依据。本论文采用项目反应理论对测量工具(SF-36)的区分度进行考核。应用项目反应理论区分度、难度参数并结合量表条目的项目特征曲线(Item Characteristic Curve,ICC)和信息量分析SF-36用于评价大学生生命质量的适用性。
本次调查从不同学校类型、不同学科门类出发,以太原市本科院校在校大学生为研究对象,采用了多阶段随机抽样的方法,从四类本科高校中各抽取一所院校,再随机整群抽取11个专业,涵盖多个学科门类,包括理学、工学、经济学、管理学、医学、法学、文学。利用SF-36评价大学生生命质量。问卷共发放了1800份,有效回收问卷1695份(有效回收率为94.2%)。
本次调查研究采用了SF-36量表,从生理健康(PCS)和心理健康(MCS)两个方面,生理职能(RP)、生理功能(PF)、躯体疼痛(BP)、一般健康状况(GH)、情感职能(RE)、精神健康(MH)、活力(VT)、社会功能(SF)8个维度来评价被调查人员的整体情况;从健康变化(HT)维度发现被研究者健康变化情况、预测未来趋势(不参与计分);量表所得分越高,表明大学生生命质量状态越好。
本次调查以调查对象现场自填的方式为主,独立匿名填写,当场回收。对调查员经过培训后,统一发放调查问卷,问卷包括两部分:大学生一般资料调查表和生命质量调查表。
项目反应理论(Item Response Theory,简称IRT)也称潜在特质理论,用于指导测验编制和项目的筛选[1]。通过Multilog 7.03软件进行计算和作图。假设被试者有一种“潜在特质”,应用数学模型分析被测试者潜在特质(能力水平) 与其对测验项目(条目)反应之间的关系,即以数学形式表达其能力与对测验项目正确作答概率之间的关系,从而综合分析项目(条目)的难度、区分度等特征,筛选条目和编制测验分数等[2]。
项目反应理论的参数估计不依赖于样本量和项目量,具有参数不变性[3]。测验条目所包含的信息量由条目的区分度(a)和被测试者的能力水平(θ)与条目难度之差(b)决定,可以看出,区分度a越大,被测试者的能力水平与条目难度之差越小,则测验条目所包含的信息量越大。所以选取难度和区分度两项指标进行量表条目的筛选。一般情况下,当一个条目的区分度a<0.4时应考虑将其删除,b1、b2、b3、b4四个难度等级参数依次增加,范围一般在-3到3之间[4]。
调查问卷回收整理后,用Epidata 3.1软件建立数据库进行数据录入,用SPSS 19.0软件、Multilog 7.03软件进行统计分析。
本次调查的1695名大学生中,年龄分布范围为18-23岁,男性599人,女性1096人。专业分布中,医学类656人(38.7%),法学类229人(13.5%),管理学类334人(19.7%),经济学类120人(7.1%),理学类93人(5.4%),工学类128人(7.6%),文学类136人(8.0%)。家庭年人均收入<3000元的有488人(28.8%);家庭年人均收入在3000-6000元的有514人(30.3%);家庭年人均收入在6000-10000元的有335人(19.8%);家庭年人均收入>10000元的有358人(21.1%)。
根据项目反应理论,信息量与区分度a成正比关系,区分度越大,被测试者的能力水平与条目难度之差越小,则测验条目所包含的信息量越大。一般情况下,当一个条目的区分度a<0.4时应考虑将其删除。分析结果表明:本研究中,条目35(MH5)区分度为0.38,小于0.4,超出正常范围,应予以删除。其余35个条目的区分度取值范围为1-2.98,总条目的均值为1.71,表明本量表的区分度较好。
根据项目反应理论,难度b的取值和被试的潜在能力一样在正负无穷之间,但在θ取标准分数的量表中,绝大多数的b取值和θ取值都应在正负3之间。根据在Mutilog 7.03软件中生成的四个难度值(b1-b4),难度等级参数取值范围为-4.47-3.06,条目35(MH5)的难度参数超出正常范围,应当予以删除。其余35个条目从b1-b4呈正向递增,不存在逆反阈值。表明SF-36量表的各条目项目难度分级较为合理,量表选择正确。
项目特征曲线可以用两个特性来描述。第一个是题目的难度。项目的难度描述了项目函数处于哪一能力等级。第二个特性是区分度,描述了在低于项目区域和高于项目区域的被试之间,一个项目在多大程度有区别。曲线越平直,区别就越小,因为低能力水平正确回答的概率接近于高能力水平正确回答的概率[5]。根据SF-36量表的项目特征曲线(ICC)矩阵图特征显示,除条目35的ICC构图不是很理想,其余各条目构图理想,具有较好的难度和区分度。
项目反应理论用信息量代替信度概念,借助信息函数针对不同考生精确估计每个项目及测验的测量误差,给不同能力水平考生的估计提供了独立的信度[6]。信息函数值的大小直接反映了条目对被试能力素质水平的估计精度,信息函数值越大,这种估计就越精确。
根据本研究信息量及测量误差图,信息量曲线下面积较大,说明对应的信息量较大,精度较高,误差曲线在均数以下,说明项目测量误差较小,结果理想。
SF-36是20世纪80年代由美国波士顿健康研究所在“医疗结果研究调查表”的基础上开发的简明健康调查量表,拥有较好的信效度[7];本次调查采用SF-36量表是因为国内已经建立了该量表的常模值,同时我国已有大量学者应用SF-36对大学生生命质量进行调查研究,如学者王琪、印丽峰、陈柯帆、姜静宜、汤小等人也采用SF-36分析了大学生生命质量。
采用IRT对SF-36量表各条目的区分度、所包含信息量以及误差大小进行评价,通过观察量表条目ICC矩阵图、信息量及测量误差图,可以看出该量表条目包含信息量较大、误差较小,具有较高的区分度,因此可以对具有不同生命质量的人群进行区分。说明SF-36量表的测评效果较好,适用于大学生生命质量的评价。
[参考文献]
[1]Gothwal VK,Bharani S,Kekunnaya R et al.Measuring Health-Related Quality of Life in Strabismus:A Modification of the Adult Strabismus-20 (AS-20) Questionnaire Using Rasch Analysis.[J].PLoS One 2015,10 (5):e0127064.
[2]涂冬波,蔡 艳.信息函数在标准参照测验中的应用研究[J].江西师范大学学报,2005,29(2):167-171.
[3]杜林致.心理测量学[M].天津:南开大学出版社,2011:112.
[4]Rupp,A.A.,&Zumbo,B.D.Understanding parameter invariance In unidimensional IRT models[J].Educational and PsychologicalMeasurement,2006,66(1):63-84.
[5]Roberts L,Clifton RA.Measuring the affective domain of the quality of life of university students:the validation of an instrument[J].Social Indicators Research,1992,27:113-137.
[7]Hem EC,lifton RA,Roberts LW.The cognitive domain of the quality of life of university students:a re-analysis of an instrument[J].Social indicators Research,2001,53(1):63-77.