◎ 孙卓尔 尚志蕾 刘伟志 欧阳慧(海军军医大学心理系基础心理学教研室,上海 200433)
对于接受在校教育的青少年而言,大多数活动时间都是在学校环境中度过的。因此,做好学校心理健康教育工作、维护在校学生的心理健康至关重要。而开展心理测评,实现对学生群体心理状况的有效监控则是学校心理健康教育工作中的关键一环,对于发现群体心理问题倾向,进而开展有针对性的心理健康教育工作,筛查心理问题风险个体,建立规范的学生心理健康档案,以及在心理咨询和辅导工作中更好地掌握来访学生的心理现状等具有重要意义[1-2]。
目前,国家相关部门已经出台了部分政策和指导性意见,要求建立和完善学校心理健康监测评估体系,以及时干预青少年心理健康问题。2020 年9月,国家卫生健康委员会发布《探索抑郁症防治特色服务工作方案》,明确“各个高中及高等院校将抑郁症筛查纳入学生健康体检内容,建立学生心理健康档案,评估学生心理健康状况,对测评结果异常的学生给予重点关注”[3]。2021 年7 月,教育部在《关于加强学生心理健康管理工作的通知》中也提出了“定期开展学生心理健康测评工作,健全筛查预警机制,及早实施精准干预”等相关要求[4]。
利用各类专业化心理测量工具和技术协助开展学生心理健康测评目前已经相当普及。各高校新生入学后的心理测评已经基本实现全覆盖,部分社会经济较为发达的地区和城市的中小学也普遍开展了针对学生乃至教师和家长的心理测量[5]。随着全国范围内初等至高等各教育阶段学校心理健康教育工作的专业化程度不断提升,心理测量也日趋规范和完善。在一线心理测量的实操中已经开始注重测验的标准化,并且认识到了测量误差控制和测量结果信效度等对于开展学校心理测量工作的意义。
但是,目前学校心理健康测评工作的开展过程中依然存在专业性、科学性不够的现象,特别是在测评工具的选择方面,问题较为突出。例如,对中学生心理健康测评相关文献进行研究发现,学校心理测评中存在测量工具选择不够合理、合适的问题[6-7]。本文分析了学校心理测评中出现问题的常见原因,并提出了改进建议。
所有的测量工具都具有其适合的量程(range)。例如,在长度测量中,我们不会用直尺去测量操场的长度,也不会拿卷尺测量头发丝直径,因为这些测量对象显然不适合直尺或卷尺的量程。但是在心理测量中,人们往往会忽视这一点。受测学生的某个心理特质是心理测量的对象,而心理特质也像长度等物理特征一样有着极大的跨度范围。以心理健康维度为例,有的个体心理弹性和情绪调节能力极强,不论经历什么样的挫折和困难都可以很快恢复积极的心态,其心理健康水平位于特质轴上特别偏向“好”的一端的位置上;同样,也有的个体罹患重度精神障碍,其心理健康水平位于特质轴上特别偏向“差”的一端的位置上,与前者在轴上的距离相去甚远。就像长度测量工具往往只能覆盖有限的量程范围一样,大多数心理测量工具也仅能够覆盖其测量的心理特质的一部分区间。因此,在开展心理测评时所选测量工具的量程必须与目标对象群体的整体心理水平相适配。
心理测量工具的量程不合适可能会造成很多不利后果。
一是心理测量的结果会出现天花板效应(ceiling effect)或地板效应(floor effect),导致整体结果集中在高分段或低分段,压缩了测量结果的变异程度,进而影响测量结果的区分度和准确性。例如,90 项症状自评问卷(Symptom Check List 90,SCL-90)是目前在学校心理健康测评中广泛使用的心理量表,该量表是从躯体化、抑郁、精神病性等多维度评估精神障碍症状程度的临床心理量表,其量程在心理健康特质轴上应该在“疑似有精神障碍”到“中度或重度精神障碍”之间[8]。如果想基于该量表进行精神障碍的筛查,则目标群体就是可能患有精神障碍的个体,使用该量表是合适的;但如果想评估学生群体整体心理健康水平或一般心理问题倾向,该量表并不适用,因为对于学生群体而言,心理问题大部分集中表现在学习、交往、情绪状态和社会适应性等方面,并且多数属于发展性问题,仅少数属于障碍性问题[9]。学生群体中的绝大多数心理健康水平会比SCL-90 适用的量程上限更好,如果用该量表施测,则结果会主要集中于低分段,难以进行实质性分析。
二是心理测量的实施是向受测学生提供标准化刺激(题目描述)并采集受测学生相应的行为反应(作答记录)的过程,受测学生的心理活动本身也会受到测量过程的影响,而测验量程与测验题目表述往往密切相关,测验量程不适配则该测验表述通常也不适宜展示给受测学生。如果将这样的测验给低年级学生群体用,则可能会对受测学生造成一定的心理伤害,甚至可能引发恶性的群体心理事件。
例如,2021 年11 月,上海市某区在本区小学组织开展的心理健康测评中,就选用了贝克自杀意念量表(Beck Scale for Suicide Ideation,BSS)作为测评工具之一。该量表适用对象为可能存在抑郁等精神障碍且可能存有自杀意念的群体,因此其中含有大量类似“最近一周为了自杀,你的准备行动完成得怎么样”的表述。使用该量表施测对于心智发展尚不成熟的小学生群体可能会起到负面的诱导作用,也引发了很多家长的担忧。最终,该事件在媒体报道和互联网讨论中不断发酵,发展成为公众舆论事件,造成了较为恶劣的影响。
绝大多数心理测验分数的意义都是靠测验参照赋予的。按照测验参照的不同,心理测验可以分为标准参照测验(Criterion-Referenced Test)和常模参照测验(Norm-Referenced Test)[10]。其中,部分临床心理测验和成就测验等属于标准参照测验,其余常用心理测验大都为常模参照测验。常模(norm)是根据标准化样本的测验结果,经过一定的统计处理建立起来的测验结果评价参照系。常模参照测验的实质就是将受测对象放到其所在的群体中来确定其在某心理特质上的相对位置。但群体的心理特征并非长久稳定的,也会随社会经济文化的发展发生变化,因此常模也应随群体的变化而不断更新。根据心理测量学的要求,心理测验的常模一般每5 至10 年就应重新制定[10]。但目前学校心理测量工作中常用常模参照测验的本土化常模大部分是于20 世纪80 至90 年代制定的,以常用的人格测验工具艾森克人格问卷(Eysenck Personality Questionnaire,EPQ)为例,其简式中国版常模由钱铭怡等于20 世纪90 年代末修订[11]。类似这些心理测验的常模已经过于老旧,无法跟上我国日新月异的社会发展,不适宜在心理测量工作中继续使用。
对于基于问卷的心理测量而言,受测学生认真如实作答是测量有效性的根本前提。如果受测学生因为某些原因提供了不准确的答案,心理测量的结果也就变成了空中楼阁。在学校心理测评的实施中,确实存在一些因工具选择不当而影响受测学生作答真实性的问题。
一是使用的测验过于冗长。不少教师在开展学校心理测评工作时,使用的测验工具包含的题目数量本就很多,有时为了增强测量的全面性和信度水平,还会将多个心理测验合并施测,总施测题目数量一般在100 项以上,学生要花20~40分钟才能完成,低年级学生由于理解能力等方面的限制,可能花费的时间更长。学生在作答时,注意力难以做到长时间集中,往往会出现不认真读题、随机作答或选择固定选项应付了事的情况,这就使得心理测量结果变得毫无意义。即便使用了如明尼苏达多相人格测验(Minnesota Multiphasic Personality Inventory,MMPI)等包含效度分量表的测验,也仅能在一定程度上区分作答是否有效,并不能起到校正无效结果的作用。因此,控制题目数量以保证受测学生的注意维持使其能够认真作答的实际效果,远优于提供大量题目但受测学生随意应付作答的情况。
二是过于依赖自评测验。目前,学校心理测评中使用的绝大多数都为自评测验,即受测学生就是评估的对象,根据测验题目和自身实际情况自行作答。在接受心理健康方面的筛查时,受测学生可能存在的掩饰会有意或无意地直接影响作答过程,造成测量结果的偏差。
在立足既有心理测验开展学校心理测评工作时,应进一步加强测验选择的科学化和规范化。一般来说,按照以下五步流程就能够选出合理、适用的工具。
1.根据心理测评的目的确定需要测量的心理特质,如心理健康、智力、人格等,并找出尽可能多的针对目标特质进行测量的心理测验作为备选。
2.考虑备选心理测验的量程和题目描述是否适合学生群体。
3.查看备选心理测验的参照是否更新及时,如果确实没有新近修订的参照工具,在排除其他因素的情况下可优先选择标准参照测验。因为标准参照测验中标准的建立通常基于较为确定的专家共识,相对于常模参照有更好的稳定性。
4.根据测验使用手册评估备选测验结果信效度是否在可以接受的范围。
5.考虑备选测验的题目数量,尽可能选择简短的测验。
目前,我国针对在校学生群体的心理测评工具较为缺乏,有针对性地开发新的心理测验,是解决学校心理测评工具选择问题的更为理想的方案。即便是中国中学生心理健康量表这样专门针对我国中学生群体编制的心理健康测验,其测量内容也是以强迫、抑郁等精神障碍因子为主,并未涵盖前文所述的更为关键和普遍的发展性问题[12]。因此,新的学校心理测评工具的开发势在必行。
新的学校心理测评工具的开发应该遵循以下三个原则:
一是继承现有工具的优点。经典心理测验经过长期使用和多次修订,通常具有测验结构清晰、施测信效度好、配套手册完善等特点。在编制新的测验时,应借鉴经典心理测验对于特质结构的分析和典型表现的表述,在此基础上进行适应我国学生群体的改编和拓展,可以更好地提供开发思路,保证开发质量,降低开发成本。
二是采用新测量理论和测评技术。新的学校心理测评工具应是基于项目反应理论(Item Response Theory,IRT)的计算化自适应测验(Computerized Adaptive Testing,CAT)平台,可以通过手机、智能平板、电脑等个人智能终端设备访问。其特点是受测学生在完成每一道或每一组题目后,测评程序会重新评估受测学生的特质水平,然后根据其特质水平呈现最适合的后续题目。这一技术可以通过提供更加合适的题目减少测验所需的题目数量,能够较好地克服测验冗长的问题,达到精简测验长度的目的[13]。而且此类平台可以不断更新测验模型和参照,如在使用时借鉴美国教育测试服务机构(Educational Testing Service,ETS)编制的学业测验的方法,在每一次施测的过程中对已有的和新的测验题目模型和常模进行验证和完善。同时,该方法还便于利用技术手段提高学校心理测评工作的保密性。
三是顶层统筹指导实施。不论是项目反应理论测验模型的建立,还是计算机化自适应测验平台的建设,都具有前期投入和初始成本较高,但边际成本很低的特点。因此,建议工具的开发建设应由省级以上教育主管部门牵头组织,以提供较强的技术和资金支持,在平台建成后以公共服务的形式向各级学校开放使用。
在短期内无法获得特别适合的心理测评工具的情况下,也可以借鉴360 度评估技术,采用他评与自评相结合的方式开展学校心理测评。360 度评估是组织行为学中常用的评估技术,指由员工自己、上司、下属、同级同事,乃至顾客等从全方位、多角度对员工进行评估的方法[14]。
心理测评其实只是以低成本快速了解测评对象心理状况的妥协性手段,因此只要能够达到了解目标群体心理的目的,并非一定要实施心理测评。当缺乏合适的工具直接实施自评测验时,通过问询测评对象的熟人其在一些关键表现和线索上的情况,同样可以取得较好的效果。例如,关于自杀意念和自杀行为的监测,可通过对学生开展心理健康教育,使学生了解自杀前常见表现,之后通过学生间互助提供自杀预警,反而优于使用贝克自杀意念量表等工具进行筛查的效果[15]。因此,在学校心理测评工作中,应重视学生中心理骨干、心理委员或学生心理社团队伍的培训,从学生群体内部入手,增进对学生心理健康状况的了解和掌握,实现心理问题相关风险的提前预警。
心理测评作为学校心理健康教育工作中的重要一环,其科学化和规范化应得到进一步加强。而测评工具的选择作为心理测评中的关键环节之一,理应得到高度重视。针对当前学校心理测评工具选择中存在的一些实际问题,学校心理健康教育工作的管理指导者和一线教师都应立足自身岗位资源,提升和完善个人和体系的专业化程度,以提高心理测评服务学校心理健康教育工作的实效。