心理教育量表的发展及在孤独症儿童评估中的应用述评

2022-03-02 23:29黎朝钰
现代特殊教育 2022年2期
关键词:效度测验信度

黎朝钰 陈 珂 赵 微*

(1.陕西师范大学 教育学部 西安 710062;2.华南师范大学 教育学院 广州 510631)

一、前言

孤独症谱系障碍是一种由遗传及环境因素共同作用引起的常发生在儿童早期的广泛性发育迟缓,其核心特征是儿童在社会交往、言语沟通与行为方面存在明显异常[1]。虽然目前学界尚不清楚孤独症的确切病因,但通过大量研究已经得到一个共识,即对孤独症儿童进行早期干预能够最大限度地预防孤独症儿童的发展性问题,并会产生积极效果[2]。而在对孤独症儿童进行早期的康复训练前[3],一份能够准确、全面、真实、动态地反映儿童发展水平的孤独症评估量表显得尤为重要。当前,在孤独症儿童评估工具中,语言行为里程碑评估与安置程序(Verbal Behavior Milestones Assessment and Placement Program,简称VB-MAPP)主要是针对0—4岁儿童的语言和社会技能方面的评估,内容单一,缺少儿童体能运动方面的内容。基本语言和学习技能评估(Assessment of Basic Language and Learning Skills,简称ABLLS)则是针对0—12岁儿童语言技能方面的评估工具,适用年龄阶段更广,但各评估项目之间没有按照年龄进行设置,从而导致并非所有项目都是按儿童发展顺序进行编排。以上这两种针对孤独症儿童的评估工具都无法全面地显示不同年龄阶段的儿童在不同功能领域发展的具体情况,因此在实际的教学领域中所发挥的作用十分有限。在此背景下,心理教育量表(Psycho-Educational Profile,以下简称PEP)应运而生[4]。

PEP独特评价机制可以在被试儿童当下能力水平的基础上检测其与正常阶段儿童能力特征的偏差程度,这些特点使该量表在为特殊教育领域工作者及家长制订个别化教育计划方面发挥着关键作用[5]。随着PEP的发展与完善,该量表现已被翻译成中文、德文、日文、法文等多国文字。作为评估孤独症及有关发育障碍儿童的标准化测评工具之一,其临床应用效果在跨文化环境中也不断得到验证。在干预反应模式成为融合教育环境中有效教学模式与最佳实践方式的背景之下,该量表独特的孤独症儿童评价方式与干预反应模式[6]相契合。心理评估手册第三版(Psychoeducational Profile -Third Edition,以下简称PEP-3)和心理评估量表中文修订版(Revision of Chinese Version of Psycho-Educational Profile,以下简称C-PEP)作为我国对残障儿童进行诊断与评量的评估工具,为孤独症儿童进行随班就读等融合教育模式提供了实践依据。此外,该量表将影响孤独症谱系儿童的家庭教育因素纳入评估范围,在一定程度上促进了孤独症儿童家庭教育的发展。

二、PEP在美国本土的编制与修订

(一)第一版PEP的编制

20世纪70年代中叶,美国学者Schopler 和Reichler在北卡罗莱纳州立大学的精神病学系研发出一套孤独症结构化训练方法(Treatment and Education of Autism and Related Communication Handicapped Children,简称TEACCH)[7],初版PEP量表便是其中一种测验工具。该量表以发展理论为基础[8],认为孤独症儿童与普通儿童在身心发展历程上拥有共同点,以发展的眼光看待孤独症儿童的发育水平,使其成为孤独症儿童个性化服务中发展目标来源的有力支撑。初版PEP包含两个分量表,第一个量表是以儿童知觉、精细动作、粗大动作、手眼协调、认知表现等95项评估方向[9]为内容的功能发展量表,主要用于发现儿童不均衡、不协调的学习模式;另一个分量表则是以学生情感、人际关系及合作行为、语言、感觉模式等44项评估方向为内容的病理行为量表,主要对儿童病理行为的严重程度进行评估。

两个分量表的评分机制[10]有所不同,但都以发展理论为基础,将儿童的发展过程看作是一个循序渐进的过程来进行评价。在功能发展量表中,将学生的反应行为划分为三级,分别为“通过”(P)、“中间反应”(E)、“不通过”(F),其中“通过”计1分,“不通过”计0分,“中间反应”(E)不计分。“中间反应”的记分选项主要是用来描述儿童未能充分理解项目要求或不具备完成任务的必要技能,从而只能完成项目要求的部分任务的表现,儿童在该类项目上的表现可以直接转化为个别化训练目标。将每项得分画在功能发展侧面图中,便可得到儿童目前可能的发展潜能区域。而在病理行为量表中,则是以普通儿童年龄阶段的正常反应作为标尺衡量,如“没有”等级是指被试儿童的行为表现与同龄儿童行为特征相符合;“轻度”等级是指被试儿童的行为滞后于相应年龄阶段特征;如果被试儿童的行为与同龄普通儿童的表现在强烈程度、性质与特征上都表现出极为显著的差距和不同,则被评为“重度”等级。从施测过程看,与以往其他的量表不同,该量表在测验时间、测验项目顺序呈现及实施方法上具有灵活性,单次施测时间在50—90分钟不等,可以分成1—3次进行,特别适合教师和家长的日常评估与积累。但考虑到每个儿童的年龄、发育特征及练习效应等因素,该测验必须在两周内完成。从施测工具上看,PEP工具具有种类多样且趣味性强的特点,其中包括如布娃娃、泡泡水、积木等儿童喜欢的玩具,有助于激发起儿童对施测工具的好奇心和探索欲,因而能够快速配合施测者进行测验。除此之外,从施测引导上看,该量表针对孤独症儿童言语沟通方面存在严重障碍的特点,专门设计了每个项目施测前的指导语以及被试反应所需语言的要求,从而使整个量表所需语言程度较低。

该量表最初并不是为检测儿童的智力分数而开发的,而是旨在鉴别孤独症儿童的发展特点,根据评估得出的优劣势特点和发展潜力设计适合孤独症儿童的个别化训练方案。正因为心理测验的用途并不是PEP研发的初衷,故而关于该量表初版的信度尚无详细数据供参考。然而值得一提的是,有相关研究证实初版PEP的功能发展量表的相容效度较高,如该量表与图词测验(Peabody Picture Vocabulary Test,以下简称PPVT)、文兰社会成熟量表 (Vineland Social Maturity Scale,简称VSMS)的相关系数都高达0.71,说明初版PEP与某些同类测验在相同情境下进行的评定结果有效性程度较高。另外,还有调查结果显示,初版PEP的病理量表与儿童孤独症评估量表(Childhood Autism Rating Scale,简称CARS)间存在显著相关。但必须明确的是,同时也存在初版PEP相关系数较低的测验,如在雷特国际操作量表(Leiter International Performance Scale,简称LIPS)、韦氏儿童智力量表、学前儿童智力量表上的相关系数都显示在0.24—0.47之间,没有达到显著相关。与此同时,仍有一些相关研究表示,直接根据PEP的判定作为学校设计教学内容的依据这一做法是应当被质疑的[11]。

(二)PEP的第一版修订——PEP-R

1986年美国出台《全体残疾儿童教育法案》修正案,强调应该将更多婴幼儿早期教育与服务的权利置于《残疾人教育法》(IndividualswithDisabilitiesEducationACT,简称 IDEA)的保护之下。PEP修订版(PEP-R)作者Schopler回应了当时美国的社会吁求[12],进一步扩大PEP的适用对象和范围,增加了适合2岁半儿童的测试项目,并且删去了原版中最难的项目61B(示意求助),使修订版适合于对6个月至12岁的儿童进行评估,更加关注婴幼儿早期教育的需求。

与此同时,为了弥补初版PEP信度缺失的问题,修订版的PEP-R除了在内容方面进行调整之外,在信效度方面也进行了补充。PEP-R的评分者组内相关信度系数ICC 为0.92。行为量表各分测验的重测信度达到0.75 以上,评分者信度在0.56—0.88之间。在效度方面增加了该量表与两个量表之间的相关效度,其中与文兰适应行为量表(Vineland Adaptive Behavior Scales,简称VABS)的相关系数为0.66—0.87,与格塞尔量表的相关系数为0.61—0.82,其效标关联效度较理想。

(三)PEP-R的修订——PEP-3

随着孤独症结构化教学在孤独症干预领域的治疗成果逐渐显著,PEP和PEP-R的运用领域同样日渐延伸,在检查各种干预训练方法的成效中发挥了重要作用。不可避免的是,作为评估相关测验的指标,PEP的心理测量特性同样面临了较多争议[13]。Hanna认为,PEP 的测验结果无法提供适合学校教学内容设计的有效数据支撑;Wiese指出,PEP的信效度缺陷直接影响工具的使用;Tindal则表示,PEP-R分量表的信效度数据仍需进一步验证。这些心理测量学特性上的缺陷无疑是 PEP 量表决定开始最新一次修改的内部驱动力。在新版本的适用年龄阶段上,PEP-3针对发展年龄小于7岁半的儿童或者生理年龄介于2至7岁半的儿童进行测验。在第三版的内容方面,PEP-3进行全面有序的评估内容调整[14],在充分考虑学生发展特点的前提下,将评估内容增加至172个项目。新增的关于儿童感知觉、动作、语言、认知特点等评估项目与孤独症儿童早期干预内容相契合,且更加注重对社交和沟通领域障碍的特点进行测量[15]。与此同时,PEP-3注重评估中亲子的双主体作用[16],借鉴TEACCH模式的优点,将重要照顾者纳入评估体系,并为此增加了评量家长对儿童现状能力了解程度的《儿童照顾者报告》。PEP-3 计分方法也有所改变[17]。除了保留PEP-R的P(通过)、E(中间反应)、F(不通过)和A(恰当)、M(轻度)、S(重度)之外,还采用了统一的量化评分(0—2分)。“恰当表现”为2分,“轻度到中度问题”为1分,“严重问题”为0分。

在该量表的信度方面[18],新增加了普通儿童和不同年龄阶段孤独症儿童的内部一致性Cronbach’s α系数指标,普通对照组和孤独症儿童群组在各个领域的α系数均大于0.90,相隔一段时间的重测信度为0.94,有关该量表的子测验照顾者报告中的信度相关均值为0.84。同时,在该量表的效度方面还提供了该量表与孤独症行为检核表 (The Second Autism Behavior Checklist,简称ABC-2)、简明能力评定量表(Behavioural Activity Rating Scale,简称BARS)相关的效度数据;利用项目功能差异分析(Differenrial Item Functioning,简称DIF)完善了各项目效度信息,相较于PEP-R效度值存在明显优势。PEP量表与年龄有较为显著的正相关,具有良好的建构效度;各个群组间儿童的PEP发展分数具有较好的区分效度。除此之外,PEP-3进一步分析了各分测验之间的相关系数 (0.39—0.90之间),并通过验证性因子分析(CFA)得到沟通、运动、不适应行为三个合成因子。虽然三因子模型的拟合指数都高于0.93,但近似误差均方根 RMSEA(0.178)较大,还需要更加可靠有效的数据证明。

三、PEP的本土化过程

(一)心理评估量表在中国大陆的引进与修订

20世纪末,为了对我国孤独症儿童进行早期评估与干预,辽宁师范大学孙敦科教授[19]成功申报辽宁省“重点扶植”科研项目“孤独症及相关发育障碍儿童用心理教育量表(PEP)跨文化修订”。紧接着,孙敦科等人发表了《PEP量表跨文化修订的预测报告》。预测结果显示,PEP的年龄效标效度为0.85,内部一致性信度为0.95,是实用有效的评估工具[20]。而PEP进行跨文化中文版的修订是应用于中国特殊儿童评估的基础。于是,该课题项目在辽宁师范大学和北京大学精神卫生研究所的共同努力下,历时3年完成PEP中文版的修订及试用工作。进入21世纪,联合课题组发表《〈心理教育评定量表修订版C-PEP〉 评定报告》等相关研究成果。2001年,在我国首次进行的残疾儿童抽样调查中,C-PEP量表成为评估儿童是否患有精神残疾类疾病的重要测验方法之一。经过20多年的跨学科研究及临床应用后,一些研究者对PEP-3也进行了中文版修订,建立了中国本土化的常模数据,具有良好的信效度。在Shek等人的研究中[21],CPEP-3的第一部分发展功能量表的信度范围在0.59—0.83之间,第二部分照顾者报告的信度范围在0.54—0.59之间,该子测验的重测信度[22]在0.84—0.87之间。此外,该子测验与香港适应行为量表之间的相关系数也在0.40—0.62之间,成为我国孤独症儿童临床评估的有效工具。

我国在量表的应用与修订过程中,对原有量表的基本内容结构、评分方式等作了保留[23]。C-PEP以美国原版PEP为蓝本进行修订,功能发展量表与病理行为量表共同构成量表主要内容,共139个项目。计分机制和前两个版本一样,由“通过”“不通过”“中间反应”项组成,其中“通过”计“1分”,“不通过”计“0分”。“中间反应”项不计入总分,而是作为设计个别化教育课程的数据支撑。

在对北京市78名孤独症儿童与120名普通幼儿园3—6岁儿童进行研究后发现,该量表的信度系数均在0.77—0.99之间,其中PEP功能量表的效标效度在两组都达到了0.98和0.69[24]。在与PPVT和瑞文测验的相关研究中发现,相容效度达到0.99的高相关水平。

此外,还有一些研究发现,C-PEP中多数分测验的Conbach’s α 系数都在0.80—0.94之间[25]。总体来说,C-PEP两个功能量表的信度均高于0.90,说明C-PEP测验内部题目之间具有较高的一致性。同时,组内相关系数(Intraclass Correlation Coefficient,简称ICC)的判断标准显示, C-PEP量表的评分者一致性较高,值得纳入实际运用的评估工具中。

(二)PEP在港台地区的引进与修订

PEP自问世以来迅速在美国及全球得到广泛应用[26],我国港台地区对于PEP的引入和修订时间也较早。20世纪80年代,我国台湾地区张正芬教授首次发表文章对PEP进行介绍。2000年,Tang完成了中文繁体版的PEP-R的修订,即C-PEP广东话繁体字版本,该量表的病理分量表的组内相关系数为0.73—0.94,再测信度为0.75—0.99。在另一些研究中发现,该量表的发展分量表的组内相关信度系数为0.98—0.99,病理分量表为0.84—0.87,发展分量表再测信度为0.89—0.99,病理分量表再测信度为0.76—0.92[27]。

20世纪90年代,香港协康会引入并修订PEP[28],对于涉及语言文字材料和文化差异的项目都进行了更换,使其更加适合我国的文化背景和儿童的认知水平。直至2013年协康会[29]发布了全港首次建立的孤独症儿童常模数据,并紧跟PEP的改版不断翻译修订至如今的PEP-3繁体中文版,逐渐成为目前我国国内使用的PEP较为广泛的版本之一。香港协康会完善的PEP-3中常模数据除了有普通儿童样本的常模发展年龄,还包括可用于孤独症群组内部比较的发展适应程度及百分等级的常模。

四、PEP在孤独症儿童评估中的应用

(一)孤独症谱系障碍儿童的评估与筛查

国内一项对孤独症儿童早期筛查的研究指出,通过使用PEP-3量表与改良版婴幼儿孤独症筛查量表(Modified-checklist for Autis Toddcers,简称M-CHAT)相结合的方式对孤独症儿童进行评估,可以判断该类儿童的孤独症障碍程度[30]。有相关研究通过使用C-PEP量表对接受针刺干预的孤独症儿童进行测验,并将测验结果作为针刺干预治疗成效显著的数据支撑[31]。一些针对高压氧对孤独症儿童康复效果的研究中[32],C-PEP量表就被用来分析这种干预方式是否可以改善孤独症儿童的行为表现。在一项关于特殊教育机构中的结构化教育与家庭中的康复训练干预效果对比的研究中,使用孤独症行为评定表(Autism Behavior Rating Scale,简称ABC)和C-PEP相结合判断学生的行为改善效果,结果发现,将特殊教育机构中的结构化教育与特殊儿童家庭教育相结合的干预比单独的家庭康复训练更为有效。此外,一些研究通过对PEP进行借鉴后编制测量孤独症儿童绘画能力方面的量表,信度与效度较好[33]。还有研究使用C-PEP评估应用行为分析法(ABA)训练、引导式教育和感觉统合训练等干预措施对孤独症干预效果的有效性[34]。

(二)制订有效的个别化教育计划

首先,PEP-3已引入家长评定量表,该内容的补充有助于干预者多视角地认识儿童发展过程中的不足,这使得该量表在孤独症儿童评估与个别化教育计划制订过程中优势更加突出。其次,目前已有大量研究证实,PEP不仅能提供孤独症儿童的发展程度信息,而且“中间反应”的项目最贴近儿童的最近发展区,有助于教师更好地设计课程内容,作为学生下一阶段教育的跳板。如在一些研究中发现,孤独症儿童干预教师可以根据学生在PEP中的“中间反应”项目表现情况制订训练干预目标,还可以根据功能评分所描绘出的学生心理发展侧面图制订相应的训练目标[35]。最后,该量表中的病理量表部分可以成为我们对目标儿童行为观察的依据,使干预者初步了解儿童问题行为,从而初步提供行为干预方案,这是制定与实施个别化教育计划的前提与基础。一项研究则通过对6名7—10岁的儿童进行研究,以C-PEP量表的“中间反应”表现为依据,并将之作为个别化教育计划的短期目标对学生进行干预,结果发现,这种个别化教育计划非常有效[36]。C-PEP-3量表,即孤独症谱系及相关发育障碍儿童评估心理教育量表中文修订三版,由辽宁师范大学、北京大学第六医院联合修订,经历了20多年跨学科团队的科学研究及临床应用,具有良好的效度和信度。无独有偶,有研究通过随机对照试验发现,根据C-PEP-3评估结果制订的个别化教育计划在改善孤独症与患者认知能力方面,是值得推广的[37]。

(三)提供家庭教育的结构化支撑

PEP量表将家庭教育中的影响因素纳入评估范围,最新版PEP-3的《儿童照顾者报告》将家长纳入评估主体,整合家长对儿童日常生活的观察报告,进一步验证评估结果,并为家长提供结构化家庭教学的支撑。有研究认为,在进行评估的过程中重视照顾者对于儿童日常生活的观察和反馈,能提高评估结果的准确性,有助于评量照顾者对儿童的发展水平及教育期望。不仅可以进一步判断不同障碍间是否存在相关性,还便于分清教育干预中的主次矛盾,逐一解决问题[38]。有研究发现,通过PEP-R对有家庭干预项目的小组进行评估在促进孤独症儿童发展方面是有效的[39]。

五、挑战与展望

(一)在坚持本土化经验积累的基础上及时对量表进行更新

迄今为止,PEP量表已经走过三个版本的修订历程。从已有文献中,我们可以了解到PEP量表在中国大陆的修订过程[40],即立足中国的国情,将引进的蓝本与自己不断探索验证的经验相结合,使之满足评估特殊儿童的需要。最新版本PEP-3问世后,许多国家和地区的研究者在接纳的同时,就其常模的普遍性表示存疑。如我国台湾地区选择了审慎严谨的立场[41],姜富美等人表示,“PEP-3 常模为美国常模,不一定适用于我国台湾地区,临床解释及应用仍须谨慎”[42]。因此,今后研究应该在立足于国内儿童心理特征的基础上对量表进行更新引进,从而提高评估的可靠性。

(二)使用多元化评估方式对儿童进行评估

研究发现,在使用该量表进行评估时,应该进行各量表间与量表内多维度评估结果的相互印证。首先,评估者应该注意,该量表的心理侧面图所反映的儿童心理发展水平只是依据常模划分的并不精确的年龄区间,这种特点要求评估者使用多元化的评估工具对儿童进行评估,从而进行评估结果间的相互印证。其次,该量表的评估由两部分组成,分别是施测者填写的测评报告与父母等照顾者填写的《儿童观察者报告》,包括除了施测者以外的其他相关个案信息[43]。青少年和成人心理教育量表(Adolescent and Adult Psychoeducational Profile,以下简称AAPEP)是由PEP衍生的为青少年和成人孤独症人士设计的评估工具。AAPEP[44]由直接观察、学校和工作三份量表组成,分别由测试实施者、访谈家长和教师共同完成,共48道测试题,通过不同主体的评估和观察,从患者的各个生活环境对其进行测评,便于更有针对性地制订康复训练计划[43]。而在我国目前应用PEP量表的过程中,同样需要注意结合其他测验共同评估,进行多维度多主体的观察,才能更好地为患者提供有针对性的教育计划。

(三)开发基于发展性和适应性的教育课程

孤独症儿童在身心发展上存在不同程度的障碍,但其生长发育过程和普通儿童并无不同,并且有着相同的心理特征与发展需求,具备各方面能力发展的潜能,只是发展速度相对来说较为缓慢。因此,孤独症儿童的发展依赖于相应的、针对性的教育和训练[45]。研究者及教育工作者可以根据实践教学中的反馈进一步完善C-PEP量表的结构和适用于评估我国特殊儿童的本土常模数据,并在此基础上开发多方面适用于干预治疗孤独症儿童的生态性、适应性的课程。不管是特殊需要儿童还是普通儿童,都将从这类涉及多个功能领域的课程中受益无穷[46]。除此之外,像这类体现儿童发展性和适应性的课程内容能够帮助特殊教育工作者在教育内容的呈现、教育形式和手段的选择上更加得心应手,有效提高干预效果,促进儿童康复与成长。

猜你喜欢
效度测验信度
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
平衡损失函数下具有时间效应和通胀因子的信度估计
《新年大测验》大揭榜
两个处理t测验与F测验的数学关系
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
中文版脑性瘫痪儿童生活质量问卷的信度
你知道吗?
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度