复旦中文版脑瘫粗大运动功能测试量表项目难度改良及反应度和精确度研究

2018-05-28 08:06史惟

中国循证儿科杂志 2018年2期

史惟

粗大运动功能测试量表(GMFM)由Russell等人编制出版，用于测量脑瘫患者粗大运动功能随时间或干预而产生的改变状况，是目前脑瘫粗大运动功能评估中使用最广泛的量表[1、2]，评估内容主要集中于ICF-CY框架中的活动成分，尤其是活动成分中的改变和保持身体姿势、步行和移动部分，与身体功能有关联的GMFM项目主要涉及手臂的支撑功能部分[3]。GMFM量表可以用来观察脑瘫患者粗大运动功能发育状况，分析和预测不同类型、不同分级脑瘫患者粗大运动发育轨迹和结局[4]，同时还可以判断各种干预和治疗方法对脑瘫患者粗大运动的影响，以及各种方法之间的疗效对比[5、6]。

GMFM量表目前包括GMFM-88和GMFM-66两个通用版本[7]，GMFM-88包括88个项目，5个分区，其中A区(17项)卧位与翻身；B区(20项)坐位；C区(14项)爬与跪；D区(13项)站立；E区(20项)行走与跑跳，每个项目4个评分点，评估结果包括各分区的完成百分率和总百分率。GMFM-88使用Rasch分析删除了22个项目形成GMFM-66版[8]，建立了项目难易度与被测试者的能力之间的关系。

由于GMFM-66大量删除了更为适宜婴幼儿脑瘫的项目[8,9]，仅提供了项目的整体难度值，没有提供每个评分点的具体难度值，给临床康复治疗师通过评估精确确定婴幼儿脑瘫干预目标带来诸多不便。

本文通过回顾性分析接受儿童康复评估和干预的脑瘫患儿的GMFM数据，重新确定复旦中文版GMFM的项目难度顺序，并与GMFM-66进行反应度和精确度比较，希望重新确定的项目难度顺序可以更好地适宜所有年龄段脑瘫患儿，为临床康复干预目标的制定提供更多的便利。

1 方法

1.1 参与研究机构及质量控制本研究用于分析的数据均来自于复旦大学附属儿科医院(我院)康复中心以及上海儿童康复合作群中的21家合作单位，其中包括3家二级医院儿童康复科、9家社区卫生服务中心儿童康复基地、1家民营儿童康复机构和8家特殊教育学校。

我院康复中心为国内GMFM量表的主要培训机构，参与数据收集医疗单位的评估医生和治疗师均在我院康复中心或培训学习班接受过GMFM评估培训，熟练掌握评估和计分方法，可以保障评估数据的准确性。在8所特殊教育学校接受康复治疗和教育的脑瘫儿童和青少年均由我院康复中心派员进行评估。定期开展数据复核评估质量监控，评估数据纳入同一数据库，由专人进行统一管理。本课题组验证了GMFM评估在上述机构中的各项心理测量学指标[10、11]。

1.2 脑瘫及分级诊断标准诊断符合2006年国际脑瘫会议制定的标准，脑瘫分型采用欧洲脑瘫监测组织推荐的方法[14]；采用中文版脑瘫粗大运动功能分级系统(GMFCS)进行分级[15]。

1.3 纳入与排除标准 ①2001至2017年在上述机构接受康复治疗和教育(运动治疗、作业治疗、感觉统合训练、力量训练、针灸、推拿、引导式教育以及特殊教育课程等)[12、13]的脑瘫儿童和青少年；②每例患儿至少具有1次18个月以后的评估数据，同一患儿每2次评估数据的测试时间至少间隔3个月以上；③排除伴有其他显著影响粗大运动功能疾患(臂丛神经损伤、脊柱裂、脊肌萎缩症、进行性肌营养不良等)的患儿；④排除测试前1年内接受过手术者、6个月内接受过肉毒毒素注射者。

1.4 评估方法采用复旦中文版GMFM-88进行粗大运动功能评估，GMFM每项采用4级评分法，0分：动作还没有出现的迹象，1分：动作开始出现，2分：部分完成动作，3分：全部完成动作。当无法确定分数时，按照较低的等级给分。除非评估者明确且清晰观察到患儿自发地能够(3分)或不能(0分)完成某个测试项目，其余难以明确观察到的项目均需实施评估，每个项目最多可以做3次尝试。将评估结果输入由GMFM配置的软件GMAE(version1.0)得出GMFM-66分值。

评定由指定治疗师或医师进行，环境设定为安静、独立、采光较好的房间，室温控制在20～30℃，患儿衣服为1～2层，每个评估时间约30 min。

1.5 分析方法

1.5.1 复旦中文版GMFM量表转化方法为了精确地分析每个项目评分点难度值，分别将每个GMFM-88项目转化为3个小项，分别对应原来项目中的(1、2、3)三个评分点，小项计分方式为(0、1)，例如：GMFM-88原来项目E区第69项4级评分转换为(69e1、69e2、69e3)三个小项，如果原来得分为2分的话，转换后计为69e1(1分)、69e2(1分)、69e3(0分)。依此GMFM-88被转化为具有264个测试小项，每项1个评分点(0、1)的构成,简称为GMFM-264。

1.5.2 Rasch分析采用Rasch分析中的等级量表模型进行分析，对GMFM-264采用内聚拟合度(Infit)的均方(MnSq,mean-square values)来确定量表的单维性，标准为MnSq在0.6～1.4，MnSq值不在上述区间的项目被判定为不适合项目，经Rasch分析筛选，要求最终确立项目中不适合项目的比例控制在5%以下[7]，在确定单维性后，可以得出包括信度、分离指数、MnSq均值等多项分析结果，项目难度尺度原始单位为logit(从正值到负值排列)，为了便于临床使用，将这些原始尺度通过Bigsteps软件转换为百分刻度，其中项目难度尺度即为改良后的复旦中文版GMFM量表项目难度顺序，同时也生成了与264个原始分相对应的能力值转换表。

1.5.3 反应度反应度是反映在变化状况下量表的应变性，常使用效应尺度评价，效应尺度=(后次得分-前次得分)/前次得分的标准差[15]，效应尺度越高，表示反应度越佳。

1.5.4 精确度精确度是指某种评估方法在不同人群或测试状况下区分被测者水平的能力，其高低依赖于两方面因素：①区分不同人群和不同测试状况的程度，②测试结果的组内和组间差异水平。相对精确度可以提示某种测试方法与标准方法或原方法相比，精确度的增减状况。相对精确度是成对F检测值的比值[9]，精确度越高表明区分能力越佳。

采用分层随机抽样方法确定纳入反应度和精确度分析的研究对象，在至少具有3次以上符合纳入条件的GMFM评估结果的纳入对象中，分为<3岁和～6岁组，按照GMFCS五个级别，每个级别通过计算机软件随机抽取5例研究对象，两组共计50例。每例纳入对象取前3次评估结果进行分析，通过分析各次评估结果间的GMFM-264与GMFM-66的分值差异比较两种计分方法的反应度和精确度。

1.5.4 统计学方法使用Microsoft Access和Mcirosoft Excel进行数据输入、整理和转化，Rasch分析采用Bigsteps(v2.82版)软件，计算机随机采集的样本和其他分析采用SPSS19.0软件。

2 结果

2.1 纳入对象一般情况符合本文纳入排除标准的1 198例脑瘫患儿作为本文研究对象，男801例(66.9%)，女397名，首次评估时平均年龄(4.5±3.8)岁，最小2个月，最大19岁；其中痉挛型四肢瘫324例(27.0%)、痉挛型双瘫506例(42.2%)、痉挛型偏瘫255例(21.3%)、徐动型45例(3.8%)，肌张力障碍型40例(3.3%)，共济失调型28例(2.3%)。GMFCSⅠ级348例(29.0%)、Ⅱ级273例(22.8%)、Ⅲ级213例(26.0%)、Ⅳ级182例(15.2%)、Ⅴ级182例(15.2%)。

2.2 GMFM数据样本的年龄分组与分级、分型分布情况共计3498次GMFM评估结果被纳入分析，平均(2.9±4.0)次，有2人评估次数最多，为27次，见表1。

表1 GMFM数据样本的年龄分组与分级、分型分布情况(n)

2.3 Rasch分析 Rasch分析结果显示，264小项中Infit MnSq值>1.4的只有6项，分别为05-a-03、04-a-03、04-a-02、05-a-02、01-a-03、57-d-03，没有<0.6的项目，因此不适合项目占总项目的比例仅为2.3%(6/264)，表明GMFM-264中的绝大多数项目具有良好的单维性。

项目难度尺度的标准误均数(mean standard error)为0.32(区间为0.25～1.83)，项目信度为1.00，表明这些项目具有良好的信度。项目分离系数(item separation values)为55.12，表明这些项目具有较好的难度分层。样本能力尺度的标准误均数为1.16(区间为0.83～4.39)，样本信度为1.00，样本分离系数为15.07，说明GMFM-264具有良好的内在信度和良好的难度分层。经Rasch分析后得出的项目和样本的各项参数见表2。最终确立的样本能力值与项目分布情况见图1，GMFM 264个小项的项目难度值和纳入分析的样本能力值之间对应关系见表3。

表2 Rasch分析后得出的项目和样本的各项参数

注 1)：按Rasch要求，除去29个满分(原始分满分为264分)样本

2.4 GMFM-264与GMFM-66的反应度和精确度比较比较GMFM-264和GMFM-66前后3次评估分值发现，GMFM-264和GMFM-66的效应尺度<3岁组明显高于～6岁组，而在<3岁组中，GMFM-264的效应尺度又高于GMFM-66，尤其在第2次与第3次(0.33vs0.18)以及第1次与第3次(0.96vs0.75)比较中更为明显。在～6岁组中，GMFM-264与GMFM-66的效应尺度非常接近，差异均在0.02。

图1 样本能力值与项目难度的分布情况

注左侧#表示5个样本数,.表示1～4之间个样本数，右侧为264个GMFM小项的难度分布，01a1表示为GMFM-A区第1项的1分小项

表3 GMFM原始分、能力和项目难度值对应关系举例

由于GMFM-264和GMFM-66在～6岁组的各次评估分值间，以及GMFM-66在<3岁组的第2和第3次的配对方差检验均无显著性差异，因此不能计算相对精确度，在<3岁组中，第1次与第2次的分值比较两种计分方法的相对精确度比较接近，但是第1次与第3次分值比较后，GMFM-264的精确度明显高于GMFM-66(1.57vs1.00)。

3 讨论

GMFM量表自从1988年发布以来，原著者和相关研究者不断地推进各种改良工作，除了推出GMFM-66以外，其他改良工作主要聚焦于缩短评估时间和提高针对各类脑瘫患儿的适应性两方面。史惟等2008年基于GMFM量表设计了脑瘫患者粗大运动功能问卷(CP-GMFQ)[16]，包括56个图文并茂的测试项目，通过家长问卷的方式，平均4.7min就能完成测试，与GMFM-66和GMFM-88的相关性均>0.90。2010年Russell等提出了GMFM项目组集测试法(GMFM-66-IS)[17]，评估者通过被试者的特征从预先确定的项目组集中选择合适项目组进行测试，以缩短测试时间。2011年Bartlett等提出了第二种GMFM缩短测试方法地板和天花板法(GMFM-66-B&C)[18],借鉴发育测试中常用的切入点方式(例如Peabody Developmental Motor Scales)，快捷地测试与脑瘫患儿当前能力相关的项目，以推测患儿的整体粗大运动功能。Wilson等人开发的GMFM挑战模块(Challenge Module，CM)，旨在提升高功能脑瘫患儿(GMFCSⅠ级)测试的有效性[19]。Hielkema针对GMFM在婴幼儿脑瘫中的测试中的不确定性提出了相关改进意见[20]。Salavati等针对伴有视觉障碍脑瘫患儿在接受GMFM测试时各种困难，提出了改良方案[21]。Marois等人提出的GMFM演变比率计算法，为脑瘫患者粗大运动功能自然发展提供对照性指标[22]。

表4 GMFM-66与GMFM-264的反应度和精确度比较

注 1)：与前次比较t检验，P<0.05；2)：与前次比较t检验，P>0.05；3)：与前次比较配对方差检验，P<0.05；4)：与前次比较配对方差检验，P>0.05，不能计算相对精确度

GMFM-66采用了项目反应理论中的Rasch分析，传统项目分析理论是从原始数据中直接推断出项目的难易度、信度和效度，确定原始数据与项目难易度之间的关系；而Rasch分析是通过对样本总体进行评价后，在被测试者的全部测试结果中确定被测试者的能力和项目的难易度以及它们之间的关系，Rasch分析得出的项目与样本之间的关系具有更高的精度和更强的稳定性，通过样本与项目的关联，GMFM-66项目难度顺序成为临床康复目标的设定有效工具。目标设定是临床康复干预最为重要的环节，所以与其他GMFM改良方案相比，GMFM-66得到更为广泛的认可，但是由于Avery等人确立GMFM-66时所选样本的局限性，被动地删除了更为适宜婴幼儿脑瘫的低难度项目[8]，尽管本课题组当初证实了GMFM-66在婴幼儿脑瘫中的具有良好的心理测量学指标[9]，但是并没有解决GMFM-66低难度项目减少给婴幼儿康复干预目标选定所带来的困扰。

Avery等确立GMFM-66时使用样本的平均年龄为6.4岁，最终删除的22项目中A区被删除了13项[8]，本课题组曾经以平均年龄1.6岁的<3岁的脑瘫患儿为样本[9]，进行与Avery类似的Rasch分析，最终形成的GMFM-73保留了A区所有的项目，删除了难度相对较高而被GMFM-66所保留的E区的5个项目，可见用于Rasch分析的数据样本构成在很大程度上影响最终纳入项目的组成。从临床角度出发，尽可能多地保留GMFM-88的项目，维持一定规模的适合不同年龄脑瘫的项目池，可能便于临床制定更为精确的干预目标和多样的干预方法。

本课题组从2003年起在上海通过儿童康复合作群的方式，整合了包括早期筛查、社区康复、医教结合的资源[23]，通过脑瘫登记、标准化功能评估与干预等多样化措施为脑瘫患者提供康复服务[24～27]，同时也积累了大量生活在上海脑瘫患者的GMFM数据，与本课题组前期研究相比，纳入本研究的样本获得了巨大扩展的同时，年龄、级别、类型的分布更为均衡。

确定每个GMFM项目中小项的难度可以更加细化项目难度顺序，提升制定干预目标的精确性，Rasch分析中局部评分模型(Partial Credit Moder，PCM)可应用于项目间步骤数目相同但各自对应步骤难易程度不同的各种类型项目或项目间步骤数目不同的项目[28]，但是不能生成与原始分相对应的能力值转换表，因此本文将GMFM-88转化为GMFM-264，采用等级效应模型(RSM)开展建模，RSM应用于具有相同应答模式并且可以认为项目间相同步骤或类级的变化不大的各种类型项目，比如态度类型的问卷评估(喜欢、有些喜欢、无所谓、有些不喜欢、不喜欢),因此针对GMFM-264采用RSM是比较适宜的，同时比较了这两种不同模型在本研究被纳入数据中分别建模后得到的264个小项难度顺序的一致性，ICC值为0.995，两种建模方式得出的结果高度一致的。

Rasch分值模型拟合度的主要评价指标为包括内聚拟合度(Infit)和发散拟合度(Outfit)，其中Infit用来描述项目对测试者进行评估的能力与项目的接近程度，Outfit描述能够评估出人们远高于或低于项目难度功能水平的能力，GMFM-66采用的是Infit进行分析，评价拟合度的指标可以采用MnSq或ZSTD，相关研究认为采用MnSq指标建模更稳定[29]，鉴于上述情况，本文采用了Infit的MnSq评价指标来构建模型，筛选GMFM-264中的不适合项目，首轮筛选结果显示，264个小项中只有6个小项为不适合项目，占总项目比例<5%，所以可以保留全部小项，同时能够建立起包括GMFM-264个所有小项在内的项目难度顺序表，由于Rasch分析将项目难度值与被试者的能力值建立起紧密的关联，因此能够更加精确地判断被评估脑瘫患儿运动功能状态的“最新发展区”，例如(表3)如果被试脑瘫患儿最终GMFM-88的原始总分为169分，通过分值转换表可以得出GMFM-264的能力值为56.97，对应最接近的项目为69-e-01(E区第69项中1分小项：站立位：向前走< 3 步)，该项难度值为56.96，表明该患儿获得此项能力的可能性为50%，围绕该难度值附近没有通过的那些小项即为该患儿的“最新发展区”，也就是最可能达成的功能干预目标。

Rasch分析结果显示GMFM-264具有良好的项目和样本信度，由于GMFM-264并没有改变GMFM-88的评分原则，所以没有必要验证外在信度(重测信度和评估者间信度)，但是因为改变了计分方式，因此有必要比较两种计分方式的反应度和精确度。由于基于GMFM的发育研究提示不同级别脑瘫患儿存在发育平台期[3、30]，运动功能障碍越轻，平台期出现得越晚，最轻的GMFCSⅠ级患儿在5～6岁以后出现平台期，进入平台期就难以测定反应度，反之3岁以前是发育速率相对较快的阶段，鉴于上述因素本文选定了<3岁和～6岁两个年龄组脑瘫儿童分别进行反应度比较，结果显示，<3岁组中，GMFM-264的效应尺度大于GMFM-66，～6岁组中，GMFM-264和GMFM-66的效应尺度是相似的，主要原因在于GMFM-264还原了更为适宜婴幼儿的项目从而提升了在<3岁年龄阶段的反应度。<3岁组中，间隔较短时间GMFM-264与GMFM-66的精确度差异不甚显著，随着时间的延伸，GMFM-264的精确度明显高于GMFM-66，与反应度相似，～6岁组两种方法的精确度也明显下降。

本研究基于扩展与标准化评估相结合的脑瘫患儿粗大运动干预目标制定项目池，提升了GMFM在脑瘫患儿尤其是婴幼儿脑瘫儿童中的反应度和精确度，为研发中的智能化脑瘫患儿粗大功能评估与干预系统(Gross Motor Assessment and intervention，GMAI)提供基础模型与数据，随着与目标达成测量(Goal Attainment Scaling，GAS)以及家庭干预体系的相结合，以推动改善脑瘫儿童和家庭的生活质量[31]。

致谢：谨以此文纪念2016年11月辞世的刘湘云老师，同时感谢多年来共同工作的复旦大学附属儿科医院康复科同事及上海儿童康复合作群机构的同道，感激参与研究的脑瘫儿童和家庭的支持。

参考文献

[1] Ko J. Functional Improvement after the Gross Motor Function Measure-88 (GMFM-88) Item-Based Training in Children with Cerebral Palsy. J Kor Phys Ther, 2017, 29(3): 115-121

[2] Alotaibi M, Long T, Kennedy E, et al. The efficacy of GMFM-88 and GMFM-66 to detect changes in gross motor function in children with cerebral palsy (CP): a literature review. Disabil Rehabil, 2014, 36(8): 617-627

[3] 史惟, 朱默, 翟淳, 等. 基于ICF-CY的脑瘫粗大运动功能测试量表内容效度分析. 中国康复理论与实践, 2013, 19(1): 13-18

[4] 史惟, 丁俊杰, 杨红, 等. 非线性混合效应模型评估脑瘫患儿粗大运动功能发育进程. 中国循证儿科杂志, 2012, 7(4): 245-251

[5] Wallard L, Dietrich G, Kerlirzin Y, et al. Effect of robotic-assisted gait rehabilitation on dynamic equilibrium control in the gait of children with cerebral palsy. Gait & posture, 2018, 60: 55-60

[6] 史惟, 杨红, 施炳培, 等. 运动发育推拿法对脑瘫患儿粗大运动功能的影响. 中国循证儿科杂志, 2007, 2(5): 354-363

[7] Russell DJ, Rosenbaum P, Wright M, et al. Gross motor function measure (GMFM-66 & GMFM-88) users manual. 2002

[8] Avery LM, Russell DJ, Raina PS, et al. Rasch analysis of the gross motor function measure: validating the assumptions of the rasch model to create an interval-level Measure1. Arch Phys Med Rehabil, 2003, 84(5): 697-705

[9] Wei S, Su-Juan W, Yuan-Gui L, et al. Reliability and validity of the GMFM-66 in 0-to 3-year-old children with cerebral palsy. Am J Phys Med Rehabil, 2006, 85(2): 141-147

[10] 史惟, 廖元贵, 杨红, 等. 粗大运动功能测试量表与Peabody粗大运动发育量表在脑性瘫痪康复疗效评估中的应用. 中国康复理论与实践, 2004, 10(7): 423-424

[11] 史惟, 廖元贵, 王素娟, 等. 粗大运动功能测试量表66项的反应度和精确度研究. 中国康复理论与实践, 2005, 11(10): 838-840

[12] 史惟, 杨红, 王素娟, 等. 脑性瘫痪患儿运动障碍的系统康复管理(一). 中国循证儿科杂志, 2007, 2(3): 220-227

[13] 史惟, 杨红, 王素娟, 等. 脑性瘫痪患儿运动障碍的系统康复管理 (二). 中国循证儿科杂志, 2007, 2(4): 292-302

[14] 史惟, 杨红, 施炳培, 等. 国内外脑性瘫痪定义, 临床分型及功能分级新进展. 中国康复理论与实践, 2009, 15(9): 801-803

[15] 史惟, 王素娟, 杨红, 等. 中文版脑瘫儿童粗大运动功能分级系统的信度和效度研究. 中国循证儿科杂志, 2006, 1(2): 122-129

[16] 史惟, 杨红, 李惠, 等. 脑瘫患者粗大运动功能问卷的编制. 中国康复理论与实践, 2008, 14(10): 952-955

[17] Russell DJ, Avery LM, Walter SD, et al. Development and validation of item sets to improve efficiency of administration of the 66-item Gross Motor Function Measure in children with cerebral palsy. Dev Med Child Neurol, 2010, 52(2): e48-e54

[18] Brunton LK, Bartlett DJ. Validity and reliability of two abbreviated versions of the Gross Motor Function Measure. Phys Ther, 2011, 91(4): 577-588

[19] Wilson A, Kavanaugh A, Moher R, et al. Development and pilot testing of the challenge module: a proposed adjunct to the Gross Motor Function Measure for high-functioning children with cerebral palsy. Phys Occup Ther Pediatr, 2011, 31(2): 135-149

[20] Hielkema T, Hamer EG, Ebbersdekkers I, et al. GMFM in infancy: age-specific limitations and adaptations. Pediatr Phys Ther, 2013, 25(2): 168-176

[21] Salavati M, Krijnen WP, Rameckers EAA, et al. Reliability of the modified Gross Motor Function Measure-88 (GMFM-88) for children with both spastic cerebral palsy and cerebral visual impairment: a preliminary study. Res Dev Disabil, 2015, 45: 32-48

[22] Marois P, Marois M, Pouliot-Laforte A, et al. Gross Motor function measure evolution ratio: use as a control for natural progression in cerebral palsy. Arch Phys Med Rehabil, 2016, 97(5): 807-814. e2

[23] 史惟, 杨红, 施炳培, 等. 脑性瘫痪儿童链式康复服务模式的建设. 中国康复理论与实践, 2015, 21(9): 1099-1102

[24] 史惟, 杨红, 王素娟, 等. 脑瘫登记管理. 中国康复理论与实践, 2009, 15(11): 1025-1028

[25] 肖丽萍, 史惟, 康淑蓉, 等. 上海市闵行区脑瘫登记管理的初步结果. 中国康复理论与实践, 2010, 16(7): 613-616

[26] 陆恺, 史惟, 翟淳, 等. 复旦中文版脑瘫幼儿手功能分级系统的信度和效度研究. 中国循证儿科杂志, 2017(6)

[27] 王燕娜, 史惟. 复旦中文版沟通功能分级系统的信度和效度研究. 中国循证儿科杂志, 2017(5): 321-327

[28] 史惟, 李惠, 杨红, 等. 脑瘫患儿精细运动功能测试量表的单维性和信度研究. 中国循证儿科杂志, 2008, 3(2): 110-118

[29] Smith AB, Rush R, Fallowfield LJ, et al. Rasch fit statistics and sample size considerations for polytomous data. BMC Med Res Methodol, 2008, 8(1): 33

[30] Rosenbaum PL, Walter SD, Hanna SE, et al. Prognosis for gross motor function in cerebral palsy: creation of motor development curves. JAMA, 2002, 288(11): 1357-1363

[31] 史惟, 王素娟. 脑性瘫痪儿童运动功能与生存质量之间的相关性分析. 中国康复医学杂志, 2016, 31(1): 35-40