薛凯文,刘翔翔,张泽宇,王玉龙*
1 山东中医药大学康复医学院,山东济南 250355;2 深圳大学第一附属医院,广东深圳 518035;3 深圳市第二人民医院,广东深圳 518035
目前,脑卒中已成为世界第二大致死原因和中国首位致死原因,也是造成残疾的主要原因[1]。脑卒中后约80%的幸存者遗留有不同程度的功能障碍[2],不仅影响患者正常的日常生活活动,也会影响患者生活质量。因此,提高患者日常生活活动能力(activities of daily living,ADL)进而改善患者生活质量是脑卒中后康复训练最主要的目标。在这一过程中,临床医生及治疗师需要借助ADL 量表了解患者所需要的训练内容并阶段性评价康复训练效果,因此,选择一个能够准确反映患者ADL 能力并敏感地检测ADL能力变化的量表是至关重要的。
选择量表时,通常会从信度和效度2 个方面对其性能进行检验。但临床工作中通常需要通过患者ADL 评定量表得分变化反映患者ADL 能力的变化,因此仅对量表的横截面属性进行检验是不够的[3]。量表还需要具有一种特殊的临床特性,即反应性[4]。反应性指的是量表检测出有意义的变化的能力,具有良好反应性的量表对高发病率、高流行率的疾病(如脑卒中等)具有重要的意义[5]。因此,本研究对临床常用ADL 量表反应性进行总结和比较,为临床选择合适的评估工具提供参考。
ADL 是指在社会和生活中至关重要的,以自我照料为导向的身体活动[6]。ADL主要分为基本日常生活活动能力(basic activities of daily living,BADL)和工具性日常生活活动能力(instrumental activities of daily living,IADL)。BADL 主要指管理自身基本需求的技能,包括个人卫生、着装、如厕、控制、转移、走动和进食等;IADL则包括与独立社区活动更加相关的复杂活动[7]。ADL评估方法主要包括直接观察法、间接评定法、ADL 能力测试和问卷调查法。临床评估时常用的方法是直接观察患者是否能按要求完成规定的项目,对不能或不便直接观察的活动,可以询问患者、家属或护工后进行间接评价。目前尚无有关脑卒中后ADL 能力评估的“金标准”[5],国际常用的ADL 量表主要包括Barthel 指数量表(Barthel index,BI)、改良Rankin 量表(modified Rankin scale,mRS)、功能独立性量表(functional independence measure,FIM)、复杂活动测评工具(frenchay activities index,FAI)和Katz 指数等。国内开发的ADL 工具主要包括陶氏ADL 量表、康复护理日常生活活动评定量表、龙氏日常生活能力评定量表(龙氏量表)(Longshi Scale,LS)[6,8]。本研究主要对临床中较常用的BI 量表、mRS 量表、FIM 量表及LS 量表进行对比分析。见表1。
表1 临床常用ADL量表Table 1 Common clinical ADL scales
BI 量表对日常生活活动中的10 项任务进行评估,根据完成每项任务所需要的时间或帮助进行评分,得分范围为0~100 分,得分越高表明独立性越强[9]。BI量表具有良好的信度、效度[10],是脑卒中康复过程中最常用的功能评价指标,也是急性脑卒中试验中主要的功能结局指标[5]。BI量表是预测脑卒中后患者所需护理水平及功能预后的有效工具[11]。研究表明,BI 量表具有良好的重测信度(信度系数=2.0)[12]、评价者间信度(Kappa=0.8~1.0)和内部一致性(Cronbach's α=0.87)[13-14]。此外,BI 量表也具有良好的同时效度[10]和结构效度[15]。
mRS 量表是一个整体残疾量表,以运动能力为主要关注点,主要衡量患者的独立性而非特定任务的完成情况[5,16]。mRS 量表根据功能情况将受试者分为7 个等级(0~6 级),0 级为无症状,5 级为严重残疾,6 级为死亡。临床上通常认为mRS≤1 级或mRS≤2级为良好预后的分界值[17]。研究表明,mRS量表具有良好重测的信度(Kappa=0.81~0.95)[18]。虽然mRS 量表的评估较为主观,但经过结构化访谈培训后mRS 量表的评分者信度极高(加权Kappa 系数=0.93)[19]。mRS量表有良好的结构效度,其评分与脑卒中严重程度紧密相关[18]。由于mRS 量表分数有限,与其他量表比较,mRS 量表对变化的反应性较差,敏感性也低于BI 量表和FIM 量表[18]。但与BI 量表比较,mRS 量表在区分轻、中度功能障碍方面具有更好的敏感性[20],可用于脑卒中急性期患者功能评估。
FIM 量表是国际上运用较多的一种功能评价量表[21],可以敏感地衡量患者的功能障碍,广泛用于评价各种功能缺陷的患者。FIM 量表由包含运动和认知2 个领域相关的18 个评估项目。其中评估运动功能有13 个项目,项目1~6 主要评估患者自我照顾能力,项目9~13评估患者的转移和步行能力。评估认知领域的项目则包含了理解、表达、社交、问题解决和记忆5 个方面[22]。FIM 量表及其运动、认知分量表都具有较高的内部一致性(Cronbach's α=0.86~0.97)[23]及良好的信度、效度[组内相关系数(interclass correlation coefficient,ICC)=0.872,Kappa=0.011,加权Kappa=0.521][24],在入院和出院评估时与BI量表具有较高的一致性[25-26]。
LS量表是一个图示化的ADL评价工具,以关键词“能不能下床”“能不能转移到户外”为线索,根据活动范围将患者分为床上人、家庭人和社会人3 个群体。其中床上人是仅能在床上活动的人群;家庭人是可以主动下床或转移到轮椅上且可以在家庭中自由活动但无法主动转移到户外活动的人群;社会人是指能主动下床或自主转移到轮椅,并可主动转移到户外活动的人群。根据活动范围对患者进行分组,有针对性地对各组患者进行ADL 能力评定。床上人主要评估其二便控制、进食和娱乐等方面能力;家庭人主要评估其如厕、自我清洁和家务等方面能力;社会人主要评估其社区活动、购物和社会参与等方面能力。每个项目得分1~3分,总分3~9 分。根据患者分组和得分情况,将患者自理能力分为生活完全不能自理、生活基本不能自理、生活小部分自理、生活大部分自理、生活基本自理和生活完全自理6 个等级[27]。LS 量表具有良好的信度、效度,且能减少评估所需时间,简化评估流程[28-29]。专业人员和经过简单培训的非专业人员均能较好地使用LS量表对脑卒中患者进行评定[27]。
反应性是指评估工具能检测出临床最小差异的重要能力[30],主要反映评估工具检测出患者治疗后状态改变的能力。因此,临床结局指标量表除关注其良好的信度、效度外,还需要关注其反应性。
衡量反应性的主要指标包括内部反应性和外部反应性2个方面。内部反应性是指在特定时间段内评价工具显示患者功能状况变化的能力[31];外部反应性是指特定时间段内该评价工具检测到的变化和选定外部标准变化间的相关程度[32]。
2.2.1 内部反应性 内部反应性主要包括效应大小(effect size,ES)和标准化反应平均值(standardized response mean,SRM)2个指标。1977年COHEN首次提出ES概念[33]。0.2≤ES<0.5、0.5≤ES<0.8和ES≥0.8分别代表较小反应性、中等反应性、较大反应性。SRM 也是临床经常使用的反映内部反应性大小的指标[34]。0.2≤SRM<0.5、0.5≤SRM<0.8和SRM≥0.8分别代表较小反应性、中等反应性和较大反应性[35]。ES≥0.2 或SRM≥0.2 均可认为该量表具有足够的内部反应性[36]。采用SRM 衡量评价工具反应性指标的优点在于其消除了对样本量大小的依赖,其评价分数变化是相对标准化的。
2.2.2 外部反应性 研究表明,受试者工作特征曲线(receiver operating curve,ROC)可用于评估量表反应性[30]。敏感性和特异性是描述评价工具反应性的重要内容,也是评估评价工具反映外部标准变或不变能力的重要指标。通过真阳性率(灵敏度)和假阳性率(1-特异度)绘制ROC 曲线并计算曲线下面积,估算评价工具将患者正确分类为好转和未好转的概率[37]。但ROC 曲线的描述方法存在一定的缺点,如使用该方法描述评价工具的反应性时必须使用二分类变量,这会忽略一些关于具体变化幅度的信息[30]。
此外,通过计算评价工具与选定外部标准之间的相关性也可以检验评价工具的外部反应性。Pearson 相关系数(r)>0.75 表示相关性良好;0.5~0.75 表示相关性中等至良好;0.25~0.5 表示相关性一般;r≤0.25表示几乎没有相关性。r>0.25为足够的外部反应性[38]。
影响评价工具反应性的因素主要包括量表自身特点和不同时期疾病恢复特点2个方面。量表评价条目设置过于简单或过于困难,就会导致“天花板”或“地板”效应。“天花板”效应通常由于内容相对简单,大量受试者得分达到或接近满分[39],与之相对应的“地板”效应则是指由于任务内容过于困难,导致受试者评价结果都很差且得分无明显差异。由于量表无法反映出被评为最低分的患者ADL能力是否恶化,也无法反映评为最高分的患者ADL能力是否提高,因此“天花板”和“地板”效应的存在会导致量表表现出较低反应性[40]。脑卒中患者发病后不同阶段的ADL 需求及恢复情况各不相同,评价工具的反应性也会受到不同康复时间和疾病阶段的影响。因此,在比较不同评价工具的反应性时,应区分不同康复阶段,将各阶段ADL 恢复特点与量表自身特征相结合进行讨论。不同时期脑卒中患者ADL 恢复的特点及推荐使用的评估量表,见表2。
表2 不同时期脑卒中患者ADL恢复特点及适用量表Table 2 Recovery characteristics and applicable scales of ADL of stroke patients at different stages
在脑卒中发生的最初几个小时,即使病情较轻的患者也会被要求卧床休息。BI 量表最初是用于评估患者所需护理量的量表,因此BI量表的评估内容主要包括室内行走和大小便控制。由于脑卒中急性期患者尚无法恢复正常的日常活动,其BI评分可能比较低,因此BI量表并不适用于脑卒中急性期患者的ADL 评估,也不适用于急性期根据严重程度对患者进行分层。与BI 量表比较,FIM 量表的运动部分在评估内容上增加了关于受试者转移和步行能力的评价内容,因此在急性期评估中具有良好的反应性(ES=1.68,SRM=1.31)[41]。采用mRS、BI 和FIM量表检测脑卒中急性期患者ADL能力变化情况时发现,不同量表对脑卒中患者ADL 能力变化的敏感度从高到低排序分别为FIM、BI 和mRS 量表。此外,ROC 曲线分析结果也显示,mRS 量表对脑卒中患者ADL 能力变化的敏感性比BI 量表低很多[42]。这可能是因为mRS 量表是一个整体残疾量表,每一个等级的变化都意味着重要的功能改善,而脑卒中急性期患者住院期间并未完全恢复正常的日常生活活动。因此,mRS 量表在脑卒中急性期的反应性较差。
亚急性期是脑卒中患者功能恢复的黄金时期。亚急性期BI、FIM 量表有相似的SRM(BI:0.63,FIM:0.62)和ES(BI:0.31,FIM:0.28),均表现出较好的反应性[43]。研究发现,虽然BI、mRS 量表之间具有很高的相关性,但在脑卒中亚急性期患者ADL评定时,BI量表比mRS量表具有更明显的“天花板”效应[20]。
BI 量表评估内容对于亚急性期患者相对简单,大量受试者的得分集中在最高分,受试者即使ADL能力提高,其量表得分也不会发生改变,无法通过量表得分变化来反映其功能状态的变化。受BI 量表“天花板”效应的影响,轻/中度残疾、亚急性期和恢复期脑卒中患者BI量表的反应性低于mRS量表。
目前关于脑卒中恢复期各量表反应性的研究较少,但目前研究表明BI、FIM量表在恢复期均表现出较弱的反应性[44]。BI、FIM 量表在脑卒中恢复期反应性较差可能与以下因素有关:①脑卒中患者身体活动方面的功能恢复通常在脑卒中后3~6 个月达到平台期,恢复期患者ADL 变化较小,因此量表检测到的变化比急性期和亚急性期少。②脑卒中恢复期ADL 变化主要表现在家庭和社会生活方面,而BI 量表和FIM 运动量表缺乏对恢复期脑卒中患者的家庭和社会生活能力评估,故表现出较差的反应性。研究显示,脑卒中后90 d 和180 d 随访分别有37%、56%患者BI评分最高;而脑卒中发生后1年随访,患者FIM评分为(112.2±8.3)分[44],这说明BI、FIM 量表均存在“天花板”效应。这将会导致其无法衡量已取得最高分的脑卒中患者功能状态的变化,表现出较弱的反应性。因此,在对脑卒中恢复期患者进行ADL 评估时应该选择包含IADL 评估项目且“天花板”效应较小的量表。
目前脑卒中患者ADL 能力评定仍缺乏“金标准”,常用ADL 评价工具(如FIM、BI 和mRS 量表等)的主要关注点都是患者的BADL 能力。FIM、BI 和mRS 量表用于评定脑卒中急性期和亚急性期患者ADL 能力时表现出较好的反应性,但用于评定脑卒中恢复期患者的ADL 能力时均存在“天花板”效应,反应性较差。FAI和LS 量表评定内容包括BADL 能力和IADL 能力,能更敏感地反映脑卒中恢复期患者ADL能力变化情况,量表反应性更好,但这2种量表在临床中的应用普及程度还不够。因此,应针对不同分期脑卒中患者的实际情况,进一步加强FAI和LS量表的临床应用及研究,并开展其反应性的研究,以更加敏感地检测脑卒中患者ADL 能力变化,为脑卒中患者康复训练计划制定和训练效果评估提供更强有力的支撑。