评分量表在脊柱疾病评价中的应用进展

2019-02-11 14:30戚麟王馨陈瑞奇黎志宏
实用骨科杂志 2019年12期
关键词:功能障碍脊柱维度

戚麟,王馨,陈瑞奇,黎志宏*

(1.中南大学湘雅二医院骨科,湖南 长沙 410011;2.肿瘤模型与个体化诊治湖南省重点实验室,湖南 长沙 410011;3.中南大学湘雅护理学院,湖南 长沙 410013)

脊柱疾病是一类因创伤、退变、肿瘤、炎症、畸形等造成的脊柱、脊髓功能障碍疾病。随着对脊柱疾病认识的不断发展,一系列相应的评分量表随之出现。这些量表从不同角度对脊柱疾病的症状体征、功能障碍及生存质量等方面进行评价,在脊柱疾病病情的判断、治疗方法的选择、疗效和预后的评定等方面发挥了积极作用。近年来,随着生物-心理-社会模式深入人心,脊柱疾病中评分量表的应用更加广泛和深入。现就当前国内外常用脊柱疾病评分量表及其应用情况综述如下。

1 症状体征及功能障碍评价方面的量表

1.1 以疼痛为主的评分

1.1.1 视觉模拟评分量表(visual analogue scale,VAS) VAS为当前临床应用较为普遍的疼痛评分量表[1]。该量表采用长度为10cm的线段或标尺,被测者根据主观疼痛强度在线段上做出相应标注。VAS与其他疼痛量表相比,敏感性和特异性均极高[2],加之其易于理解、操作简单、记录精确,所以被广泛用于临床疼痛强弱和缓解程度的评估。但该量表只能评价疼痛程度,且评估认知水平较低人群(儿童、老年人及存在认知障碍患者)VAS错误率较高[3]。

1.1.2 口述分级评分量表(verbal rating scale,VRS) VRS包括一系列表示疼痛强度的词汇,根据词汇数量分为四点口述分级法和五点口述分级法[4]。临床上该量表多用于对疼痛程度和疗效的简单测评,相比于VAS操作便捷,可用于对认知水平较低患者进行疼痛评估,但口述分级评分量表较其他疼痛评分量表敏感性稍低,在评价过程中会产生一定偏差。

1.1.3 数字分级评分量表(numeric rating scale,NRS) 与VAS类似,NRS中共有0到10共11个数字(点),被测者可根据主观疼痛程度选择相应数字(点)[5]。NRS效度较高且和VAS的关联程度高,该量表虽不如VAS、VRS常用,但因其便于被测者配合,可口述亦可书写记录,所以也用于临床上主观疼痛的简单评定。

1.1.4 McGill疼痛问卷表(McGill pain questionnaire,MPQ) MPQ为多因素疼痛评分量表,其建立了疼痛性质三维结构[6]。MPQ具有较高评估维度,可对疼痛的多维因素进行评价,但由于该调查表设计相对复杂,需要知识水平较高的被测者和测试者配合完成,目前在国内,该量表临床应用不广泛。

1.2 颈肩痛功能障碍量表 颈椎功能障碍指数(neck disability index,NDI)[7]、颈部疼痛障碍量表(neck pain and disability scale,NPDS)[8]和特定患者功能量表(patient-specific functional scale,PSFS)[9]等为评价颈肩痛功能障碍的常用量表。NDI为颈椎功能障碍评价量表,为Vernon[7]在Oswestry功能障碍指数(oswestry disability index,ODI)基础上修订得到,被广泛用于颈椎功能障碍的评价。NDI共有10个选项,包括痛觉强度、个人自理能力、抬物、阅读、头痛、注意力、工作、驾驶、睡眠和娱乐等。分数反映功能障碍严重程度。颈部疼痛障碍量表共20个条目,被测者根据颈椎功能状态在一条长为100 mm视觉类比量表进行标注。在特定患者功能量表中,被测者根据颈肩痛功能障碍程度,提出因功能障碍导致的无法进行或进行困难的活动,并将这些活动进行排序。在这三个量表中,NDI偏向于评估群体的颈肩痛功能障碍,而单个个体常采用特定患者功能量表进行评估[7]。NDI在欧美国家较为流行,翻译版本众多但仍能保持较好信度及效度,伍少玲等[10]采用汉化版NDI进行调查研究,结果表明该量表汉化版也具有极高的信度、效度和敏感性。但此类量表在评价过程中,认知程度较低患者量表错误率较高,故该量表存在一定局限性。

1.3 改良MacNab标准 改良MacNab标准(modified MacNab criteria)[11]为临床上常用腰腿痛与腰椎微创术后功能评价量表,此量表等级由优(excellent)、良(good)、可(fair)、差(poor)组成。改良MacNab标准因其内容简洁、便于理解,且疗效评价准确,故可用于腰椎微创手术患者术前指导和术后随访。该量表的评价方式较为简单,且量表结果与评定人员主观感受关联较大[12]。

1.4 魁北克腰痛障碍量表(Quebec back pain disability scale,QBPDS) QBPDS为临床上常用慢性腰痛(chronic low back pain,CLBP)评价量表[13]。该量表由20个问题组成,每个问题涵盖5个选项,被测者根据功能障碍严重程度进行选择。该量表信度较高、设计简洁明了、内容通俗易懂,被测者可较为轻松完成评价。但该量表翻译版本较少,缺乏若干重要评价条目且不对疼痛强度进行评估,在临床上应用并不广泛。

1.5 日本矫形外科协会评分(Japanese orthopedic association score,JOA) JOA评分由颈椎JOA评分和腰痛JOA评分组成。1975年,日本矫形外科协会制定了一套评分系统用于评定脊髓型颈椎病的治疗疗效,简称颈椎JOA评分。20世纪80年代,日本矫形外科协会开始研究探讨针对腰痛(low back pain,LBP)患者进行评估治疗的评分量表,反复修订并在1986年公布原始版本,简称JOA腰痛评分。由于1975年版JOA颈椎病评分存在分类评级不全与肩部、肘部运动功能缺项等问题,1990年日本矫形外科协会成立专门工作委员会,修改并提出3套评分系统:17-2分系统、100分系统和详尽功能系统[14],其中17-2分系统为学界相对熟悉和推荐的评分系统。1991年,Benzel等根据西方文化差异修改JOA颈椎评分,称mJOA评分(分值0~18分)[15]。因原版JOA颈椎评分以及JOA腰痛评分并非以患者为导向而建立,随着患者主观感受在医疗干预与评估中所占比重越来越大,2007年,日本骨科协会下属腰痛及颈椎病分会修订发表JOA颈椎病评价问卷和JOA腰背痛评价问卷[16],进而弥补早期JOA评分系统的不足。但2007年发布的两个量表因其评价过程比较繁琐,所以目前有关研究采用频率较低。

现阶段我国广泛使用的颈椎JOA评分为17-2分系统[14],其包含上肢运动功能(0~4分)、下肢运动功能(0~4分)、感觉功能(上肢0~2分、下肢0~2分、躯干0~2分)和膀胱功能(0~3分)。该系统分值0~17分,视各项功能障碍程度计算相应分数,最终得出总分和改善率(改善率=术后改良JOA评分-术前改良JOA评分/17×100%)。目前颈椎JOA评分已成为国际颈椎病的标准评估量表并广泛应用于临床。

腰痛JOA评分于1998年被汉化引入中国,由患者主观症状(0~9分)、临床体征(0~6分)、日常活动受限度(0~24分)和膀胱功能(正常0分、轻微失控-3分、重度失控-6分)四个部分组成,总分29分。总分反映腰痛症状与功能障碍,分值高低表明功能障碍严重程度。但该量表中膀胱功能比例较多,易影响老年被测者评估结果,且被测者难以独立进行评测,所以腰痛JOA评分不及颈椎JOA评分应用广泛。

1.6 Oswestry功能障碍指数 ODI为腰痛患者功能障碍自我评价量表。John O’Brien在1976年设计原始量表,对慢性腰痛患者疗效和障碍程度进行评估,反复修订并在1980年发布ODI 1.0版本[17]。1981年,巴黎国际脊柱研究学会(international society for study of lumbar spine,ISSLS)大规模宣传推广该量表。1996年,Bossons[18]对DOI1.0版本进行修改,省略其中第8项(性生活)和第9项(社会活动)的一个选项内容。此后美国骨科协会(American academy of orthopaedic surgery,AAOS)等省略ODI 1.0版本第1、8、9项(疼痛程度、性生活和社会活动)并调整选项分值,将修订版本应用于患者的测量评估[19]。1989年,英国医学研究委员会(medical research council)将ODI 1.0版本进行修改后设计出ODI 2.0版本[20],该版本为当前国际应用最广泛的版本。

ODI 2.0版本由疼痛程度、个人生活起居能力(洗漱、穿衣)、提物、行走、坐、站立、睡眠影响、性生活、社会活动及旅行共计10个方面组成。每个方面涵盖6项选项内容,分别为0~5分,最低分表明未见异常功能障碍,最高分表明出现严重功能障碍。相应备选内容分值根据评分依次相加,并得出总分在所有内容最高得分(50分)中的百分比,称为Oswestry功能障碍指数。而如果被测者省略若干选项,则计算有效选项累计总分占有效选项最高分(5×有效选项数)的百分比。0~20%表明轻度功能障碍,20%~40%表明中度功能障碍,40%~60%表明重度功能障碍,60%~80%表明残疾(跛足),80%~100%表明患者卧床或者本人夸大症状。2005年,首个繁体中文版ODI[21]被引入我国香港,但由于香港与内地在生活习俗及社会背景方面存在很大的不同,该版本直接简体化应用并不合理。2002年,郑光新等[22]将ODI汉化,由于内地人群的传统习惯和生活方式,人们普遍避免提及关于性的内容,因此其省略性生活1项,所以该简体汉化版Oswestry功能障碍指数为9个选项分值累加后占9项内容最高分(45分)的百分比。此外,该汉化版还对ODI 2.0版本“行走”备选内容的距离进行调整,把原版内1英里、1/2英里和100码改为1 000 m、500 m和100 m三种距离,与国人日常生活用语相符,易于患者理解,并能与其它评分量表在距离单位上保持相同。此外,汉化版ODI可靠性及反应性极高[22],适用于内地人群腰痛功能障碍自我评价。ODI原版问世以来,已在国际上通行20余年,被翻译为多种语言版本,在腰痛患者功能障碍评估方面应用非常普遍,并被作为“金标准”[19]。

2 生存质量评价

2.1 简明健康量表(short-form health survey) 常用简明健康量表包括36条目简明健康量表(the Mos 36-item short form health survey,SF-36)[23]、12条目简明健康量表SF-12(the Mos 12-item short form health survey,SF-12)[24]、6维度简明健康量表(the Mos 6-Dimension-item short form health survey,SF-6D)[25-26]等,其中SF-36为当前世界应用范围最广的通用健康相关生存质量测量工具之一。20世纪70年代,“生命质量”(Quality of life)概念开始被逐渐引入西方医学界,兰德公司(Rand Corporation)根据公司保险策略与系统在居民健康情况与成本投入使用方面的作用,开始研究生命质量测量量表,该生命质量测量量表经多次修订后公开发表,称为医疗结果研究(medical outcome study,MOS)。MOS内容长而复杂,不适用大规模人群评估,因此,波士顿健康研究所于1993年修订MOS,进而设计提出了36条目简明健康量表SF-36。1996年,原版量表经简化条目及调整布局后,SF-36 v2量表(the version 2 of the SF-36 health survey)[27]问世并公开发布。而在SF-36基础上修订产生的SF-12仅含12项原量表筛选内容,因其简短所以更方便进行快速调查。为便于进行经济评价(economic evaluation),SF-6D(SF-36)[25]和SF-6D(SF-12)[26]分别在SF-36和SF-12的基础上设计产生,对6个维度的生存质量进行评估。

SF-36涵盖评估健康相关生存质量的8个维度共计36项内容项目,各维度包括:生理功能(physical function,PF)、生理职能(role physical,RP)、身体疼痛(bodily pain,BP)、总体健康(general health,GH)、活力(vitality,VT)、社会功能(social function,SF)、情感职能(role-emotional,RE)和精神健康(mental health,MH)。此外,该量表也涵盖一健康指标:健康变化(reported health transition,HT),用来评估既往一年中的健康改变。SF-36计分方法较为复杂,首先计算8个维度原始分数,之后通过相应换算后得到最终得分,最终得分分值为0~100分,最终分数越高表明被测者健康状况越好。根据以上8个维度的分值,可分别计算生理健康总分(physical component summary,PCS)和心理健康总分(mental component summary,MCS)[23]。与一般普通生存质量评价量表相比,SF-36从定量角度准确具体评估健康情况,并且该量表内容项目全面精炼、敏感性及信度效度准确可靠,适用于普通健康被测者及不同疾病患者生存质量评估。但由于SF-36为普适性简明健康量表,其仍缺乏若干精细条目,不能绝对客观评估被测者健康相关生存质量,在评价过程中,还需参考其他量表进行补充。

此外,健康相关生存质量评价为不同社会背景及价值评估方式下主观多维度评定体系,不同社会背景及地区间有着显著差异,进行跨文化和社会背景评估时会产生误差并具有一定局限性,所以采用SF-36对中国人群进行健康相关生存质量评估,需对中国特定的社会背景及生活习俗差异采取调查。中国众多专家学者对SF-36汉化进行了调查,将原版SF-36汉化后进行检验并建立区域性普通人群常模[28-30]。汉化过程中,简体汉化版更加贴近国情并尊重我国内地居民生活传统,如将“用吸尘器打扫卫生”改为内地居民更熟悉的“拖地、打扫房间”等,此外,汉化版还根据中文表达习惯,将英语习语翻译得更加地道。调查显示,大陆地区被测者的常模与美国被测者的常模存在极大差异,这极有可能与两国间生活传统及社会文化背景不同有关;检验表明,汉化版SF-36可较好地对内地普通群体的健康状况进行评估。而目前为止,SF-36并没有对中国健康普通被测者采取大规模、多领域性能测试及建立中国人种的常模,制约了SF-36在中国的应用和发展。

2.2 欧洲五维健康量表(EuroQol-5D,EQ-5D) EQ-5D是多维度通用健康相关生命质量评价量表,常用量表包括EQ-5D-3L[31]及EQ-5D-5L[32]。20世纪80年代,欧洲生存质量学会(EuroQoL Group)提出并设计了一种基于偏好(preference-based)的通用生存质量评价量表,称原版EQ-5D(EQ-5D-3L)。EQ-5D是一类简单、便捷的多维度健康相关生命质量评价量表,在国际上(欧洲地区居多)使用较为普遍,并被翻译成150余种语言版本。但由于存在较为严重的天花板效应(ceiling effect)[33],欧洲生存质量学会在EQ-5D-3L基础上设计了EQ-5D-5L。

EQ-5D包含问卷和效用值换算表。问卷包括两个部分,分别为EQ-5D健康描述系统和EQ-VAS,其中系统部分包括行动能力(mobility)、自理能力(self-care)、日常活动能力(usual activities)、疼痛或不适(pain/discomfort)、焦虑或沮丧(anxiety/depression)共五个维度;而EQ-VAS则为竖直目测刻度尺,标尺最上端表示“认为最理想的健康状况”,赋值100,最下端表示“认为最糟糕的健康状况”,赋值0。效用值换算表可视作一计算公式,通过分析被测者的选项分值,得出相应的EQ-5D指数分值。EQ-5D-3L每个维度包含3个水平:无任何困难、些许困难、极其困难,可测量243(35)种潜在的被测者健康情况可能。而EQ-5D-5L各个维度涵盖5个水平:无任何困难、一点困难、中等困难、严重困难、极其严重困难,可测量3125(55)种潜在的被测者健康情况可能。EQ-5D简体汉化版由欧洲生存质量协会(EuroQoL Grou)官方发布,但自发布以来,相较于其他常用生存质量量表,EQ-5D的敏感性较低[34],且目前对于EQ-5D简体汉化版的调查研究仍相对较少。研究表明,EQ-5D-5L相比于EQ-5D-3L具有较高的信度、效度及可行性,可较客观、准确评价不同被测群体的身体健康状况[35]。

2.3 脊柱侧凸研究协会22项问卷(scoliosis research society-22,SRS-22) SRS-22为评价特殊畸形的多维度专用健康相关生命质量评估量表,被广泛用于特发性脊柱侧凸(idiopathic scoliosis,IS)患者生存治疗和治疗效果的评估。1999年,Haher等设计提出SRS-24量表,以评估IS患者主观满意度及生存质量。但原版SRS-24存在回答可能性受限、维度重复及不完全检验等问题,所以Asher等[36]修订原版SRS-24提出改良版SRS-24量表。2003年,Asher等[37]将改良版SRS-24中的相关内容选项进行整合修改,制定SRS-22量表。2006年,为提高青少年患者功能维度内部一致性,SRS-22第18题进行了修订[38]。

SRS-22包含22个内容选项,共计5个维度:功能/活动(第5、9、12、15、18题)、疼痛(第1、2、8、11、17题)、自我形象(第4、6、10、14、19题)、心理健康(3、7、13、16、20题)及对治疗满意度(第21、22题)。每个内容选项得分1-5分,分值大小表示功能障碍程度和主观满意度的高低。不同维度得分为相应内容选项得分总和,SRS-22总分为所有内容选项分值总和。汉化版SRS-22量表于2008年才正式引入中国大陆,并根据中国大陆的医疗体系和社会情况进行相应修改。简体中文版SRS-22量表具有良好的信度及效度,被广泛用于评价IS患者手术疗效及生存质量[39]。

3 现状及展望

3.1 评价范围有限 虽然大部分评分量表在独立进行脊柱疾病评价过程中存在良好信度、效度,并在临床广泛应用,但疼痛症状、功能障碍及生存质量往往受多因素共同作用,患者的教育程度、社会文化背景、经济状况和心理等因素均会对评价造成一定影响。因大部分单个评分量表评估范围仍较为有限,所以并不能对脊柱疾病进行全面、系统的评价。

3.2 适用标准及人群不明 量表采取相应的描述性条目对受试者进行评估,但是大部分评分量表的使用标准模糊不清,进而会对评价造成一定的偏差。JOA 17分法虽能用于脊髓型颈椎病评价,但是却无法应用到神经根型颈椎病,所以评价体系需要根据疾病的分型进一步细化。此外,某些量表对不同人群评估效果差别较大,如评估认知水平较低人群时(儿童、老年人及存在认知障碍患者),VAS错误率较高,所以需综合考量受试者特点,再选择相应量表。

3.3 医护人员量表理论知识欠缺 因被测者中包含很大一部分听说读写能力存在障碍及文化程度较低的患者,量表评估通常需要在医护人员的协助下进行,但是目前国内医护人员量表理论知识普遍欠缺,在量表的选择、条目解读及效果评估过程中存在许多误区。为提高评分量表在脊柱疾病中的评估效果,需进一步加强医护人员理论学习。

综上所述,当前评分量表在脊柱外科疾病症状体征、功能障碍及生存质量评定方面应用越来越广泛,各量表针对不同疾病人群具有不同的优点。目前颈椎JOA评分、ODI量表、SF-36等经多国验证,国际通用性较强,在国际上已被广泛接受应用。由于文化、语言及社会背景的巨大差异,部分直接汉化的量表目前尚缺乏国内大规模人群的验证数据,随着国内学者对量表研究的不断深入,亟待更多适合中国人的评分量表出现,使脊柱疾病的评估更加规范。

猜你喜欢
功能障碍脊柱维度
糖尿病早期认知功能障碍与血浆P-tau217相关性研究进展
糖尿病认知功能障碍机制研究进展
理解“第三次理论飞跃”的三个维度
长期久坐低头 你的脊柱还好吗
18F-FDG PET/CT在脊柱感染诊治中的应用及与MRI的比较
认识党性的五个重要维度
浅论诗中“史”识的四个维度
如何保护宝宝的脊柱
勃起功能障碍四大误区
护理干预在轻度认知功能障碍患者中的作用分析