王玉琳,张亚珂,李超然,刘佳,李俊辰,杨添淞,张琳,冯楚文,王更宏
轻度认知功能障碍(mild cognitive impairment,MCI)指认知功能下降快于年龄和文化程度相应的预期下降,但不足以造成日常功能的显著损害,是介于正常衰老与痴呆间的一种不稳定的临床过渡状态[1]。随着全球老龄化进程的加快,本病的发病率日渐攀升,最新一项针对我国46 011 例≥60 岁成年人的全国性横断面研究数据显示[2],我国MCI总体患病率达15.5%。在MCI发病的3~5年后,有21.8%进展为痴呆症,MCI患者发生阿尔茨海默病(Alzheimer’s disease,AD)的可能性是正常老年人的2.8 倍;众所周知,痴呆症所伴发的病理变化难以逆转,中后期疗效差,给患者个人及其家人带来心理、生理及经济压力[3],所以早期准确诊断与干预在控制MCI进展,为个人、家庭、社会减负,增加国民幸福度中起关键作用。
根据MCI的诊断指南[4],本病的主要诊断以临床症状为主,以量表筛查为主要手段。尽管神经心理学评估(neuropsychological assessment,NPA)是认知评估的金标准,但由于时间限制和专家管理所需的成本,在临床环境中并不常用。简短的筛查工具为临床医生提供了可行的选择,虽然无法完全替代NPA,但可以提供关键认知领域的功能指标并指导进一步评估。
纵观国内研究,针对MCI 的研究中使用最多的量表仍然是简易智力状态检查量表(Mini-mental State Examination,MMSE),但国内外各项研究均表示,MMSE 的筛查特异性、敏感性低于其他新量表,且有很明显的地板效应与天花板效应。目前各种各样的替代量表层出不穷,而临床应用却很局限。本文对常用的MCI 筛查评价量表进行综合论述,提供各量表的原始文献、临床应用临界值,并分析对比各量表特点及适宜人群,以便为MCI的临床诊疗、研究选取合适的量表提供实用参考。
这部分量表常作为门诊快速诊断与筛查量表,具有简短便捷易操作的特点,包括MMSE、蒙特利尔认 知 评 估 量 表(Montreal Cognitive Assessment,MoCA)、快速轻度认知障碍筛查记录表(Quick Mild Cognitive Impairment screen,Qmci)及专门针对低学历人群、文盲开发的Phototest量表。
MMSE 为 Flistein 等[5]于 1975 年开发,问世以来在国内外得到推广普及,目前已经有100多种语言版本。中文版本的MMSE(Chinese MMSE,CMMSE)于1983 年开发,在中国的大规模流行病学研究中被用作痴呆症、认知功能障碍的筛查工具,CMMSE 在中国社区居民中具有合理的敏感性和特异性[6]。
MMSE的优点为简单、易操作,是目前知名度最高,流传最广泛,研究最多的量表。另外,MMSE 信度良好,联合检查的组内相关系数为0.99,相隔48~72 h 重测,组内相关系数可达0.91,用于随访敏感[7]。但MMSE总分易受到年龄、教育程度、文化背景甚至人种的影响,不仅文化程度较高的患者易出现“天花板效应”,即可能出现假阴性,而且文化程度较低的人群也易出现“地板效应”,即可能出现假阳性。另外,Mitchell[8]经过文献荟萃分析提出,MMSE 区分MCI 患者和健康参与者的能力非常有限。Pinto 等[9]研究提出,在筛查诊断MCI 方面,MoCA 优于MMSE。
此外值得注意的是,MMSE 中的单个项目及其得分与相应的认知领域并不能完全划等号,其与相应的神经心理测验的相关性非常低[6]。如MMSE 中物体命名不等同于语言(命名)能力,如果该项目得分较差,只能提示语言能力可能存在障碍,还需要采用针对该结构领域的量表进一步诊断,如波士顿命名检测。
中文版MMSE依据不同教育程度做出的临界值为,文盲组17 分、小学组20 分、中学或以上组24 分,低于该值为认知功能受损[6]。2011 年上海华山医院洪震课题组[10]通过大样本研究又提出MMSE划界值按照受教育时长:文盲≥20 分,1~5 年≥23 分,6 年以上≥27分。人群随访中MMSE下降≥2或3分被认为具有病理意义。
MoCA 为 Nasreddine 等[11]于 2004 年开发,自问世以来被用于检测不同种族及地区人群的认知功能障碍。此外基于该量表,已经开发出适用于视力障碍、听力障碍患者的版本,使其临床应用更加广泛[12]。目前MoCA 在国内被翻译成多个版本,较常用的有2006年解恒革等翻译修订的北京版MoCA和2010年涂秋云等翻译修订的长沙版MoCA。
MoCA为解决MMSE的局限性而开发,它较MMSE能更敏感地识别轻微的认知损伤,其检测MCI 的敏感性为90%,检测轻度AD 的敏感性达100%[11]。如Siqueira 等[13]通过对全球范围文献研究提出,在识别认知能力下降的早期阶段,MoCA的敏感性优于MMSE。但对于文盲与低教育水平的老人,该量表中的一些项目并不适合,如模仿立方体和画钟试验对于没有书写经验的老人而言较困难,连线和相似性的指导语也不易为他们所理解。另外,MoCA项目分并不反映相应的认知领域,如MoCA的简短连线项目和相似性项目与完整的连线测验和相似量测验相关性极低[6]。
根据开发者 Nasreddine 等提出,MoCA 总分为 30 分,26 分是认知功能障碍出现的划界值,低于26分可能患有认知功能障碍,受教育年限≤6(或12)年者总分加一分。但是,MoCA临界值及评估结果容易受教育水平、年龄、文化背景等诸多因素影响,不同国家地区的临界值存在差异,如O'Driscoll 等[14]提出在不同的文化背景下,MoCA筛选MCI的建议临界值范围很广。
在我国,对北京版 MoCA 的研究如下:Lu 等[15]将 MoCA 应用于8 411例65岁以上的中国社区居民,提出最佳分界点为:文盲=13/14,6 年≥教育时长≥1 年=19/20,受教育时长>7 年=24/25。在最佳临界值的情况下,MoCA对MCI的敏感性为80.5%,对痴呆症的敏感性为96.9%,而识别健康认知的特异性为82.5%。这些表明在最佳临界值的情况下,MoCA可有效筛查中国社区中老年人的认知障碍。
自2019 年9 月1 日起,MoCA 官方网站对使用者进行强制性培训和认证,以提高临床操作的准确性和得分的可靠性。这些进展将对MoCA 在检测MCI 和痴呆症方面的敏感性和特异性产生何种影响尚待观察。
Qmci 为加拿大 O'Caoimh 等[16]创立,是 AB 认知筛查 135(ABCS 135)[17]的修改版,强调ABCS 135 的子测试延迟回忆和口语流利度,同时增加了逻辑记忆任务和新的评分系统,旨在提高其检测MCI 的敏感性;同时,最大程度地减少与MMSE 相关的天花板效应[18]。子测试逻辑记忆任务部分涉及即刻回忆故事,并根据记忆的关键词数量进行评分,在筛选MCI 方面显示出最大的敏感性和特异性,为Qmci的特色所在。而新加的评分系统优势在于,可根据子测验的效用对子测验进行加权,以衡量认知能力下降的不同阶段的变化[19]。
Qmci已在世界范围内先后以多种语言进行了翻译和验证,显示出不同文化背景下区分MCI 与正常认知的高度灵敏度(0.76~0.92)和特异性(0.72~0.95)。其中,O'Caoimh 等[20]研究表明,Qmci在区分MCI与正常认知方面较MMSE和ABCS 135更敏感。最近的系统综述和荟萃分析[20]发现,它与其他检测MCI的简短量表相比,具有更出色的敏感性与特异性,其检测MCI的准确度高于MMSE与MoCA。
Qmci 目前尚缺乏相对全面的研究与测评,它是MCI 筛查领域中一个有希望的新成员。Iavarone等[21]在意大利语版Qmci(Qmci-I)针对307 例健康受试者的规范研究中提出,年龄与教育变量对总体Qmci-I得分表现出显著的影响,其中对子测验逻辑记忆的影响最大。Bunt等[22]在验证该量表的有效性的同时提出,Qmci 可准确区分健康受试者与认知损伤者,但在区分MCI与AD时缺乏特异性。
Qmci 量表包括6 个子测试项目,总分100 分,临界值<63/100 为认知功能损害,此时灵敏度为85%,特异性为85%[19]。临界值<62/100时,对认知障碍的敏感性为83%,特异性为87%。
Phototest 为 Carnero-Pardo 等[23]针对低学历人群、文盲开发的用于筛查MCI 及痴呆症的简易量表,内容包括三个部分:命名任务、口语流利度与情境记忆;适用于基层医疗中心,完成测试只需约3 min,高效实用且不受教育程度的影响[24]。
Carnero-Pardo 等[25]对 Phototest 与 Eurotest、记忆改变测试(M@T)这两种同样适用于低文化水平的简短筛查量表进行诊断准确性、有效性与成本分析提出,Eurotest、记忆改变测试(M@T)和Phototest具有同等效力。Eurotest和Phototest都是较便宜的选择,但Phototest 最有效,所需时间最短。Russo 等[26]在Phototest对阿根廷人民检测认知障碍和痴呆症的诊断准确性研究中提出,Phototest 在识别MCI 方面的准确性优于传统的MMSE和画钟试验(clock drawing test,CDT),同时,Phototest与MMSE 和CDT 有很强的相关性。这些分析支持标准有效性和总Phototest 评分筛查整体认知障碍的能力。Burke 等[27]在西班牙语国家的老年人群中研究发现,Phototest在快速检测MCI中,速度与效率比MMSE、MoCA更优良。
MCI 的Phototest 临界值为28/29 分,痴呆的临界值为26/27分,对于痴呆和MCI 分别具有足够的判别效度,敏感性和特异性达90%[23]。
这部分量表既可作为较细致的筛查量表,又可作为评价量表,用于临床评价,包括Addenbrooke’s 认知功能检查第三版(Addenbrooke’s Cognitive Examination-Ⅲ,ACE-Ⅲ)中文版和圣路易斯大学精神评估量表(Saint Louis University Mental Status Examination,SLUMS);量表包含的每个子项目均独立可靠,代表特定的认知功能,在临床疗效观察应用中可更加敏感细致地体现治疗结果。
ACE 是英国剑桥大学 Hodges 等[28]于 20 世纪 90 年代编制,起初ACE 及ACE 修订版的评估内容包含MMSE,因而可同时得到ACE 和MMSE 两部分的评分。2013 年,为使ACE 更具独立性,在ACE-R基础上,将MMSE内容从量表中去除,进而发展为ACE-Ⅲ。中文版ACE-Ⅲ是在ACE-R的基础上,由王刚和黄越翻译修订,评分指南由陈生弟、章军建和熊丽翻译修订。
ACE-Ⅲ问世以来,先后以西班牙语、英语、中文、意大利文、葡萄牙文等验证了在不同临床背景下的高诊断准确性。Fang等[29]在运用ACE-Ⅲ筛选MCI 与AD 的研究中提出,中文版ACE-Ⅲ是一种可靠的认知障碍评估工具,其具有良好的可靠性(同类相关系数ICC=0.994,重测ICC=0.967)以及可靠的内部一致性(α=0.859);ACE-Ⅲ筛选aMCI 的敏感性优于MMSE,临界值为 85/86 分。Li 等[30]将 ACE-Ⅲ中文版与 MMSE、MoCA 进行对比提出,ACE-Ⅲ具有良好的内部一致性和收敛效度,并在检测MCI方面明显优于MMSE和MoCA。同样,该量表不可避免地受文化程度、年龄等变量的影响,有学者提出,对于中高文化水平的患者而言,ACE-Ⅲ的筛查准确性与特异性明显优于MMSE,而对于文化程度较低的患者,ACE-Ⅲ并不优于MMSE[31]。
ACE-Ⅲ满分100 分,原作者推荐两个划界值(88 分和82分)[28]。将88 分作为划界值时,该量表识别痴呆的敏感性高(94%);将82分作为划界值时,可以得到较好的特异性(100%),但敏感性降低(84%)。
ACE-Ⅲ由26个独立部分组成5个子项目,每个项目代表了一个特定的认知功能:注意力和定向力(18分)、记忆力(26分)、词语流畅性(14分)、语言(26分)和视空间能力(16分)。有研究提出,ACE-Ⅲ具有良好的内部一致性(α=0.824),五个子测验的内部一致性系数分别为:注意力0.788、记忆力0.744、流利度0.772、语言0.702、视觉空间能力0.740,这表明ACE-Ⅲ的每一项子测试均独立可靠[30]。
ACE-Ⅲ作为MCI 较详实的评价量表,近来不断被翻译成各国语言广泛应用,更有North等[32]对ACE-Ⅲ量表进行改编(即HI-ACE-Ⅲ),以使其适用于听力障碍患者的认知筛查,并初步验证了该表在听力障碍患者中的可靠性、有效性与筛查效用。
SLUMS由Morley和Tumosa于2002年开发,在北美广泛用于评估老年人和痴呆症患者的认知功能。该量表包含11项,分为6 个子项,包括方向、记忆、执行功能、注意力、视觉空间技能和画时钟图,其格式与MMSE 相似,但它为MMSE 补充了增强任务,包括注意力、数值计算、即时和延迟回忆、动物命名、数字跨度、钟表绘制、图形识别等,旨在解决MMSE在筛查高知识水平患者所遇到的“天花板效应”这一局限性。
Tariq等[33]在针对MMSE、SLUM筛查认知障碍的对比研究中提出,SLUM可能更适合于检测MMSE未能检测到的轻度神经认知障碍,在筛查MCI 方面,SLUM 比MMSE 更加准确、灵敏;而在区分 AD 与 MCI 时,MMSE 更胜一筹。Cao 等[34]运用SLUMS 筛查中国老年患者的认知障碍,发现SLUMS 评分与MoCA 和MMSE 评分高度相关。Zhang 等[35]运用中文版SLUMS检测脑外伤患者认知障碍中的有效性和可靠性的初步研究中提出,中文版的SLUMS具有令人满意的内部一致性(α=0.723)、出色的间信度(ICC 0.990~0.998)和评估者内信度(ICC 0.968)、良好的有效性、很高的敏感性和特异性。它可用于筛查中国脑外伤患者认知障碍。同样,Yang等[36]针对中文版SLUM特异性与敏感性研究提出,中文版SLUM适用于中国人群认知功能的筛选。但该量表尚缺乏临床大样本研究的数据支持。
SLUM总分30分,对于未受过高中教育的老年人正常分数为25~30分,20~24分表示MCI(敏感性/特异性为0.92/0.81),1~19 分表示各种程度的痴呆(敏感性/特异性为1.0/0.98);对于高中或更高学历的老年人,正常分数为27~30,21~26 分表示MCI(敏感性/特异性分别为0.95/0.76),1~20分表示痴呆(敏感性/特异性分别为0.98/1.0)[33]。
MCI 发病率高,起病隐匿,以记忆轻度损害为前驱症状[37],是介于正常衰老与痴呆间的一种不稳定的临床过渡状态,易向痴呆进展,故早期准确诊断、及时干预是本病治疗的关键,也是降低痴呆发病率的关键。纵观国内研究,临床筛查诊断使用最多的仍然是MMSE,量表使用单一,正如Cullen 等[38]的评论所述,不可能有一种完美的量表可用于每个人群及所有类型的神经退行性疾病,各量表各有偏倚,各有优缺点,单一量表使用并不能有效规避量表自身的缺点,甚至造成研究结果的偏差,临床应用中应根据具体需求,选择合适的评价量表,方能事半功倍。
本文大致将常用的MCI筛查评价量表分为两大类:①简易筛查量表:这类量表具有简短便捷易操作的特点,包括MMSE、MoCA、Qmci 及 Phototest;MMSE 作为临床使用历史最长的老牌经典量表,流传度广,普及度高,但不可避免的有一些局限性,如“天花板效应”、“地板效应”,并对MCI 的筛查敏感度与特异性较低;后来的MoCA、Qmci及Phototest针对MMSE的局限性、针对筛查MCI而开发,这其中,MoCA临床应用度最广,对MCI筛查的灵敏度与特异性明显高于MMSE,但由于MoCA评估结果易受教育程度、年龄、文化背景等诸多因素影响,不同国家地区的临界值存在差异。Qmci是ABCS 135的修改版,旨在提高其检测MCI 的敏感性,是临床快速检测MCI 的理想简短量表;Phototest为针对低学历人群、文盲开发的检测MCI及痴呆的简易量表,适用于基层医疗中心,不受教育变量的影响。②细致评价量表:这类量表在临床中既可以用于细致筛查诊断,也是理想的评价量表,包括ACE-Ⅲ和SLUMS;ACE-Ⅲ量表由26个独立部分组成5个子项目,每个项目代表了一个特定的认知功能,且每一项均独立可靠。SLUM量表格式与MMSE相似,但它又补充增强了MMSE的一些项目,更有利于对MCI的筛查与评价。