运动干预阿尔茨海默病患者认知功能元分析文献的方法学与证据质量评价

2022-05-27 01:18许正东弓烨弘万嘉倩李鹏辉张庆文
上海体育学院学报 2022年5期
关键词:方法学条目证据

许正东,弓烨弘,2,万嘉倩,李鹏辉,张庆文

(1. 上海体育学院 体育教育训练学院,上海 200438;2. 华东理工大学 体育科学与工程学院,上海 200237;3. 上海震旦职业学院 教育学院,上海 201908)

阿尔茨海默病(Alzheimer's Disease,AD)俗称老年痴呆症,是一种以认知、记忆等能力下降为表现特征的神经退行性疾病。脑内β-淀粉样蛋白(amyloid-β,Aβ)异常聚集形成的老年斑和Tau蛋白过度磷酸化积聚形成的神经元纤维缠结是AD发病的主要原因[1−2]。据统计,目前全球约有5 000万名痴呆患者,而AD占其总数的60%~70%[3]。随着年龄的增长,AD的发病率也逐步上升,预计到2030年全球AD患者将超过7 000万人[4]。当前,该病是仅次于心脏病、肿瘤和中风之外,导致老年人死亡的第四大疾病,已成为人类目前和未来所面临的全球公共卫生和社会保健的最大挑战之一[5]。尽管AD在100年前就已经被确定,各国政府和医药企业也为开发AD药物投入了大量的研究和试验经费,但至今仍未研发出有效治疗AD的药物[6]。因此,研究者们逐渐将AD防治策略转向非药物疗法。

运动作为一种可干预AD的非药物手段,已受到越来越多人的关注。如:运动可降低AD患者脑内的氧化应激水平,促进AD患者脑内的线粒体生物发生,缓解线粒体功能障碍[7];运动可激活PI3K/Akt/mTOR信号通路诱导脑细胞自噬启动,使脑细胞通过自噬系统清除脑内Aβ聚集物水平[8]。运动还可促进脑内海马体积的增大,提升相关脑区结构和功能的可塑性改变,缓解AD所致的认知功能障碍[9]。近年来,针对运动干预AD患者认知功能效果影响的临床研究不断增加,同时也出现大量针对该方向的元分析(meta分析)研究。从循证临床实践角度出发,元分析可提供指导临床实践的最佳证据[10−11]。通过初步检索发现,已有多个元分析结果表明,运动对AD患者认知功能的改善有一定疗效,但这些元分析文献质量不一,证据等级尚不明确。方法学质量与证据质量评价可从更高层面对元分析的研究结果进行综合分析来指导证据使用者[12]。因此,本文对运动干预AD患者认知功能效果的元分析文献进行再评价,采用AMSTAR2量表评估文献的方法学质量,并通过GRADE等级对其进行证据质量评级,以了解当前运动干预AD患者认知功能循证研究的现状及存在的问题,为临床实践和运动防治AD领域以及科学、合理地使用元分析方法对该领域相关研究进行评价提供参考。

1 研究设计

1.1 纳入与排除标准

1.1.1 研究类型

所有与运动干预AD患者认知功能效果相关的元分析文献。

1.1.2 研究对象

已确诊的AD患者,或符合以下标准之一:①1年之内进行头颅核磁检查,均显示海马区萎缩或内嗅区皮质萎缩,与AD的诊断相符。②世界卫生组织的国际疾病分类第10版(ICD-10)的AD诊断标准。③美国精神疾病诊断和统计手册修订第4版(DSM-Ⅳ)的AD诊断标准。④美国国立神经病语言障碍卒中研究所和相关疾病协会(NINCDS-ADRDA)的AD诊断标准。⑤中国精神疾病分类与诊断标准第3版(CCMD-3)的AD诊断标准。其中,研究对象的性别、种族、籍贯和受教育程度不限。

1.1.3 干预措施

至少有一个试验组采用运动干预手段,其中,运动干预类型不限。对照组不参与运动,可为常规治疗、健康教育和空白试验对照等。

1.1.4 结局指标

主要结局指标包括简易精神状态评价量表(Mini-Mental State Examination,MMSE)和阿尔茨海默病评定量表-认知分表(Alzheimer's Disease Rating Scalecognitive,ADAS-cog);次要结局指标包括神经精神问卷(Neuropsychiatric Inventory,NPI)、日常生活能力评估量表(Activity of Daily Living Scale,ADL)等。

1.1.5 排除标准

①非中英文文献;②会议、论文、摘要;③重复发表的文献(保留信息最新或最全面的一篇); ④尚处于计划书和题目阶段的Cochrane元分析;⑤试验对象为轻度认知障碍或非AD型痴呆患者;⑥试验组为运动与认知训练、音乐疗法等非单纯运动的训练方式;⑦无法获取全文或提取数据;⑧动物实验;⑨结局指标与认知功能不相关等。

1.2 文献检索策略

本文由3位接受过严格文献检索训练的检索人员进行文献检索。其中,第一、二作者分别独立对中外文数据库进行全面检索,第五作者处理意见分歧。检索的中文数据库包括中国生物医学文献数据库(CBM)、中国知网(CNKI)、万方数据知识服务平台(Wan Fang Data)、维普网(VIP);英文数据库包括PubMed、The Cochrane Library、Embase、Scopus、Web of Science(WoS)。检索选择的时间区间为从数据库建库至2020年12月31日,第1次检索时间为2021年2月1日,第2次检索时间为2021年3月17日。中文检索词包括运动、体育锻炼、身体活动、抗阻训练、瑜伽、太极、阿尔茨海默病、阿尔兹海默病、元分析、系统综述、系统评价、荟萃分析和meta分析;英文检索词包括exercise、physical activity、resistance training、strength、walk、yoga、tai chi、tai ji、Alzheimer's disease、Alzheimer's dementia、systematic review、meta-analysis。以CNKI数据库的检索策略为例:以“运动”or“体育锻炼”or“身体活动”or“抗阻训练”or“瑜伽”or“太极”为主题词1(#1),“阿尔茨海默病”or“阿尔兹海默病”为主题词2(#2),“元分析”or“系统综述”or“系统评价”or“荟萃分析”or“meta分析”为主题词3(#3),检索#1 and #2 and #3,时间范围为建库到2020年12月31日。

1.3 文献筛选与资料提取

由第三、四作者独立筛选文献、提取资料并交叉核对,如遇分歧,咨询第五作者协助判断。缺乏的资料尽量通过邮件的方式与作者联系予以补充。文献筛选时首先阅读文题和摘要,在排除明显不相关的文献后,进一步阅读全文,以确定最终是否纳入。采用Microsoft Excel 2019软件建立表格提取资料,提取内容主要包括:①研究题目、作者、发表时间、发表期刊、纳入的原始研究数量与样本量、干预措施的具体细节、结局指标、主要结论、质量评价工具、元分析的注册方案号和基金支持等基本信息;②文献评价的方法学及报告质量相关内容;③各个结局指标的定性或定量分析结果。

1.4 方法学与证据质量评价

1.4.1 方法学质量评价

方法学质量是指系统评价/元分析的研究设计、实施过程、偏倚控制及结果描述达到预期最高标准的程度[13]。方法学质量过低会直接影响结果的科学性与可靠性[14]。系统评价方法学质量评价工具第二版(A Measure Tool to Assess Systematic Reviews 2,AMSTAR2)是当前实用性较好的评估元分析方法学质量的工具之一,其评估范围包括了随机对照试验和非随机干预研究[15−16]。由本文第一、三作者独立采用AMSTAR2量表对纳入文献进行方法学质量评价。AMSTAR2量表共16个条目,研究者根据评价标准的满足程度评价为“是”和“否”,部分条目可评价为“部分是”,其中2、4、7、9、11、13和15为关键条目。每个研究的可信度等级按照“高级”“中级”“低级”“极低级”评分,0或1个非关键条目存在缺陷评为“高级”,大于1个非关键条目存在缺陷评为“中级”,1个关键条目加或不加非关键条目存在缺陷评为“低级”,大于1个关键条目加或不加非关键条目存在缺陷评为“极低级”[16−17]。评价过程中若遇有分歧,由5位作者共同讨论直至意见统一。

1.4.2 证据质量评价

证据质量是指效应估计值能够正确反映真实情况的把握程度[18]。证据质量过低可产生误导性的推荐意见,降低结果的可靠性并影响结果的适用性[19−20]。由包括世界卫生组织(WHO)在内的19个国家和国际组织推出的推荐分级评价、制定与评估系统(Grades of Recommendations Assessment, Development and Evaluation,GRADE)是当前较为成熟的证据质量评价和推荐强度评级标准之一[21−22]。由本文第一、三作者独立使用GRADE系统评价纳入文献结局指标的质量等级。GRADE系统对于结局指标证据质量的评价包括研究的局限性[23]、不一致性[24]、间接性[25]、不精确性[26]和发表偏倚[27]5个降级因素,证据质量可因此划分为“高级”“中级”“低级”“极低级”4种级别。其中,不降级为高级证据,降1级为中级证据,降2级为低级证据,降3级为极低级证据,最终将证据等级分为“高级”“中级”“低级”“极低级”4个等级[22]。评价过程中若遇分歧,由5位作者共同讨论直至意见统一。

2 研究结果

2.1 文献筛选流程及结果

初检共获得相关文献774篇,导入EndNoteX9软件,经逐层筛选,最终纳入9篇文献。文献筛选流程及结果见图1。

图 1 文献筛选流程及结果Figure 1 Flow diagram of literature selection

2.2 纳入文献的基本特征

纳入的9篇元分析文献发表年限从2015年至2020年,英文文献5篇,中文文献4篇。在9篇元分析文献中,除1篇文献纳入的原始研究类型为随机对照试验和非随机干预研究外,其余文献纳入的原始研究均为随机对照试验。纳入的原始研究数量最多为23篇,最少为5篇,样本量最多为923人,最少为364人;试验组干预措施为有氧、有氧与无氧结合运动形式;对照组以常规治疗手段或空白对照等为主。在方法学质量评价工具方面,6篇文献采用了Cochrane 协作网RoB风险评估工具,2篇文献采用了Jadad量表,1篇文献同时采用Jadad和NOS量表进行风险评估。8篇文献明确指出运动可有效改善AD患者的认知功能,1篇文献指出运动改善AD患者认知功能效果的证据有限。纳入文献的基本特征见表1。

表 1 纳入文献的基本特征Table 1 Basic characteristics of the literature included in the study

2.3 纳入文献的方法学质量评价

通过AMSTAR2量表对纳入的9篇元分析文献进行方法学质量评价,结果显示4篇文献的方法学质量为“低”,其余5篇文献为“极低”,无文献完全符合中、高质量级方法学要求(表2)。在AMSTAR2量表的16个条目中,有12个条目被评定为报告较为完整(≥70%),分别为条目1(100%)、条目3(100%)、条目4(100%)、条目5(77.78%)、条目6(77.78%)、条目8(100%)、条目9(88.89%)、条目10(77.78%)、条目11(100%)、条目12(77.78%)、条目13(100%)、条目14(77.78%)。在7个关键条目中,条目4、9、11和13报告较为完整。在纳入的9篇元分析文献中,无文献详细描述是否提前制定研究方案及报告相应注册号, 2篇文献在检索和数据提取过程未描述是否为双人重复式文献选择方式, 5篇文献没有提供排除文献清单,1篇文献没有合理使用偏倚风险评估工具, 2篇文献未报告是否存在纳入研究的资助来源情况,2篇文献未考虑纳入研究的偏倚风险,2篇文献未对合并结果的异质性给予满意解释,6篇文献充分评价了发表偏倚,5篇描文献述了是否存在潜在的利益冲突。结果见表3。

表 2 纳入文献的方法学质量Table 2 Methodological quality of included literatures

2.4 纳入文献的证据质量评价

纳入的9篇元分析研究共包含17个结局指标,运用GRADE系统评估工具对所有结局指标进行证据质量评价。其中,中级证据3个,低级证据9个,极低级证据5个。结果见表4。

2.4.1 MMSE

MMSE是结果可靠且采用最广泛的认知功能检测手段之一,被广泛应用于AD的临床实践中[37−38]。9篇文献分析了运动干预对AD患者MMSE分数的影响,8篇文献表明运动可有效提升AD患者的MMSE分数,且差异具有统计学意义。其中,2项研究MMSE的结局指标证据质量为中级,5项研究MMSE的结局指标证据质量为低级,2项研究MMSE的结局指标证据质量为较低级。

表 3 纳入文献的AMSTAR2量表各条目质量Table 3 The quality of AMSTAR2 items for included literatures

表 4 纳入文献的证据质量评价Table 4 GRADE classifications of the included literatures

2.4.2 ADAS-cog

ADAS-cog可评估AD患者的认知功能并评估抗痴呆治疗的疗效,在临床试验中的应用仅次于MMSE[39−40]。3项研究分析了运动干预对AD患者ADAS-cog分数的影响,3项研究结果均表明运动可有效降低ADAS-cog分数,且差异具有统计学意义。其中,2项研究ADAS-cog的结局指标证据质量为低级,1项研究ADAS-cog的结局指标证据质量为较低级。

2.4.3 NPI

3项研究分析了运动干预对AD患者NPI分数的影响,3项结果均显示运动可有效降低NPI分数,且差异具有统计学意义。其中,1项研究NPI的结局指标证据质量为低级,1项研究NPI的结局指标证据质量为较低级。

2.4.4 ADL

部分试验应用ADL量表鉴别痴呆与轻度认知损害患者的认知能力[41]。2项研究分析了运动干预对AD患者ADL分数的影响,2项结果均显示运动可有效提升ADL分数,差异具有统计学意义。其中,1项研究ADL的结局指标证据质量为低级,1项ADL的结局指标证据质量为较低级。

3 讨 论

作为非药物疗法之一,运动改善AD患者认知功能的生物学机制已被大量临床试验证实。其中,运动干预试验主要包括有氧运动、有氧运动和无氧运动相结合的综合运动等形式。运动可促进血液流向大脑,加快血管生成,丰富脑部微血管网络,触发大脑区域的可塑性[42]。运动可通过促进脑源性神经营养因子、血管内皮生长因子的表达,促进神经元形态学改变和突触可塑性提升,进而改善涉及认知的大脑结构和神经元回路[43]。运动还可通过抑制星形胶质细胞过度活化,减缓Aβ和Tau蛋白异常聚集速率,进而改善认知与记忆功能[44−45]。

目前已有多个系统评价证实:运动对AD患者的认知功能具有一定改善效果,但相应研究的方法学质量及证据质量尚未明确。在本文纳入的9篇元分析文献中,英文文献为5篇,中文文献为4篇,提示运动改善AD认知功能这一话题已受到了国内外的广泛关注。同时,9篇文献均为2015年后发表,2017年至2020年发表的文献达到8篇,表明近年来这一话题的关注度呈上升趋势。值得一提的是,9篇文献均采用了相应的偏倚风险工具评估纳入的原始研究质量,所有研究方法较规范,确保了后续评价的科学性。

3.1 元分析文献的方法学质量评价

通过AMSTAR2量表对9篇元分析文献进行方法学质量评估发现,整体方法学质量普遍偏低,表明各个元分析研究在选题、设计、注册、数据提取和统计分析等方面存在不同的方法学缺陷,主要表现在以下几个方面:

(1)所有研究均未描述是否提前撰写计划书或提供注册号。提前撰写计划书或预注册可有效减少选择性报告偏倚,避免摘取与使用数据过程中的随意决策给结果带来的偏倚风险[11,16]。遗憾的是,本文纳入的9篇中英文文献均未进行方案注册,可能与英文注册平台注册周期时间较长、国内无中文注册平台、研究者尚未重视方案注册等因素有关。元分析研究者在开展研究前应当提前撰写计划书,以减少元分析制作过程中的偏倚风险。同时,应当在注册平台(The Cochran Library、PROSPERO或Inplasy等)进行注册,以保证元分析研究的透明化[15−16]。

(2)文献筛选、数据提取和文献排除理由并未详细描述。2篇文献在文献筛选和数据提取时并未提及多人操作,这可能会造成后续数据统计与分析的误差。5篇文献均未提供排除文献的清单及理由。尽管大多数元分析的研究者制定了文献纳入标准、详细的检索策略和数据库,但仍存在未提及双人重复式文献筛选与提取、列举排除文献清单与理由的问题。为减少选择性偏倚,研究者应在元分析制作中提及文献筛选与资料提取过程中是否涉及双人重复式、展示排除研究的数目清单和排除缘由[46]。同时,建议期刊审稿人在审稿时索要排除文献清单,以保证研究者筛选文献过程中的透明性。

(3)元分析实施过程不严谨。1篇文献没有合理采用评估工具对纳入研究文献进行偏倚风险评估,2篇文献未充分考虑纳入研究的偏倚风险对结果分析的潜在影响,且未对元分析结果中存在的异质性给予满意的解释及讨论,3篇文献未充分评价发表偏倚。元分析是公认的可客观评价和综合某一特定问题研究证据的最佳手段,元分析实施过程中的偏倚风险分析、异质性来源解释和发表偏倚评价等决定着结果的可靠性[14,19]。当纳入不同偏倚风险的随机对照试验或非随机干预研究时,研究者应对纳入文献的偏倚风险进行深入剖析,并讨论其对结果(定性分析结果或合并效应量)的影响[46]。同时,异质性检验提示存在异质性时,研究者应尽力寻找异质性的可能原因,在讨论部分对异质性可能原因进行探讨[14−15]。

(4)未说明元分析制作过程中纳入研究的资助来源及相关利益冲突。2篇文献未说明纳入研究的资助来源信息,4篇中文文献均未报告是否存在潜在的利益冲突。其中,中文文献未报告利益冲突可能与国内中文学术期刊未对投稿的资金支持提出相关规定性相关。商业资助的研究项目易出现倾向资助方产品的结果,进而影响元分析最终的证据质量[17,47]。在元分析中详细说明资助来源情况,进而根据资助来源情况对纳入研究的结果进行分析,可有效减少研究者对系统评价产生的偏倚。同时,对研究成果所带来的利益冲突也应给予重视,处理潜在的利益冲突关系可减少同行评议专家和读者在判断过程中的偏倚风险[17,48]。因此,研究者应将研究的资金来源、有无利益冲突等描述清晰。

3.2 元分析文献的证据质量评价

通过GRADE系统对9篇纳入文献的17个结局指标进行证据分级显示,中级证据3个、低级证据9个、极低级证据5个,证据质量整体偏低,该结果与当前运动能够改善AD患者认知功能的主流观点不符。对结果剖析发现,影响证据质量等级降低的原因主要表现在以下几个方面:

(1)设计和实施局限。1篇文献纳入的大部分试验未提及具体对照组的定义与选择标准,仅提及随机方法、随访与退出人数的报告。1篇文献纳入的大部分试验结果数据不完整。1篇文献纳入的大部分试验未总结与盲法相关的偏倚风险评价。2篇文献对纳入文献的质量报告没有明确分类描述。这些问题是导致证据质量偏低的主要因素,建议元分析研究者在实施过程中根据潜在偏倚的可能大小,在可选类别间进行判别决策[23]。

(2)结果不一致。共有14个结局指标具有中、高度异质性。证据质量具有中度或高度异质性时会导致证据质量降级,问题可能源自纳入试验的差异性较大[24]。在元分析实施过程中研究得出差异性较大的效应估计值时,元分析作者应在结果讨论中对异质性给予充分合理的解释,或可通过亚组分析和敏感性分析处理结果的异质性,提高证据质量等级。

(3)结果不精确。3个结局指标存在研究数量较少、可信区间较宽等问题,进而导致降级,这可能与文献筛选和统计过程设计不合理有关。今后的运动干预试验应科学合理地规范文献筛选过程,避免产生该类问题。

(4)可能存在发表偏倚。在17个结局指标中,仅对3个结局指标进行了漏斗图分析,对2个结局指标运用Egger法检测,其余结局指标并无详细描述发表偏倚情况,导致证据质量降级,提示在今后的元分析实施过程中应科学、全面地对结局指标进行发表偏倚的检测与描述。

3.3 改进建议

基于本文的结果,笔者提出以下建议,为后续的研究和评价标准提供参考:

(1)研究者加强系统评价/元分析等循证理论学习,熟练掌握研究方法学和证据质量规范,学习并遵守相应声明和原则,规范地进行系统评价/元分析研究。此外,研究者完成元分析研究后,可根据AMSTAR2和PRISMA清单[49−50]条目对研究成果进行交叉核对,及时完善缺失信息,提升元分析的研究质量。

(2)国外期刊编辑部有补充资料在线共享系统,研究者可通过在线共享系统查询系统评价/元分析的研究方案、文献检索策略、排除文献清单以及相关图表。国内中文期刊文献受篇幅限制,以及编辑部未建立对应的数据库,致使元分析作者无法按照AMSTAR2和PRISMA清单制定自检报告规范,这一客观因素会降低中文元分析文献的质量。因此,建议国内中文期刊编辑部建立补充材料在线共享系统。此外,有意愿和条件的期刊编辑部可增设元分析专栏,减少篇幅限制,呈现元分析的全貌供读者甄别。

(3)本文检索的9篇文献均未提及注册计划书和注册号。研究方案预注册可有效减少选择性报告偏倚,避免使用数据过程中的随意决策给结果带来的偏倚风险[11,16]。当前,国内仍缺乏具有国际影响力的元分析研究方案及注册平台,有条件的高校及循证医学中心可在国家政策的支持下联合进行该平台的建设。一方面,可以更高效率地利用和实践临床证据,提高科研成果向实践的转化率;另一方面,注册平台与国际接轨,进一步加强国际合作和交流。

(4)当前国内高校较少开设循证理论课程,体育院校更是鲜有此类课程,大多数循证研究者依靠自学、讲座和培训获取相关知识,不利于长期系统地培养循证专业人才。因此,建议有条件的高校开设系统评价/元分析相关专题培训。

3.4 本文的局限性

本文存在一些局限性:①只纳入了中英文文献,检索结果可能不全面;②仅通过计算机进行检索库检索,未补充检索;③因受版面限制,未详细列出排除文献清单,也未注册研究方案,可能会产生结果偏倚;④评价分析过程中不可避免存在一定的主观性,可能导致偏倚;⑤AMSTAR2量表是一个“舶来品”,中文元分析研究者无法按照AMSTAR2量表完善元分析研究方案,这一客观因素也会影响后续中文元分析文献的方法学质量评价。

4 结 论

通过对运动干预AD患者认知功能效果的元分析文献进行方法学与证据质量评价,发现元分析文献的方法学质量普遍偏低,结局指标的证据质量可靠程度一般。元分析是评价研究试验的高级质量工具之一,其优劣决定着研究的可靠性。运动延缓AD患者相关病理特征、改善患者认知功能是当前国际热点研究问题之一,建议本领域元分析研究者遵循严谨的元分析报告规范,期刊编辑部从审稿制度上严格把关元分析研究,有条件的高校及循证医学中心在政策支持下联合建设注册方案平台,学校开设元分析理论与实践课程,共同为运动防治AD领域提供更加科学、准确、高质量的临床试验证据。

作者贡献声明:

许正东:检索文献,分析统计数据,撰写论文;弓烨弘:检索文献,提出论文主题;

万嘉倩:筛选、提取资料,分析统计数据;

李鹏辉:筛选、提取资料;

张庆文:核实统计数据与结果,设计论文框架,审核、指导并修改论文。

猜你喜欢
方法学条目证据
大型学术著作《药理研究方法学》出版发行
《词诠》互见条目述略
药品微生物限度检查方法学验证的研究进展
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
对于家庭暴力应当如何搜集证据
手上的证据
追踪方法学在院前急救护理安全管理中的应用
手上的证据
名老中医学术传承工作进程与方法学研究
对县级二轮修志采用结构体式的思考