赵丽丽,张 硕,姜立刚
帕金森病(Parkinson’s disease,PD)是好发于中老年人的神经系统变性疾病之一,其主要的运动症状为静止性震颤、肌肉强直、运动迟缓及姿势和步态的异常。冻结步态(Freezing of gait,FOG)是一种短暂性发作的步态障碍,当PD患者发生FOG时,会产生一种特别的感受,即于启步或行进过程中突然感觉到脚粘在地板上,尽管尝试着向前迈步,却仍无法移动。一项国内纳入了474例PD患者的横断面研究显示,FOG的发生率为46.62%[1~3],另有一项纳入990例PD患者的国外研究显示,FOG的发生率是32%[4]。此外,FOG常见于晚期PD患者,有研究显示,在PD早期阶段,FOG的发生率为27%,而晚期阶段,FOG的发生率可达80%[5~7]。FOG作为PD摔倒的独立的危险因素,会对患者的生活质量造成严重影响,应该引起临床医生的重视。为此本研究通过Meta分析的方式,对PD FOG的H-Y分期及运动功能进行分析,为临床医生对FOG的诊断提供比较确切依据。同时对PD FOG的左旋多巴日负荷量进行分析,指导临床用药,并对FOG的认知功能情况进行探究。
1.1 文献检索 使用“Parkinson’s disease”、“PD”、“freezing of gait”、“FOG”作为关键词进行组合在PubMed和Embase数据库内检索。使用“帕金森病”、“冻结步态”作为关键词进行组合在中国知网(CNKI)、万方及维普(VIP)数据库中检索。同时采用手工检索及文献追溯的方法以确保查全,所查文献包括期刊、会议文章汇编及研究生论文。通过以上途径收集2018年12月及之前发表的关于PD患者中FOG相关因素研究的观察性研究。
1.2 纳入及排除标准 纳入标准:(1)关于PD FOG的观察性研究,实验分组需有冻结步态组及非冻结步态组。(2)以人为研究对象。(3)明确的PD诊断标准。(4)原始数据提供单因素分析的各组人数、均数及标准差。排除标准:(1)剔除综述、病例报告、评论、动物和细胞实验及内容无关文献。(2)对于报道相同研究人群的不同研究,仅纳入具有最大样本量或提供最丰富信息的研究,其他予以排除。
1.3 文献检索结果 通过计算机检索数据库,共检出文献784篇,其中英文文献368篇,中文文献24篇。阅读标题及摘要后剔除749篇文章,其中综述57篇、病理报告1篇、评论5篇、内容无关681篇。进一步阅读全文,剔除5篇研究资料不充分的文章,最终纳入30项研究[1,8~36]。
1.4 文献质量评价 由两名研究者独立进行,对于队列研究,采用NOS(Newcastle-Ottawa Scale)进行文献的质量评价。NOS评分标准包括3个项目:(1)研究对象的选择0~4☆;(2)基线可比性0~2☆;(3)临床结局0~3☆。NOS评分的最高分为9☆,其中6~9颗星视为高质量研究,6颗星视为中等质量研究,0~5颗星视为低质量研究;对于横断面研究,采用AHRQ(Agency for Healthcare Research and Quality)所推荐的11个项目进行质量评价,分别用“是”(1分)、“否”(0分)及“不清楚”(0分)作答,总分小于3分视为低质量研究,4~7分视为中等质量研究,8~11分视为高质量研究。如有分歧,则参考第3名研究者意见并协商解决。纳入文献基本特征及质量评价见表1。
1.5 数据提取 由两名独立研究者进行数据提取,如遇意见不统一,则参考第3名研究者意见并协商解决。数据提取内容包括:H-Y分期(Hoehn and Yahr Stage)均数及标准差、帕金森病统一量表运动评分(UnifiedParkinson Disease RatingScale-Motor Part,UPDRS-III)均数及标准差、简易精神状态筛查量表(mini-mental state examination,MMSE)和蒙特利尔认知功能量表(Montreal Cognitive Assessment,MOCA)评分均数及标准差、左旋多巴胺等效日负荷量(Levodopa Equivalent Daily Dose,LEDD)均数及标准差。
1.6 统计学分析 使用RevMan 5.3软件进行统计学分析。对各因素的计量资料加权均数(Weighted mean difference,WMD)以95%置信区间(Confidence interval,CI)表示。以Q统计量和I2统计量检验数据的异质性;认为异质性I2小于50%可接受,此时采用固定效应模型;如异质性I2大于等于50%,使用随机效应模型进行合并行亚组分析和敏感性分析尽量明确原因。以森林图来展示分析结果。通过漏斗图法对各相关因素的研究是否存在发表偏倚进行检验。
2.1 PD患者中FOG组与NFOG组H-Y分级对比 全组分析表明PD患者中FOG组的H-Y分期明显高于NFOG组,差异有统计学意义(P<0.00001,WMD 0.43,95%CI[0.29,0.56])(见图1)。采用漏斗图法进行发表偏倚的检验,各个研究基本对称提示无发表偏倚(见图2)。异质性检验发现,纳入文献的异质性较大(P<0.00001,I2=81%),因此使用随机效应进行合并,然后进行剔除单项研究的敏感性分析,I2值波动在76%~82%之间,异质性并无明显变化,表明Meta分析结果稳定,故进行亚组分析。根据不同的诊断方法分为UPDRS14项组(P<0.00001,WMD 0.93,95%CI[0.78,1.08])、旧问卷组(P<0.00001,WMD 0.37,95%CI[0.21,0.53])及新问卷组(P<0.0001,WMD 0.43,95%CI[0.22,0.64]),进行亚组分析后发现,不管是何种诊断FOG的方法,均提示FOG组的H-Y的分期更高,差异有统计学意义。当使用UPDRS量表中的第14条进行诊断时,各研究间无异质性(P=0.63,I2=0%),当使用旧问卷诊断时,各研究间异质性无明显变化(P<0.00001,I2=79%),当使用新问卷诊断时,各研究间异质性有所降低(P=0.01,I2=66%)。
表1 纳入文献基本特征
2.2 PD患者中FOG组与NFOG组UPDRS运动评分对比 全组分析表明PD患者中FOG组的UPDRS运动评分明显高于NFOG组,差异有统计学意义(P<0.00001,WMD 5.45,95%CI[3.81,7.08])(见图3)。采用漏斗图法进行发表偏倚的检验,各个研究基本对称提示无发表偏倚(见图4)。异质性检验发现,纳入文献的异质性较大(P<0.00001,I2=71%),因此使用随机效应进行合并,然后进行剔除单项研究的敏感性分析,异质性并无明显变化,表明Meta分析结果稳定,故进行亚组分析。
图1 H-Y分级森林图
图2 H-Y分析漏斗图
图3 UPDRS运动评分森林图
图4 UPDRS运动评分漏斗图
根据对PD患者进行UPDRS运动评分时所处的状态,分为ON组(P<0.0001,WMD 3.70,95%CI[2.04,5.37])、OFF组(P<0.0001,WMD 6.65,95%CI[3.68,9.62])及NO组(P<0.00001,WMD 6.49,95%CI[3.88,9.09]),进行亚组分析后发现,不管在何种状态下对PD患者进行UPDRS运动评分时,FOG组都明显高于NFOG组,差异有统计学意义。对处于开期的PD患者评分时,各研究间无异质性(P=0.84,I2=0%),而对处于关期的PD患者评分时,各研究间异质性无明显变化,仍存在重度异质性(P<0.00001,I2=80%),当不区分状态对PD患者进行评分时,各研究间异质性同样未见(P=0.0006,I2=71%),但仍存在较大异质性。
2.3 PD患者中FOG组与NFOG组MMSE评分对比 MMSE评分全组分析表明PD患者中FOG组的评分低于NFOG组(WMD -0.46,95%CI[-0.66,-0.25])(见图5),差异有统计学意义(P<0.00001)。采用漏斗图法进行发表偏倚的检验,各个研究基本对称提示无发表偏倚(见图6)。异质性检验发现,纳入文献无异质性(P=0.05,I2=36%),因此使用固定效应进行合并,然后进行剔除单项研究的敏感性分析,异质性并无明显变化,表明Meta分析结果稳定。
图5 MMSE评分森林图
图6 MMSE评分漏斗图
2.4 PD患者中FOG组与NFOG组MOCA评分对比 MOCA评分全组分析表明PD患者FOG组评分低于NFOG组(WMD -0.86,95%CI[-1.71,-0.01])(见图7),差异有统计学意义(P=0.05)。采用漏斗图法进行发表偏倚的检验,各个研究基本对称提示无发表偏倚(见图8)。异质性检验发现,纳入文献具有中度异质性(P=0.002,I2=65%),因此使用随机效应进行合并,然后进行剔除单项研究的敏感性分析,结果显示在分别剔除Ruwei.O(P=0.01,I2=57%)和Young.E.H(P=0.04,I2=50%)的研究后,异质性发生较大变化,因此进一步行亚组分析明确异质性来源。
根据纳入研究所在国家分为亚洲国家组与非亚洲国家组,进行亚组分析后发现,亚洲国家的研究之间仍然存在中度异质性(P=0.003,I2=69%),并且结果提示PD患者FOG组与NFOG组之间的MOCA评分无显著差异(P=0.38,WMD -0.47,95%CI[-1.53,0.59]),而非亚洲国家的研究之间异质性低(P=0.27,I2=24%),结果提示PD患者FOG组的MOCA评分要低于NFOG组(WMD -1.85,95%CI[-2.78,-0.91]),差异有统计学意义(P=0.0001)。
图7 MOCA评分森林图
图8 MOCA评分漏斗图
2.5 PD患者中FOG组与NFOG组LEDD对比 每日多巴胺等效剂量全组分析显示,PD患者中FOG组要明显高于NFOG组(WMD 163.98,95%CI[113.2,214.77])(见图9),差异有统计学意义(P<0.00001)。采用漏斗图法进行发表偏倚的检验,各个研究基本对称提示无发表偏倚(见图10)。异质性检验发现,纳入文献具有中度异质性(P=0.002,I2=65%),因此使用随机效应进行合并,然后进行剔除单项研究的敏感性分析,结果显示除了在剔除陈生弟的研究后异质性下降比较明显外(P=0.004,I2=49%),依次剔除其余的文献I2值波动在63%~68%之间,因此进一步行亚组分析明确异质性来源。
图9 LEDD森林图
图10 LEDD漏斗图
根据纳入研究中FOG发作的时期分为关期发作组与发作不区分组。进行亚组分析后发现,对FOG的发作时期未区分的研究异质性没有明显降低,仍然存在中度异质性(P<0.0001,I2=65%),结果提示PD患者FOG组的每日等效多巴胺剂量明显高于NFOG组(WMD 168.04,95%CI[116.74,219.34]),差异有统计学意义(P<0.00001)。FOG关期发作的研究异质性同样没有明显降低(P=0.06,I2=65%),结果提示FOG组与NFOG组的每日等效多巴胺剂量无显著差异(P=0.06,WMD 179.29,95%CI[-88.39,446.98])。
根据地理位置将纳入的文献分为北美洲组、欧洲组、大洋洲组和亚洲组。亚组分析发现,北美洲人群FOG组每日等效多巴胺剂量要明显高于NFOG组(WMD 263.06,[98.12,428.00]),差异有统计学意义(P=0.002),而且无异质性(P=0.06,I2=65%)。欧洲人群的FOG组与NFOG组相比,每日等效多巴胺剂量要更高(WMD 160.79,[46.80,274.77]),差异有统计学意义(P=0.006),且异质性有所降低(P=0.03,I2=56%)。大洋洲人群的每日等效多巴胺剂量无明显差别(P=0.07,WMD 166.57,[-10.99,344.14]),异质性同样有所降低(P=0.08,I2=56%)。亚洲人群仍然为中度异质性(P<0.00001,I2=78%),结果提示FOG组每日等效多巴胺剂量明显高于NFOG组(WMD 158.24,[91.33,225.14]),差异有统计学意义(P<0.00001)。
根据研究国家的经济水平将纳入的文献分为发达国家组和发展中国家组。亚组分析发现,发达国家(WMD 146.17,[87.46,204.88])与发展中国家(WMD 173.70,[99.96,247.43])的研究都显示,FOG组每日等效多巴胺剂量高于NFOG组,差异有统计学意义(P<0.00001)。异质性研究显示,发达国家组异质性明显下降(P=0.03,I2=42%),发展中国家组异质性仍然很高(P<0.00001,I2=78%)。
3.1 冻结步态的H-Y分级 Hoehn-Yahr分期是1967年由Margaret Hoehn和Melvin Yahr提出的量表[37],因为H-Y分级能够简单快速的对PD的临床表现进行评估,因此被广泛的用于临床。此后又有了改良版,即在原有的1级与2级之间增加了1.5级,2级与3级之间增加了2.5级,从而使其在临床应用中更精确的评估患者的病情。此次纳入的文献异质性较大,可能与文献所用的H-Y分级标准不同所导致的,但文献中未提供H-Y分级的标准,故未能从此层面进行亚组分析。
此次纳入文献中FOG的诊断标准不统一,其中有3篇文献是通过UPDRS量表中的第14项来诊断[38],有15篇文章使用旧的FOG调查问卷诊断,而有6篇文章使用的新FOG的调查问卷来诊断的[39]。前两者实质上区别不大,均是让患者自己回忆既往有无冻结步态的发生,而新FOG调查问卷则增加了对患者识别冻结步态的视频训练内容,先通过训练,在进行问答,从而提高了冻结步态的特异性和敏感性。因此在该层面对纳入文献进行了亚组分析,结果除了UPDRS组无异质性外,新问卷组和旧问卷组仍有较大异质性。一方面可能是因为纳入文献数量较少,另一方面可能由于不管是旧版调查问卷和新版调查问卷,都是以患者的主观感觉为主,虽然有研究表明两种版本都比较可靠,但Shine等研究表明不可靠[40],所以可能是造成各研究间异质性过大的主要原因,提示在今后的研究中应该建立对FOG更为客观的诊断体系。全组与亚组分析结果一致,均提示PD冻结步态患者的分级要高于非冻结步态的患者。
3.2 冻结步态的UPDRS运动评分 UPDRS评分和H-Y分级同样是对PD患者的病情严重程度的一个评估,基于此量表临床医生们能够更直观的理解和描述患者病情的发展及其临床特征。由于部分文献对测评分时患者所处的状态进行了区分,其中“开期”被文中定义为PD患者在早晨服用多巴胺能药物后30~90 min之间的状态[41],而“关期”被文中定义为PD患者停用多巴胺能药物12 h后的状态[42]。因此在该层面进行亚组分析,异质性分析显示“开期”组无异质性,而“关期”组和未进行区分组仍有较高异质性,可能是因为在关期状态下患者的运动功能水平相差较大所致。同时,对于冻结步态患者与非冻结步态患者UPDRS运动评分的对比,全组分析与亚组分析的结果一致,都显示冻结者的评分要高于非冻结者,提示冻结者的运动功能要更差。
3.3 冻结步态的认知功能 MMSE量表与MOCA量表是临床上评价认知功能最常用的工具[43]。通过合并FOG组与NFOG的MMSE评分结果提示,FOG组的认知功能要低于NFOG组,且各研究间无明显异质性,敏感性分析也提示结果稳定可信。而对于MOCA评分的对比,虽然合并后的结果同样提示FOG组的认知功能较差,但各研究之间的异质性大,亚组分析与全组分析的结果并不完全一致,来自亚洲外国家的研究,结论支持FOG患者的认知功能较差,研究异质性明显降低,来自亚洲各国的研究,却提示PD FOG患者与非FOG患者的MOCA评分的差异无统计学意义,异质性仍较高。Zadikoff等研究表明[44],对于轻度认知功能障碍的筛查,MOCA量表(敏感性90%)比MMSE量表(敏感性18%)具有更高的敏感性,这可能是用MOCA量表对PD患者进行评分时,研究异质性的来源之一。其次,本文亚洲组的国家的7个研究中,有4个研究都来自中国,根据联合国开发计划署2018年所公布的人类发展报告,中国仍处于发展中国家,且区域内经济发展及教育水平不均衡,在一定程度上增大了认知功能评分的异质性,同样敏感性分析里对异质性影响最大的两个研究均是来自同属于亚洲组的两个国家,分别是中国和韩国,韩国虽然是发达国家,但其和中国一样也存在区域经济发展不平衡的问题。值得一提的是,以色列虽然也是发达国家,但因为其历史、地理位置及宗教等原因,长期与周边国家发生战争,其经济和教育水平都不能与欧美那样传统发达国家相比,因此中国、泰国、以色列及韩国所组成的亚洲国家组,由于其经济发展和教育水平的差异,可能是本组及全组的异质性的重要来源。
3.4 冻结步态的LEDD Meta分析合并相关研究显示,PD患者FOG组比非FOG组的每日等效多巴胺剂量明显明显增加。由于研究间异质性的存在,亚组分析设置了两个方面:FOG发作的时期、研究国家的地理位置、研究国家的经济水平。在FOG发作时期层面的亚组分析,分组后各组异质性没有降低,这提示FOG的发作时期并不是异质性的主要来源。在进行研究国家地理位置的分析后,北美洲组研究异质性明显降低,结论支持PD FOG患者每日等效多巴胺剂量高于非冻结步态患者;欧洲组研究异质性有所降低,研究结果同样支持上述结论;大洋洲组研究异质性也有所降低,但结论显示PD FOG患者与非冻结步态患者每日等效多巴胺剂量没有显著差异;亚洲组仍有较大异质性,结论与全组分析结果一致,这些结果表明国家地域因素为异质性的重要来源;在研究国家经济水平层面亚组分析发现,发达国家组异质性明显降低,而发展中国家组异质性仍较高,二者结论都支持冻结步态患者有更高的每日多巴胺日负荷剂量。
无论是亚组分析还是敏感性分析,都显示出来自亚洲各国的研究对异质性的影像较大,如前文所述,亚洲各国大部分是发展中国家,国家与国家之间以及国家内各区域之间的经济发展极不平衡,而众所周知,PD属于慢性疾病,目前来讲没有有效的治疗手段来根除该病,只有通过长期口服药物控制其症状,故该病给家庭带来沉重的经济负担,因此可能有很多患者得不到充分的药物治疗,从而造成了各研究间较大的异质性。
此外,PD虽然由于数据不足未将PD患者的每日多巴胺负荷剂量纳入分析,但各项研究都显示冻结步态患者左旋多巴的用量更高。以上研究提示在给与PD患者药物治疗时,应充分考虑剂量增加带来的风险。
3.5 研究的局限性 首先,由于PD发病率相对较低,因此相关研究较少,纳入文献的数量少,直接影响到Meta分析的准确性。其次,由于调查问卷的形式太过于主观性,缺乏相对客观的证据进行诊断,因此造成了一定程度的选择偏倚,进而影响纳入文献的质量和异质性。相信今后随着时间的推移,相信可以纳入更多的、高质量的观察性研究。
3.6 结论 本研究通过荟萃分析的方法表明,PD FOG的患者比非冻结步态患者的H-Y分级和UPDRS运动评分要更高,病情更严重,并且冻结步态患者认知功能更差,每日等效多巴胺剂量更高,且至少高113.2 mg。