张旭, 左丽倩, 刘明秀, 谭坤, 殷玉华, 李奎, 杨自仙
系统评价(systematic review,SR)或Meta分析(meta-analysis,MA)是循证医学研究的重要方法,目前已经被广泛运用于医学领域。相关SR/MA对医学指南的制定提供了科学的循证依据,而这些SR/MA的质量决定了指南证据的强度。国内外有关SR/MA的质量评价研究已有很多,大多采用A Measurement Tool to Assess Systematic Reviews(AMSTAR)对随机对照实验(randomized controlled trial,RCT)SR/MA进行方法学质量评价,结论显示其方法学质量整体偏低,特别是在检索策略、亚组人群、资金资助、潜在偏倚以及统计分析等方面尤为显著[1-4],而针对非随机对照实验(non-randomized controlled trial,NRCT)SR/MA的质量评价相当缺乏。2017年,英国医学会期刊(BMJ)发表了用于评价纳入随机和(或)非随机对照试验SR/MA的方法学质量评价方法AMSTRA-2[5-6]。因此,本研究利用AMSTRA-2对纳入的医学领域SR/MA进行质量评价,并探讨多种分组下,各分组SR/MA之间的质量差异,可使研究的方法学质量评价更具有客观性和全面性,有助于了解纳入NRCT的SR/MA方法学质量处于哪一水平,通过分组分析,了解当前对纳入NRCT的SR/MA研究质量的影响因素,从而为学者写作系统评价时,提供较为客观的系统评价写作需要注意的问题,进而为提高系统评价的质量提供科学依据。
1.1.1 纳入标准国内外于2015—2017年发表的同时纳入随机对照试验(RCT)与非随机对照试验(NRCT)或仅纳入NRCT的SR/MA的文献。对纳入的同时包含RCT与NRCT的SR/MA按照影响因子进行分层随机抽样,得到最终样本量。
1.1.2 排除标准①重复发表的文献;②会议、摘要等文献;③动物研究;④非英语语言;⑤系统评价计划书;⑥非SCI文献。
计算机检索PubMed、EMbase、Cochrane Library数据库。查找发表于2015-2017年的SR/MA的文献,检索时限均为2015年1月1日-2017年12月31日。以PubMed为例,检索策略见图1。
图1 PubMed检索策略
由2名研究者分别独立按照纳入和排除标准阅读文献标题、摘要及全文进行两轮筛选,如遇分歧,则讨论或咨询第三人予以解决。资料提取内容包括:作者姓名及数目、发表年份、发表国家、发表期刊、杂志影响因子、方法学质量评价方法、偏倚分析方法、试验注册以及资金资助的报告。
由2名研究人员分别独立采用AMSTAR-2对纳入的SR/MA进行方法学质量评价,AMSTAR-2共计16个条目,条目的评估选项为“符合”“部分符合”“不符合”三种,依次按“2”“1”“0”计分。由于第9、第11条目内含两个小条目,因而满分为36分,本研究将0~16分者记为低等质量,17~28分者记为中等质量,29~36分者记为高等质量。如遇分歧,讨论解决,必要时与第三名研究者商议。
采用Epidata进行基本数据提取及AMSTRA-2条目评价的录入及整理。采用t检验和秩和检验对不同分组下的文献质量评分进行分析,运用二分类Logistic回归分析影响SR/MA质量的因素,以Stepwise方式纳入变量,α入=0.05,α出=0.1,检验水准α=0.05。所有统计分析均在SPSS 22.0软件中完成。
最初检出28 413篇文献,阅读文题和摘要后筛选出2 491篇,阅读全文后最终纳入599篇SR/MA。其中仅纳入NRCT的SR/MA为49篇,同时纳入RCT与NRCT的SR/MA为550篇,由于两类文献数目相差较大,为避免统计分析结果可能存在的误差,将仅纳入NRCT的SR/MA按杂志影响因子分为5层,1~2(10篇,20.41%)、2~3(11篇,22.45%)、3~4(10篇,20.41%)、4~5(9篇,18.37%)以及5以上(9篇,18.37%)。将同时纳入RCT与NRCT的SR/MA按影响因子排序进行分层抽样,最终分层抽取的SR/MA数量为9,18,10,10,12,共计59篇,每层抽取文献数=该层文献总数×NRCT该层文献所占百分比/(1+0.98),当该层文献数量少于理论数量时全部纳入(同时纳入RCT与NRCT的SR/MA文献占比98.00%)。最终纳入SR/MA的文献共计108篇。文献筛选流程结果见图2。
图2 文献筛选流程及结果
对纳入文献基本特征进行描述,2015年、2016年、2017年分别纳入文献37篇、36篇和35篇,而进行过试验注册的文献分别有6篇、9篇和12篇。针对纳入文献的偏倚风险评价:在同时纳入RCT与NRCT的文献中,25篇文献采用Cochrane risk of bias(ROB)tool和Newcastle Ottawa Scale(NOS)分别对RCT与NRCT进行评价,19篇文献采用同一种方法进行评价,13篇文献采用The Grading of Recommendations,Assessment,Development and Evaluation(GRADE)进行了证据质量评价;在仅纳入NRCT的文献中,20篇文献采用NOS进行评价,15篇文献采用其他评价方法评价,5篇文献采用GRADE进行了证据质量评价;有基金支持的文献39篇,其中非营利性基金支持25篇,营利性基金支持5篇、混合型基金支持8篇、1篇基金支持性质不清。本次研究纳入的文献共发表自26个国家,其中文献发表量较高的国家依次是:中国31篇、英国14篇、美国13篇、意大利8篇、澳大利亚,加拿大及德国各为5篇、其余国家均发表1~3篇。见表1。
表1 纳入研究文献的基本特征
2.3.1 描述性结果在纳入的SR/MA中,AMSTAR-2量表评分为10~26分,平均为18.79分。其中同时纳入RCT与NRCT的SR/MA量表评分为15~26分,平均为20.29分;仅纳入NRCT的SR/MA量表评分为10~21分,平均为16.80分。各条目符合率(%)=该条目符合和部分符合的实际得分/该条目理论分数×100,其中条目3报告符合率为100.00%,完全报告。仅3个条目报告的符合率较高,包括条目1(82.87%)、14(86.11%)、16(87.96%)。条目10报告完整度最低,报告符合率仅为5.56%。108篇文献研究中,其中高等质量文献为0,80篇为中等质量,28篇为低等质量。见表2。
表2 AMSTAR-2各条目得分表
2.3.2 影响因素分析将纳入的研究文献按照年份、作者人数(以6人为界限)、是否纳入RCT、是否进行试验注册及是否有基金支持的质量评分进行单因素分析,结果表明年份、是否纳入RCT及是否进行试验注册差异有统计学意义(P<0.05)。见表3。
表3 不同分组下的文献质量评分单因素分析
为进一步确定各因素对SR/MA质量的影响,采用二分类Logistic回归进行统计分析,采用向前法进行分析,得回归方程:Y=4.284-2.213X2+1.682X4。通过回归分析可知,X2的OR值小于1,提示未纳入RCT的SR/MA质量是纳入RCT的SR/MA的0.109倍,即不纳入RCT是SR/MA质量的危险因素;X4的OR值大于1,表明注册的SR/MA的质量是未注册SR/MA质量的5.377倍,即注册是SR/MA质量的保护因素。各变量赋值情况见表4,回归分析结果见表5。
表4 各变量赋值表
表5 二分类Logistic回归结果
本研究对纳入的108篇文献SR/MA进行质量评价,结果显示,纳入文献多与临床相关,以癌症、手术相关SR/MA数量最为突出,且大部分研究运用了合理的偏倚风险评价体系。采用AMSTAR-2评价,结果显示,纳入的SR/MA都为中低等质量。同时,对影响文献质量的相关因素进行二分类回归分析发现,除去年份外,是否纳入RCT及是否试验注册均进入Logistic回归方程,且不纳入RCT是SR/MA质量的危险因素,本研究认为这主要是由于相比于NRCT,RCT更具有严谨性,且多为高质量研究,有效的降低了该SR/MA纳入研究的偏倚,进而提高了该SR/MA的质量。这一点从本研究描述性分析中也可以看出,28篇低质量研究中,有24篇来自只纳入NRCT的研究组中。除此之外,研究结果表明,进行试验注册的SR/MA质量高于未进行注册的SR/MA,本研究认为这可能是由于进行试验注册的研究有更具体的规划、更完善的前期准备工作,保证了该SR/MA研究过程中的顺利进行,有效地预防了研究过程中存在的潜在问题,促进了研究质量的提高。最后,还需要提出的两点:一是年份因素未进入Logistic回归方程,这可能是由于该因素与是否注册存在一定程度的共线性,从描述性分析可知,随年份变化,试验注册率有一定上升趋势;二是虽然本研究显示基金支持与SR/MA质量无关,但在Barnes等[7]的研究中发现,基金来源会影响研究的结果和质量。这可能是因为本研究文献检索时间范围窄,纳入样本量较少,因而使得统计结果存在一定的偏差。
本研究具有一定优势也存在一些不足,优势之处在于国内外关于这一类型的方法学质量评价再评价几乎没有,本次研究更为全方位地对两种形式的SR/MA进行比较,得出纳入RCT可以提高SR/MA的研究质量等结论,对以后SR/MA的写作具有一定的借鉴意义。同时,本次研究也存在诸多不足:①纳入因素较少,本研究仅纳入了5个因素,可能还存在其他对SR/MA质量有显著性影响的因素;②无高质量文献,纳入研究多为中等质量,均有不足之处,有可能存在偏倚;③比较范围较为狭窄,本研究只比较了同时纳入RCT与NRCT和只纳入NRCT两组的研究质量,缺少一组只纳入RCT的SR/MA。虽然得出纳入RCT可提高研究质量的结果,但不能确定是否只纳入RCT的SR/MA具有更高的研究质量;④对于是否有国际学者间的合作这一因素尚未纳入,在后续研究中可进一步进行分析。
总之,本研究通过对两组SR/MA的研究质量进行统计学分析,发现在SR/MA中纳入RCT有助于提高研究质量。但基于存在的缺陷,还需要继续进行更为深入全面的分析,进而提升本次研究结论的可信度及加以推广的可行性。