如何提高动物实验系统评价质量
---基于动物实验系统评价与临床试验系统评价的比较研究

2019-06-19 08:09廖绪亮姜彦彪王欢赵梦娜朱敏刘欣语尚志忠吴安虎魏鹤翔田家乐杨宏焱张瑞星郭星辰任磊马彬

中国循证心血管医学杂志 2019年5期

廖绪亮，姜彦彪，王欢，赵梦娜，朱敏，刘欣语，尚志忠，吴安虎，魏鹤翔，田家乐，杨宏焱，张瑞星，郭星辰，任磊，马彬

自1989年Iain Chalmers爵士发表第一篇现代意义上的系统评价以来[1]，该研究方法在临床医学领域得到了广泛应用和空前的发展。近年来，系统评价这一研究方法也逐渐应用于基础医学领域中，特别是在动物实验中[2]。1993年第一篇动物实验系统评价发表[3]，此后其数量呈现逐年递增趋势。对动物实验进行系统评价，可更好的了解其生物学合理性[4-7]，并促进其结果向临床的转化，降低其转化时的风险[8]。高质量的系统评价可提供基于当前可获得证据的无偏倚的综合结论[9]，对指导实践和今后的研究方向具有重要价值和意义。相比较于系统评价这一研究方法在临床实践领域下的成熟应用，其在动物实验领域的应用较少，且方法学还存在较多挑战。因此，本研究将全面对比分析动物实验系统评价与临床试验系统评价在研究特点、方法和报告质量等方面的差异，为今后动物实验系统评价的开展和实施提供参考依据。

1 资料与方法

1.1 纳入/排除标准纳入动物实验系统评价，不限制动物种属；纳入临床试验系统评价，不限制临床试验类型。对于同时包含动物实验数据与人体实验数据的系统评价则排除。

1.2 样本的选择和来源计算机检索PubMed数据

库，具体检索策略参见框1。考虑到临床试验系统评价与动物实验系统评价在发表数量上的巨大差异，对于其检索时间分别随机限定在2016年10月和2016年1月至12月间的数据。具体的检索策略参见图1～2。

图1 临床试验系统评价检索策略

图2 动物实验系统评价检索策略

1.3 文献筛选由5名研究者（廖绪亮、朱敏、赵梦娜、姜彦彪、唐晓宇）按照上述纳入/排除标准，独立进行文献筛选，并进行交叉核对。如果遇到不同的意见，由第三位研究者（马彬）裁决或讨论决定。

1.4 数据的提取与分析由5名研究者（廖绪亮、朱敏、赵梦娜、姜彦彪、侯皓中）独立提取相关资料并交叉核对。提取信息如下：①一般特征：被引次数、作者数量、发表期刊特点（综合期刊、专业期刊）、纳入研究数量、纳入研究样本量、涉及疾病和干预范围等；②方法特征：检索特征（数据库数量、是否实施补充检索、是否报告检索词/检索式、是否进行语言限制、是否至少报告一个数据库的检索策略、是否报告研究人员资质、是否报告文献筛选流程图等）、其它特征（是否评估纳入研究内在偏倚风险、是否进行数据合成（MAs）、是否进行了异质性分析、是否评估发表偏倚等）。

1.5 统计分析采用Office Excel 2013进行统计学分析计数资料（如被引次数、期刊类别、杂志性质、纳入研究数量、纳入研究样本量）采用例数（N）和百分比（%）进行统计描述；计量资料（如作者数量）采用中位数和四分位数间距进行统计描述；采用SPSS 20.0软件，组间比较使用卡方检验和OR值，检验水准α。

2 结果

2.1 文献筛选结果文献筛选流程及结果详见（图3），最终纳入680篇研究，其中临床系统评价共624篇、动物系统评价共56篇。

2.2 纳入研究一般信息

图3 文献筛选结果

2.2.1 发表国家无论是临床试验系统评价还是动物实验系统评价，其发表数量排在前三位的分别为中国、美国和英国（图4）。

图4 纳入研究的发表国家

2.2.2 涉及疾病范围624篇已发表的临床试验系统评价中，研究疾病排在前三位的分别是肿瘤（14.3%，89/624）、肌肉骨骼系统和结缔组织疾病（12.2%，76/624）和消化系统疾病（10.7%，67/624）；56篇已发表的动物实验系统评价中，疾病排在前三位的分别是循环系统疾病（23.2%，13/56）、肌肉骨骼系统和结缔组织疾病（14.3%，8/56）和神经系统疾病（10.7%，6/56），如图5。

图5 临床试验SRs/动物实验SRs涉及疾病范围（参考Clinical Description and Diagnostic Guidelines[M].WHO,1993.）

2.2.3 涉及干预措施就干预措施范围而言，无论是临床试验SRs（28.5%，178/624）还是动物实验SRs（49.2%，24/56），其干预措施大多涉及“药物-化学物质”方面（图6）。

图6 动物实验SRs/临床试验SRs涉及干预类型分类（分类标准参考自：Kilkenny C,Parsons N,Kadyszewski E,et al. Survey of the quality of experimental design, statistical analysis and reporting of research using animals[J]. Plos One,2009,4(11):e7824.）

2.3 纳入研究方法特征

2.3.1 检索特征动物实验系统评价在检索数据库数量≥3个研究数量（26.8% vs. 74.4%）（P=0.000）、实施补充检索（0/56 vs. 12.7%）（P=0.005）、未进行语言限制（62.5% vs.76.6%）（P=0.019）和报告文献筛选流程图（19.6% vs. 27.4%）（P=0.209）方面的比例均低临床试验系统评价，且在前三个方面之间的差异均具有统计学意义（图7）。

图7 纳入研究方法特征

2.3.2 其他方法特征与临床试验系统评价相比，动物实验系统评价在实施数据合成（MAs）（73.2% vs. 80.3%）（P=0.270）、进行异质性分析（44.6% vs. 56.7%）（P=0.081）和评估发表偏倚（32.1% vs. 36.1%）（P=0.558）方面的比例均较低，但差异均无统计学意义。

3 讨论

总所周知，相比较于系统评价这一研究方法在临床实践领域下的成熟应用，在动物实验领域的应用还较少，且方法学还存在较多的挑战。本研究是第一个全面开展对比分析动物实验系统评价与临床试验系统评价在研究特点、方法和报告质量等方面的差异，可为今后动物实验系统评价的开展和实施提供一定的参考依据。

3.1 纳入研究一般特征我们的研究显示，总体而言，动物实验系统评价发表的数量远低于临床试验系统评价，且国家分布亦较少，这可能与动物实验系统评价起步较晚，目前方法学尚不完善，以及在基础医学领域的宣传和普及度较低有关。Ma等[10]的研究亦显示，在266名受访者中，虽然大多数受访者（77.4%）听说过系统评价，但仅31.2%的人曾阅读过动物实验系统评价，且很少有受访者实施（6.0%）或发表（4.1%）过动物实验系统评价。

此外，动物实验系统评价和临床试验系统评价在涉及疾病和干预范围方面，基本一致。这在一定程度上也说明了临床前研究是后续临床研究得以延续、转化和发展的重要来源和基础，亦是连接基础研究与临床试验的重要桥梁[11,12]，其结果直接影响着许多临床领域研究课题成果的确立和水平的高低。

3.2 纳入研究方法特征系统评价是证据综合研究方法之一，检索的全面性和广泛性在一定程度上决定了系统评价研究结果的可信度[13,14]。由于当前没有一种数据库能全面收录所有已发表的医学文献，且各数据库收录的期刊均不相同，每种期刊收录文献的标准同样均有差异[13]。因此，需要通过对多个数据资源的查询，以达到全面广泛的目的。但我们的研究依然显示：已发表的动物实验系统评价中，低于1/3的研究检索超过3个以上数据库，近一半的研究实施语种限制、无研究实施补充检索，低于20%的研究报告文献筛选流程图，这些比例明显低于临床试验系统评价[15]，这可能与关于动物实验检索策略制定的标准和规范也是近几年发表有关[16]。但需要注意的是，我们已经考虑到这些标准发布时间与实际研究实施时间之间滞后性，样本均发表于2016年。因此，说明动物实验检索策略的标准和规范推行力度不够，今后需要联系相关专业期刊，将动物实验检索策略的标准与规范引入到“稿约”中，并且需要采取恰当的措施，加大规范对动物实验检索策略制定方法学的宣传、教育和推广，以促进动物实验系统评价质量的提高。

对纳入研究的偏倚风险进行科学、准确的评估，是制作系统评价的核心步骤之一。尽管2014年，基于Cochrane风险评估工具，由来自荷兰动物实验系统评价研究中心的Hooijmans等[17]起草、制定并颁布了SYRCLE动物实验风险评估工具（SYRCLE's risk of bias tool for animal studies），该工具也是目前唯一专门适用于动物实验内在真实性评估的工具。但我们的研究依然显示，仅一半的动物实验系统评价（51.8%）对纳入研究的偏倚风险进行了评估，其中SYRCLE 动物实验风险评估工具的使用比例仅为5.4%[18]。因此，非常有必要今后在国内进一步加大对该评估工具的推广和宣传，促进国内基础研究领域人员更为科学、严谨设计动物实验，以提高动物实验的内在真实性。

Sutton等基于48个已发表的系统评价，评估发表偏倚对系统评价结果的影响，结果显示[19]，50%的系统评价结果受到发表偏倚的影响，其中10%的系统评价的结果被完全改变。因此，科学评估发表偏倚对解读动物实验系统评价结果的可信度具有重要意义。我们的研究显示，仅1/3的动物实验系统评价对发表偏倚进行了评估，该比例明显低于Korevaar等[20]和Peters等[21]的研究。对动物实验而言，目前尚缺乏类似临床试验的注册制度，且大多数动物实验纳入样本数量较少。目前如何对其发表偏倚进行评估尚未形成共识，仍存在巨大挑战[22]。为尽量降低和避免发表偏倚，我们建议在制作动物实验系统评价时，除保证检索数据库的广泛性外，非常有必要与作者实验室和其他相关研究机构联系获取未发表的数据。

众所周知，应用Meta分析的前提是纳入研究间具有足够的同质性[23,24]。我们的研究显示：虽然大部分（73.2%）动物实验系统评价进行了数据合成（Meta分析），仅44.6%的研究对纳入研究进行了异质性分析。研究显示：动物实验研究间的异质性大且消除困难[25]，如何科学评估动物实验间异质性，也是目前开展此类型系统评价研究的难点和挑战。我们建议动物实验Meta分析中选择随机效应模型合并效应量比较稳妥。合并多个研究的结局变量时，离散型结局变量通常以OR表达，若为连续型结局变量，可采用标准化的结局变量或利用研究报告的资料将连续型变量转化为相对的OR值后计算效应值。当定量Meta分析不适合时亦可采用其他合成研究的方法，如Meta回归和贝叶斯 Meta分析，后者可分析异质性来源。

目前，相比较临床系统评价而言，动物系统评价发表数量相对较少，且在在数据库检索规范、偏倚风险评估的准确性、异质性的分析和识别等重要影响方法质量的环节方面存在局限性。因此，今后有必要进一步完善动物实验系统评价在以上制作环节方法学的不断完善和发展，并采取恰当的措施，对目前已经形成的如检索策略的制定、偏倚风险的准确评估等规范加大宣传、教育和推广，以促进动物实验系统评价质量的提高。

如何提高动物实验系统评价质量---基于动物实验系统评价与临床试验系统评价的比较研究

1 资料与方法

2 结果

3 讨论

如何提高动物实验系统评价质量
---基于动物实验系统评价与临床试验系统评价的比较研究