系统评价中研究筛选与资料提取具体策略及方法探讨

2020-08-25 01:26孟玲慧
医学新知 2020年4期
关键词:均数置信区间样本量

孟玲慧,姬 阆

1.首都儿科研究所循证医学中心(北京 100020)

2.瑞典卡洛琳斯卡医学院全球公共健康系(瑞典斯德哥尔摩 17177)

循证医学诞生以来,在短短二十多年的时间以其独特的视角和科学的方法迅速传到一百多个国家和地区的医学卫生领域,是20世纪医学领域的一大创新和革命[1]。在这一过程中,系统评价与Meta分析得到不断推广并被公认为是评价临床疗效、制定临床指南和规范的基石[2],得到越来越多研究者的青睐,大量Meta分析的出现为临床决策提供了良好的支持[3]。但是在这一过程中,方法的错误使用会使Meta分析的质量很低甚至得出错误的结论,Meta分析的真正价值在于对临床实践的正确指导[4]。研究筛选与资料提取是Meta分析中非常重要的步骤,我们拟从这两方面入手,介绍其中的策略及方法,为Meta分析作者提供参考。

1 系统评价的研究筛选

1.1 同一研究重复报告[4-5]

识别:当同一个研究有多篇文献发表时,按照系统评价Meta分析的纳入和排除标准进行文献检索时,可能同时被纳入,此时应该从多个角度加以识别:(1)比对作者姓名;(2)研究的场所如医院、研究机构的名字;(3)干预措施的细节如药物剂量、给药频率;(4) 研究对象的数量及基线数据;(5)研究的时间和周期。

处理:这种情况处理方法基本上有两种:其一,将不同文献归属于同一研究结果并加以整合;其二,根据可获得的信息判定哪一篇文献的结果最能代表原始研究并且与正在制作的系统评价与Meta分析契合度最高,将其纳入,其他的予以排除。

1.2 通过审阅文献筛选

选择拟开展系统评价的研究领域的专业人士及方法学专业人士至少两名进行文献筛选,通过逐步审阅(1)标题、(2)摘要及(3)全文,决定是否成为系统评价与Meta分析最终的目标文献,如果不同筛选者判定结果不一致,需请专业专家进行仲裁,决定是否纳入综述。

1.3 核查排除的文献

考克兰的系统评价中要求附上排除文献列表,包括可能被误认为与研究问题相关且貌似符合入选标准、但经仔细审查后需排除的文献,以及并不符合检索策略而部分读者非常熟悉并认为应该被纳入的文献,以供读者需要时审核查阅。制表时系统评价者要将排除的文献列出并简要说明排除的依据和理由,用以表明系统评价者对这些文献进行了充分而客观的考量,但需注意这部分要极近简洁,避免拖沓。

不管我们只做考克兰系统评价还是其他系统评价,研究筛选的最后一步,都必须要对排除的文献加以核查,以保证排除的理由充分而客观,避免遗漏报道目标研究的文献。

文献检索流程图既包括了文献检索的结果、初步筛选的结果、深入评估的结果,又包括最终筛选的结果及每一步骤文献的数量。曾宪涛等[6]的研究呈现了标准的文献筛选流程,见图1。

2 资料提取的原则及步骤

确定了合格的纳入研究后,就需要从原始研究中将制作系统评价和Meta分析所需的资料加以提取,并整理成系统评价可用的形式。为确保资料提取的完整性和真实性,尽量减少偏倚或错误的发生,这个过程需要严格按照一定的原则和步骤进行,以保证最终制作系统评价的质量。

2.1 基本原则

客观:即忠实于原始资料,避免提取者主观因素的影响。为了保证客观,Cochrane协作网推荐至少两位评价员独立进行,并进行交叉核对。

提前培训:包括资料提取的基本过程,资料提取表的相关内容,相关软件的使用,及相关流行病学知识等。为了保证效果,Cochrane协作网还建议对评价员进行标准一致性检验。

预提取:选择几篇有代表性的原始研究,对其进行资料预提取,由此可以发现并完善数据提取表的不足之处。同时可以评价不同评价者对同一问题理解的一致性程度,理解不一致时需加以统一。

多人提取:提取资料时最好由至少两人独立进行,并进行交叉核对。同时,为尽量减少偏倚,建议选择不同专业背景的人员,如一位流行病学家和一位专业专家。

恰当处理分歧:疏忽或失误引起的分歧可通过讨论解决。讨论不能解决的情况下,还需要提请第三方介入(通常是制作小组中经验最丰富的成员,或者邀请相关领域的专家)。若通过上述方法仍不能解决,可以联系原始研究的作者,并在系统评价与Meta分析中注明相应的分歧及其产生原因。

2.2 数据提取的基本步骤

按照一定的、明确的步骤进行资料提取,可避免重复劳动并保证准确性。数据提取主要分为以下步骤:① 明确需要纳入的资料范围;② 明确资料提取人员;③ 设计资料提取表;④ 对资料提取表进行预提取并完善;⑤ 进行资料提取;⑥ 资料核查及修改;⑦ 处理相应的分歧。

2.3 数据提取表的设计

首先,数据提取表是提取资料的载体,是对纳入研究的系统总结,也可对纳入研究的合格性加以核实;其次,数据提取表展示了关键的原始记录及更改记录,为后续的系统评价及Meta分析提供明确的数据;再次,采用统一标准格式的数据提取表,便于多个独自进行数据提取的评价者相互对比,发现差异,减少相应的偏倚产生[7]。

2.4 数据提取表基本内容

主要包括以下几个部分:纳入研究的基本信息、拟纳入文献的合格性资料和特征资料。

2.4.1 基本信息

包括系统评价与Meta分析题目,评价者对原始研究设定的代码(一般使用第一作者的姓和文章发表的年份,如果作者在同一年发表数篇文章,可在年份后添加字母等区分)、报告代码(便于识别同一研究的重复报告),评价者代码(数据提取者的姓名或其他形式),评价日期(数据提取表的填写日期),原始研究的题目、杂志名称、年份、期卷、页码等(便于需要时联系作者)等。

2.4.2 纳入研究的要素

这部分需严格按照计划书设定的纳入标准对文献的合格性加以考察。可遵循“PICOST”原则从研究人群、干预措施、对照、结局、研究设计、时间等方面进行考核,必要时还可以结合发表时段考量其合格性。将易于判断的标准放在前面,快速舍去不符合标准的研究,可提高效率,减少工作量。

研究对象特征包括性别、年龄、种族等人口学信息,研究对象总人数及各组人数、研究地点、纳入排除标准、纳入人群基础状况及并发症等。对于针对某疾病的治疗性研究,原始研究中的疾病定义、诊断标准及病情分级也应注明。总之,影响干预措施适应范围的资料都应体现在数据提取表中。(对于干预性研究而言)。

干预措施的资料可用表格来记录,如干预组和对照组各自的病例数,干预措施以及具体方法等。对于药物干预,需要详细记录药物的名称、剂量、给药方式、使用频率及周期等。若是非药物干预,记录干预措施的内容、操作规范及参与人员等。同时,应注意有无混杂因素以及依从性的情况。

对于原始研究的结局指标,需要记录其定义、测量时间点、测量单位及上下限值等。还应判断指标是有害指标还是有益指标。建议提取完整的结局指标,以便判断有无选择性报告偏倚。设计结果数据表可参考计划书规定的主要结局和次要结局指标,提前设置一些条目,按照数据类型进行数据提取表的设计以及数据提取。对于连续型变量,需要提取每组人数、均值及标准差;对于二分类变量,需要提取结局事件的发生例数、各组的人数。数据提取表要有足够的灵活性,可以允许评价者视具体情况添加或删除条目及数据。

2.4.3 方法学部分

这部分包括研究设计,随机序列的产生、随机分配隐藏、盲法设定、研究期限、其他偏倚等[8]。方法学部分涵盖对原始研究的质量评价,其资料可对原始研究的测量偏倚、报告偏倚、随访偏倚、实施偏倚、选择性偏倚、混杂偏倚等进行评估。Julian等[4]建议风险偏倚评价中应突出描述一些重要细节,如:详细说明分配序列的生成方法;详细描述随机分配隐藏的方法并说明分配隐藏的可信度;注明盲法设置是否有效的所有提示信息;描述每个主要结局的失访和排除情况如失访/排除病例数、原因及在分析中系统评价作者是否将其重新纳入等。

2.4.4 其他

包括原始研究的资助情况及来源,是否有潜在利益冲突,研究得出的关键结论,混杂因素及其校正等。

编制数据提取表应考虑方便输入、表格结构要有逻辑性、编码应尽可能一致及简单。编制完成后进行预试验,并根据预试验结果进行修改。可以考虑使用数据或数据库管理软件,如 Excel、FoxPro等用于制作电子版数据提取表。如我们以收集干预性研究为例,设计一个简单的表格,如表1,仅供参考。

在进行数据提取时,有时会遇到各研究报告的数据格式不一致或者未采用Meta分析软件(如RevMan)所需要的数据格式,这时候就需要对相应数据进行转换之后再行Meta分析。

2.5 数据转换

2.5.1 利用组内均数的置信区间计算标准差

须注意这里的置信区间是指试验组或对照组的组内均数的置信区间,不是组间的置信区间。不加说明的话,置信区间一般指95%置信区间。均值近似处于置信区间的中间值即数据符合正态分布时,可以使用一下公式计算SD[9]:①如果试验组及对照组样本量足够大(N≥100),则;②如果试验组及对照组样本量较小(N≤60),则t值可由Excel表格输入“=TINV(概率,自由度)”获得(概率,P值;自由度,NE+NC-2);③如果 60<N<100,上述公式均可使用。如果数据不符合正态分布,可考虑对原始数据进行数据转换(计算其对数值等);如果转换后数据符合正态分布,可再按照上述方法进行相应转换。

2.5.2 利用组间均数差以及标准误、置信区间、t值或P值计算标准差

如果原始研究中仅有组间均数差(MD)及标准误(SE)、t值、P值或置信区间,可进行换算求得标准差(SD)。此时假设两组标准差相等,进行meta分析时输入的两组标准差为同一个值。计算步骤如下:

1)通过P值计算标准差[9],可分三步:

第一,利用P值算出t值。如果已知P值和两组样本量(NE,试验组;NC,对照组),可使用Excel表格输入“=TINV(概率,自由度)”获得t值(概率,P值;自由度,NE+NC-2)。若研究未报告P的具体数值,如P≤0.05,可用P值上限做概率估计(P=0.05);注意组间差异无统计学意义时(P>0.05),不能计算t值。

第二,利用t值计算标准误。将上述计算得到的t值带入公式SE=MD/t,求得SE。

第三,利用SE计算SD。将上述计算得到的SE带入公式,求得SD。

2)使用t值计算标准差。如果文章直接报告t值,如上第二、三步就可以计算出标准差。

3)使用置信区间计算标准差[9]。如果试验组及对照组较大,(该处默认为95%置信区间,如果是90%置信区间或99%置信区间,则将3.92分别换成3.29和5.15;N=NE+NC)。如果试验组及对照组样本量较小,则t值可由Excel表格输入“=tinν(概率,自由度)”获得(概率,P值;自由度,NE+NC-2)。

表1 一个简单的干预性研究数据提取表Table 1.A simple data extraction table of intervention study

2.5.3 通过中位数,四分位数间距和极值估计均数和标准差

有些研究没有直接报告均数和标准差,而报告了中位数和四分位数间距。此时分两种情况[10]:(1)数据符合正态分布,此时中位数与均数非常接近,可用中位数代替均数进行Meta分析;(2)数据不符合正态分布,中位数与均数相差较大,不能使用中位数代替均数进行计算。一般而言,原始研究采用中位数描述数据均值,提示数据不符合正态分布。

四分位数间距(IQR)指上四分位数与下四分位数的差值,反映非正态分布数据的离散程度。一般而言,如果原始研究中使用IQR反映数据离散程度,提示数据不符合正态分布。如果研究的样本量较大,数据的分布接近正态分布,可用IQR≈1.35×SD求得SD[11];如果样本量较小,数据呈偏态分布,不能通过IQR计算SD。

如果研究报告了中位数m,最小值a,最大值b及样本量n,可以通过以下公式估算均数和标准差[12]:(1);(2)但这一方法未对基础数据的分布进行假设,有研究认为这一方法局限性较大[13],也有研究采用近似贝叶斯算法评估均值和标准差[14],对偏态分布数据的均值和标准差的估计较为准确,感兴趣的研究者可以自行探索。

2.5.4 亚组数据的合并有时在数据提取时需将亚组数据进行合并

例如:某研究将口腔溃疡的患者分成为轻、重度二个亚组进行报告,而其他研究未分亚组,这时就需要将该研究的二个亚组先行合并。

在合并时,若研究数据为二分类变量,则直接将各亚组的样本量和发生目标事件的病例数相加即可。

若研究数据为连续性变量,则需要进行换算。设亚组A的样本量为N1,均数为M1,标准差为SD1;亚组B的样本量为N2,均数为M2,标准差为SD2,则合并后的样本量为N=N1+N2;均数M=(N1 M1+N2 M2)/(N1+N2);标准差的计算公式为[9]

如果有三个以上(k)的亚组数据需要合并,可使用公式

2.5.5 OR值与RR值

在观察性研究中,因需要对相应的风险因素进行校正,故原始研究多提供了RR值或OR值及其95%可信区间。RR值多用于队列研究,OR值多用于病例-对照研究及横断面研究。但有些队列研究计算的是OR值,而病例-对照研究计算了RR值。此时,就需要对RR值进行相应的转换[15]:

在队列研究中,0表示非暴露组结局事件的发生率,1表示暴露组结局事件的发生率;因此,(p1/p0)=OR[(1-p0)+p0*OR]。因RR=p1/p0,故

2.5.6 HR与RR值

在队列研究中,因有些涉及到生存资料,故报告的是HR及其95%可信区间,此时可认为HR≈RR,即直接将HR看成RR,进行合并。

2.5.7 从统计图中截取数据

还有一些研究只报告统计图,未写明均数、标准差的具体数值,这种情况可以使用Photoshop软件从统计图中提取数据。操作方法为[16]:Photoshop打开图片——点击“窗口”——点击“信息”——点击“信息”,即可显示鼠标所在位置的横纵坐标数据。然后根据由已知实际值的点及其所在坐标和未知点的坐标,来推断未知点的实际值。计算方法为:已知A、B两点是纵坐标轴上已知实际值的2个点,分别为a、b,利用Photoshop获得其坐标为(0,yA)、(0,yB);C点是“均数线”上任意1个点,D点为“误差线”上任意1个点,该两点实际值未知,设为c、d,利用Photoshop获得其坐标为(xC,yC)、(xD,yD);则

同理对于非正态分布的数据,可以通过箱式图截取中位数、四分位数或极值,再利用公式进一步估算均数与标准差。

科学合理地使用系统评价与meta分析,可以全面而客观地梳理现有的临床证据,以规范地指导科学研究和临床实践。在进行系统评价/meta分析时,研究筛选过程中正确判定某一研究是否为目标研究及准确核查排除研究是前提,数据提取过程中客观地提取、合理的数据提取表设计、必要时适当的数据转换是基础。以上是我们从这两方面入手介绍的一些策略和方法,希望能为作者们在进行Meta分析时提供参考。

猜你喜欢
均数置信区间样本量
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
样本量对云南松苗木生物量特征的影响
家系抽样大小对云南松遗传力估算的影响
基于预警自适应技术的监控系统设计
效应量置信区间的原理及其实现
关于均数与偏差
关于均数与偏差