国内男性泌尿生殖系统结核文献中随机对照试验的质量评价

2016-06-23 13:25黄明伟熊国兵邱明星

实用医院临床杂志 2016年3期

关键词：生殖系统泌尿临床试验

黄明伟，熊国兵，邱明星，

(1.西南医科大学，四川泸州 646000；2.四川省医学科学院·四川省人民医院泌尿外科，四川成都 610072)

国内男性泌尿生殖系统结核文献中随机对照试验的质量评价

黄明伟1，熊国兵2，邱明星1，2

(1.西南医科大学，四川泸州 646000；2.四川省医学科学院·四川省人民医院泌尿外科，四川成都 610072)

目的评价国内男性泌尿生殖系统结核文献中随机对照试验(RCT)的方法学质量。方法检索截至2015年8月收录于中国生物医学文献数据库(CBM)、万方、CNKI、维普以及PubMed中的关于国内男性泌尿生殖系统结核的文献，纳入所有随机对照试验文献，依据CONSORT 2010声明对文献质量进行评价，由两名研究者独立进行文献质量评价。结果共纳入9篇中文文献。质量评价结果显示，大多数文献与CONSORT 2010声明符合率不高。纳入文献对样本量确定、随机序列产生、分配隐藏、盲法、意向性治疗分析等条目的报道不详尽或未见报告，同时在试验局限性、可推广性、试验解释以及其他信息(试验注册、试验方案以及资助)等条目的报告上也不够重视。结论国内男性泌尿生殖系统结核文献中RCT的报告质量较低，与CONSORT 2010声明符合率不高，建议RCT的报告尽量采用CONSORT 2010声明来规范，以提高临床随机对照研究的质量。

男性泌尿生殖系统结核；随机对照试验；CONS0RT声明；质量评价

随机对照试验(randomized controlled trial，RCT)可减少或避免偏倚，高质量RCT被公认为判断临床试验的“金标准”[1]。而低质量的随机对照试验可能会错误地估计疗效。因此，随机对照试验的报告应当准确、完整，以便判断其内部有效性和外部有效性[2]。1996年，临床试验报告统一规范——CONSORT(Consolidated Standards of Reporting Trials)声明出版，并于2001、2010年进行了两次修订。CONSORT标准的目的是指导研究者提高其临床试验报告的质量，清晰、完整和透明的临床试验报告可以帮助读者、审稿人和编辑更好地评估和解释RCT报告。20世纪90年代，由于对结核病的忽视、移民难民增加，人类免疫缺陷病毒(HIV)流行、耐药结核病例增加等因素影响，全球结核病疫情回升[3]。肺外结核占所有结核病例数的10%，泌尿生殖系结核是最常见的肺外结核病之一[4]。目前国内关于男性泌尿生殖系统结核的RCT报告的研究较少，且几乎没有涉及RCT文献质量的评价。为此，我们采用国际公认的临床试验报告统一标准CONSORT声明评价国内男性泌尿生殖系统结核中的RCT报告质量，以了解当前国内男性泌尿生殖系统结核相关随机对照研究报告质量的现状。

1 资料与方法

1.1 检索策略检索截至2015年8月收录于中国生物医学文献数据库(CBM)、万方、CNKI、维普以及PubMed中的关于国内男性泌尿生殖系统结核(本研究纳入肾上腺结核，排除女性生殖系统结核)的文献。中文检索词为：“结核，泌尿生殖系统；肾上腺、肾、输尿管、膀胱、尿道、阴茎、阴囊、前列腺、尿道球腺、精囊、输精管、精索、睾丸、附睾，结核”。英文检索词为：“Tuberculosis/Urogenital；tuberculous/Tuberculosis；testicula r/scrotal/Epididymitis/urinary tract/genital/prostatic/urogenital/urethral/adrenal/genitourinary/bladde r/renal/adrenal glands/kidney/ urete r/urinary bladde r/urethra/bulbourethral glands/ejaculatory ducts/ epididymis/penis/prostate/scrotum/seminal vesicles/spermatic cord/testis/vas deferens；China”。

1.2 文献纳入与排除标准纳入国内男性泌尿生殖系统结核文献中声明采用“随机”方法进行分组的临床试验。排除综述、病例分析、病例报告、实验研究、理论探讨、动物研究、非随机对照研究、诊断试验研究以及重复类似文献。

1.3 文献质量评价根据CONSORT 2010声明[5]的对照检查清单，分别从文题和摘要、引言、方法、结果、讨论和其他信息6个部分，共25个条目(37个问题)对纳入文献的质量进行评价。每一条目根据作者是否报告，给出“是”或“否”的判断。所有被评估的文献均由两位研究者按照评价表独立完成，如遇分歧，讨论解决。

1.4 统计分析方法采用 EpiData 3.1软件建立评价表数据库，对CONSORT各条目进行评价并提取数据，数据采取后导入Excel软件并对相关内容进行统计分析。

2 结果

CBM、万方、CNKI以及维普中检索出相关文献6230篇，PubMed中检索出相关文献186篇，阅读题名及摘要初步排除并通过详细阅读全文进一步排除，获得男性泌尿生殖系统结核相关文献中文1409篇，英文28篇，排除综述、病例分析、病例报告、实验研究、理论探讨、动物研究、非随机对照研究、诊断试验研究以及重复类似文献。最终仅9篇中文文献符合纳入条件。CONSORT 2010对照检查清单RCT文献评价结果，见表1。

表1 CONSORT 2010对照检查清单对9篇国内男性泌尿生殖系统结核RCT文献评价结果

3 讨论

随机对照试验是一个整体的设计，从受试者的选择、分配、实施、测量至论文发表的各个环节，都要求设计严谨、方法科学、数据真实可靠，应严格遵循临床流行病学和循证医学的原则和方法。CONSORT声明的发表和推广，旨在指导研究者提高随机对照试验的质量，鼓励作者清楚报告试验方法与结果，以便读者了解RCT的全貌[6]。本研究采用CONSORT 2010声明评价国内男性泌尿生殖系统结核的RCT报告质量，结果显示其报告质量存在较大的问题。

3.1 文题从数据库中能否找出一篇相关试验报告，主要取决于该文献是如何被索引的。为确保RCT能正确地被标引，文题中应使用“随机”一词。在本研究中，无文献文题提及随机，即从文题不能识别是随机临床试验。

3.2 摘要随机临床试验建议采用结构式摘要，以便提供足够的临床试验信息，准确记录临床试验的实施过程和结果。一篇结构清晰、撰写得当的摘要可以帮助读者快速评价相关的试验结果，准确地从数据库中检出相关的试验报告[7]。本研究中，6篇文献采用结构式摘要，报告较为清楚，3篇文献摘要部分缺如，严重影响文章的质量。

3.3 背景/目的典型的引言应该清楚地解释试验的科学背景、试验理由、试验必要性和研究目的，并介绍试验的整体概况。本研究中的RCT对这部分内容报告较差，未能详细地阐述试验的理由、科学背景以及研究目的，分别仅有4篇和3篇文献描述研究背景和研究目的较清楚，其余文献在这部分内容只是宽泛地描述，显然对此方面不够重视。

3.4 试验设计 CONSORT声明主要针对平行对照设计的临床试验，尚有多组平行设计、交叉设计、群组设计以及析因设计等等。试验设计强调的是描述，应该对试验设计各方面是如何安排的进行清晰的描述。本研究除1篇文献错误运用随机方法外，其余8篇文献仅仅提及“随机”，未能准确地描述随机化方法，且均按1∶1比例分为两组，可以看出文章是按照平行随机对照设计的临床试验，试验开始后试验方法均未进行改变。

3.5 受试者受试者合格标准以及资料收集的场所和地点是确保RCT结果外部真实性的中心环节，能帮助读者清楚理解该试验干预措施的适用人群及地区[8]。本研究描述了合格标准的文献仅有4篇。6篇文献对资料收集的地点与背景进行说明，多为该研究实施医院的住院患者，无多中心临床试验，在一定程度上影响了试验的实用性和可推广性。

3.6 干预措施随机临床试验的干预措施应该详尽地描述，以使干预措施能够被其他的临床医生重复验证[9]。对于药物治疗，应该包括药名、剂量、给药方式、给药时间和疗程、什么情况下撤药等具体信息。如果对照组接受“常规治疗”，详尽描述“常规治疗”都包括哪些治疗方法也很重要。如果对照组或治疗组联合使用几种干预措施，应该详尽描述每一种干预措施，解释联合方案中每一种干预措施的施加顺序或撤减顺序。本研究中，仅4篇文献对干预措施进行了较详细的描述，以使其他的医生可以重复验证。

3.7 结局指标所有结局指标，无论是主要还是次要指标，都应该列出并完整地定义，以提供充足的信息使他人也能使用这些指标[9]。大多数试验都有好几个结局指标，主要结局指标常用来计算样本量，通常不推荐用多个主要结局指标，否则会出现解释多种分析结果的问题。一般有几个次要结局指标，常常包括未预料到的或不希望出现的干预措施效应，但危害始终应被视为重要的结局指标。本研究中，5篇文献对结局指标有较明确的描述，但都未区分主要、次要结局指标，4篇文献在方法学部分对测量指标描述不清楚。

3.8 样本量一些有临床价值的差异可能很小，需要大样本试验才能检出。然而，样本量过大会增加临床试验的困难，同时造成人力和物力的浪费。因此，样本量估计在临床试验设计中有重要意义。本研究5篇文献样本量为20～50例，4篇文献样本量50～80例。没有一篇文献提及样本量估计以及计算方法，对研究结论的可靠性影响较大。

3.9 随机序列的产生、分配隐藏及实施 RCT的核心就是把研究对象随机地分配入各组，其特点是具有不可预测性。如果仅提及“随机分配”、“随机化”、“随机”等关键词，而未具体描述随机序列生成的方法，很难判断随机方法是否合理、实施是否正确。同时，生成的分配序列应通过分配隐藏来执行[10]，可防止负责招募受试者的人因预先知道分配的治疗而影响分配过程。如果分配隐藏不充分，即使进行了随机，还是有可能使不可预测的分配顺序遭到破坏[11]。此外，需要清楚地说明谁生成分配序列、谁实施分配隐藏以及谁参与执行分配，尽量使他们完全分开。如果不将三者完全分开，即使序列生成和分配隐藏完美无瑕，仍可能导致偏倚。所纳入的9篇文献都有提到“随机”，但均未描述随机序列生成的方法，其中1篇运用随机方法不恰当。9篇文献均未说明随机实施的具体过程，也未能实施分配隐藏，严重影响了研究的内部真实性。

3.10 盲法盲法是指隐瞒干预措施分配信息以免参与试验的人知道这些信息而可能受影响。设盲的对象包括受试者、医护提供者、数据收集者、结局评判者和数据分析者等等，因此，在描述盲法时，尽量避免使用“单盲”、“双盲”、“三盲”等词，一定要清楚地说明设盲的对象，否则会影响试验的可靠性。但是，盲法并非总是适用，在外科试验中，对受试者和外科医生设盲常十分困难，甚至不可行，但对数据收集者和结局评判者设盲往往可行。盲法是防止偏倚的重要保护措施，尤其是在评价主观性结局指标时[12]。此外，对受试者和医护提供者施行了盲法的试验，应该说明干预措施的相似之处(如外观、味道、气味、施予方法等)[13]。本研究中，除4篇与外科操作相关的随机对照研究，本身很难实施盲法外，其余研究亦未运用盲法，严重影响了研究结果的内部真实性。

3.11 统计学方法统计学方法应该具体而详细地描述，以使具备相关知识而又能获得原始数据的读者能够核实报告的结果。除了需要报告比较组间结局指标的疗效估计值外，还应同时报告疗效估计值的置信区间。P值表示干预措施的作用确无差异时，由机遇造成观察值差异的可能性。尽可能报告确切的P值，而不是不精确的阈值。本研究中，有8篇文献提供了研究所采用的统计方法，但这些统计方法是否正确还需进一步评价。

3.12 受试者流程受试者流程图可以清楚地标示随机对照试验各阶段的受试者流向，受试者例数从设计开始至研究结束会不断变化。由于受试者失访、退出、换组、脱落和被剔除等现象频频发生，使得设计时的例数、治疗时的例数、分析时的例数等不断变化。本研究无一篇运用流程图的形式清晰阐述，国内研究者尚未重视。6篇文献从研究数据中判断无失访例数，未进行对各阶段的受试者例数分别描述，1篇文献明确描述了退出、脱落的例数及原因。

3.13 招募受试者纳入的文献这个条目报告的较好，8篇文献对研究对象收集的时间段和随访时间做了描述，但在文中多分散报告，9篇文献均未对中断或停止试验进行报告。

3.14 组间基线比较随机临床试验恰当地随机分配可防止选择偏倚，却不能保证各组基线一致。需要注意的是，基线特征的任何差异并非偏倚而是机遇所致。对各试验组的重要人口学和临床特征等基线资料进行比较，可以使读者能够评估组间的相似性。目前国内文献对基线差异的显著性检验很常见，而基线特征的任何差异是机遇所致，因此检验基线差异并非一定是错误之举，只是不合逻辑[14]。建议人口学资料和临床特征等用表格报告，连续变量用均数和标准差表示，偏态分布的连续变量用中位数和百分位数范围描述，而分类变量用例数和构成比表示。9篇文献均未采用表格形式报告基线资料，其中，7篇文献对基线资料的年龄、性别、严重度、病程等进行了简单地描述。7篇文献提到到基线的检验，“差异无统计学意(P> 0.05)，具有可比性”，描述不妥当。

3.15 纳入分析的例数纳入分析的例数主要讨论的是意向性治疗分析[15]，即分组后不论出现什么情况，都要按照随机分配的最初的全部受试者进行统计分析。本研究中，仅有1篇文献在随机分组后出现脱落或退出病例并说明原因，6篇文献从研究数据中判断无失访例数，统计分析时均未进行意向性治疗分析，影响研究结果的真实性。

3.16 结局和估计值对于每组的主要和次要结局指标，都应总结性地报告研究结果，同时给出组间差异，即所谓效应值。对于生存时间数据，可以是危害比或中位生存时间的差值；对于连续变量数据，通常是均值的差异；而对二分类变量结局指标，效应值应该同时报告相对效应(危险比或相对危险度，或者比值比)和绝对效应(危险差)。无论P值如何，置信区间为判断试验结果是否与有临床意义的效果一致提供了有价值的信息[16]。本研究中，8 篇文献报告了所采用统计方法的相应结果及其P值的阈值，但无一篇文献报告测量结果的估计值(如95%置信区间)以及确切的P值(如P= 0.003)，无一篇文献同时报告了二分类变量的相对效应和绝对效应。

3.17 辅助分析辅助分析通过报告所有所做的分析(如亚组分析，校正分析等)，探讨可能影响结果的因素。本研究中，无文献提及辅助分析，可能与临床试验流程简单，测量指标单一有关，同时试验设计员和资料分析员对辅助分析的掌握不够也有关系。

3.18 危害临床研究的干预措施会对受试者产生有利的益处和不良反应，应该权衡利弊后综合测评干预措施，以便作出明智的决定。本研究中，4篇文献报道了不良反应，其余5篇文献均未报道有无不良反应出现。不良反应的存在及其性质对判断干预措施是否可以接受和是否有用会产生很大影响。

3.19 局限性讨论研究的局限性有助于读者正确评价研究结果，发现那些被局限性所掩盖的真实情况。本研究中，随机临床试验的局限性主要是样本量估计、随机序列产生、分配隐藏、盲法、意向性治疗分析等的问题，而导致试验的内部真实性不好。

3.20 可推广性任何研究的最终目的都是希望推广其研究结果，而实验结果被推广的可能性通常要以内部真实性为前提。本研究9篇文献内部真实性均有问题，一个有缺陷的试验其结果是不可靠的，其外部真实性则无从谈起。

3.21 解释本研究中，仅4篇文献较好地讨论了结果，并与相关研究进行了比较。如能将现在所做研究的结果与以往所有相关研究的结果结合起来进行系统综述则更好。

3.22 其他信息本研究中，没有任何一篇文献对试验注册、试验方案以及资助这三项条目进行报告，目前，国内大部分文献未对这三项条目的报告引起重视。

综上所述，CONSORT 2010声明对国内男性泌尿生殖系统结核的RCT质量评价结果表明，大多数文献随机对照试验报告质量较低，与CONSORT 2010声明符合率不高。从实验设计和研究角度看，本研究所纳入文献主要在样本量确定、随机序列产生、分配隐藏、盲法、意向性治疗分析等方法学的质量报告不详尽或未见报告，同时在试验局限性、可推广性、试验解释以及其他信息(试验注册、试验方案以及资助)等的报告上也不够重视，因此严重影响到研究质量，使文献的可重复性及可信度降低。因此，建议研究者在报告RCT时尽量按照CONSORT规范来报告，特别是在方法学和结果部分，以供读者、其他研究人员参考，同时也有利于研究结果的推广应用。

[1] Mehrazmay A，Karambakhsh A，Salesi M，et al.Reporting quality assessment of randomized controlled trials published in nephrology urology monthly journal[J].Nephro Urol Mon，2015，7(4)：e28752.

[2] 王波，詹思延.如何撰写高质量的流行病学研究论文，第四讲，随机平行对照试验报告规范-CONSORT介绍[J].中华流行病学杂志，2006，27(12)：1086-1088.

[3] WHO.Global tuberculosis control report：surveillance，planning，financing[R].Geneva，2007.

[4] 那彦群，叶章群，孙颖浩，等.中国泌尿外科疾病诊断治疗指南[M].北京：人民卫生出版社，2014：456.

[5] Schulz KF，Altman DG，Moher D，et al.CONSORT 2010 Statement：updated guidelines for reporting parallel group randomized trials[J].BMJ，2010，340：698-702.

[6] Ghimire S，Kyung E，Kim E，et al.Assessment of adherence to the CONSORT statement for quality of reports on randomized controlled trial abstracts from four high-impact general medical journals[J].Trials，2012，13：77.

[7] Hartley J.Current findings from research on structured abstracts：an update[J].J Med Libr Assoc，2014，102(3)：146-148.

[8] Zhang X，Wu Y，Kang D，et al.The external validity of randomized controlled trials of hypertension within China：from the perspective of sample representation[J].PloS One，2013，8(12)：e82324.

[9] Glasziou P，Meats E，Heneghan C，et al.What is missing from descriptions of treatment in trials and reviews[J].BMJ，2008，336(7659)：1472-1474.

[10]English M，Schellenberg J，Todd J，et al.Assessing health system interventions：key points when considering the value of randomization[J].Bull World Health Organ，2011，89(12)：907-912.

[11]Clark L，Schmidt U，Tharmanathan P，et al.Allocation concealment：a methodological review[J].J Eval Clin Pract，2013，19(4)：708-712.

[12]Wood L，Egger M，Gluud LL，et al.Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes：meta-epidemiological study[J].BMJ，2008，336(7644)：601-605.

[13]Hopton AK，Macpherson H.Assessing blinding in randomised controlled trials of acupuncture：challenges and recommendations[J].Chin J Integr Med，2011，17(3)：173-176.

[14]Mcllroy D，Nishanian E.The fundamental importance of baseline comparisons in a clinical trial[J].J Thorac Cardiovasc Surg，2010，139(3)：801.

[15]Polit DF，Gillespie BM.Intention-to-treat in randomized controlled trials：Recommendations for a total trial strategy[J].Research in Nursing and Health，2010，33(4)：355-368.

[16]Sánchez-Ramón S，Comins-Boo A，Beltrán MN，et al.The absence of evidence is not the evidence of absence[J].Hum Reprod，2016，31(1)：217-218.

Quality assessment of randomized controlled trials of the male genitourinary tuberculosis in China

HUANG Ming-wei1，XIONG Guo-bing2，QIU Ming-xing1，2

(1.Southwest Medical University，Luzhou 646000，Sichuan，China；2.Department of Urology，Sichuan Academy of Medical Sciences & Sichuan Provincial People’s Hospital，Chengdu 610072，China)

QIUMing-xing

Objective To assess the quality of randomized controlled trials associated with the male genitourinary tuberculosis in China.Methods Literatures of the male genitourinary tuberculosis in China were searched from the database of CBM，Wan fang，CNKI，VIP and PubMed.We researched randomized controlled trials associated with the male genitourinary tuberculosis in China up to August，2015.CONSORT 2010 statement was used to assess the quality of literatures by two researchers independently.In case of disagreement，discuss was performed to solve the disagreement.Results A total of nine Chinese literatures were included and assessed without any English literature.We found that most of the studies didn’t meet with CONSORT 2010 statement.In the included literatures，the report was not in detail or not shown in the report on sample size estimation，random sequence generation，distribution of hidden，blindness and intention-to-treat analysis.Meanwhile，trial limitations，generalizability，test interpretation and other information (registration，protocol and funding) were also not reported in detail.Conclusion The quality of reports of randomized controlled trials associated with male genitourinary tuberculosis in China was low-quality，and the articles don’t meet well with CONSORT 2010 statement.To improve the quality of randomized controlled trials，it is suggested that CONSORT 2010 statement should be used to report randomized controlled trials.

Male genitourinary tuberculosis； Randomized controlled trials； CONSORT statement； Quality assessment

四川省科技厅科技支撑计划项目(编号：2014RZ0032)；四川省医学科学院·四川省人民医院博士基金资助项目(编号：2015BS01)；四川省医学甲级重点学科(泌尿外科)建设项目

邱明星

R697

1672-6170(2016)03-0100-06

2015-11-04；

2016-01-24)