王惠群 张小为 杨玉英 宋 玮 李贺琼 傅贤波
(北京大学第三医院《中国微创外科杂志》编辑部,北京 100191)
随着微创外科的迅猛发展,设备、器械更新升级,技术不断提高,微创外科领域新技术新方法层出不穷,操作技巧的技术改进更是各有所长,从传统开腹手术到腹腔镜手术,从三孔到两孔、单孔到经脐或经自然腔道手术和机器人辅助手术,一些以往的禁忌证在一定条件下逐渐变为适应证。新技术的报道可以为国内或国际首例[1~3](需要省级以上单位的查新报告),也可以积累一定病例数和随访作为描述性研究进行报道,但只能说明这个技术的可行性,如果要说明其相对于传统方法的优越性,如手术时间短、出血少、疗效好等,则需要进行比较性研究[4~8]。
比较性研究的证据等级高于描述性研究,但很容易出错,而且是原则性错误,其结局是没有回旋余地的退稿。比较性研究包括前瞻性随机对照研究(randomised controlled trial,RCT)、队列研究(cohort study)、病例对照研究(case-control study)(前瞻或回顾性)等,均各有自己的要求。现将我刊对比较性研究的基本要求总结如下,以供读者设计、撰写、修改比较性研究时参考。
前瞻性研究都会有严格的病例选择与排除标准,通常容易控制两组可比性,而回顾性研究的可比性问题比较普遍。不是随便两组病例都能比较,例如比较两种方法的安全性,要选择病情轻重、操作难度、术者经验都一致的病例进行比较;如果比较两种技术的有效性,除了术前、术中情况一致外,还要求术后处理、随访时间和内容相同。如果两组不可比,就不能确定观察指标的差异是由于不同处理方法造成的,还是由于不同病情造成的。对所有可能影响观察指标的因素在“一般资料”中列表一一比较,包括性别,年龄,体重指数,病程,病变大小、位置、分期或分型,合并症,等等。
临床工作中,通常是新技术逐渐开展,应用一段时间后体会某些方面有优势,然后回顾性统计半年或1年此新技术治疗病例的数据与传统方法进行比较。这种回顾性病例对照研究很容易犯下“组间无可比性”的错误。因为开展新技术时,一般先选择肿瘤小、分期早、粘连轻、体型偏瘦的病例,即手术难度相对较低的病例,而手术难度高的病例仍然使用自己已经熟练操作的传统技术。经过一定数量手术经验积累,手术难度较高的病例也逐渐应用新技术,而有一些特别困难的手术还是需要采用传统方法。因此,如果比较,应选择手术难度一致的病例。而难度高只能进行传统手术的病例应该排除。
如果两组为同一术者,开展新技术都要经过一定病例数的学习曲线开始阶段,这个例数根据不同手术种类、不同术者的经验基础和悟性而不同,而传统术式是术者已经熟练掌握的技术,进行回顾性病例对照研究时,不能用新开展的技术和传统技术比较,要去掉学习曲线达平台期之前的病例,而选择学习曲线平台期技术熟练后的新技术与传统技术进行比较。
如果两组为不同手术者,可比性则难以控制,“两组均为经验丰富的术者手术”缺乏客观标准,“两组术者均为主任医师”也不能说明技术水平一致。应尽量避免不同手术者之间进行比较。
如果比较手术时间、出血、并发症等指标,两组手术应该具有相同的范围,例如,肿瘤手术不能比较联合和不联合淋巴结清扫的两组,不能比较全子宫切除和次全子宫切除术,不能比较射频消融和肿瘤切除术。但如果观察肿瘤复发、生存,在基线情况一致时,例如乳腺癌可以比较保乳手术和乳腺癌根治术的长期随访结果。
前瞻性随机对照研究开始之前,应获得医院伦理委员会审批,以及患者充分知情同意,并上报国家RCT中心备案。微创外科的论文通常涉及两种处理方式,随机分组容易导致患者不能知情同意,尤其应该注意,不要刻意追求“随机”、“双盲”。对于新技术,在哪些方面可能有何获益,风险如何,应该向患者交代清楚,由患者选择。不符合伦理的情况可以发生在观察组,也可以发生在对照组。对照组不符合伦理通常是因为观察组方法的优势已经是公认的,在两个技术都熟练的情况下,为了比较而给对照组施行传统术式就不符合伦理。为了比较而给某一组增加创伤或麻烦的做法也要避免,如在正常部位取材镜检,注射安慰剂或空白对照,都要设身处地考虑患者利益,维护伦理与人道。
前瞻性随机对照研究应在论文前言或一般资料中要明确说明本研究经哪级伦理委员会审批,注明批文号,批文复印件或照片应附于文末。审批的时间应在研究开始之前,不能后补。
前瞻性论文通常会写明诊断标准(包括权威的文献出处)、病例选择和排除标准,回顾性论文也应明确。针对一个术式,尤其新术式,不是有手术指征即可实施,对病情严重程度的上限都会有所限制,例如子宫肌瘤剔除术,不仅要求有手术指征,还要对肌瘤的个数、大小、位置、患者年龄和生育要求进行限制,这些会影响手术的安全性和有效性。
病例选择标准不等于一般资料,不能用一个代替一个,都要写清楚。例如选择某处肿瘤1 cm以上,但不能大于10 cm,这是“病例选择标准”;本组肿瘤最小2 cm,最大8 cm,平均4 cm,这是“一般资料”。
作为比较性研究,分组方法(即两种方法如何选择)必须如实写清。回顾性研究不能写“根据术式不同分为两组”,而要写如何决定患者采用哪个术式,是患者决定,还是术者根据什么情况选择;前瞻性研究不能随便写“随机分为两组”,“随机”是统计学概念,不等于“随意”、“随便”,要写用什么方法进行随机分组,如随机数字表法、密闭信封法等,具体如何操作,如果两组例数不同要解释原因,要按“随机”的操作方法调整。当然,在回顾性研究中写“随机分组”、“按住院号单双号分组”等明显错误一定要避免,应实事求是写明如何选择两种方法。
通常对新技术都会详细描述,但对照组由于是传统术式,有时会受到忽略。传统术式也是各人有各人的习惯,至少要写明关键器械、步骤、顺序,具体的手术方法可以引文献。手术方法要避免写成手术志,读者是相同专业的医生,应选择手术的重点部分,使读者可以重复。如果是技术改良,则先写传统方法,再写改良之处,以突出改良的部分。
观察指标应围绕研究目的选择,不能所有数据都罗列进来比较,导致重点被湮灭在繁杂的数据和表格中。观察指标如何界定、如何获得应如实明确写清。例如机器人的手术时间是否包括机器人安装调试时间;术中出血量如何测量;各并发症如何诊断,以及标准和文献出处;住院时间是总时间还是术后住院时间,术前住院几天,达到什么标准方可手术,达到什么标准出院;如何随访;复发和转移的诊断如何做出;如何判断“治愈”、“有效”,以及标准和文献出处。
疗效标准要客观,应该用公认的或权威杂志发表的治愈标准或优良中差的判断标准,而且要有文献依据,具体评分方法或标准要有中文出处,除非是非常普遍应用的方法。不能用“明显减轻”、“明显缩小”这类非量化的不确定词,即使要用,也要对“明显”、“减轻”、“缩小”等有明确、可重复、客观的界定标准,如缩小的百分比,并应该有文献出处。比较的数据要列表,并将统计值也列入表中。正文不要写某指标两组有显著性差异,而要写哪组什么指标高于或低于哪组,且不要重复表中的数据。
包括统计学软件的版本,什么资料如何表示,采用具体哪个检验方法进行比较,如何定义有统计学差异。统计软件的不同版本能做的统计方法不一样,比如用SPSS13.0不可能做重复测量资料的方差分析。不能笼统地说用t检验,要写明是独立样本t检验还是配对t检验;不能说用非参数检验或秩和检验,而应写明具体是哪个检验方法。所有统计值都要放在表中,如t、F、χ2、Z、P值等,不能只写P<0.05。
科学论文不是工作总结汇报,不是对外宣传资料,而是用科学的方法论证一个问题。作为证据等级较高的比较性研究,要在临床工作的基础上,针对一个创新点,提出科学问题,从病例选择、分组方法、可比性分析、观察指标选择、统计学处理等方面进行严谨、科学的设计,得出令人信服、经得起推敲的比较结果,指导临床选择处理方法。本文仅总结比较性研究的基本要求,对于前瞻性随机对照研究尚有更高的要求[9,10],如样本量计算、招募、隐藏、盲法、注册等,需要有更多的统计学知识,最好寻求专业的统计学人士的帮助,从实验设计、数据采集和处理各阶段进行正确处理,得出科学的结论。