何朝凯 ,刘春香 ,王辉 ,张俊华
(1.天津中医药大学循证医学中心,天津 301617;2.中国医学科学院北京协和医院,北京 100730)
目前,在医疗、护理、康复、营养以及精神卫生等健康领域的临床研究中普遍存在结局指标选择、测量和报告不一致、不实用性、不规范性等问题,甚至一些至关重要的结果可能被低估或完全忽视[1-6]。为了得到实用性、可靠性更高的研究结果,使之成为患者、医疗健康专业者和卫生政策制定者等决策时的重要参考依据,研究者在进行临床试验和系统评价时需要高度重视结局指标报告的规范化[7]。
核心指标集(COS)是一组关于健康卫生行业中特定领域的所有临床试验被要求测量和报告的最少化、共识化的指标集合[8]。COS研究通过候选条目产生、两轮Delphi问卷调查、举办多方共识会议这3个阶段与18条最基本的报告条目要求来产生标准化的指标集合,从而在临床研究结局指标的选择和报告上达成共识[9],以提高同类研究指标的一致性和实用性[10],避免同类研究结果因异质性无法进行合并与比较所造成的不必要的资源浪费[11-12]。
中医药临床研究的结局指标问题同样较多,且有一定的特殊性,迫切需要探索形成符合自身特点的COS[13-14]。本研究采用COS研究的方法,通过对近5年中医药治疗乳腺癌随机对照试验(RCT)进行收集,分析研究报告的结局指标及存在的问题,为构建中医药防治乳腺癌核心指标集奠定基础。
1.1 纳入与排除标准
1.1.1 纳入标准 1)研究类型:随机对照试验,语言限定为英文和中文。2)患者类型:明确符合乳腺癌诊断标准的患者,不受乳腺癌病理类型、乳腺癌临床分期、病程、年龄、种族和地域的限制。3)干预措施:观察组单独或联合使用中医药相关疗法,包括中药方剂和中成药,对照措施不进行限制。4)结局指标:提取纳入研究中报告的所有结局指标。
1.1.2 排除标准 1)合并其他疾病的研究。2)以针灸、推拿、中药熏洗、穴位注射、穴位贴敷等为干预措施的研究。3)学位论文。4)综述性文章。5)重复发表的研究。
1.2 文献检索 采用自由词和主题词结合的方式 检 索 Cochrane Library、Pubmed、Embase、Web of Science、SinoMed、万方数据和中国知网(CNKI)数据库。检索时间为2014年1月—2019年10月。中文检索词为“乳腺癌”“乳腺肿瘤”“临床试验”“临床研究”“临床观察”“临床评价”“临床调查”“随机对照试验”“中医”“中药”等。英文检索词为“Breast Neoplasms”“Breast Cancer”“Breast Tumor”“Traditional Chinese Medicine”“herbal medicine”“zhongyi”“zhongyao”“Clinical Trial”“Randomized Controlled Trial”等。
1.3 文献筛选与资料提取 由两名评价者独立阅读题目和摘要,排除明显不符合纳入标准的研究,对可能符合纳入标准的研究阅读全文,确定是否纳入,并提取资料,交叉核对。如遇分歧,经讨论解决。
采用预先设计的Excel表格对纳入文献进行资料提取,主要内容包括:1)研究的基本信息,包括题目、第一作者、发表年限、发表期刊等。2)研究对象的基线情况,包括人口学特征如例数、年龄,以及临床特征如病理分型、临床分期、病程、中医证型等。3)干预措施,包括药物名称、疗程、频次、用量等。4)结局指标及其测量方法和评价时间点。
2.1 文献筛选流程 根据检索策略初检获得10202篇相关文献,删除重复文献后,根据纳入排除标准,经筛选后最终纳入112篇文献,其中中文110篇,英文2篇。见图1。
图1 文献筛选流程Fig.1 Literature screening flow
2.2 纳入研究的基本特征
2.2.1 样本量 112个RCT研究中共包含9 430例患者,其中观察组4 738例,对照组4 692例,年龄范围17~80岁。样本量范围为20~620例,研究的平均样本量为84例。
2.2.2 病程 共有23个(23/112,21%)研究报告了病程,具体病程为0~25年,89个研究未报告病程。
2.2.3 病理分型 共53个(53/112,47%)研究报告了乳腺癌患者的病理分型,主要包括乳头状癌、髓样癌、小管癌、黏液腺癌、鳞状细胞癌、浸润性导管癌、浸润性小叶癌和腺癌等。
2.2.4 临床分期 65个(65/112,58%)研究报告了具体临床分期,根据国际抗癌联盟(UICC)和美国癌症联合会(AJCC)联合制定的乳腺癌TNM分期法分为Ⅰ~Ⅳ期。
2.2.5 中医证型 报告中医证型的研究共25个(25/112,22%),包括气阴两虚、气血两虚、正气亏虚、中阳气虚、气虚、血虚、肾虚、肾阴虚、肝肾阴虚、肝郁痰凝、肝瘀痰凝、肝郁脾虚、肝郁气滞、瘀毒蕴结、冲任失调、正虚毒炽、心脾两虚、脾虚痰湿、脾胃虚弱、脾胃湿热、脾胃虚寒,共21种证型。
2.2.6 干预措施 干预措施分为中药汤剂和中成药两种类型,分别有62个和49个研究,另有1项研究采用汤剂结合中成药疗法。其中中成药22个为注射液,28个为口服制剂。
2.2.7 疗程 除5个研究未报告疗程相关信息外,其余107项RCT均报告试验疗程。疗程为7 d~5年,具体分布为:疗程≤2周有3个(2.6%),疗程2~4周有7个(6.3%),疗程4~8周有34个(30.4%),疗程8周~6个月有53个(47.3%),疗程6个月以上共10个(8.9%)。
2.3 结局指标
2.3.1 指标域 纳入研究报告的所有结局指标共61项,单个研究报告的最少结局指标为1个,最多为7个,每项研究平均报告3个。根据指标的功能属性,将纳入研究的所有结局指标归类为临床疗效、中医症状/证候、症状体征、理化检测、生活质量、远期预后、经济学评估和安全性事件8个域。见图2。
图2 指标域Fig.2 Outcome measures field
2.3.2 指标频次 在所有纳入文献中,结局指标使用率排前15位的依次为:临床疗效、不良反应、生活质量、肿瘤标志物、生存情况、免疫功能指标、安全性评价、复发转移情况、中医证候积分、中医证候疗效、中医症状积分、血管生成指标、体力状况、骨髓抑制、睡眠质量。见表1。
表1 使用率排前15位的结局指标Tab.1 Top 15 indicators of utilization rate
其中,临床疗效的评价标准以世界卫生组织拟定的实体瘤客观评价标准为依据,主要分为完全缓解(CR)、部分缓解(PR)、稳定(SD)、进展(PD),临床受益率=CR+PR+SD。
2.3.3 指标组合 结局指标组合使用情况的统计结果显示,有10个研究同时使用临床疗效、不良反应、生活质量3个指标;有4个研究同时使用临床疗效、不良反应两个指标;有4个研究同时使用临床疗效、不良反应、安全性评价3个指标;有3个研究同时使用临床疗效、不良反应、免疫功能3个指标。具体的结局指标组合类型多达82种。不同指标组合使用频数详见开放科学(资源服务)标识码(OSID)。
2.3.4 测量时间点 频次排列前5位的有效性指标测量时间点如下。1)临床疗效:83项研究采用临床疗效指标,测量的时间点共14个,3项研究未报告时间点,其中20个研究(24.1%)选择在治疗6周后测量,15个研究(18.1%)为治疗12周后测量,12个研究(14.5%)为治疗8周后测量,10个研究(12.0%)为治疗9周后测量。2)肿瘤标志物:26项研究共报告9个测量时间点,9个研究(34.6%)选择在治疗6周后测量,其次为治疗9周后(5/26,19.2%)。3)免疫功能指标:22项研究共9个测量时间点,以治疗6周后进行测量的最多(6/22,27.3%),其次为9周(4/22,18.2%)。4)中医证候积分:8个研究选择了中医证候积分指标,2项(25%)研究在治疗6周后进行测量。5)中医证候疗效:8个研究选择了中医证候疗效指标,2项(25%)研究在治疗6周后进行测量,另有2项(25%)研究在治疗9周后进行测量。详见OSID。
有学者在对中医药治疗心绞痛临床试验COS研究中指出,原始研究所报告的结局指标存在差异性大、不规范和不实用等问题[13,15]。本研究中同样发现相似的问题,但以指标组合过于随意、指标测量方法差异性大和指标报告不规范这3个问题更为突出。
本研究在对中医药治疗乳腺癌随机对照试验的结局指标分类整理过程中发现,原始研究在选择和报告结局指标时主要存在以下6个方面的问题。
1)缺乏终点指标,临床实用性不强。对于肿瘤的疗效评价,最具临床价值的指标是预后,而现有研究中过多的中间指标被研究者所使用,缺少对生存期等的报告。本研究中,仅17项(15.2%)纳入研究报告了患者生存期,10项(8.9%)报告了生存率,2项(1.8%)报告了死亡情况。
2)指标组合过于随意。在112个RCT中就出现了多达82种不同的指标组合类型,组合条目有2~7条不等,随意性较大。其中,仅4个指标组合使用的类型就有29种,且在所有组合类型中单个组合的使用频次普遍不高。如使用频次最高的临床疗效、不良反应、生活质量这一组合指标仅为10次,其余大多为1次。
3)同一指标的测量时间点不统一,缺少远期效应观测。如临床疗效这一指标的测量时间点就多达14个,且大部分研究的指标测量时间点多在12周以内。对于肿瘤治疗来说,长期随访的结果评价是关键,但目前中医药治疗乳腺癌的研究,缺乏对远期预后结果的测量与评价。
4)相同指标测量方法差异性大。如在进行生活质量评价时,研究者采用了8个不同的测评量表。部分结局指标的评价标准也不尽相同,也存在自拟评价标准的情况。
5)指标报告不规范。主要体现在指标变量类型随意转换、指标名称不规范和不同指标存在相似交叉条目这3个方面。如临床疗效、生存情况和中医症状疗效等连续性变量被转化成等级资料进行报告,多用显效、有效、无效、总有效率、总生存率等形式。同一指标存在错用或乱用不同名称进行报告的情况,如部分研究将KPS评分报告为生活质量评分,而另一部分研究却报告为体力状况或功能状态评分。此外,还有研究在报告结局指标时存在条目交叉重复报告的情况。如生活质量评分中包含了躯体功能、心理功能、社会功能和物质生活状态4个维度,在临床疗效、中医症状疗效和睡眠质量评分等条目中均有重复交叉的内容。
6)自拟症状或证侯积分,缺乏能体现中药特色效果的特异性指标。在所有纳入研究中,仅18%左右的研究报告了中医相关指标。
本研究还对所有指标的使用频次进行了统计,为核心指标集条目池的构建提供数据支持。这些在原始文献中使用频次高的指标将被推荐为候选指标条目进入初选条目池,然后通过Delphi调查和多方共识会议,最终形成中医药治疗乳腺癌的临床研究COS。
本研究纳入的原始研究类型较为单一,且文献限定为近5年发表,样本的代表性存在一定的局限。未来的研究应该进一步扩充纳入研究的类型,如病例报告文献、注册研究方案等,同时扩大文献的年限跨度进行补充和对比研究,为COS的制定提供更为全面的初始条目池。
中医药治疗乳腺癌相关临床研究所报告的结局指标主要存在终点指标过少、远期效应测量缺乏等临床实用性差的问题;同时还存在组合过于随意、测量方法差异性大、表达不规范、数量不一致以及测量时间点跨度大等异质性过高的问题。因此,需要构建公认的中医药核心指标集,以提高中医药临床研究的质量,减少不必要的资源浪费。