林深,王小易,饶辰飞,乔树宾,颜红兵,窦克非,唐熠达,吴永健,徐波,杨新春,沈珠军,刘健,郑哲
稳定性冠心病冠状动脉血运重建指征选择不合理现象普遍存在,美国国家心血管病注册登记研究(the National Cardiovascular Data Registry,NCDR)显示2009 年6 月至2010 年9 月,在美国1 091 家医院开展的144 737 例非急诊经皮冠状动脉介入治疗(PCI)中,11.6%指征选择不适宜[1],我国一项多中心横断面研究则显示这一比例高达20.9%[2],而不合理的决策显著影响患者预后[3]。
为规范稳定性冠心病血运重建指征选择,美国六大心脏学会于2009 年联合推出美国冠状动脉血运重建适宜性标准(以下简称“美国标准”)[4],并于2012 年、2017 年进行更新。与临床指南不同,该标准不仅基于既往研究及证据,还融合专家共识对各种临床场景给予决策推荐,较指南更具有实用性。然而,美国标准需要参考患者术前负荷试验检查结果进行推荐,这可能导致部分中国患者无法得到推荐,适合中国人群的血运重建适宜性标准亟待制定。2016 年国家心血管病中心结合我国国情制定了《中国冠状动脉血运重建适宜性标准的建议(试行)》(以下简称“中国标准”),该标准根据我国国情优化场景设置及推荐[5],但是,尚无研究论证我国血运重建适宜性标准是否较美国适宜性标准更适用于中国人群。因此,本研究旨在比较中美标准在中国人群中的适用性和科学性。
研究对象:本研究是一项多中心、观察性研究。研究数据来自一项多中心冠状动脉造影注册登记研究(NCT02880605)。该注册登记研究连续入选4 家大型心脏中心行择期冠状动脉造影发现至少一支冠状动脉狭窄≥50%的稳定性冠心病患者。排除标准为:(1)既往行冠状动脉旁路移植术(CABG);(2)不同意参加本研究。各中心伦理委员会审核批准该项研究,所有患者均签署知情同意书。
血运重建适宜性标准:2009 年,美国六大心脏学会首次联合推出血运重建适宜性标准,并根据新证据的产出定期更新[6-7]。该标准根据以下变量设计了170 个常见临床场景:(1)患者的诊断(急性ST 段/非ST 段抬高型心肌梗死、不稳定性心绞痛、稳定性心绞痛);(2)加拿大心血管学会(CCS)劳力型心绞痛分级;(3)术前无创检查结果;(4)抗心绞痛药物治疗;(5)冠状动脉病变的程度和范围。针对每一个场景,采用专家小组两轮投票的方式形成最终推荐,包括适宜、不适宜和可能适宜血运重建。该标准融合了最新证据、指南及专家共识对每一常见临床场景给予推荐,较临床指南具有更好的实用性。中国血运重建适宜性标准的制定借鉴2012 版美国标准的思路和方法,并对部分场景的设置和推荐进行了以下优化:(1)将负荷试验分为未进行负荷试验、负荷试验阳性和阴性三类[5];(2)专家组包含6 位介入医生、6 位心血管外科医生、12 位具有代表性的心血管科医生、其他从事心血管病诊治医生和卫生评价研究人员,并根据我国循证医学证据和专家经验做出决策推荐。
研究结局指标:主要结局指标为1 年主要不良心脑血管事件(MACCE),包括全因死亡、非致死性心肌梗死、脑卒中、再次血运重建和再发心绞痛入院。次要结局指标为全因死亡、非致死性心肌梗死、脑卒中、再次血运重建、再发心绞痛入院。
数据收集与随访:经培训合格的护士在造影手术前对患者进行前瞻性问卷采集,收集适宜性标准推荐相关的关键变量,包括冠心病临床表现(稳定性心绞痛、非缺血症状、无症状)、CCS 分级、术前抗心绞痛药物治疗情况。其它推荐相关变量及患者资料从电子病历中获取,包括人口学特征、病史危险因素、冠状动脉病变程度、实验室及影像学检查、手术操作等。两位未参与研究设计及数据采集的研究人员根据中美标准各自判定患者血运重建适宜程度,结果不一致时由第三位研究者判断以达成共识。经培训合格研究者通过电话或邮件等形式按照标准化程序完成患者1 年随访。未参与研究设计的医生对随访中出现的终点事件逐一审核并确认。
统计学方法:(1)应用2016 版中国血运重建适宜性标准和2012 版美国适宜性标准对入选患者进行决策推荐,比较两者推荐的结果及“未得到推荐”的患者比例,以分析中美标准在中国人群中的适用性。(2)为比较中美标准在中国人群中的科学性,将中美标准推荐不一致的患者按照中国标准划分为血运重建适宜组、不适宜组和可能适宜组,各组中再根据患者实际接受的治疗划分为血运重建患者和药物治疗患者进一步进行分析。不同适宜程度组中使用多因素Cox 比例风险回归模型分析血运重建与1年MACCE 的相关性。模型变量选择将纳入单因素分析P<0.1 及临床考虑与结局相关的变量。(3)为进一步分析中国标准中根据我国国情设计的“未行负荷试验”场景的科学性,分别假设所有未行负荷试验的患者均为“负荷试验阳性”或“负荷试验阴性”,以描述负荷试验结果对适宜性推荐的影响。所有数据应用SPSS 24.0 版软件进行统计分析。计量资料以均数±标准差表示,组间比较用t检验或Mann-Whitney-U 检验;计数资料以百分比表示,组间比较用卡方检验或 Fisher 精确检验。双侧检验P<0.05为差异有统计学意义。
本研究纳入2016 年8 月至2017 年8 月 在4 家心脏中心行择期冠状动脉造影的稳定性冠心病患者6 315 例。因既往CABG 排除150 例,最终纳入6 165 例患者。根据中国标准,26.2%(1 617/6 165)的患者适宜血运重建,29.4 %(1 810/6 165)不适宜,43.1%(2 658/6 165)可能适宜,1.3%(80/6 165)未得到推荐。根据美国标准,12.7%(786/6 165)适宜血运重建,21.9%(1 350/6 165)不适宜,19.1%(1 178/6 165)可能适宜,46.2%(2 851/6 165)未得到推荐。两种标准推荐不一致比率为47.0%(2 900/6 165)。
图1 中美冠状动脉血运重建适宜性标准对6 165 例稳定性冠心病患者的推荐差异
在中美标准推荐不一致的2 900 例患者中,根据中国标准推荐,911 例适宜血运重建(适宜组),504 例不适宜血运重建(不适宜组),1 479 例可能适宜血运重建(可能适宜组)。其中,适宜组中药物治疗(n=160)和血运重建(n=751)的两类患者基线特征无显著性差异;而不适宜组中的血运重建患者(n=140)较药物治疗患者(n=364)更年轻,更少合并脑血管疾病;可能适宜组中血运重建患者(n=1 136)较药物治疗患者(n=343)也更年轻,较少合并心血管病史,且男性居多。
表1 中美冠状动脉血运重建适宜性标准推荐不一致的2 900 例患者的基线特征[ 例 (%)]
2 900 例中美标准推荐不一致患者1 年随访率为97.3%。中国标准判定的三组患者中,适宜组接受血运重建与药物治疗1 年MACCE 发生率相似(9.8%vs 10.4%,Log-rankP=0.79)。校正后,血运重建与1 年MACCE 无显著相关性(校正后HR=0.91,95%CI:0.53~1.57,P=0.74)。不适宜组中接受血运重建与药物治疗患者1 年MACCE 发生率差异也无统计学意义(6.6% vs 4.6%,Log-rankP=0.37);校正后,血运重建与1 年MACCE 无显著相关性(校正后HR=1.15,95% CI:0.33~3.97,P=0.82)。可 能 适 宜组中接受血运重建与药物治疗患者1 年MACCE 发生率也相似(7.5% vs 7.2%,Log-rankP=0.82)。校正后,血运重建与1 年MACCE 无显著相关性(校正后HR=1.14,95% CI:0.70~1.85,P=0.61)。
图2 中美冠状动脉血运重建适宜性标准推荐不一致患者中不同组别血运重建患者和药物治疗患者的生存曲线
表2 中美冠状动脉血运重建适宜性标准推荐不一致患者遵循中国标准与远期预后的相关性[ 例 (%)]
本研究中,96.0%(5 921/6 165)患者无负荷试验结果。当研究假设所有患者均为负荷试验阳性时,中国标准判定的适宜血运重建患者由26.2%增至55.2%;不适宜血运重建者由29.4%降至15.8%;可能适宜血运重建者由43.1%降至29.0%。当研究假设所有患者均为负荷试验阴性,中国标准判定为不适宜血运重建患者由29.4%增至41.1%,适宜血运重建患者由26.2%降至15.9%;可能适宜血运重建者由43.1%降至31.8%。
图3 负荷试验对中国冠状动脉血运重建适宜性标准推荐的影响
在这项多中心、观察性研究中,通过对比中美冠状动脉血运重建适宜性标准对中国人群的推荐结果,发现1.3%(80/6 165)患者无法得到中国标准推荐,46.2%(2 851/6 165)患者无法得到美国标准推荐。在中美标准推荐不一致的患者中,中国标准推荐适宜血运重建患者,血运重建与1 年MACCE 无显著相关性;中国标准推荐不适宜血运重建者,药物治疗与1 年MACCE 无显著相关性。这提示,中国标准的推荐对真实世界临床场景的覆盖率优于美国标准,针对中美标准推荐不一致的患者,遵循中国标准决策与1 年预后的改善无显著相关性。
鉴于稳定性冠心病冠状动脉血运重建指征选择不合理的情况普遍存在,美国推出的血运重建适宜性标准的合理性在欧美人群中得到验证并作为评价指标纳入医疗质量改善工作[3,7]。然而,美国标准基于患者术前负荷试验检查结果进行决策推荐,这可能导致部分中国患者无法得到推荐。因此,中国在制定符合国情的适宜性标准时对部分场景进行了优化,但是尚无研究论证我国标准是否较美国标准更适用于中国人群。本研究发现中国标准对真实世界临床场景的覆盖率为98.7%,相比之下美国标准仅53.8%;此外,中美标准推荐不一致时,遵循中国标准进行治疗与1 年预后无显著相关性。这提示,在中国人群中,中国标准的适用性优于美国标准;对于中美标准推荐不一致的患者,中国标准推荐的科学性可能仍需进一步改善。由于本研究存在回顾性研究的选择偏倚,人群样本较小且随访时间较短等问题,中国标准推荐的科学性仍需前瞻性、大样本队列研究进一步证实。
在中美标准推荐不一致的患者中,中国标准推荐不适宜血运重建者,药物治疗的1 年预后与血运重建无显著差异。该组患者的冠状动脉病变程度以临界病变(61.5%)和单支冠状动脉病变(36.1%)为主,且96.4%的患者无心绞痛症状。对于临界病变且无症状的稳定性冠心病患者,指南不推荐血运重建治疗[8]。对于单支冠状动脉病变(狭窄>70%)患者,ORBITA 研究表明PCI 未能显著提升患者的运动耐量[9]。本研究在具有相似特征的患者中未发现PCI与药物治疗的预后差异,与既往研究结果一致,因此中美标准推荐不一致时,中国标准判定不适宜血运重建者可考虑采取药物治疗。此外,在中美标准推荐不一致的患者中,中国标准推荐适宜血运重建者,血运重建与1 年预后无显著相关性。该组患者以多支病变为主(84.3%),62.3%的患者心绞痛症状为CCS Ⅱ级及以上,74.1%的患者接受了PCI 治疗。COURAGE 研究入选了至少一支主要冠状动脉狭窄≥70%的患者(69.1%为多支病变,57.5%心绞痛症状为CCS Ⅱ级以上),发现PCI 未能显著降低患者的远期死亡、心肌梗死和脑卒中发生风险,然而行PCI 患者再次血运重建率却显著降低[10]。本研究同样发现接受血运重建治疗的患者再次血运重建率有降低趋势,但结果并无统计学意义(HR=0.79,95% CI:0.34~1.83,P=0.59)。这可能由于本研究随访时间较短,患者预后改善不显著,因此,当中美标准推荐不一致时,中国标准推荐的科学性仍需进一步研究证实。
中国标准中“未行负荷试验”场景的合理性仍需探讨。负荷试验被指南作为重要的危险分层工具来指导治疗决策[8]。但由于中国负荷试验应用率低(本研究为2.9%),适宜性标准在制定时纳入“无负荷试验结果”场景。本研究通过真实世界数据,发现该场景设计的科学性可能存在两方面问题:第一,负荷试验结果对中国标准的推荐影响较大(图3);第二,中美标准推荐不一致的患者中,94.8%未行负荷试验,这些患者中,遵循中国标准决策与1 年预后改善无显著相关性(图2)。因此,中国标准对“未行负荷试验”患者的推荐可能仍需进一步论证和优化。
本研究通过对比中美冠状动脉血运重建适宜性标准在中国人群中的适用性和科学性,为中国标准的进一步优化提供了如下参考:(1)针对“未行负荷试验”场景谨慎推荐,并鼓励临床诊疗过程中重视负荷试验的应用;(2)根据最新临床证据,增加冠状动脉腔内影像、冠状动脉生理学辅助决策信息,如血流储备分数(FFR)、血管内超声(IVUS)、定量血流分数(QFR)等,进一步优化推荐;(3)整合最新临床证据,特别是基于中国患者的证据,定期进行适宜性标准的更新;(4)大力推广和宣传中国血运重建适宜性标准,倡导遵循指南实践,以规范血运重建指征选择,最终改善患者预后,降低疾病负担。
本研究存在以下局限性:首先,本研究为观察性研究,可能存在选择偏倚和未校正的混杂因素;第二,研究在北京4 家心脏中心开展,研究结果可能无法推广至全国范围;第三,血运重建与预后的相关性分析中,可能存在样本量较小导致的检验效能不足,仍需更大样本及更长时间随访的研究进一步论证中国标准的科学性;第四,稳定性冠心病血运重建主要目的为改善症状和生活质量,但本研究无法满足上述分析,仍需相关研究进一步评价遵循中国标准实践能否改善患者症状及生活质量。
综上所述,与美国标准相比,中国标准临床场景覆盖率更高,适用性更好,主要由于中国标准对未行负荷试验患者给予推荐。中美标准推荐差异主要出现在未行负荷试验人群中,在该人群中,中国标准推荐血运重建者,血运重建与1 年MACCE 无显著相关性;中国标准推荐药物治疗者,药物治疗与1 年MACCE 无显著相关性。中国标准对“未行负荷试验”患者的推荐可能仍需进一步论证和优化。
致谢:感谢北京大学人民医院心外科陈彧主任、北京协和医院心外科苗齐主任、北京朝阳医院心外科苏丕雄主任对研究组织和实施的帮助。感谢中国医学科学院阜外医院赵艳、张月、杨琼琼协助进行患者入选及数据采集。感谢中国医学科学院阜外医院徐波、谢丽华、管常东、吴帆及北京大学人民医院、北京协和医院、北京朝阳医院导管室的工作人员协助进行造影数据获取。