阮海燕,李丽英,张木馨,3,郑翼,何森*
肥厚型心肌病(hypertrophic cardiomyopathy,HCM)是一种以左心室壁肥厚为特征的疾病[1-2]。HCM常出现各种临床表现并伴随多种并发症,其中血栓栓塞(thromboembolism,TE)事件发生率相对较高,既往文献提示在HCM患者中,TE事件的年发病率约为1.0%,明显高于一般人群[3-4];如患者合并心房颤动,则TE事件年发病率更高[5-7]。作为HCM的一个重要并发症,TE事件可导致HCM患者预后不良及生存率降低[2,5-6,8-10]。
因此,如能在HCM患者中识别易发生TE事件的高风险患者,则可以采取相应的预防措施,一定程度上降低TE事件发生的可能性。关于如何识别高危患者,相对于单个预测指标,在临床实践中通常使用风险预测模型帮助临床决策,从而为患者做出合理的治疗选择[11-12],因风险预测模型综合了某个疾病不同的病理生理特征,可整体评估患者的预后。目前针对HCM患者TE事件的风险预测,仅国外学者构建了两个模型:HCM Risk-CVA[9]及 French HCM score[13]。既往研究发现HCM Risk-CVA模型对于中国HCM患者的临床价值较为有限[14]。因此,构建适合中国HCM患者的TE事件风险预测模型,对于指导临床决策具有重要的临床意义。鉴于此,本研究拟构建适合中国HCM患者的TE事件风险预测模型。
1.1 研究对象 本研究系回顾性队列研究,收集2010—2018年在四川大学华西医院就诊的537例HCM患者病例资料。本研究遵循《赫尔辛基宣言》的原则,并经四川大学华西医院生物医学研究伦理委员会批准(批准文号:2019-1147)。由于为回顾性研究,委员会批准知情同意豁免。
1.2 HCM诊断标准、相关定义与基线数据收集 根据2014年欧洲心脏病学协会指南[2],HCM的诊断是基于左心室壁肥厚,并需排除负荷增加如高血压、主动脉瓣狭窄和先天性主动脉瓣下隔膜等引起的左心室壁肥厚,并排除了其他可能导致心肌肥厚的疾病,如已知的代谢疾病(如Anderson-Fabry病)或肥厚型心肌病综合征(如Noonan综合征)等。成年人HCM的诊断标准为[2]左心室舒张末期室壁厚度≥15 mm,或者有明确家族史者左心室舒张末期室壁厚度≥13 mm。本研究使用超声心动图评估左心室壁肥厚等指标,严格按照目前国际通用的标准方法进行测量[15]。
所有患者基线特征数据由经验丰富的临床医生从病历中收集。数据的录入采用二次录入的方法,即当两次录入的数据一致时数据将进入数据库;否则,将重新评估原始数据。
1.3 随访及终点事件 本研究的随访方式包括电话随访或通过电子病历系统查询患者就诊记录,从而评估患者终点事件;随访从首次评估开始,每6~12个月随访1次,直至出现终点事件或死亡或研究拟定的评估日期(2019-12-31),如患者在随访过程中失访,则将最近一次随访纳入分析。
本研究的终点事件定义为复合性TE事件,包括缺血性脑卒中、短暂性脑缺血发作及外周动脉栓塞,具体为:(1)缺血性脑卒中及短暂性脑缺血发作定义为临床医生诊断的局灶性突发性神经功能缺损,分别持续>24 h和<24 h[6];(2)外周动脉栓塞定义为脑、心、眼、肺以外的TE事件,诊断依据是突然出现的局部疼痛,伴有寒冷和无脉的四肢或血尿等,通常通过血管造影、计算机断层扫描或超声确诊[5-6]。此外,鉴于本研究系回顾性研究,以及在临床实践中确定缺血性脑卒中亚型的病因较为困难,根据既往文献[5,16-17],本研究没有将心源性栓塞性脑卒中与其他缺血性脑卒中亚型进行区分。
1.4 候选预测变量 将既往文献[5-6,9,18-19]中报道的HCM患者的TE预测因子作为候选预测变量,候选预测变量均在基线时进行评估。此外,本研究还评估了HCM Risk-CVA模型中的预测因子,以便进行模型之间的比较,相关变量的定义详见表1[20-21]。
1.5 缺失数据的处理及构建 模型最后纳入的样本量针对前述的候选预测变量,数据清洗提示左心房(LA)内径、最大左心室壁厚度(MWT)及左心室射血分数(LVEF)有不同程度的缺失,分别为3.9%、3.2%及4.1%。本研究初步纳入537例患者,针对前述3个有缺失的变量,其中24例患者有不同程度的数据缺失,数据完整的患者共计513例;为评估删除该24例患者对结果可能产生的偏倚影响,将研究样本按照基线数据缺失与否进行对比,结果提示基线数据在两组人群间无统计学差异(P>0.05),基线数据包括:年龄、既往TE事件、血管疾病、高血压、糖尿病、心房颤动、MWT、LA内径、左心室流出道梗阻(LVOTO)、纽约心脏协会(NYHA)心功能分级及LVEF,且随访时间及终点事件在两组人群间也无统计学差异(P>0.05)。因此,最后纳入了具有完整数据的513例患者进行研究分析。
1.6 模型回归系数的数目 通常情况下,构建风险预测模型时需要基于事件比例(events per variable ratio,EPV)来确定纳入模型的预测变量个数,其中EPV是数据中事件的数量除以风险预测模型中回归系数的数目。每个模型估计的系数至少需要10个事件,以确保模型的回归系数得到足够的精度估计、避免过度拟合。构建模型的人群(n=513)在整个随访过程中共计发生42例TE事件,因此允许4~5个回归系数。
1.7 风险预测模型的构建及验证 表1中候选预测变量均为拟构建风险预测模型的潜在候选变量。采用Schoenfeld残差研究评估所有变量进行Cox回归分析要求的比例风险假设,另外,对于连续性变量,评估其潜在的非线性关系,并评估变量间可能潜在的交互作用。该模型是根据整个研究人群随访过程中的42次TE事件构建,为了保证EPV至少在10左右,从而避免模型的过度拟合以及确保模型的精简性,首先进行单因素分析,然后将P<0.1的候选预测变量纳入多因素Cox回归分析进行模型构建,方法采用向后最大似然比估计的方法构建模型;模型最终的选择由AIC信息准则确定。模型建立后,构建关于1、3、5年TE事件的预测概率计算公式;同时,为方便临床应用,构建1、3、5年TE事件风险预测概率的诺曼图。
表1 基线评估的候选预测变量定义及赋值原则Table 1 Definitions and weight assignment principles of candidate variables
为验证构建的风险模型,使用自助重抽样(Bootstrap,1 000次)的方法进行内部验证[22]。Harrell's C-指数用于评估整体区分能力,该指标可以评估涉及生存时间的模型,通常情况下,Harrell's C-指数<0.600提示模型的区分能力较差,Harrell's C-指数为0.600~0.750提示有一定价值的区分能力,Harrell's C-指数>0.750则提示有确切价值的区分能力[23];此外,评估模型对1、3、5年TE事件的区分能力。对于模型校准能力的评估,采用图形化的方法展示预测/观察TE事件发生率之间的关系。
采用构建的风险模型进一步对是否合并心房颤动的人群进行亚组分析[23-24],探讨模型的适用范围。
1.8 统计学方法 采用(±s)或M(P25,P75)作为计量资料的表示方法,组间差异比较采用独立样本t检验或秩和检验进行评估;分类变量采用频数及百分率表示,组间比较采用χ2检验或Fisher's确切概率法。同时评估构建的风险模型与HCM Risk-CVA模型对TE事件区分能力的差异。
所有分析使用R版本4.1.0(R Project for Statistical Computing) 进行,包括“compare Groups”“rms”“survminer”“tidyverse”“survival”“time ROC”“survival ROC”“nomogram Formula”和“stats”等软件包。所有检验为双侧检验,以P<0.05为差异有统计学意义。
2.1 基线特征及随访TE事件 513例患者中,男283例(55.17%),女230例(44.83%);年龄12~87岁,中位年龄57.0(450,67.0)岁;MWT 19.0(17.0,22.0)mm;LA内径40.0(35.0,45.0)mm;LVEF 69.0(63.0,73.0)%;中位随访时间为4.2(1.3,6.2)年,累积随访2 000.0人年。随访过程中,513例患者中42例(8.18%)发生TE事件,年发病率为2.10%〔95%CI(1.47%,2.73%)〕。42例TE事件中:36例为缺血性脑卒中,4例为下肢动脉栓塞,1例为上肢动脉栓塞,1例为肠道动脉栓塞。
未发生TE事件者和发生TE事件者血管疾病发生率、高血压发生率、MWT、LVOTO、NYHA心功能Ⅲ/Ⅳ级所占比例、LVEF、阿司匹林服用比例、氯吡格雷服用比例比较,差异均无统计学意义(P>0.05);发生TE事件者女性所占比例、年龄、既往TE事件发生率、糖尿病发生率、心房颤动发生率、LA内径、华法林服用比例均高于未发生TE事件者,差异有统计学意义(P<0.05),见表2。
表2 未发生TE事件者和发生TE事件者基线特征比较Table 2 Baseline characteristics in hypertrophic cardiomyopathy patients with and without thrombotic events
2.2 构建TE事件风险预测模型 为便于临床使用以及构建风险预测模型,先将年龄、MWT、LA内径及LVEF等连续性变量按照既往文献报道及研究数据具体情况(分组前使用3次样条曲线初步评估潜在切点)进行分组(表3);单因素Cox回归分析结果显示,性别、年龄、既往TE事件、糖尿病、心房颤动、LA内径、LVEF及服用华法林等变量可较好地预测未来TE事件的发生(P<0.1)(表3);随后,将上述变量纳入多因素Cox回归模型,采用向后最大似然比估计的方法构建TE事件风险预测模型,根据AIC信息准则,模型最终纳入年龄、既往TE事件、心房颤动及LVEF(P<0.05,表3),即本研究的SAAE score评分,S=既往脑卒中(stroke)等TE事件,A=心房颤动(atrial fibrillation),A=年龄(age),E=左心室射血分数(left ventricular ejection fraction)。
表3 HCM患者发生TE事件预测的单因素和多因素Cox回归分析Table 3 Univariate and multvariate Cox regression analyses for factors predicting the risk of thrombotic events in hypertrophic cardiomyopathy patients
根据多因素Cox回归模型中每个变量的回归系数,每例患者1、3、5年TE事件发生率的计算公式如下:PTEat1、3、5年=1-S0(t)exp(个体评分-人群平均分),其中,S0(t)为患者1、3、5年平均无TE事件的概率,分别为0.988、0.964、0.941。个体评分=1.174×既往TE事件(是=1,否=0)+1.472×心房颤动(是=1,否=0)+0.329×年龄(50~<70岁:是=1,否=0)+1.107×年龄(≥70岁:是 =1,否 =0)-0.981×LVEF(50~<70%:是 =1,否=0)-1.407×LVEF(≥70%:是=1,否=0);人群平均分=-0.449。同时,为方便临床应用,构建1、3、5年TE事件风险概率预测的诺曼图(图1)。
图1 HCM患者发生TE事件风险预测的诺曼图Figure 1 Nomangram for risk prediction of thrombotic events in hypertrophic cardiomyopathy patients
2.3 SAAE score的验证 使用SAAE score对整体人群进行内部验证时,自助重抽样提示校准能力较好(校准斜率=1.006)。Harrell's C-指数为0.773〔95%CI(0.688,0.858)〕,提示对于整体人群具有较好的TE事件区分能力。进一步评估SAAE score对不同随访时间点的TE事件区分能力,整体上Harrell's C-指数波动在0.700~0.800。其中,对于1、3、5年TE事件区分及校准能力:Harrell's C-指数分别0.790、0.799及0.735(图2),提示SAAE score对这些时间点具有较好的TE事件区分能力,校准能力也较好(图3)。
图2 SAAE score对整体人群1、3、5年TE事件的区分能力Figure 2 Predictive power of SAAE score for 1-,3- and 5-year risk of thrombotic events in the whole study population
图3 SAAE score对整体人群1、3、5年TE事件的校准能力Figure 3 Calibration plots for predicted versus observed 1-,3-,5-year risk of thrombotic events for whole study population
2.4 敏感性分析 上述内部验证提示SAAE score对整体人群的TE事件具有较好的区分及校准能力;但针对不同人群可能存在潜在差异,因此,进一步评估了SAAE score在心房颤动及非心房颤动人群中的应用。
结果显示SAAE score在心房颤动人群中也可较好地区分TE事件的发生,整体上Harrell's C-指数为0.669〔95%CI(0.548,0.791)〕,提示对于心房颤动人群具有一定价值的TE事件区分能力(校准斜率=1.117)。对于区分1、3、5年TE事件的发生,Harrell's C-指数分别为0.745、0.671及0.616(图4);对于模型的校准能力详见图5。
图4 SAAE score对心房颤动人群1、3年及5年TE事件的区分能力Figure 4 Predictive power of SAAE score for 1-,3-,5-year risk of thrombotic events for hypertrophic cardiomyopathy patients with atrial fibrillation
图5 SAAE score对心房颤动人群1、3、5年TE事件的校准能力Figure 5 Calibration plots for predicted versus observed 1-,3-,5-year risk of thrombotic events for hypertrophic cardiomyopathy patients with atrial fibrillation
对于非心房颤动人群,SAAE score区分TE事件的整体Harrell's C-指数为0.647〔95%CI(0.498,0.795)〕,提示有一定价值的区分能力(校准斜率=1.245)。对于区分1、3、5年TE事件的发生,Harrell's C-指数分别为0.661、0.697及0.634(图6);对于模型的校准能力详见图7。
图6 SAAE score对非心房颤动人群1、3、5年TE事件的区分能力Figure 6 Predictive power of SAAE score for 1-,3- and 5-year risk of thrombotic events for hypertrophic cardiomyopathy patients without atrial fibrillation
图7 SAAE score对非心房颤动人群1、3年及5年TE事件的校准能力Figure 7 Calibration plots for predicted versus observed 1-,3-,5-year risk of thrombotic events for hypertrophic cardiomyopathy patients without atrial fibrillation
2.5 风险分层的临床应用 SAAE score作为连续性变量,当用作TE事件危险分层时,需要确定最佳分界值;另外,本研究的数据为包含时间因素的生存资料,对于此类数据的最佳分界值,采用X-tile软件确定SAAE score预测整体人群、心房颤动人群和非心房颤动人群发生TE事件的低、中、高风险分值(表4)[25]。通过前述分界值对患者进行分组,根据分数的高低定义为高风险、中风险及低风险,结果提示SAAE score均可较好地区分人群TE事件的发生(图8)。其中对于非心房颤动人群,低风险及中风险者发病率为0.8/百人年、0.9/百人年,高风险者发病率为3.7/百人年;对于心房颤动人群,低风险者发病率为3.5/百人年。
图8 SAAE score对于不同人群危险分组的Kaplan-Meier曲线分析Figure 8 Kaplan-Meier analysis showing cumulative thrombotic events in hypertrophic cardiomyopathy patients with low,moderate or high thrombotic risk predicted by SAAE score
表4 SAAE score预测整体人群、心房颤动人群和非心房颤动人群发生TE事件的低、中、高风险分值(分)Table 4 Cutoff points of SAAE score for low,moderate and high risk of thrombotic events in different populations
2.6 与HCM Risk-CVA模型对比 本研究基线数据可计算HCM Risk-CVA模型,因此,在对SAAE score进行评估分析后,进一步将其与HCM Risk-CVA模型进行对比。对于整体人群,SAAE score对于TE的区分优于HCM Risk-CVA模型(P=0.013);但针对不同时间点,SAAE score并不优于HCM Risk-CVA模型(P>0.05,表5)。对于心房颤动及非心房颤动人群,SAAE score对于TE的区分并不优于HCM Risk-CVA模型(P>0.05,表5)。进一步针对两个评分模型进行临床效用的对比,绘制临床决策曲线,结果提示在不同预测时间点(1、3、5年),SAAE score的净获益均优于HCM Risk-CVA(图9)。
图9 SAAE score及HCM Risk-CVA在不同预测时间点的临床决策曲线Figure 9 Decision curve analysis of SAAE score and HCM Risk-CVA score for predicting the risk of thrombotic events in hypertrophic cardiomyopathy at different time points
表5 SAAE score与HCM Risk-CVA模型区分TE事件的对比Table 5 Comparisons between SAAE score and HCM Risk-CVA score for predicting the risk of thrombotic events in hypertrophic cardiomyopathy
本研究构建了关于中国HCM患者的TE事件风险预测模型,即SAAE score,结果提示该模型对于HCM整体人群、心房颤动及非心房颤动人群,均具有较好的TE事件区分及校准能力;根据不同的分界点,可有效地对患者进行TE事件风险分层。此外,SAAE score对于TE事件的区分能力倾向优于HCM Risk-CVA模型。
对于不同的研究人群,因存在不同的临床背景等,风险预测因素对预后的影响存在较大差异[5,23,26-36],有的可能对预后存在较强影响,有的可能对预后影响较弱,甚至没有影响。例如,在HCM Risk-CVA模型构建过程中[9],多因素Cox回归分析提示心房颤动对TE事件影响的HR为8.41、对既往TE事件影响的HR为3.63,而在本研究中心房颤动对TE事件影响的HR为4.21,对既往TE事件影响的HR为3.16;这提示心房颤动对于不同HCM人群TE事件发生的影响具有较大差异,而既往TE事件对于不同人群未来发生TE事件的影响具有相对一致性。另外,HCM Risk-CVA模型构建的研究中发现LA内径对TE事件具有独立预测作用[9],而HARUKI等[6]的研究也提示LA内径是无心房颤动病史的HCM患者TE事件的重要危险因素;但本研究调整混杂因素后未见相关发现,既往MARON等[5]研究在调整相关混杂因素后也未发现LA内径与TE事件存在相关性。这提示针对不同的人群,各种预测因素对于预后的影响存在较大差异,在不同模型中所占的权重不同,这可能是由于不同人群的临床背景有所差异,因此需要针对不同的人群以及需要达到的临床目的构建不同的风险预测模型[37-38]。值得注意的是,数据提示服用华法林增加TE事件风险,可能的解释是心房颤动患者多服用华法林预测TE事件,但华法林的预防效果需基于长期服用且国际标准化比值(INR)控制在目标范围,而这部分患者可能基线短期服用而未长期服用或INR不达标,因此服用华法林实际上从另一角度反映了心房颤动的TE风险。
通常情况下,构建风险预测模型需结合既往研究结果进行预测指标的筛选,也同时需要结合自身研究人群的数据进行综合分析,最终构建针对研究目的的模型,但在构建模型的过程中,可能受到多方面因素的影响,特别是患者随访时间跨度较长,这期间存在诊疗技术及患者随访过程中服用相关药物等情况的变化,因此必要时需要对不同人群构建针对不同目的的模型,甚至需要在随访过程中针对原本有效的模型进行再次调整[16,23,26,37,39-41]。本研究在进行文献复习后,筛选了可利用的临床指标,通过分析最终构建了SAAE score模型,该模型对于未来发生TE事件具有较好的区分及校准能力;结合临床实践,有以下临床意义:(1)本研究构建的模型较为简单实用,指标包括既往TE事件、心房颤动、年龄及左心室射血分数,这些指标在临床中非常容易收集,可以较好地在临床中应用;(2)该模型可较好地区分不同人群发生TE事件的风险,包括整体人群、非心房颤动及心房颤动人群;(3)对于非心房颤动人群,当评分<11.25分时(低危及中危组),TE事件的年发病率低于1.0%,针对这部分患者或许可以根据临床实际情况进行规律随访,在一定程度上可以避免可能有害且几乎不具有成本效益的抗栓治疗;(4)在非心房颤动人群中,高于11.42分(高危组)的患者TE事件年发病率约为3.5%,表明这部分患者可能需要积极服用处方抗栓药物,从而在一定程度上减少TE事件的发生;(5)对于心房颤动人群,无论在低危、中危及高危组中,TE事件的发生率均较高,这进一步支持了目前指南中对于该部分患者进行积极抗凝治疗的推荐。虽然本研究的SAAE score在构建模型的人群中通过内部验证提示具有较高的价值,但是否在其他HCM人群中也具有较高的价值,需要进一步的研究。
本研究也存在某些局限性。由于本研究资料来源于回顾性队列且数据来源于三级医院,因此可能存在一定程度的偏倚,本研究仅进行了内部验证,对于模型的外延性需要在未来的研究中进一步探讨。另一方面,由于本研究中部分患者服用了华法林、阿司匹林及氯吡格雷等抗栓药物,可能影响了模型的构建,且该部分患者多为TE事件的高危患者,若排除相关患者,则TE事件会明显减少,从而导致统计学效能明显下降;在构建模型中,经回归分析筛选提示前述抗栓药物的使用对模型构建不产生影响,因此不排除服用抗栓药物的患者,这在真实世界研究中可能会存在,但仍需在后续研究中进一步扩大样本探讨未服用抗栓药物人群的TE事件风险评估。此外,HCM合并心房颤动的患者未来发生TE事件的风险较高,建议服用抗凝药物,因此,单纯构建关于非心房颤动人群的模型更有价值;SAAE score用于心房颤动人群时,也可区分TE事件的发生,从而识别心房颤动人群中的TE事件超高风险患者,进一步加强患者及医务人员的关注,具有一定的临床意义。在未排除心房颤动患者的情况下构建的SAAE score应用于非心房颤动人群时也能有效识别TE事件的高危患者,也提示了该模型在非心房颤动人群中的价值。
综上所述,本研究构建了中国HCM患者的TE事件风险预测模型,即SAAE score,该模型在整体人群、心房颤动及非心房颤动人群中均具有较高的TE事件区分及校准能力;该模型可较好地对不同HCM人群进行TE事件的风险分层。
作者贡献:阮海燕负责数据清洗、统计学分析、绘制图表及论文起草等;李丽英负责数据收集、采集、清洗、检索文献等,参与研究过程的实施;张木馨负责数据收集、采集、清洗等,对研究指标及论文数据进行核查;郑翼提出研究思路,设计研究方案,提出研究命题等;何森提出研究思路,设计研究方案,提出研究命题,设计主要研究指标等,参与并负责研究所有过程,负责论文最终版本修订,对论文负责。
本文无利益冲突。