黄 平,冯慧芬,王 芳,党德建,王 斌,赵 敬,易佳音
1) 郑州大学第五附属医院消化科 郑州 450052 2) 郑州大学附属儿童医院感染科 郑州 450051 3) 郑州大学第五附属医院感染控制科 郑州 450052
手足口病(hand-foot-mouth disease,HFMD)是由肠道病毒引起的一种常见的儿童传染病[1],由于该病的自限性,大多数患儿仅表现出轻微的症状,如发热及伴随的躯体相应部位的出疹。但少数重症患儿病情容易进展,出现各种严重的并发症[2],如肺水肿、病毒性脑炎等[3],导致不良预后。2012年我国流行病学调查数据[4]显示,12~23个月的幼儿HFMD发病率和病死率最高,心肺或神经系统的并发症发生率为1.1%,病死率为3%,其中超过90%的死亡病例与肠道病毒71型(EV71)感染有关[5]。因此早期识别患儿的重症化趋势,及时进行临床干预对于减少重症HFMD患儿不良预后的发生显得尤为重要。
通过创建一个直观的统计预测模型图表,可以准确地评估各种癌症预后参数如转移概率、总生存期及复发概率与各预测指标之间的关系,从而精确地预测各种结局风险[6]。列线图是一种基于回归模型创建的图形计算工具,已成为一种流行的统计预测模型[7-8]。列线图可以与Cox回归或logistic回归联合应用。目前,尚无可供参考的HFMD临床评分工具。既往大量学者的研究[9-10]仅限于在重症危险因素的挖掘中,停留在定性评价阶段,而无法做到向临床辅助工具的转化和开发。本研究旨在借助列线图模型实现对重症HFMD的发病风险预测,从而为后续研究以及临床辅助量表的开发提供方法学参考依据。
1.1研究对象收集郑州市某儿童医院2017年7月至2018年2月住院诊治的HFMD患儿病例资料。所有病例的诊断均由主治及以上职称的医师,依据《手足口病诊疗指南(2010年版)》[11],将患儿分为轻症组562例和重症组218例。纳入标准:①初次诊断的HFMD患儿。②患儿除HFMD疾病之外,无其他基础疾病,一般情况尚好。③患儿病例及检验等资料完整,无缺失。排除标准:①恢复期的HFMD患儿。②HFMD发病之前,已经合并心肺等其他并发症的患儿。③存在免疫力缺陷等先天性疾病的患儿。
1.2资料收集按照预先制定的表格,由专人负责对纳入的病例资料进行记录及整理,包括患儿的基本信息及化验结果等。录入数据的质量控制由两位研究者相互监督,保证资料的完整及真实性。
1.3列线图的计算原理回归模型对每个变量生成一个回归系数β,将变量中绝对值最大的β转化为100分,其余所有变量的β除以这个最大β,再乘以100,转化为相应得分。将所有变量的得分进行累计求和,最终用总分来推算其结局事件发生概率。
1.4统计学处理使用R 3.5.1处理数据。主要用的R包有:mlr,stats,ROCR,Hmisc,grid,lattice,Formula,ggplot2,rms等。通过查阅文献以及结合临床,将连续性变量进行二分类离散化处理。2组基线特征和基础资料构成的比较使用χ2检验。使用简单随机抽样方法将全数据集分成训练子集(70%)和测试子集(30%),其中训练子集用于建立列线图模型,测试子集用于模型的预测性能分析。使用预测正确率、ROC曲线和分类器校准进行间接评价。将所有变量一次性代入logistic回归模型中,使用逐步回归法进行分析,筛选有统计学意义的指标用于列线图的构建。检验水准α=0.05。
2.1一般资料轻症组562例,男、女分别为310、252例,发病时间1~7(2.2±1.9) d;重症组218例,男、女分别为135、83例,发病时间1~5(2.1±1.8) d;两组性别和发病时间均衡,年龄均为2个月~7岁。两组患儿的基线特征见表1,训练和测试子集的基础资料构成比较见表2。
表1 轻症和重症组的基线特征
表2训练和测试子集的基础资料构成例(%)
特征训练子集(n=546)测试子集(n=234)χ2 P分组 轻症 重症389(71.2)157(28.8)173(73.9)61(26.1)0.587 0.444 性别 男 女317(58.1)229(41.9)128(54.7)106(45.3)0.754 0.385 年龄/岁 <2 ≥2378(69.2)168(30.8)147(62.8)87(37.2)3.059 0.080 发热/d <3 ≥3122(22.3)424(77.7)48(20.5)186(79.5)0.322 0.570 体温/℃ <38.5 ≥38.5218(39.9)328(60.1)89(38.0)145(62.0)0.246 0.620
2.2重症HFMD列线图模型的构建使用训练子集的数据进行模型训练,采用逐步回归法将所有变量代入logistic回归方程,结果见表3。将上述logistic回归筛选出的预测变量代入列线图模型,结局指标选取重症HFMD的发病风险,绘制列线图,结果见图1。根据每个变量的取值,向得分轴进行垂直投射,可以对应一个得分,如此,将所有变量对应得分进行总计,通过对应的总分轴向重症风险轴进行投射,可以判断某患儿发生重症的风险。
表3 Logistic回归分析
图1 重症HFMD的发病风险预测列线图
2.3列线图模型预测性分析模型拟合度偏差性检验结果:χ2=6.425,P>0.05,即模型预测的偏差性较小,拟合度较好。输出模型预测正确率为83.9%。绘制列线图模型和logistic模型预测重症HFMD的ROC曲线为图2,其曲线下面积分别为0.850(95%CI=0.835~0.864)和0.832(95%CI=0.821~0.848),两者诊断价值差异无统计学意义。
图2 两种模型的ROC曲线
列线图模型的分类器校准图见图3,可以看到,该模型实际校准线距离参考线较为接近,表明模型性能较好。
图3 列线图模型的分类器校准图
本研究通过回顾性分析,将常见的几种可能为HFMD患儿病情进展为重症的危险因素进行初步筛选,并借助于列线图模型,创建了一个临床评分工具。目前,在评分工具开发方面,临床预测规则(clinical prediction rules,CPRs)是较为常见的方法。CPRs是一种用来辅助临床决策制定的工具,通常从病史、体格检查以及相关化验、检查结果等方面来量化影响因素。CPRs通常又被称为预测模型或风险评分等,它提供了一种估计发病风险、疾病预后,甚至是诊断或治疗方案获益的评判策略[12]。现临床上广泛使用的如新生儿阿普加评分、格拉斯昏迷评分量表等,都是基于CPRs的设计理念,经历了从推导到验证的过程,最后评价其临床应用价值。
从推导过程来看,CPRs和列线图都是基于logistic回归模型,进行一系列回归系数的转化处理,但是相比于CPRs,列线图具有以下优势:①凭借着R语言的编程优势,仅需一行代码,就可以轻松绘制,无需像CPRs一系列复杂的手动的计算过程。②放宽了对预测变量类型的要求,无论是分类型,还是连续性变量,均可以用于构建列线图,而CPRs仅限于分类变量,这就要求在构建之前对连续性变量进行人工离散处理。相比于软件对连续性变量的自动优化处理,人工离散往往借助于临床经验,具有一定的盲目性,不能实现最优分割。③借助于R语言强大的编程,列线图绘制中可以实现交互式建模,通过对预测变量的机器筛选结合人工增减实现拟合最佳模型,从而为后期创建具有指南指导价值的列线图提供强大的技术平台。
在筛选出的预测变量方面,Ooi等[13]通过前瞻性的队列研究,得出发热>38.5 ℃、发热时间>3 d为HFMD患儿合并神经系统并发症的独立危险因素。林克武等[14]认为血糖增高具有提示HFMD合并脑炎的价值。目前的研究[15]认为,促炎因子参与了HFMD重症化的过程,当患儿合并有脑干等损伤时,引起机体的一系列机能紊乱,进而导致外周血中白细胞及血糖的增高[16],但其具体机制仍待后续深入。
Liu等[17]认为,HFMD患儿发病的高峰年龄为2岁,Luo等[18]的流行病学调查研究发现,对于重症HFMD患儿,从诊断到进展为重症的中位数时间为2 d。因此对于少部分病情进展迅速的患儿,需要更多有效的临床预测指标来识别,帮助临床医生从不典型症状的患儿群体中尽可能筛选出高危的患儿,给予必要的干预与治疗措施,提高患儿的预后,避免不良事件的发生。
本研究尚存一些不足,虽然纳入了较多样本,一定程度上减少了拟合偏差,但是一个好的模型构建往往需要巨大的样本量的支持,因此后续可继续扩大样本量,并在模型验证方面积极跟踪随访。目前国外有些学者依据已经发表的文献,将肿瘤方面的列线图工具制作成在线评分调查问卷,借以来收集外部验证数据。因此后续研究如果能收集不同地域人群的调查结果,将更有助于完善模型和评测性能。
综上所述,本研究表明列线图可以用于重症HFMD风险评估的预测,相比于传统logistic回归模型,列线图具有简单、直观、实用性强等优势,在临床应用方面具有一定的辅助价值。借助于更多挖掘危险因素方面的深入研究以及结合流行病学大样本量数据的应用,有望创建一个价值更高、应用范围更广的列线图,为临床指南和医学决策的制定提供更充实的参考依据。