盛和静
既往的研究表明,左心室肥厚(LVH)患者的心血管事件发生率较高,远期预后较差,提示LVH的早期诊断具有较大的临床意义[1-4]。我国对于LVH人群的筛查检出率较低,其原因主要有两个方面:(1)缺乏LVH的直接检查手段。目前最常用的诊断LVH肥厚的检查手段是超声心动图,还包括MRI、CT等方法。与心电图相比,其他检查方式的普及率较低;(2)缺乏LVH的专业诊断技术人员。与心电图检查结果的参数自动生成不同,超声和MRI等检查方式需要技术人员参与,操作过程复杂,因技术人员不同造成的差异较大。特别是在以疾病筛查为主要任务的基层医疗中心,心电图由于其便于携带、方便操作等优点而应用广泛。目前有一些现行用于心电图诊断LVH的公式和评估指标,相关研究显示这些基于心电图的诊断公式灵敏度相对较低,用于筛查存在重大缺陷[5-7]。
人工神经网络(ANN)是一种复杂的网络系统,通过赋予变量不同的权重来模拟人脑神经的信息处理工作[8]。人工神经网络对于变量的非线性处理过程主要包括两个步骤:前向信号传递和误差触发的反向权重调整。数据信息在隐藏层经过计算处理,然后在输出层完成结果数据的输出。如果输出结果与预知的结局一致则结束运算;如输出与预知结果不同,则反向进行预测因素的权重调整,重新进行运算,直到输出结果适配到可接受的水平[9]。本研究目的是建立一个以心电图参数为主要预测变量的人工神经网络,评估其用于LVH的筛查价值。
1.1 一般资料 选择2017年1月至2018年1月在温州市中西医结合医院接受健康体检者486例。纳入标准:心电图和超声心动图检查且心电图节律判断为窦性心率。排除标准:影响心电图间期时长的病变,如预激、传导阻滞;异位节律心动过速,如阵发性房性心动过速/室性心动过速;节律显著异常,如心房颤动;房室关系异常,如房室传导阻滞;起搏心率;符合急性冠状动脉缺血的心电图。参与本研究的人群均知情同意,通过本院伦理委员会审核批准。
1.2 方法
1.2.1 数据采集与预测变量选择 采用超声心动图机(荷兰飞利浦,CX50 POC)和心电图机(中国纳龙科技,aECG-12PWL)分别进行心脏超声和心电图检查。检查结果由2位经验丰富的医疗技术人员评估,如果出现矛盾意见,则邀请第三方决定。LVH定义为:二维超声左心室质量指数(LVMI-2D)≥103g/m2(男性);≥89g/m2(女性)[10]。根据该标准将研究对象分成两组:LVH组和对照组。预测变量的选择以心电图参数为主,参考简易进行的原则[8-11]纳入变量(共11项)。预测变量可分为3类:(1)通过访谈即可获得的数据(高血压病史、性别、年龄);(2)通过简单检测即可得到的数据(身高、体重);(3)心电图参数(包括电轴、PR 间期、QRS 间期、QTc 间期、SV1、RV5)。
1.2.2 logistic回归(LR)模型的建立 根据预测变量临床指标的截断值,对所有连续性变量进行分类和转换,然后采用多因素logistic回归分析评价LVH相关因素,建立稳定的输出模型。输出结果以“0和1”来表示预测结局。计算预测模型灵敏度、特异度及预测价值。
1.2.3 人工神经网络(ANN)模型的建立 根据分区变量公式[分区变量=R.Burnuri(0.7)] 对纳入本研究的486例研究对象进行无偏随机分组,随机分组得到的70%(340例)作为训练集,将剩下的30%(146例)作为测试集。将所有数据集进行归一化,使所有变量数据在0~1,以提高神经网络预测模型的稳定性。采用多层感知器(MLP)作为前馈神经网络预测模型,对误差反向传播进行重复权重调整,使其在最小二乘误差下停止,保障测试集的误差维持在最小范围内。多层感知器的建模过程由包含11项预测变量的输入层、4个节点组成的一个隐藏层和具有两个结局(LVH组和对照组)的输出层组成。首先通过经验确定隐藏节点的数目,并通过多次测试得到最佳值。多层前向神经网络模型的预测结果根据超声心动图检查结果设置为LVH组(编码为1),对照组(编码为0),根据预测结果可以得到预测变量的相应权重。计算最大Jouden指数(灵敏度+特异度-1)和 ROC AUC。
1.2.4 logistic回归模型与人工神经网络模型筛查价值的评价 根据ROC AUC评价人工神经网络和LR模型预测诊断的价值。比较两种预测模型的灵敏度、特异度、似然比和一致性。
1.3 统计学处理 采用SPSS22.0统计软件,正态分布的计量资料以表示,比较采用t检验;非正态分布的计量资料采用中位值(四分位数区间,IQR)表示,比较采用Mann-WhitneyU检验。计数资料以百分率表示,比较采用χ2检验。建立ROC曲线坐标轴,计算ROC AUC。如果ROC曲线与对角线一致,表明AUC为0.5,则提示预测模型与单纯随机模型价值相当;如果灵敏度和特异度达到100%,则提示AUC为1。因此,AUC越大,预测模型诊断价值越高。用Z检验对AUC进行比较,计算95%CI。当Jouden指数达到最大值(Jouden指数=灵敏度+特异度-1)时,确认预测模型的灵敏度和特异度。P<0.05为差异有统计学意义。
2.1 预测变量的纳入 本研究以心电图参数为主建立预测变量列表,其中高血压216例(44.4%),男性 287例(59.1%),年龄(61.19±11.44)岁,体重(65.39±10.05)kg,身高(163.66±10.00)cm;电轴 37(45)°,PR 间期 160(36)ms,QRS 间期 92(8.500)ms,QTc 间期 429(28)ms,SV10.800(0.625)mV,RV51.650(0.915)mV。
2.2 训练集与检测集变量比较 见表1。
由表1可见,训练集与检测集之间的预测变量差异均无统计学意义(均P>0.05)。
表1 训练集与检测集变量比较
2.3 ANN的构建 ANN预测模型过程,包含一个输入层(11个变量),一个隐藏层(4个节点),一个输出层(2个结局)。
2.4 多因素logistic回归的预测变量分析 见表2。
表2 多因素logistic回归的预测变量分析
由表2可见,RV5对于筛查LVH的诊断价值较高(P<0.05)。
2.5 变量权重排序 ANN模型显示“体重、QTc间期、QRS间期、RV5”是占权重最大的4个预测变量,见图1。
2.6 两个预测模型对LVH诊断价值的比较 见图2、表 3。
由图2、表3可见,ANN预测模型对LVH筛查诊断的 ROC AUC 值为 0.964(95%CI:0.921~1.000),与LR模型预测诊断的ROC AUC值0.889(95%CI:0.831~0.948)相比,差异有统计学意义(Z=2.016,P<0.05)。
图1 ANN预测变量的相关权重
图2 两个预测模型的ROC AUC比较
表3 两个预测模型对LVH诊断价值的比较
在我国基层医疗中心筛查LVH的主要困难在于缺乏超声检查设备和经验丰富的医疗技术人员。心电图检查由于其仪器携带、操作简便易行在我国基层医疗中心广泛应用。既往多个研究致力于开发基于心电图的LVH诊断公式[5-7],其中常见的包括“Cornell电压诊断标准”“Sokolow-Lyon电压诊断标准”“Romhilt-Estes 评分”“电轴”“Perugia 评分”“aVL R波”,灵敏度多在30%~80%,特异度最高可达到90%[7,11]。作为辅助筛查LVH的检查手段,应进一步研究提高筛查手段的灵敏度。
建立LVH筛查预测模型需要符合3个特征:(1)预测变量容易获得;(2)预测变量与LVH相关;(3)对医疗技术人员个人能力经验依赖少。因此本研究纳入的预测变量包括易于获得的个人临床信息,如病史、年龄、身高、体重,以及相关的心电图参数,包括电轴、PR间期、QRS间期、QTc间期、SV1、RV5。其他LVH相关的影响因素如肾功能和甲状腺功能亢进未被纳入本研究即基于此原因,血清肌酐及激素水平在基层医疗中心不易获得。
Hopkins等[12]的研究提示基于神经网络的LVH预测可能优于传统的心电图诊断标准。但我们认为其研究有几个较大缺陷尚需要改进:(1)该研究的纳入对象仅限于男性,研究结果外推整个人群价值有限。既往有研究提示性别差异会导致LVH不同的表型[13];(2)在 Hopkins的研究中,人群体重未被作为预测变量纳入,而通过系统回顾表明LVH与体重显著相关[14];(3)Hopkins研究建立的神经网络预测模型的特异度较低(40%~70%),故对降低医疗费用的作用非常有限,甚至在某种程度上会增加部分非LVH患者的医疗费用。本研究将体重、性别均纳入预测变量,预测模型灵敏度为93%,特异度为91%,与Hopkins研究比较,本研究建立的ANN模型在不降低灵敏度的基础上具备了较高的特异度,显著优于前者模型。
关于多因素预测模型除了ANN外,LR是临床上较常用的模型之一。LR模型能够处理与结局相关的复杂变量数据[15],增加变量的数量将降低检测可能存在相关性的能力[16]。LR模型更适用于定性和半定量的变量,而ANN可以用于排查任何类型的交互作用,甚至包括非线性交互作用。本研究建立LR与ANN模型用于LVH预测诊断价值的比较。LR模型P值为0.472,表明该模型拟合较好,其灵敏度和特异度分别为89%和74%;而ANN预测模型的灵敏度和特异度分别为93%和91%。根据ROC AUC,ANN模型优于LR模型。
本研究存在一定的局限性,数据库构建的模型较小,均来自单个医疗中心。其中数据来源的心电图机和超声心动图仪器来自于特定医疗设备,可以防止构建模型的异质性,但也削弱了将本研究成果应用于其他临床中心的效能。由于本研究构建模型涉及的预测变量容易获得,且本研究中使用的心电图机和超声心动图仪等医疗设备为我国最常用的医疗器械品牌,这在一定程度上可以改善外推效应。
将本研究设计的ANN预测模型应用于基层医疗机构的LVH早期筛查,可以在节省医疗资源的基础上提高筛查效率。通过本研究的前期探索,构造稳定有效的ANN模型可以进一步应用于如窦性心律不齐在性别差异或心力衰竭等心肌结构性病变的筛查[17-18]。