基于经优化的logistic模型的微小病变型肾病诊断

2021-01-22 10:21张杏珍奚炜炜
中国医院统计 2020年6期
关键词:诊断模型生物学肾病

张杏珍 黄 坚 奚炜炜 应 俊

1 浙江大学医学院附属金华医院,321001 浙江 金华;2 浙江大学医学院附属邵逸夫医院肾内科,310016 浙江 杭州

微小病变型肾病(minimal change disease, MCD)是特发性肾病综合征(nephrotic syndrome, NS)的主要病因之一。其临床表现特点是产生大量的蛋白尿,并导致水肿以及血容量的减少。在成人中,MCD约占特发性NS患者的10%~15%[1]。值得注意的是,在1岁以下的儿童中,MCD是NS最常见的病因,约占80%;在青春期前后,随着其他肾小球疾病的发生,如膜性肾病,这一比例将会显著下降[2]。但与其他肾小球疾病相比,MCD患者出现NS的症状和体征要更快。目前,肾活检是肾实质疾病诊断、治疗管理和预后预测的金标准,为医生提供临床诊断和相关检测的信息,有助于提高对相关疾病的认识[3]。但肾活检的缺陷是,作为一种有创的侵袭性检查,有可能会引起并发症,比如出血或感染。此外,由于一些地区的医疗条件、诊断标准的制定或患者自身的身体情况等原因,部分患者并不能接受肾活检,从而导致无法及时诊断[4]。因此,迫切需要一种无创的数学模型来诊断MCD。

2018年,Zhu等收集798个肾病患者的相关数据,其中MCD患者47人,其它肾病患者751人,基于生物学参数,通过t检验与ROC分析进行参数筛选,并构建二元logistic模型,用以诊断MCD。作者认为,该方法建立的“总胆固醇+凝血酶时间”诊断模型可用于MCD的分类诊断[5]。尽管作者采用了一个很大的患者人群,但提出的模型因纳入参数个数过少,可能会因此降低了大样本的本来价值。本研究拟在该研究基础及标准上[5],更换新的参数筛选软件与方法,构建二元logistic模型,并用ROC分析与诊断准确度评价模型的诊断价值,用以更好更准确地无创诊断MCD。

1 资料与方法

1.1 资料来源

本次研究的MCD和其他肾脏疾病的相关临床研究数据是来自公共数据库PeerJ,共包括798名患者,包括47名MCD患者和751名其他肾脏疾病患者。原始数据包括每个患者的临床生物学参数数据以及疾病状态以供建模。

1.2 方法

采用MedCalc version 15.8软件对全部生物学参数进行了ROC(receiver operating characteristic)曲线分析,计算曲线下面积(area under the curve,AUC),以评估相关生物学参数是否能有效地区分MCD和其他肾脏疾病患者(AUC>0.70,P<0.001)。AUC大于0.70的生物学参数作为构建二元logistic模型的协变量。这些参数包括白蛋白(albumin, ALB)、总胆固醇(total cholesterol, CH)、血浆纤维蛋白原(plasma fibrinogen, FIB)、高密度脂蛋白(high density lipoprotein cholesterol, HDL)、低密度脂蛋白(low density lipoprotein cholesterol, LDL)、总蛋白质(total protein, TP)、凝血酶时间(thrombin time, TT)。

将CH、HDL、LDL、TT和FIB作为协变量,疾病状态作为因变量,应用向后步进法(似然比)构建二元logistic模型,定义为模型1。将所有满足建模条件的生物学参数(ALB、CH、FIB、HDL、LDL、TP、TT),作为协变量,疾病状态作为因变量,应用向后步进法(似然比)构建二元logistic模型,定义为模型2。

利用MedCalc version 15.8对2个模型进行了ROC曲线分析,计算AUC、约登指数(Youden index)、灵敏度、特异度,以评估基于相关生物学参数所构建的logistic模型是否能有效地区分MCD和其他肾脏疾病患者。根据约登指数的阈值,预测疾病的状态,并据此分别计算2个模型的准确度,对比模型效果。

2 结果

2.1 生物学参数评价与筛选

为评估相关生物学参数是否能有效地区分MCD和其他肾脏疾病患者,我们对28项生物学参数进行ROC曲线分析。如图1所示,0.50

图1 生物学参数ROC曲线分析分布图

本文将AUC>0.70作为生物学参数可以满足建模的筛选条件,来构建二元logistic模型,包括白蛋白(AUC=0.821)、总胆固醇(AUC=0.800)、血浆纤维蛋白原(AUC=0.706)、高密度脂蛋白(AUC=0.747)、低密度脂蛋白(AUC=0.777)、总蛋白质(AUC=0.824)、凝血酶时间(AUC=0.804)。

2.2 logistic模型构建

为建立MCD及其他肾病的分类模型,将相关生物学参数作为协变量,疾病状态作为因变量,应用向后步进法(似然比)构建二元logistic模型。

在模型1中,将CH、HDL、LDL、TT、FIB作为协变量。 CH(P<0.001)和TT(P<0.001)是MCD的危险因素。见表1。

表1 两自变量的多重logistic回归分析

包括CH和TT在内的分类方程如下:

在模型2中,将所有满足建模条件的生物学参数(AUC>0.70,P<0.001),包括ALB、CH、FIB、HDL、LDL、TP、TT作为协变量。 其中CH(P=0.038)、HDL(P=0.035)和TT(P=0.001)是MCD的危险因素,TP(P<0.001)是MCD的保护因素。见表2。

表2 4个自变量的多重logistic回归分析

包括CH、HDL、TP与TT在内的分类方程如下:

2.3 模型评价

为评估基于相关生物学参数所构建的logistic模型是否能有效地区分MCD和其他肾病患者,对基于预测概率的logistic回归分析结果进行ROC曲线分析。模型1的ROC曲线分析结果如图2所示,与Zhu等的研究结果一致[5]。

图2 模型1的ROC曲线分析

模型2的ROC曲线分析结果如图3所示。

图3 模型2的ROC曲线分析

模型1最佳截断点处的约登指数为0.528,灵敏度为82.98%,特异度为69.83%,此处相关标准为0.038 3,意指若PRE1>0.038 3,则判定为MCD患者,反之为其他肾脏疾病患者。模型2最佳截断点处的约登指数为0.617,灵敏度为80.43%,特异度为81.31%,此处相关标准为0.073 5,意指若PRE2>0.073 5,则判定为MCD患者,反之为其他肾脏疾病患者。见表3。

表3 模型1与模型2的ROC曲线分析结果比较

根据“最佳”截断点处约登指数的相关标准,预测疾病的状态,并据此分别计算2个模型对MCD诊断的准确度。拥有4个生物学参数的模型2的准确度高于仅使用2个生物学参数的模型1的准确度。

3 讨论

MCD是特发性NS的主要病因。其中儿童特发性NS中,绝大部分都是MCD[6],而且发病迅速。在成人中,情况要复杂得多,MCD是特发性NS的第三大原因,仅次于局灶性节段性肾小球硬化和膜性肾病[2]。从临床表现上看,MCD的特点是低蛋白血症、高脂血症、蛋白尿和水肿[7]。从组织学上看,MCD的免疫荧光染色通常是阴性的,而MCD的特点是足细胞内的足突融合,但只有通过电子显微镜才能检测到。目前MCD的发病机制并不清晰[8]。但研究成果尚不能提出具有临床应用价值的MCD诊断方法,以替代具有有创缺陷的肾活检穿刺术。

Zhu等[5]构建的用以诊断MCD的“CH+TT”诊断模型的AUC为0.827,灵敏度为82.98%,特异度为69.83%。该模型的效果有待加强。作者过度地简化了生物学参数的数量弱化了模型的实际应用潜能,忽略了部分校正AUC绝对值大于0.70的生物学参数,从而导致所构建的二元logistic模型并不完善。因此,我们基于同样的临床患者数据,将满足条件(AUC>0.70,P<0.001)的生物学参数悉数纳入,重构该二元logistic模型。本研究纳入4个生物学参数的诊断模型与原来的仅包括2个生物学参数的诊断模型均可用于MCD的分类诊断。新的诊断模型更值得在临床上尝试应用。

值得注意的是,MCD是一种典型的儿童疾病,占儿童原发性NS病例的绝大多数[9]。而且,在发病过程中,儿童和青年人临床特征是水肿,这是诱导父母寻求健康护理的主要临床症状;而大于60岁的成人的临床特征往往是出现肾功能损伤或高血压[10-11]。因此,在成年人中,可逆性急性肾衰竭患者(可能与较高的蛋白尿水平有关)的发病率要高于儿童[8,12]。此外,在发病时,由于高凝状态、血脂升高和血浓度升高而引起的血栓并发症,在成年人中的比例更高,而且发病率更为稳定[8]。而本研究的MCD诊断数学模型包含参数分别是总胆固醇、高密度脂蛋白、总蛋白质以及凝血酶时间,这4个参数的临床意义明显与成年人的临床特征更为契合,本模型更加适用于成年人群体,对于儿童和青少年患者,应谨慎使用本模型。

猜你喜欢
诊断模型生物学肾病
预防肾病,维护自己和家人的健康
谷稗的生物学特性和栽培技术
肾病防治莫入误区
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用
“重女轻男”的肾病
PEDF抗肿瘤的生物学作用
基于模糊优选反问题的电机电气故障诊断模型
对于电站锅炉燃烧经济性诊断模型的研究
中西医结合治疗糖尿病肾病50例