2 型糖尿病患者并发糖尿病肾病风险的列线图预测模型与验证研究

2023-12-18 02:25韩俊杰武迪陈志胜肖扬森干
中国全科医学 2024年9期
关键词:线图变量高血压

韩俊杰,武迪,陈志胜,肖扬,森干*

1.830017 新疆维吾尔自治区乌鲁木齐市,新疆医科大学医学工程技术学院

2.830017 新疆维吾尔自治区乌鲁木齐市,新疆医科大学公共卫生学院

3.835099 新疆维吾尔自治区伊犁哈萨克自治州伊宁市,伊犁州疾病预防控制中心

糖尿病肾病(diabetic nephropathy,DN)是2 型糖尿病(diabetes mellitus type 2,T2DM)患者重要的并发症之一。根据国际糖尿病联合会预测,到2030 年世界糖尿病患病率将增至10.2%(约5.78 亿人),到2045年将增至10.9%(约7 亿人)[1],其中30%~40%的糖尿病患者可发展为DN[2]。由于DN 代谢紊乱较复杂,可能会造成患者肾脏损伤或者功能丧失[3],从而给患者的生活和经济带来极大的困扰。因此,对DN 进行早期筛查,对高危患者的防治具有重大意义[4-5],也是全球公共卫生事业的重要目标。

对T2DM 患者进行适当的干预可以有效地减少或延迟DN 的发病,尤其是在DN 发病初期进行干预可获得较好的疗效。因此本研究基于医疗数据采用多种预处理的方法清洗数据,采用LASSO 回归分析DN 可能发生的筛选特征变量,采用多因素Logistic 回归分析构建列线图预测模型,筛选出DN 的危险因素,进行DN 的风险预测。采用受试者工作特征(ROC)曲线下面积(AUC)、Hosmer-Lemeshow 校准曲线和决策曲线分析(DCA)对预测结果和临床实用性进行验证,从而为DN 的早期诊断和防治提供参考依据。

1 资料与方法

1.1 研究对象

收集2016 年1 月—2021 年6 月在新疆医科大学第一附属医院住院的5 810 例T2DM 患者的住院资料并进行回顾性分析。纳入标准:(1)确诊为T2DM 患者;(2)年龄≥18 岁;(3)可以自主沟通,并且无任何精神和心理障碍;(4)自愿签署知情同意书。排除标准:(1)数据及资料不完整;(2)1 型糖尿病、妊娠期糖尿病及其他特殊类型糖尿病;(3)因泌尿系统感染、急性肾损伤或有肾脏肿瘤等其他原因所致的肾脏损伤;(4)有恶性肿瘤、精神疾病或严重的肾脏或肝功能障碍。本研究已获新疆医科大学第一附属医院伦理委员会批准(批号:K202108-24)。

1.2 诊断标准

T2DM 依据《中国2 型糖尿病防治指南(2010 年版)》[6]中的诊断标准;DN 诊断标准为3~6 个月内复查尿白蛋白,3 次结果中至少2 次达到或超过临界值,且排除感染等其他影响因素。根据是否并发DN 将患者分为DN 组(481 例)和非DN 组(5 329 例)。

1.3 资料收集

一般资料包括年龄、性别、BMI、是否高血压、舒张压(DBP)、收缩压(SBP)和糖尿病病程等。患者禁食8~12 h,于次日清晨空腹取3 mL 肘部静脉血,以3 000 r/min(离心半径22 cm)离心10 min,留取血清,采用美国BECKMANDxC800 全自动生化分析仪,对患者白细胞计数(WBC)、血清肌酐(Scr)、总胆固醇(TC)、三酰甘油(TG)、低密度脂蛋白胆固醇(LDL-C)、高密度脂蛋白胆固醇(HDL-C)、载脂蛋白A1(ApoA1)、载脂蛋白B(ApoB)、24 h 尿微量总蛋白(Up)、定性尿蛋白(Upn)和糖化血红蛋白(HbA1c)等进行测量。

Upn 标准:-表示阴性(尿蛋白<0.1 g/L),+表示尿蛋白为0.2~0.9 g/L,++表示尿蛋白1.0~2.0 g/L,+++表示尿蛋白>2.0 g/L。

1.4 统计学方法

采用SPSS 26.0 和R 4.1.3 软件对收集的数据进行统计分析。符合正态分布的计量资料以(±s)表示,两组间比较采用两独立样本t 检验;不符合正态分布的计量资料以M(QR)表示,两组间比较采用秩和检验;计数资料以相对数表示,两组间比较采用χ2检验。将符合标准的481 例DN 患者和非DN 患者依据性别、年龄(±2 岁)进行1∶1 病例对照匹配。将匹配后的962例患者根据2∶1 比例随机分为训练组(n=641)和验证组(n=321)。以DN 作为结局变量,通过LASSO 回归筛选出独立危险因素,并结合多因素Logistic 回归分析探讨和构建列线图(Nomogram)预测模型。采用AUC验证预测模型预测效果,ROC 曲线是真实结果与模型预测结果进行比较,以定义真阳性率与假阳性率的函数[7]。AUC 范围为0.5~1.0,越接近1.0,说明模型的真实性越高;通过Hosmer-Lemeshow 校准曲线检验拟合优度[8];DCA 用来评估临床有效性[9]。以P<0.05 为差异有统计学意义。

2 结果

2.1 一般资料

5 810 例T2DM 患者中男3 671 例(63.2%)、女2 139 例(36.8%),年龄(57.2±12.1)岁。非DN 组和DN 组患者性别、年龄、BMI、糖尿病病程、WBC、TC、TG、LDL-C、Scr、高 血 压、SBP、DBP、HbA1c、ApoB、Up、Upn 比较,差异有统计学意义(P<0.05);两组患者HDL-C、ApoA1 比较,差异无统计学意义(P>0.05),见表1。

表1 非DN 组和DN 组患者一般资料比较Table 1 Comparison of general information between the non-DN group and DN group

2.2 变量筛选

使用LASSO 回归分析,对18 个变量进行非零系数预测变量的筛选(图1)。在λ 最小值(λ=0.005)和最小值的1 SE(λ=0.035)处分别绘制垂直线,最终选取最小10 倍交叉验证误差1 SE 为最优值,并筛选出5个非零系数的预测变量,包括糖尿病病程、TC、Scr、高血压、Upn。

图1 使用LASSO 回归模型筛选预测变量Figure 1 LASSO regression model used to screen the predictor variables

2.3 构建预测模型

2.3.1 多因素Logistic 回归分析:以T2DM 患者是否并发DN(赋值:否=0,是=1)为因变量,以LASSO 回归筛选出的5 个变量糖尿病病程(赋值:实测值)、TC(赋值:实测值)、Scr(赋值:实测值)、高血压(赋值:否=0,是=1)、Upn(赋值:-=0,+=1,++=2,+++=3)作为自变量构建条件多因素Logistic 回归预测模型,结果显示,5 个变量均是T2DM 患者并发DN 的危险因素(P<0.05),其中高血压患者发生DN 的风险是无高血压患者的2.174 倍(95%CI=1.517~3.137,P<0.001),见表2。

表2 T2DM 患者并发DN 风险的多因素Logistic 回归分析Table 2 Multivariate Logistic regression analysis used to analyze the influencing factors of DN in T2DM patients

2.3.2 列线图绘制:结合分析结果绘制列线图(图2),将各变量的分数相加得到总分。通过总分向下绘制一条垂直线可以标出T2DM 患者并发DN 风险的估计概率。以糖尿病病程的中位数(M=10年)、TC的中位数(M=4.14 mmol/L)、Scr 的中位数(M=74 μmol/L)、Upn(++)且患有高血压为例,总分为128 分,T2DM 患者并发DN 的风险为85%。

图2 T2DM 患者并发DN 风险的预测列线图Figure 2 Nomogram for predicting the risk of DN in patients with T2DM

2.4 验证模型

通过ROC 曲线对T2DM 患者并发DN 风险的模型进行区分度评估,结果显示,训练组的AUC 为0.866(95%CI=0.839~0.894)(图3A),验证组的AUC 为0.849(95%CI=0.804~0.889)(图3B)。同时,校准度通过Hosmer-Lemeshow 拟合优度检验进行评估,结果显示训练组最大偏移量(Emax)为0.050,最小偏移量(Eavg)为0.024(P=0.748)(图4A);验证组Emax 为0.030,Eavg 为0.014(P=0.986)(图4B),两组均通过校准度检验。

图3 列线图预测模型预测DN 风险的ROC 曲线Figure 3 ROC curve of the nomogram prediction model to predict the risk of DN

图4 预测模型的Hosmer-Lemeshow 校准曲线Figure 4 Hosmer-Lemeshow calibration curve of the prediction model

2.5 临床应用

采用DCA 评价预测模型在临床上的有效性(图5),结果显示,在当前研究中若患者或医师的阈值概率介于0.15~0.95,则对所有患者采取干预措施相比,采用此列线图对DN 的风险进行预测更有利。假定选择预测概率为60%(高风险阈值为0.6)诊断为DN 并进行治疗的患者,那么每100 例使用本列线图预测模型的患者,大约有50 例(净收益为0.5)能从中获益并且不损伤其他人的利益。

图5 预测模型的DCA 分析Figure 5 DCA analysis of the prediction model

3 讨论

本研究通过LASSO 回归、多因素Logistic 回归,筛选T2DM 患者并发DN 的风险因素,建立预测模型。筛选出5 个预测变量包括糖尿病病程、TC、Scr、高血压和Upn。其次,基于筛选出的独立风险因素构建列线图预测模型,并利用AUC、校准曲线Hosmer-Lemeshow和DCA 分析对预测模型的区分度、准确度和临床有效性进行验证。结果显示5 个变量均是T2DM 患者并发DN 风险的影响因素,预测模型有良好的区分能力,同时该模型预测概率与实际概率基本一致,具有较好的校准度。此外,校准曲线在训练组和验证组中均显示了良好的校正能力。净效益具有可比性。综上可以看出预测模型在训练组和验证组均有具有较强的区分度和预测能力。

本研究采用LASSO 回归分析方法筛选独立风险因素,不论因变量的类型如何都可以进行建模预测,通过对所有变量的系数进行回归惩罚,使相对不重要的自变量系数变为零,从而提高模型的稳定性。通过将Logistic 回归形式进行转化,使用列线图对临床预测模型可视化[9-11],使用者可以直接从图中读取模型预测结局的概率值[12],目前也有大量研究使用机器学习算法改进和训练Nomogram 预测模型,并将其用于乳腺癌[13]、结肠癌[14-15]等疾病的生存预测。

对预测模型的验证使用AUC 和DCA。本研究的预测模型训练组DN 发生风险的AUC 为0.866(95%CI=0.839~0.894),预测模型验证组DN 发生风险 的AUC 为0.849(95%CI=0.804~0.889)。XI 等[16]构建的DN 风险预测模型共纳入10 个指标,其中包括性别、年龄、高血压、Scr、糖尿病病程、BMI 以及尿氮水平等,其AUC 为0.813(95%CI=0.778~0.848)。本研究排除性别、年龄指标外纳入的指标与其相似,但效能相对较优。相比SHI 等[17]构建的预测模型(AUC=0.807,95%CI=0.784~0.830)也具有较好的效能。此外,本研究基于实验室检测变量的结果与侯新月等[18](AUC=0.852,95%CI=0.822~0.882)和HUI 等[19](AUC=0.862,95%CI=0.834~0.890)构建的预测模型结果相似。校准曲线Hosmer-Lemeshow 模型拟合良好(训练组P=0.748;验证组P=0.986)。DCA 显示当患者的阈值概率为0.15~0.95 时,使用列线图预测模型预测DN更有益。

该预测模型提示,对于糖尿病病程较长的T2DM 患者,应尽早采取降压、降脂、低盐饮食和改善肾脏功能等措施降低发生DN 的风险。有研究表明,糖尿病病程与DN 的发生、发展有着密切的关系,10 年以上的T2DM 患者会逐渐发展为大量蛋白尿[20-21],发生DN的风险更高。本研究发现,是否患有高血压是T2DM 患者并发DN 的风险因素,这与BASHIR 等[22]的研究结果相似。田蓉等[23]发现DN 组的SBP 明显高于无DN 组。原因是当血压升高时,机体肾血流灌注量增加,损害微血管内皮细胞并进一步加快肾脏微血管病变进程,使T2DM 患者肾脏严重受损,DN 发生风险显著增大[24-25]。有研究发现研究组的尿蛋白和尿微量白蛋白均显著高于健康组与对照组[26]。根据相关临床研究显示,当其肾脏功能严重损害后,其大分子蛋白会渗入尿液,导致尿蛋白过高[27-28]。本研究结果也显示Upn 是T2DM 患者并发DN 的风险因素。根据《中国2 型糖尿病防治指南(2010 年版)》[6],在常规控糖基础上应行血压控制可延缓DN 进展。结合以上结果可以发现,高血压可以加速DN 的尿蛋白析出,这提示T2DM 合并高血压患者,把血压控制在125/75 mmHg(1 mmHg=0.133 kPa)左右可以延缓DN 的发生和发展。

有研究发现TC 在肾病发生、发展以及预后的过程中都起着非常重要的作用[29]。本研究发现TC 与DN 发生风险呈正相关,其OR 值为1.260(95%CI=1.109~1.439)。周玉萍等[30]发现糖尿病肾损害不断加重,Scr、TC 水平逐渐上升,差异有统计学意义(P<0.01)。这是由于TC 等会改变肾小球基底膜磷酸酯成分或改变机体糖代谢而增加肾小球基底膜的通透性,造成肾脏损伤。Scr 与DN 的发生密切相关[31-32],同时也是评估肾脏功能以及诊断DN 的关键指标,本研究也发现Scr 与DN 发生风险呈正相关,OR 值为1.008(95%CI=1.004~1.013)。有研究提示肾小球滤过功能出现严重损伤时Scr 水平将会升高[33]。

本研究存在一些不足之处。首先,在风险因素的分析上,预测模型未能考虑到T2DM 患者的日常生活环境和饮食习惯等潜在因素,这可能导致某些信息的偏倚或者患者的选择偏倚,研究结果与真实结果可能产生偏差。其次,本研究是回顾性横断面单中心研究,未利用外部验证对模型的预测效能进行进一步评估。在后续研究中将会借助数据库的样本数据对该列线图进行外部验证,同时将对不同地区、多中心的大样本数据进一步验证,以提升该模型的预测精度和通用性。

综上所述,本研究发现糖尿病病程、TC、Scr、高血压、Upn 是T2DM 患者并发DN 的风险因素,建立了T2DM患者发生DN 风险的预测模型,其具有良好的预测能力和临床实用性,可为临床医生及早有效地诊断提供决策依据。治疗DN 的关键在于控制糖尿病的进展,通过低盐饮食、降压、降脂、戒烟、戒酒和定期的医学检查等,预防肾脏的进一步损伤,以防止或减少DN 的发生。

作者贡献:韩俊杰提出研究思路和设计方案,负责论文起草;武迪负责数据整理、清洗、统计学分析及临床预测模型的构建;陈志胜负责数据采集;肖扬提出对变量筛选的方法,负责数据预处理及论文修改;森干负责研究构思与设计,负责调查对象的选取,对论文负责;所有作者阅读并修订了最终稿件。

本文无利益冲突。

猜你喜欢
线图变量高血压
全国高血压日
抓住不变量解题
预测瘢痕子宫阴道试产失败的风险列线图模型建立
也谈分离变量
基于箱线图的出厂水和管网水水质分析
如何把高血压“吃”回去?
高血压,并非一降了之
东山头遗址采集石器线图
SL(3,3n)和SU(3,3n)的第一Cartan不变量
分离变量法:常见的通性通法