运用机器学习算法探索2型糖尿病临床代谢亚型的研究

2021-09-01 09:12孙敏娴张红梅毛红易兰周婕
临床内科杂志 2021年8期
关键词:基础代谢率体脂率骨骼肌

孙敏娴 张红梅 毛红 易兰 周婕

糖尿病是目前最常见的慢性非传染性疾病之一,我国糖尿病患者数量居世界首位,其患病率从1980年的0.67%上升至2017年的11.2%[1-2]。糖尿病患者临床特征多样,精准医疗的需求显得越来越重要[3]。机器学习可通过自动学习大量输入的数据样本内在结构和规则,对新样本进行智能辨识,甚至实现对未来的预测,符合精准医疗的需求,在医学领域已得到越来越广泛的应用。我们收集了1 487例新诊断2型糖尿病(T2DM)患者的人体成分、生化指标等数据,应用机器学习建模方法对T2DM不同代谢表型进行分类预测,旨在为T2DM精准医疗提供依据。

对象与方法

1.对象:收集2017年8月~2019年1月于我科住院的1 487例新诊断T2DM患者的临床资料。纳入标准:(1)T2DM符合WHO 1999糖尿病诊断标准;(2)年龄≥20岁。排除标准:1型糖尿病、妊娠期糖尿病及其他类型糖尿病;合并感染、急性糖尿病并发症、急性心脑血管疾病、急性消化系统疾病、严重肝肾功能不全、自身免疫系统疾病、肿瘤性疾病、甲状腺功能异常。患者均自愿参与本研究并签署知情同意书。

2.方法

(1)一般资料收集和体格检查:收集患者的性别、年龄、烟酒嗜好、基础疾病病史、目前用药情况。测定患者的身高、腰围、臀围、血压、心率。腰围测量方法:腋中线髂前上棘与十二肋骨下缘连线的中点,沿水平方向围绕腹部一周。臀围测量方法:沿股骨大转子水平测量臀部最大周径。

(2)人体成分分析:使用清华同方人体成分分析仪BCA-1B获取人体成分数据。要求所有受试者测试前6 h内禁止剧烈活动,测试当天空腹、排空大小便、脱去鞋袜、着薄衣,双脚平行站于足形电极上,双手握住手柄电极(拇指在上,其余四指在下),双臂伸直外展30°。测量过程中保持安静,不做身体移动。分析指标包括体重、BMI、腰臀比、体脂率、总水分、脂肪、骨质、蛋白质、肌肉、瘦体重、骨骼肌、基础代谢率。

(3)生化指标检测:患者空腹8~10 h后于次日清晨采集静脉血,检测糖化血红蛋白(HbA1c)、ALT、白蛋白(Alb)、空腹血糖(FPG)、血尿素氮(BUN)、血肌酐(SCr)、尿酸(UA)、甘油三酯(TG)、总胆固醇(TC)、低密度脂蛋白胆固醇(LDL-C)和Hb。

结 果

1.T2DM患者的一般资料、人体成分与生化指标情况:首先对1 487例数据进行初步筛选,剔除部分有记录缺失或不完整样本,获得合格样本1 146例。除性别为分类变量外,其余均为数值变量,经Box-Cox转换后均符合正态分布。1 146例合格样本的一般资料、人体成分与生化指标情况见表1。

表1 1 146例T2DM患者一般资料、人体成分与生化指标情况

2.T2DM患者临床代谢亚型的聚类分析:相关指标的聚类分析结果见图1,临床代谢亚型的最佳分类为3个。将3个临床代谢亚型与原始指标结合,利用随机森林筛选临床数据的特征指标见表2。平均准确度下降主要从精确度来衡量变量重要性,平均基尼指数下降主要从基尼指数来衡量变量重要性。由此筛选出10个作为临床代谢亚型的敏感特征指标,按基尼指数排序依次为骨质(181.814)、骨骼肌(177.686)、体重(114.874)、体脂率(61.12)、基础代谢率(40.225)、腰臀比(24.934)、SCr(17.221)、BMI(12.886)、Hb(12.339)和年龄(11.748)。在筛选出上述10个特征指标后再次进行聚类分析,提取3个亚型的特征值,并用雷达图对这3种亚型的特征进行临床归纳和可视化(图2):A型(高瘦体重型):骨质、骨骼肌、体重、基础代谢率高,体脂率低;B型(少肌少脂低体重型):体重、BMI、骨质、骨骼肌、脂肪、体脂率、腰臀比均低,基础代谢率极低;C型(高脂肪型):脂肪、体脂率、BMI、腰臀比大,骨骼肌、骨质较少,基础代谢率较低。

图1 1 146例T2DM患者代谢亚型相关指标的聚类分析结果[A:t-分布式随机邻域嵌入(T-SNE)显示3个分类的聚类效果;B:层次聚类的聚类效果]

图2 3种临床代谢亚型的特征变量雷达图

表2 影响T2DM代谢亚型指标的平均准确度下降及平均基尼指数下降情况

3.T2DM患者代谢亚型的决策树分析及预测评估:通过决策树分析,自动将所有特征指标进行离散化,结果显示仅需5个变量即可对3种代谢亚型进行判断,这5个特征变量及其诊断点分别是:骨骼肌(诊断点为34 kg)、脂肪(诊断点为20 kg)、体脂率(诊断点为33%)、体重(诊断点为63 kg)和腰臀比(诊断点为0.89),绘制出决策树流程图见图3。在1 146例T2DM患者的临床数据中,验证集取源数据的1/3(即382例),决策树模型的预测准确度为91.36%,kappa一致性指数为0.868(>0.75),模型拟合效果较好。见表3。

图3 决策树流程图

表3 决策树模型的预测结果[例,(%)]

讨 论

在糖尿病领域,近年来逐渐出现运用机器学习算法进行糖尿病分型[5-6]、诊断[7]、预测[8]等方面的研究,其中糖尿病分型的目的是对病因、自然病史、遗传学、临床表型和最佳治疗方法进行更个体化的治疗[9]。随着研究不断深入,糖尿病分型也在细化[5-6,10],以满足临床精准医疗的需求。与之前糖尿病分类所纳入的变量不同[5-6],本研究基于T2DM患者人体成分分析的大数据进行聚类分析,利用随机森林筛选临床数据的特征量,最终得出5个人体成分的相关变量(骨骼肌、脂肪、体脂率、体重和腰臀比)作为特征指标,从而进一步明确亚型的特点,且本研究决策树模型的预测结果提示,其对于糖尿病代谢亚型的预测准确度达91.36%。

人体成分是指人体所有组织器官的总成分,分为脂肪和非脂肪两部分,后者称为瘦体重(主要成分为肌肉、骨骼等)。瘦体重与基础代谢具有相关性:性别与年龄对基础代谢率的影响与瘦体重相关,男性的瘦体重高于女性,因此男性基础代谢率高于女性;随着年龄的增加,瘦体重逐渐下降,因此基础代谢率随年龄增大逐渐减低[11]。我们既往的研究发现,T2DM患者的BMI与基础代谢率呈正相关,同时瘦体重是影响基础代谢率的主要因素,瘦体重与基础代谢率呈显著正相关[12]。本研究中机器学习探索的3个糖尿病临床亚型基础代谢特点与上述情况相符:具有高瘦体重的A型伴有高基础代谢率,少肌少脂低体重的B型基础代谢率最低,而高脂肪低瘦体重的C型基础代谢率较低。另一方面,人体成分的异常变化也与多种代谢性疾病相关:肥胖常伴随脂肪代谢障碍,脂肪含量(尤其是内脏脂肪)增加是T2DM、代谢综合征、缺血性心脑血管病的高危因素。中国超重与肥胖人群的糖尿病患病率分别为12.8%和18.5%[13];而在糖尿病患者中超重比例为41.0%,肥胖比例为24.3%,腹型肥胖比例高达45.4%[14]。骨骼肌是胰岛素介导代谢葡萄糖的主要场所之一,骨骼肌丢失使得胰岛素敏感性下降,葡萄糖的代谢更差,同时出现高胰岛素血症,进一步升高血糖[15]。有研究显示,老年T2DM患者肌少症的患病率约为14.85%[16]。尽管体脂率相当,伴肌少症的T2DM患者骨骼肌量、体脂含量及基础代谢率均低于不伴肌少症的T2DM对照组[15]。肌少症与肥胖共存时被称为肌少性肥胖(SO),类似于本研究中的C型。与单纯性肥胖者相比,SO患者同时存在肥胖和肌肉量下降,胰岛素抵抗更严重,血糖控制更差。另外,低骨密度或骨质疏松与肌少症共存时称为“骨骼肌肉减少症”[17],两者均影响人体正常活动,增加骨折发生率及住院率,降低生活质量。

在糖尿病的治疗过程中,尤其要注意控制饮食及减重过程中带来的人体成分变化。理想的体重控制应达到脂肪含量的最大限度下降,而瘦体重无明显下降,达到合适的体脂率,避免盲目节食或不合适运动所导致肌少症、骨质疏松或骨骼肌肉减少症的发生[18]。尽管体重、BMI、腰围、腰臀比是目前评估肥胖的主要指标,在代谢性疾病及心血管疾病的风险评估方面具有重要意义,但这些指标不能全面反映人体成分情况。因此,纳入人体成分的糖尿病亚型分类可以帮助更精准地进行饮食和运动指导,有利于糖尿病及相关代谢性疾病的控制。本研究发现的3个糖尿病亚型中,A型(高瘦体重型)伴有高基础代谢率,需要适当增加每日热量的摄入以满足身体每日需要;B型(少肌少脂低体重型)需要进行增肌运动,增加热量摄入增肌增脂;C型(高脂肪型)高脂肪同时伴低瘦体重,需要着眼于减脂增肌运动,控制热量摄入。

综上所述,本研究基于临床大数据及人工智能计算机学习方法对T2DM进行进一步的临床代谢类型分型,但这种分型方法也存在不同程度的局限性,仅能与传统的分型互相补充,而非替代。机器学习是通过统计学方法针对临床数据得出的结论,探索T2DM可能的临床代谢亚型,但仍需要更多基础研究来证实其潜在的机制。随着临床医学研究技术的不断发展,样本数量及临床特征的不断积累,人工智能方法能更好地利用这些医疗大数据挖掘其中隐藏的规律和信息知识,为临床医疗决策提供支持。

猜你喜欢
基础代谢率体脂率骨骼肌
鸢尾素(Irisin):运动诱导骨骼肌自噬的新靶点
胖不胖?体脂说了算
不胖不瘦,需要运动锻炼吗?
运动与骨骼肌的重构研究
剔除巨噬细胞可通过抑制肌再生因子和Akt/mTOR信号通路损害骨骼肌再生
她们为什么“死吃不胖”
IL-15与骨骼肌能量代谢调控研究进展
体脂率下降5%后,你的身体会发生怎样的变化
解读“大胃王”的秘密
她们为什么“死吃不胖”?