【摘 要】目的:探讨机器学习结合CT影像组学特征构建模型预测2型糖尿病(type 2 diabetes mellitus,T2DM)患者椎体脆性骨折的准确性。方法:回顾性收集140例(新发椎体脆性骨折的T2DM患者70例,对照组70例)患者CT图像和临床资料。另收集18例(椎体脆性骨折的T2DM患者16例,对照组2例)患者的前次CT图像和临床资料作为外部验证集。应用单因素分析、Pear⁃son相关分析、最小冗余度最大相关度算法、二元logistic回归分析和最小绝对值收缩和选择算子模型筛选出最佳特征。基于支持向量机、多层感知器、极端梯度提升(eXtreme Gradient Boosting,XGBoost)构建预测模型。应用受试者工作特征曲线下面积(area under the curve,AUC)对模型效能进行评估。结果:从每例患者的CT图像中提取了1 037个影像组学特征,然后精简为14个影像组学特征。17个临床特征中性别、年龄、体质指数是预测结果的独立因素。其中XGBoost分类器表现最好,训练集中XGBoost模型的AUC分别为1.000、0.929、1.000;测试集中分别为0.954、0.862、0.969。结论:基于临床及影像组学特征构建的XGBoost模型可作为预测T2DM患者椎体脆性骨折的一种无创性辅助工具。
【关键词】影像组学;机器学习;2型糖尿病;脆性骨折;计算机体层成像
【中图分类号】R319;R587;R814.42 【文献标志码】A 【收稿日期】2024-02-01
随着人口老龄化问题的加剧,2型糖尿病(type2 diabetes mellitus,T2DM)与骨质疏松发病率逐年升高。越来越多的证据表明,2型糖尿病可能增加患者骨骼脆性,导致骨折风险[1-2]和死亡率增加[3-4],因此T2DM患者尽早做好骨质健康管理具有重要的临床意义。然而,目前的骨折风险评估工具不能充分预测T2DM 患者的骨折风险,这引发了大家对T2DM患者骨骼健康的关注。
对于患者的治疗效果和生存周期来说,精确的诊断和预测至关重要。在这个领域,机器学习算法已成为不可或缺的工具,它可以挖掘大量临床信息,比传统方法具有更高的准确性和敏感性[5]。影像组学则是从医学图像中提取定量指标,通过使用高级数据模型算法对这些特征进行进一步分析,可以发现肉眼无法识别的影像特征[6-7]。本研究应用先进的机器学习算法,提取高通量影像组学特征,可以将椎体CT图像中所包含的肉眼无法观测到的骨质结构信息量化并应用于诊断,探讨机器学习结合影像组学预测T2DM患者椎体脆性骨折的价值。
1 资料与方法
1.1 研究对象
收集重庆医科大学附属第三医院2016年至2023年收治的70例新发椎体脆性骨折的T2DM患者作为病例组。男性20例,女性50例,平均年龄(71.06±9.52)岁,年龄范围为43~90岁。病例组纳入标准:①确诊为2型糖尿病;②2周内受到轻微创伤(相当于从站立高度或更低的高度跌倒)发生椎体脆性骨折;③或者无明确外伤史,1周内经磁共振确诊为新发椎体脆性骨折;④有覆盖骨折椎体的CT平扫检查;⑤人口统计学和常规实验室检查完整。排除标准:①存在引起继发性骨质疏松的基础疾病,如库欣综合征、高泌乳素血症、吸收不良综合征和各种胃肠道疾病(克罗恩病、慢性胰腺炎);②影响骨代谢的基础疾病,如甲状旁腺功能亢进或低下、甲状腺功能亢进或低下、成骨不全症、骨软化症、佩吉特骨病;③脊柱多发肿瘤,如骨髓瘤、转移瘤等。将椎体分为3个区域,T1~T10为胸段,T11~L1为胸腰段,L2~L5为腰段[8]。纳入的患者中,骨折部位分别为:胸段(n=7)、胸腰段(n=42)、腰段(n=21)。
对照组纳入标准为:①确诊为T2DM;②经双能X线吸收测量仪(dual-energy X-ray absorptiometry,DXA)检查诊断为骨密度正常;③包含胸腰椎的CT平扫检查。排除标准为:①存在引起继发性骨质疏松的基础疾病,如库欣综合征、高泌乳素血症、吸收不良综合征和各种胃肠道疾病(克罗恩病、慢性胰腺炎);②影响骨代谢的基础疾病,如甲状旁腺功能亢进或低下、甲状腺功能亢进或低下、成骨不全症、骨软化症、佩吉特骨病;③脊柱多发肿瘤,如骨髓瘤、转移瘤等。纳入对照组患者70 例,其中男性47 例,女性23 例,平均年龄(61.83±8.51)岁,年龄范围50~83岁。
此外,收集18例患者(纳排标准同上),这些患者有本次病历前1 年内的相关病历资料,前1 次的病历资料作为外部验证集。其中骨折患者16 例,骨密度正常患者2 例。男性5例,女性13例,平均年龄(71.50±9.65)岁,年龄范围51~90岁。
将病例组和对照组的140例患者按照8∶2比例将数据随机分为训练集(112例)和测试集(28例)。训练集用于构建模型,测试集用于调整模型参数来优化模型性能。外部验证集全程不参与模型的构建,用于评估模型的性能。患者流程见图1。
根据电子病历所记录可获得下列临床数据,人口学特征:包括年龄、性别、体质量指数(body mass index,BMI)、糖尿病病程。考虑到临床指标的适用性,故纳入以下实验室指标:包括糖化血红蛋白、肝功能检查、肾功能检查。
1.2 设备及扫描参数
使用256排螺旋CT(revolution CT,GE),螺距为0.938:1,转速为0.6 s/r。扫描参数方面,采用CT平扫模式,管电压为100 kV,自动管电流调制范围为200~350 mA。图像重建方面,重建间隔为0.625 mm,重建层厚为0.625 mm。
1.3 图像分析
图像分割:运用3D Slicer软件(版本:Slicer 4.11.20210226)将导入的CT平扫图像进行感兴趣区域手动逐层勾画。感兴趣区域选取骨折椎体同区域邻近两个椎体。其中对照组与病例组一一对应。首先,沿着椎体皮质骨的内缘逐层手动勾画,避免包含相邻的椎间盘、椎弓根和脂肪组织,得到ROI-1。接着,使用Margin板块中的Shrink功能将ROI-1部分向内缩小2.5 mm,得到最终三维ROI-2(图2)。由医师A(初级影像医师)完成以上所有ROI勾画。为了评估分割中的观察者间差异,在训练集和测试集标注完成6个月后进行随机抽样,选择60位患者由2名拥有丰富图像分割经验的医师A和B(中级影像医师,从事影像诊断工作11年)重新勾画感兴趣区域。
图像预处理:首先,对ROI进行归一化,将所有影像分辨率调整到一致。然后,使用K近邻插值法将ROI重采样至1 mm×1 mm×1 mm的体素大小。
提取特征:使用Python平台(版本:3.7.6)中的开源软件包PyRadiomics(版本:3.0.1)从ROI中提取一阶特征、形状特征和纹理特征,其中纹理特征包括灰度共生矩阵特征、灰度相关矩阵特征、灰度游程矩阵特征、灰度尺寸区域矩阵特征、相邻灰度差分矩阵特征。
可重复性分析:为评估观察者内和观察者间的一致性,采用组内相关系数(interclass correlation coefficient,ICC)对数据进行分析,并且只保留了ICC值gt;0.75的特征作为进一步的分析对象。
1.4 特征选择、模型构建和验证
特征降维:为了精简影像组学特征,得到最佳特征组合,采用单因素分析、Pearson 相关分析、最小冗余度最大相关度算法(minimum redundancy maximum relevance,mRMR)和最小绝对值收缩和选择算子(least absolute shrinkage andselection operator,Lasso)回归分析逐步筛选特征。
模型构建:将经过Lasso筛选后的影像组学特征纳入3种机器学习算法支持向量机(support vector machine,SVM)、多层感知器(multi-layer perceptron,MLP)、极端梯度提升(eXtreme Gradient Boosting,XGBoost)进行建模。构建影像组学模型、临床模型、临床-影像组学模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线及曲线下面积(area under the curve,AUC)、准确度、灵敏度、特异度、召回率、F1值对模型的预测效能进行评估。
1.5 统计学方法
使用SPSS(版本:26.0)和Python(版本:3.7.6)进行临床资料统计学分析。对于计量资料,采用两独立样本t 检验分析正态分布的数据;采用Mann-Whitney U 检验分析非正态分布的数据;计数资料使用卡方检验或者Fisher精确检验进行分析;然后采用Pearson相关分析来确保特征之间不存在高度相关性(排除相关系数|r|≥0.8的特征);采用二元logistic回归分析得到纳入的临床特征。检验水准α=0.05。
2 结果
2.1 临床基线特征
按照8∶2比例将数据随机分为训练集(112例)和测试集(28例)。在训练集中,患有椎体脆性骨折的患者有56例,未患有椎体脆性骨折的患者有56例。临床特征中性别、年龄、BMI和尿酸这4个特征差异具有统计学意义(表1),接着进行二元logistic回归分析,最终使用性别、年龄、BMI构建临床模型(表2)。
2.2 影像组学特征筛选结果
从ROI-2中共提取1 037个影像组学特征,在经过ICC值筛选和标准化处理后,保留了665个特征进行后续分析。采用单因素分析筛选差异具有统计学意义的特征,共有218个特征有意义(Plt;0.05),Pearson相关分析后46个影像组学特征被保留下来。使用最小冗余度最大相关度算法,选择mRMR排序最高的30个特征。最后进行10折交叉验证得到Lasso模型的最优λ值,根据最优λ值,得到14个回归系数不等于0的影像组学特征(图3)。
2.3 模型构建与评估
基于14个最佳影像组学特征(表3)和3个临床特征通过SVM、MLP、XGBoost分类器分别建立影像组学模型和临床模型。在影像组学模型和临床模型中XGBoost分类器均表现最佳(表4),影像组学模型3个分类器的测试集AUC分别为0.862、0.806、0.954。临床模型3 个分类器的测试集AUC分别为0.778、0.770、0.862。构建结合两者的临床-影像组学模型,并绘制ROC曲线评估模型的预测效能(图4)。测试集中XGBoost模型的AUC分别为0.954、0.862、0.969;准确度分别为0.893、0.821、0.929;灵敏度分别为0.929、0.714、1.000,特异度分别为0.857、0.929、0.857;召回率分别为0.929、0.714、1.000;F1分数为0.897、0.800、0.933。
根据XGBoost分类器构建的临床-影像组学模型,对外部验证集进行验证以了解模型的预测泛化能力。应用ROC曲线分析验证集病例预测的AUC、准确度、灵敏度、特异度、召回率和F1分数分别为0.969、0.944、1.000、0.938、1.000和0.800。
3 讨论
脆性骨折通常指是指受到轻微创伤(相当于从站立高度或更低的高度跌倒)即发生的骨折,其中最常见的是椎体骨折[9]。脆性骨折严重威胁老年患者的生命和健康,常常是导致他们残疾和死亡的主要原因之一。一项针对西班牙老年人群的大样本调查显示,男性T2DM患者髋部骨折后死亡率比非糖尿病患者高出28%,女性则高出57%[10]。护理和治疗骨质疏松症及骨折的成本巨大,给家庭和社会带来了沉重的负担。因此,预防脆性骨折的发生成为了骨质疏松治疗的主要目标之一,有望以此来降低死亡率并减轻社会经济负担。
T2DM患者的骨质疏松常表现出低骨转换率、成骨细胞活性下降和骨修复能力受损等特征,并且T2DM还会影响骨基质、骨结构和骨代谢,这些都难以通过传统的DXA检测,所以DXA可能会低估2型糖尿病患者的骨折风险[11]。世卫组织推荐的骨折风险评估工具(fracture risk assessment tool,FRAX),适用于具有一个或多个脆性骨折临床危险因素,未发生骨折且骨量减少者,特异性不足,并且它在评分时纳入了T1DM风险,但是并未纳入T2DM风险,1项前瞻性研究和1项回顾性研究表明,该评分低估了2 型糖尿病患者骨折风险[12-13],因此FRAX 评分对于T2DM 患者骨折风险的评估也不能满足临床需求。
影像组学是一种新型医学技术,它利用高通量特征提取算法,充分挖掘和分析隐含在图像中的额外信息,超越了传统基于形态学和半定量分析的影像医学模式,为个性化医疗提供更有效的支持[14]。利用机器学习和影像组学预测骨质健康的研究较多,但都存在一定局限性,有待进一步探讨。2022年,Chen YX等[15]利用14 419例糖尿病患者的数据,开发了一种结合XGBoost 和深度神经网络(Deepneural networks,DNN)的混合模型来预测T2DM 患者的骨折风险。此研究同时使用了11种机器学习方法,模型的准确率为67.76%~86.08%,精确度70.41%~87.69%。混合模型获得了最好的性能(准确率90.38%,精确度90.52%,AUC约0.90)。Chu SJ等[16]开发了概率分类向量机算法来构建骨折风险预测模型,而不是普遍使用的算法。结果显示,概率分类向量机获得了最好F1评分(0.97)。Chen的研究确定了18个糖尿病患者骨折风险的影响因素,Chu确定了17个影响因素,但是此两项研究纳入了临床特征,而无影像学特征。为了更准确地预测髋部骨折的风险,Yosibash Z等[17]开发了一种基于CT扫描的自主有限元分析的机器学习算法,用于评估T2DM患者的髋部骨折风险。研究结果显示,该算法在T2DM患者中的敏感性为92%,特异性为88%(交叉验证曲线下面积AUC=0.92),表明此算法结合医学图像,在糖尿病患者骨折风险评估的准确性方面具有更大的优势。本研究将临床数据和CT平扫图像相结合,用机器学习模型评估T2DM患者的椎体骨折风险,也达到了较好的模型效果,外部验证集AUC为0.969。
本研究提取CT 影像组学特征和收集临床资料,经过统计分析,筛选出14个影像组学特征和3个临床特征。本课题组开发并验证了3种基于CT平扫成像和临床特征预测T2DM患者椎体脆性骨折的模型。其中临床-影像组学模型,结合了有意义的临床特征和影像组学特征将参与者分为骨折组和非骨折组,其效能优于单独的影像组学特征模型(在测试集中模型AUC、准确度、灵敏度、特异度、召回率、F1值分别为0.969、0.929、1.000、0.857、1.000、0.933和0.954、0.893、0.929、0.857、0.929、0.897),并且表现出较高的预测效能。研究结果显示高龄、女性、低BMI是脆性骨折的危险因素。随着年龄的增长,骨重建出现了失衡,引发进行性骨丢失。绝经后女性雌激素水平下降,对破骨细胞的抑制作用减弱,导致骨吸收功能增强。高BMI者骨骼承受更大机械负荷,这改善了骨骼的微细结构,增强了机械负荷性细胞刺激因子的作用。这些因子作用于成骨和破骨细胞表面的机械应力感受器,刺激骨形成并抑制骨丢失,从而增加骨密度和骨骼强度。单因素分析中显示,低尿酸也是脆性骨折的危险因素,可能与其具有强烈的抗氧化作用,能清除体内氧化应激产生的氧自由基,避免氧化损伤有关。糖化血红蛋白和糖尿病病程被排除了,可能是因为本研究是回顾性研究且数据量较少,存在数据偏移。
本研究仍存在一定的局限性。首先,样本数量相对较少,所有资料采集自单一中心的病例,这限制了模型的鲁棒性和泛化能力。其次,手动分割椎体,这可能导致观察者之间和观察者内部特征提取的变化,自动分割方法是在未来工作中要解决的另一个问题。脆性骨折给T2DM 患者带来严重的疼痛、残疾、感染等危害,极大地降低了患者的生活质量和生存预期,本研究提出的基于临床资料和CT图像的模型,表现出在预测T2DM患者脆性骨折风险方面的巨大潜力,可以作为放射科医生和临床医生决策时的潜在辅助工具。
参考文献
[1] Janghorbani M,Van Dam RM,Willett WC,et al. Systematic reviewof type 1 and type 2 diabetes mellitus and risk of fracture[J]. Am J Epi⁃demiol,2007,166(5):495-505.
[2] Vestergaard P. Discrepancies in bone mineral density and fracturerisk in patients with type 1 and type 2 diabetes:a meta-analysis[J]. Os⁃teoporos Int,2007,18(4):427-444.
[3] Madsen CM,Jantzen C,Norring-Agerskov D,et al. Excess mortal⁃ity following hip fracture in patients with diabetes according to age:a na⁃tionwide population-based cohort study of 154,047 hip fracture patients[J]. Age Ageing,2019,48(4):559-563.
[4] Martinez-Laguna D,Nogues X,Abrahamsen B,et al. Excess of allcausemortality after a fracture in type 2 diabetic patients:a populationbasedcohort study[J]. Osteoporos Int,2017,28(9):2573-2581.
[5] Sirsat MS,Fermé E,Câmara J. Machine learning for brain stroke:areview[J]. J Stroke Cerebrovasc Dis,2020,29(10):105162.
[6] Mayerhoefer ME,Materka ALangs G,et al. Introduction to ra⁃diomics[J]. J Nucl Med,2020,61(4):488-495.
[7] Kumar V,Gu YH,Basu S,et al. Radiomics:the process and thechallenges[J]. Magn Reson Imaging,2012,30(9):1234-1248.
[8] Muehlematter UJ,Mannil M,Becker AS,et al. Vertebral body in⁃sufficiency fractures:detection of vertebrae at risk on standard CT im⁃ages using texture analysis and machine learning[J]. Eur Radiol,2019,29(5):2207-2217.
[9] Ling X,Cummings SR,Mingwei Q,et al. Vertebral fractures in Bei⁃jing,China:the Beijing osteoporosis project[J]. J Bone Miner Res,2000,15(10):2019-2025.
[10] Tebé C,Martínez-Laguna D,Carbonell-Abella C,et al. The asso⁃ciation between type 2 diabetes mellitus,hip fracture,and post-hip frac⁃ture mortality:a multi-state cohort analysis[J]. Osteoporos Int,2019,30(12):2407-2415.
[11] 卢艳慧,李春霖. 老年2型糖尿病合并骨质疏松的临床进展[J]. 中华糖尿病杂志,2020,12(6):353-356.
Lu YH,Li CL. Clinical progress of senile type 2 diabetes mellitus withosteoporosis[J]. Chin J Diabetes Mellit,2020,12(6):353-356.
[12] Schwartz AV,Vittinghoff E,Bauer DC,et al. Association of BMDand FRAX score with risk of fracture in older adults with type 2 diabetes[J]. JAMA,2011,305(21):2184-2192.
[13] Fraser LA,Pritchard J,Ioannidis G,et al. Clinical risk factors forfracture in diabetes:a matched cohort analysis[J]. J Clin Densitom,2011,14(4):416-421.
[14] 刘泽群,孙文阁. 影像组学在胰腺囊性肿瘤中的应用进展[J].中国医学计算机成像杂志,2022,28(2):221-224.
Liu ZQ,Sun WG. Advances in radiomics ofPancreatic cystic neoplasm[J]. Chin Comput Med Imag,2022,28(2):221-224.
[15] Chen YX,Yang TY,Gao XF,et al. Hybrid deep learning modelfor risk prediction of fracture in patients with diabetes and osteoporosis[J]. Front Med,2022,16(3):496-506.
[16] Chu SJ,Jiang AJ,Chen LZ,et al. Machine learning algorithms forpredicting the risk of fracture in patients with diabetes in China[J]. Heli⁃yon,2023,9(7):e18186.
[17] Yosibash Z,Trabelsi N,Buchnik I,et al. Hip Fracture Risk As⁃sessment in Elderly and Diabetic Patients:Combining Autonomous Fi⁃nite Element Analysis and Machine Learning[J]. J Bone Miner Res,2020,38(6):876-886.
(责任编辑:李青颖)
基金项目:重庆市临床重点专科建设经费及2020年重庆医科大学智慧医学研究资助项目(编号:ZHYX202004)。