苏丽平,陈杭,唐苏丹,夏雨薇,胡勇,刘丹*
1.重庆医科大学附属永川医院放射科,重庆 永川 402160;2.慧影医疗科技(北京)有限公司,北京 100192;*通信作者刘丹 5677676@qq.com
中国是全球糖尿病(diabetes mellitus,DM)流行形势较为严峻的国家,DM发病率逐年上升,发病年龄呈年轻化趋势[1]。DM主要由基因、饮食习惯、生活方式共同作用使胰岛细胞分泌缺陷或生物作用损伤导致,其并发症较多,尤其是心脑血管方面的并发症引起的致死率及致残率居高不下,过早且严重影响患者的精神及生活质量,甚至提高了后代DM的发病风险[1]。伴随DM胰腺的不同功能状态,胰腺会出现微观的病理改变,病程足够长时则会出现形态、密度及体积的变化。近年针对DM胰腺CT、MR多参数的研究逐渐增多,大多集中于胰腺体积、密度及定量方面的研究,基于CT图像的纹理特征分析鲜见报道[2-3]。本研究基于胰腺多层螺旋CT图像,引入影像组学技术,通过胰腺CT图像纹理信息结合机器学习方法建立模型,探讨DM患者、糖耐量调节受损(impaired glucose regulation,IGR)患者及正常人胰腺CT纹理特征的差异,对DM患者胰腺改变进行分类诊断,为临床制订治疗方案提供参考。
1.1 研究对象 回顾性分析2015年9月—2019年12月在重庆医科大学附属永川医院行腹部CT检查的成年患者140例。DM组纳入标准:确诊为DM,均符合《中国2型糖尿病防治指南》中的诊断标准[4],即静脉空腹血糖(fasting plasma glucose,FPG)≥7.0 mmol/L,糖负荷后2 h血糖(2 hour postprandial blood glucose,2 h PPG)≥11.1 mmol/L;共纳入52例,男24例,女28例;年龄16~87岁,平均(52±14)岁。IGR组纳入标准:①空腹血糖受损,6.1 mmol/L≤FPG<7.0 mmol/L,且2 h PPG<7.8 mmol/L;②糖耐量减低,FPG<7.0 mmol/L,7.8 mmol/L≤2 h PPG<11.1 mmol/L;共纳入35例,男20例,女15例,年龄23~93岁,平均(65±14)岁。正常组纳入标准:无DM和糖耐量异常、无胰腺病变、无肝肾功能异常;共纳入53例,男37例,女16例;年龄15~84岁,平均(64±14)岁。排除标准:既往有胰腺手术史、急慢性胰腺炎、胰腺肿瘤、胰腺周围积液、伪影干扰明显。最终纳入的研究对象人口学及临床特征见表1。本研究经重庆医科大学附属永川医院临床试验伦理委员会核准,患者签署知情同意书。
表1 3组研究对象的人口及临床特征
1.2 CT检查 采用飞利浦Brilliance 256iCT行上腹部螺旋CT扫描,扫描范围从膈肌下至肾脏下极。扫描前0.5 h饮水500 ml,仰卧位,头先进;扫描参数:管电压120 kV,智能毫安秒,层厚5 mm,层间隔5 mm,螺距0.984~1.375,视野60~70 cm,矩阵512×512。
1.3 图像三维容积感兴趣区(volume of interest,VOI)选取 将扫描获得的原始DICOM图像导入Radcloud放射组学云平台(大数据智能分析云平台,慧影医疗科技有限公司)进行数据后处理,由1名经验丰富的放射科副主任医师和1名主治医师采用盲法审阅图像,由主治医师采用手动方式在CT平扫图像上沿胰腺边缘逐层勾画感兴趣区,计算机自动生成胰腺的VOI,由副主任医师检查勾画结果,最终由高年资医师决定胰腺边界,最终生成140个VOI,见图1。
1.4 特征提取 使用Radcloud(汇影医疗技术有限公司)处理成像数据,临床数据管理以及随后的放射组学统计分析。使用Radcloud平台从CT图像中提取共1 395个定量成像特征。上述特征分为3类:①一阶统计特征(first order),由126个定量描述CT图像中体素强度分布的特征值组成;②形状和大小特征(shape and size),反映了区域的形状和大小;③纹理特征(texture features),描述胰腺区域异质性差异,包括灰度游程长度和灰度共生纹理矩阵特征。
1.5 特征选择及模型构建 胰腺体积因年龄、性别、体质量指数不同而存在差异,此外部分患者胰腺与周围组织存在容积效应影响,本研究去除Shape类相关特征。随后采用方差阈值(方差阈值=0.8),选择方差大于阈值的特征,从1 395个特征中选择358个特征;再采用单变量特征选择方法,在上一步特征值中选择221个特征。最后采用最小绝对收缩算子(least absolute shrinkage and selection operator,LASSO)算法进行特征值最终降维。
1.6 统计学方法 在Radcloud平台上进行统计分析。将样本随机分为训练集与测试集,使用降维后的特征与临床感兴趣的信息建立机器学习模型,根据选定的特征值,使用3个学习模型,K-邻近算法(k-NearestNeighbor,KNN)、支持向量机(support vector machin,SVM)和逻辑回归(logistic regression,LR)。70%的VOI样本做训练集训练机器学习模型,30%的样本做测试集对模型的准确性进行评估,通过计算获得受试者工作特征(ROC)曲线及曲线下面积(AUC)、敏感度、特异度,并对比其诊断效能。
2.1 影像特征结果 首先使用方差阈值方法(图2)从1 395个特征中选择358个特征,然后选择K个最佳方法,进而选择221个特征(图3),最后使用LASSO算法得到正常人、IGR患者、DM患者三者间鉴别14个最优特征,其中包括一级统计特征1个、纹理特征13个(表2),算法见图4。
表2 所选的放射性特征及其相关的特征组和过滤器
2.2 3个机器模型的预测表现
2.2.1 3个模型训练集和验证集的ROC曲线 KNN学习模型、SVM机器学习模型、LR机器学习模型的训练集和测试集ROC曲线见图5。
2.2.2 3个模型训练集和验证集鉴别3组胰腺功能的效能 KNN、SVM、LR 3种机器学习模型训练集和测试集的AUC值、敏感度、特异度见表3、4。
表3 3种机器学习模型训练集鉴别3组胰腺功能的AUC、敏感度、特异度
DM发生与发展的影响因素较多,胰岛β细胞功能损伤或缺陷是其主要原因。除细胞衰老、凋亡及外界长期理化因素的刺激导致胰岛β细胞功能损伤外,基因遗传缺陷也是胰岛β细胞功能受损的重要病因。DM因早期缺乏特异性和典型的临床症状,潜伏时间可长达9~12年,发病就诊时可能已对机体各系统造成了不可逆的损伤[5-8]。研究表明,DM前期患者即出现胰岛素抵抗,与胰多肽分泌严重不足有关,胰多肽可以提高细胞组织对胰岛素的敏感性,胰岛素需求量相应增加,促进β细胞合成与分泌胰岛素[9-10]。当出现胰岛素抵抗时,胰岛素抵抗引起胰岛细胞功能紊乱,导致IGR,
既往研究利用CT成像测量健康人群和DM患者间胰腺体积的差异。范蒙[6]、袁永丰等[11]对2型DM患者胰腺进行CT测量,发现DM患者较健康人群胰腺体积明显萎缩,密度减低。李军宅等[12]对40例DM患者进行研究,发现男性DM患者胰腺与正常人群无显著差异。胰腺形态学变化可用于评价DM进程,但存在争议,单纯的形态学变化不能完全反映胰腺功能。CT灌注可以对DM患者的胰腺生理及病理状态进行显像,但可能会造成辐射剂损伤,使其推广受到限制[5]。扩散加权成像能反映胰腺的功能改变,随着DM患者病程增加,胰腺表观扩散系数(ADC)值减低;但是不同机型及扫描参数对ADC值的影响较大,可重复性差,且所测量感兴趣小区域的平均ADC值不能真实地反映整个胰腺组织的功能状态[13]。近年对于DM患者胰腺功能的研究逐渐增多,余顺等[14]利用MR Dixon技术对DM患者胰腺进行脂肪定量研究,发现胰腺脂肪沉积是DM的危险因素。王亮[15]基于糖耐量减低人群、2型DM患者和正常成人之间胰腺微循环的差异,采用动态对比增强MRI分析,对胰腺胰岛细胞的功能进行动态观察。影像组学在胰腺囊性肿瘤的鉴别诊断及风险分层中具有巨大价值,也有学者利用影像组学对胰持续不断的负荷使胰腺胰岛细胞功能衰竭,从而导致DM的发生。因此,DM前期胰腺功能诊断尤为重要。腺癌的病理分化进行评估,均是基于不同分化程度的肿瘤在病理基础上的差异实现的[16-17]。IGR和DM的发生与发展均与胰腺功能,即β细胞功能相关,无论是后天因素还是基因调控水平所致的胰腺β细胞功能障碍,均必然存在微观病理改变。上述研究使用CT或MRI图像进行研究,多受限于宏观改变不能反映其变化特点,也很少将IGR患者纳入研究。本研究引入图像纹理分析技术,可以从CT图像中提取人眼不可见的、高维的、抽象的纹理特征进行量化分析[18],建立相关分类模型对正常人群、IGR患者、DM患者的胰腺进行分类鉴别,并进一步计算各模型的鉴别诊断能力,预测患者的疗效和预后。
表4 3种机器学习模型测试集鉴别3组胰腺功能的AUC、敏感度、特异度
本研究对140例胰腺CT平扫图像进行特征提取,鉴于DM患者胰腺体积变化存在争议,排除了shape类特征,初始共1 395个特征,经降维后最终得到与三者鉴别相关的特征14个,包含一阶统计量1个:偏度(Skewness),是基于统计学的图像纹理特征,反映灰度直方图的尾部在某方向上拉长的程度[19],与基因突变相关,反映器官的异质性,本研究表明偏度在一定程度上与三类人群胰腺异质性相关[20];GLRLM 3个(Long Run Low Gray Level Emphasis等),从结果来看,DM患者及IGR患者较健康人群具有更粗糙的纹理模式和更大的强度值差异,尤其DM患者胰腺组织强度更不均,外观更暗,可能是由于DM患者胰腺组织纤维化的原因;GLDM 2个(Large Dependence Low Gray Level Emphasis等)及GLSZM 8个(Large Area Low Gray Level Emphasis等),表明DM患者胰腺纹理模式较IGR患者、健康人群质地更粗、灰度强度水平更亮[21]。
本研究发现,KNN、SVM、LR 3种机器学习模型训练集的AUC值为0.81~0.99,在正常人群、IGR患者、DM患者胰腺纹理特征方面具有良好的鉴别能力,其中SVM AUC值较高;LR模型的敏感度在三者中最高,而3个模型均具有较高的特异度。在验证集,各机器学习模型表现出不同的鉴别诊断效能,AUC值为0.63~0.88,各分类器敏感度较训练集低,但同样保持较高的特异度,可能是因为验证集的样本量较小。验证集的AUC表明3种模型均可用于鉴别正常人群、IGR患者及DM患者的胰腺功能状态,其中验证集中SVM、LR模型AUC值较大,明显优于随机猜测,可以认为SVM、LR模型具有相对较高的鉴别诊断效能。基于CT纹理分析技术避免了影像医师本身对于CT影像特征判读的主观倾向,通过计算机深度挖掘并整合二维图像中大量的肉眼无法识别和区分的高维数字信息,从而提高IGR患者和DM患者胰腺功能改变的鉴别诊断效能,相对于常规CT测量DM患者胰腺体积变化,本研究表明对胰腺实质的纹理分析可以间接反映胰腺的功能状态,甚至可能提前诊断出DM前期状态,提早发现胰腺功能衰退,有助于对DM患者进行早期干预,延缓DM的发展,避免DM严重并发症的发生。
本研究也存在一定的局限性:①为回顾性分析,且未对图像进行标准化处理;②样本量偏小,尤其是IGR患者,且为单中心研究;③仅对CT平扫图像、单个模型分析;④与大多数其他胰腺影像学研究相比,同样缺乏组织活检以进行组织病理学验证。未来将通过纳入胰腺CT增强图像和MR图像进行研究,以及多中心合作扩大样本量,以验证和提高预测模型的可靠性和稳定性。
综上所述,基于胰腺CT图像的纹理分析可能是鉴别DM相关患者胰腺功能状态的有用工具,研究中的模型对正常人群、IGR患者、DM患者间胰腺的差异具有可靠的鉴别能力,有良好的特异度和敏感度。该方法是除形态学特征外的新技术,是未来医学人工智能化的基础,对DM前期的诊断、DM的病情严重程度的判断和治疗随访提供辅助信息。
志谢:感谢重庆医科大学附属永川医院放射科王兴兰老师、向春红同学对此论文提供的帮助。