李 静,孙静涛*,王可欣,张耀峰,李世佳,王霄英
(1.唐山市妇幼保健院 放射科,河北 唐山063000;2.首都医科大学基础医学院,北京100069;3.北京赛迈特锐医学科技有限公司,北京100069;4.北京大学第一医院 医学影像科,北京100034)
脑胶质瘤是最常见的中枢神经系统(CNS)原发性肿瘤,占原发性CNS肿瘤的32%,占CNS恶性肿瘤的81%,脑胶质瘤年平均发病率为3.19/10万[1]。世界卫生组织(WHO)将脑胶质瘤分为低级别胶质细胞瘤( LGGs,I级或Ⅱ级)和高级别胶质细胞瘤(HGGs,Ⅲ级或Ⅳ级)[2],其中30%是LGGs[3-4],尽管预后相对良好,但几乎所有LGGs最终都会发生恶性转化发展为HGGs,导致高发病率和高死亡率[5]。脑胶质瘤还可以引起一些并发症,如颅内压升高、脑水肿、脑疝和精神疾病等[6]。磁共振成像(MRI)作为一种非侵入式工具,是诊断和监测CNS恶性肿瘤的首选成像方法[7]。常规MRI序列如T1WI、T2WI、T2液体衰减反转恢复序列(T2Flair)和T1对比增强(T1-CE)是脑胶质瘤检查的常规方案[8],在这些序列中,T2Flair是评价脑胶质瘤主要成像序列之一,其在浸润的肿瘤边缘与正常脑组织间具有最佳对比[9],并可以在非强化状态下捕捉一些特征,对肿瘤表型系统地量化[10]。
近年来,计算机视觉和深度学习[11]已经应用于医学成像。图像分割是图像处理技术的基本步骤,可以手动、半自动或自动执行。脑胶质瘤的自动分割将使医生能够更早地发现肿瘤的生长情况,是准确评估和监测肿瘤反应的必要工具,对诊断、分期、放疗计划、手术方案和治疗评估有重要影响[12]。本研究的目标是研究深度学习方法训练模型在颅脑T2Flair图像中自动分割脑胶质瘤的可行性,为脑胶质瘤将来的智能诊断做出初步探索。
1.1 一般资料
回顾性纳入影像归档和通信系统(PACS)中2015年3月至2019年9月经病理证实的脑胶质瘤患者81例,均进行了T2Flair检查,其中男44例,女37例,年龄7~78岁,平均(48.26±14.66)岁。根据WHO对神经上皮性肿瘤的分类[2],对肿瘤进行了分级,其中24例患者为Ⅱ级(12例少突胶质细胞瘤、4例星形细胞瘤、4例弥漫性星形细胞瘤、1例多形性黄色星形细胞瘤和3例节细胞胶质瘤),31例为Ⅲ级(13例为间变型少突胶质细胞瘤、11例为间变型星形细胞瘤、4例为间变型室管膜瘤和3例为间变型多形性黄色星形细胞瘤),26例为Ⅳ级胶质母细胞瘤(GBM)。患者临床表现为头痛、头晕、言语不利和四肢无力等。纳入标准:(1) 经手术病理确诊;(2) MRI检查前未做颅内减压、化疗或者放射治疗。排除标准:MRI图像质量不能满足评价要求(如运动或其他伪影等)。最终获得81位患者的T2Flair用于训练深度学习模型(图1)。本项目为回顾性研究,获得了伦理审查委员会批准。
图1 本实验模型训练及临床场景应用的流程图
1.2 MRI扫描参数
采用3.0T(飞利浦,荷兰)MRI成像系统和头颅8通道正交线圈。T2Flair序列扫描参数:重复时间(TR)=8000~9000 ms,回波时间(TE)=125~140 ms,显示野(FOV)=230 mm×219 mm,层厚=6 mm,层间距=6 mm,矩阵=232×181。所有MRI图像数据均来自同一台MRI机。
1.3 数据标注
将T2Flair图像导入数据管理平台,由DICOM格式转换为Nifty格式。由一位影像医生(阅片经验9年)使用ITK-SNAP软件(Version 3.6.0,http://www.itksnap.org/)逐层标注T2Flair图像上的脑胶质瘤。由另一名具有15年阅片经验的影像专家进行审核。以手工标注的标签作为评价模型分割性能的评价标准(图2)。
图2 标注脑胶质瘤区域
1.3.1模型训练 训练过程在GPU NVIDIA Tesla P100 16G上进行,软件环境包括Python3.6、Pytorch0.4、Opencv、Numpy 和Simple ITK。使用3D U-Net深度学习网络训练脑胶质瘤分割模型,使用Adam作为训练优化器。
将81例数据按照8∶1∶1的比例随机分为训练集(n=63)、调优集(n=9)和测试集(n=9)。模型训练时每批次输入数据量(batch size)设定为10,学习率(learning rate)为0.0001,模型迭代次数为300个周期(epoch)。
1.3.2模型评价 以Dice相似系数(DSC)对测试集数据的分割性能进行定量评估。基于体素自动计算脑胶质瘤手工标注体积和模型预测体积,将两者进行比较,绝对误差率计算方法为:(手工标注体积-模型预测体积)/手工标注体积的绝对值。
1.4 统计分析
应用SPSS 23.0软件进行统计学分析。应用Kolmogorov Smirnov法进行正态性检验,符合正态分布的计量资料以均数±标准差表示,不符合正态分布的连续变量以中位数表示。应用卡方检验比较训练集,调优集和测试集之间的性别组成,方差分析用于比较各数据集之间的年龄差异。P<0.05为差异有统计学意义。
2.1 数据分布
训练集、调优集及测试集之间的患者年龄(均符合正态分布)和性别的差异无统计学意义(F=0.85,P=0.43和χ2=0.40,P=0.82),见表1。
表1 患者临床特征及分布
2.2 模型分割性能
测试集中模型预测的DSC值为0.74~0.94,中位数为0.88(0.84,0.90)。医生标注脑胶质瘤的体积为32.7~168.1 cm3,中位数为146.0(91.7,162.0) cm3,模型预测脑胶质瘤体积为35.8~170.9 cm3,中位数为113.0(93.7,134.0) cm3,其绝对误差率为0.00~0.23,中位数为0.16(0.07,0.19)(图3)。
图3 模型分割脑胶质瘤的结果
主观评价可见肿瘤主要区域均可被预测,分割效果基本满意。但部分肿瘤边缘稍有不一致,表现为:模型对病灶周围高信号水肿带基本可以识别,对于水肿带边缘识别欠佳(图3a);对于病灶内囊变坏死区识别欠佳(图3b)。
在MRI图像上准确地进行肿瘤分割是通过计算方法了解肿瘤生物学的第一步[13]。脑胶质瘤由于脑组织结构复杂、病灶位置、形状、大小各异、信号强度不均匀,直接从MRI图像中分割脑胶质瘤是具有挑战性的任务,并且相邻骨骼、血管或模糊的边缘也大大增加了分割的难度,人工分割病灶耗时耗力,并且受到很多主观因素的影响。基于计算机辅助的自动分割为脑胶质瘤的诊断、治疗及效果评估提供了一个稳定的解决方案,是减少准确检测、定位和描绘肿瘤区域所需时间的有效工具。BI等[14]认为人工智能可以将脑肿瘤的术前分类细化到专家的水平之上。
传统图像分割技术包括:阈值分割、基于边缘、区域的分割和模糊聚类法等,而以深度学习为代表的脑肿瘤图像分割法现已成为主流的全自动分割方法。卷积神经网络(CNN)是一种强有力的图像识别和预测方法,在所有的深度学习方法和技术中,2D和3D CNN在图像分割、分类和患者生存时间的预测方面都有很好的表现[15]。本研究中采用3D U-Net深度学习模型,测试集中模型预测的DSC值为0.74~0.94,中位数为0.88(0.84,0.90),与国内外研究结果相似[16-17],主观评价分割结果也基本满意。本研究中医生标注脑胶质瘤的体积为32.7~168.1 cm3,中位数为146.0(91.7,162.0) cm3,模型预测脑胶质瘤体积为35.8~170.9 cm3,中位数为113.0(93.7,134.0) cm3,其误差率为0.00~0.23,中位数为0.16(0.07,0.19)。模型预测对肿瘤的实体部分标注准确,与医生标注的差异主要在于水肿的边缘、水样信号的囊变坏死区、跨中线结构非主病灶的一侧以及被病灶包绕的血管的识别上。多项深度学习的研究结果表明,在模型预测准确的基础上,AI模型对病灶分割后体积测量的准确性很高[18-19]。模型测量结果自动填写入结构化报告中,不仅能提高工作效率,而且可以提高测量的一致性,对肿瘤负荷评估和治疗后随访提供有益的帮助。
本研究的局限性:回顾性研究且相对较小的数据集,今后收集较大的样本量使得性能提高;本研究中只分割整体肿瘤,今后研究中可以分割不同的肿瘤组织,如增强图像上肿瘤的强化区域和非强化区域、水肿和坏死等;本研究只针对T2Flair一个序列进行脑胶质瘤的分割,今后应进行多模态MRI序列的分割,并将U-Net的全自动分割用于1 mm层厚的eT1W-3D-TFE-ref序列图像,对脑胶质瘤进行更精准的分割。
总之,本研究基于3D U-Net训练的脑胶质瘤病灶分割模型具有较高的性能,同时也可为后续脑胶质瘤全自动检出奠定基础。