朱逸峰,赵凯,郭丽,张耀峰,王祥鹏,张晓东,李雨师,王霄英
颈椎病(cervical spondylosis,CS)是椎间盘变性、椎体骨质及小关节软组织病理改变刺激和压迫颈动脉、脊髓、颈神经根等的退行性疾病,近年来患病率逐年增高,有明显年轻化的趋势[1]。
影像检查可以辅助颈椎病的诊断,其中X线可显示曲度改变、椎间隙变窄等,CT可显示颈椎骨质等结构,MRI可显示脊髓和颈椎间盘等结构,在实际工作中MRI更普遍地被应用于颈椎病的诊断和评估[2]。颈椎影像的精确分割和量化分析在颈椎病诊断中非常重要,但颈椎区域的骨骼、韧带、血管和神经等解剖结构较多,影像重叠度较高,如何客观、量化分析颈椎结构一直是尚未解决的难题[3]。随着人工智能(artificial intelligence,AI)的发展,AI在医学影像领域也得到了广泛的研究和应用,通过深度学习对图像进行自动分割在肾脏、前列腺和乳腺等部位都已经得到实现[4-6]。既往也有很多学者针对不同人群、不同模态影像中颈椎各结构的分割进行了相关研究[7-13]。
本研究以影像科医师手动分割为金标准,训练3D U-Net模型,实现对颈椎MR图像中各结构的自动分割,旨在为后续颈椎各结构径线自动测量和疾病诊断奠定基础。
本研究获得了本院伦理审查委员会的批准(2019-170),按照本单位人工智能(artificial intelligence,AI)模型训练规范执行研究方案。根据本单位AI训练管理方法定义研发颈椎MRI图像中各结构自动分割及径线测量模型的用例,包括模型的名称、临床问题、场景描述、模型在实际工作中的调用流程、模型输入输出数据结构等。将颈椎矢状面分割结果和横轴面分割结果进行空间配准和定位,用程序实现对颈椎各结构(椎间盘、硬膜囊等)径线及体积的测量和评价,结果可自动输入到颈椎MRI结构化报告中。设定AI模型的返回结果:颈椎椎体的定位、硬膜囊和脊髓的体积、径线等,返回结果应用于颈椎MRI结构化报告的“病灶列表”模块(图1)。
图1 颈椎MRI分割及径线测量模型的训练流程。
自本院PACS系统回顾性搜集2020年4月-9月疑诊颈椎病患者的MR图像。排除标准:①行MR检查前有手术等治疗史;②有颈椎骨折、畸形和感染等;③不能配合检查,图像质量不佳。最终将符合要求的92例患者共178扫描序列纳入研究。年龄4~85岁,平均(55.6±21.8)岁,男、女比例为1.2∶1。
扫描设备包括GE Signa Excite 3.0T(48例)、GE Discovery HD750 3.0T(5例)、Siemens Magnetom Prisma 3.0T(2例)、Siemens Aera 1.5T(14例)、Phi-lips Ingenia 3.0T(3例)、Philips Achieva 1.5T(3例)、Philips Multiva 1.5T(17例)。扫描序列为颈椎矢状面T1WI和T2WI,主要序列和扫描参数:TR 550~800 ms、TE 7~14 ms(T1WI)或TR 2800~3000 ms、TE 100~130 ms(T2WI);层厚3.0~4.0 mm,层间距3.3~4.4 mm,视野22×22 cm~25×25 cm,矩阵≥320×224。
将颈椎矢状面T1WI和T2WI的DICOM格式图像转换为NiFTI格式。由一位低年资放射科住院医师(阅片经验2年)使用ITK-SNAP 3.6.0软件在颈椎矢状面T2WI图像上进行标注,手工调整窗宽和窗位。标注的结构包括椎体 、椎间盘 、硬膜囊、椎间孔和脊髓。然后由一位高年资放射科专家(阅片经验≥15年)对低年资医师的标注进行复核,如有不一致的情况,以高年资放射科专家的标注为金标准,将修改好的T2WI图像上的标签匹配至T1WI图像上,并进行修改和确认,标注内容和标准如下。①椎体的标注:自C2椎体向下,在全部显示椎体的区域逐层标注,椎体的前缘及上、下缘沿椎体边缘进行标注,后缘标注时根据后上缘、后下缘确定边界并进行标注(不包括椎板、棘突等附件结构)。②椎间盘的标注:自C2-3椎间盘以下,在全部显示间盘的区域逐层标注,以T2WI椎体与椎间盘交界的低信号上、下边缘,以椎间盘与椎前软组织的交界为前缘,以椎间盘与硬膜囊的交界为后缘。③硬膜囊的标注:自枕骨大孔以下逐层标注扫描范围内包含硬膜囊的图像,不包括硬膜外脂肪。④脊髓的标注:自延髓以下逐层标注扫描范围内包含脊髓的图像,不包括神经根。⑤椎间孔的标注:自C2-3椎间孔以下逐层标注扫描范围内的椎间孔,其关键标志是由椎体、椎间盘及椎板边缘组成的完整环形及大部分完整环形(超过75%环形)的椎间孔区域。
使用的硬件为GPU NVIDIA Tesla P100 16G,软件为Python3.6、Pytorch 0.4.1、Opencv、Numpy和SimpleITK等,Adam为训练优化器。图像预处理参数:size=16×448×256(z,y,x),自动窗宽、窗位。178个数据按照8︰1︰1的比例随机分为训练集(train dataset,n=138)、调优集(validation dataset,n=20)和测试集(test dataset,n=20)。采用Coarse-to-Fine序贯训练的方法训练3D U-Net网络深度学习模型:先训练一个颈椎矢状面MRI粗略分割模型,将得到的粗略分割结果作为掩膜(mask),再训练精细分割模型。输入颈椎矢状面T1WI、T2WI图像和各结构的标注文件,分割椎体、椎间盘、硬膜囊、脊髓和椎间孔,训练参数:每次读取的图像数量(batch size)为4,学习率(learning rate)为0.0001,训练次数(epoch)为400。
客观评价:使用Dice相似系数(Dice similarity coefficient,DSC)评估U-Net模型的分割性能,计算公式为:
(1)
其中,A为放射科医师在颈椎MR图像上手工标注的颈椎某结构的体素数,B为在颈椎MR图像上模型分割的颈椎某结构的体素数。DSC是衡量两个像素集合之间相似性的度量指标,取值范围为0~1,数值越大,代表两个集合之间的相似度越高。
使用MedCalc 15.8软件对训练集、调优集及测试集中各结构的DSC值进行正态性检验,对不符合正态分布的数据分别使用Friedman秩和检验及Kruskal-Wallis秩和检验,比较各结构的DSC值在三组内及组间是否存在统计学差异。
主观评价:在测试集中,由影像医师在正中矢状面图像上评估模型分割椎体、椎间盘、硬膜囊和脊髓的结果,在双侧旁正中矢状面图像上评估模型分割椎间孔的结果。当模型的分割结果完全覆盖目标解剖区域,认为满足径线测量的要求;分割结果与目标区域有任何不重合之处,认为不满足径线测量的要求。
在训练集、调优集以及测试集中,分割模型对颈椎各结构的标注结果与人工标注结果的DSC值及P值见表1。各结构的DSC值在训练集、调优集和测试集之间三组的差异均有统计学意义(P<0.001)。在3个数据集中,颈椎各结构之间的DSC值的差异均具有统计学意义(P<0.001)。在测试集中,平均DSC值为0.80±0.13,其中硬膜囊的DSC值最高,椎间孔的DSC值最低(图2、3)。
表1 分割模型颈椎MR各结构的DSC值
图2 测试集病例T1WI上模型对颈椎各结构的分割结果。a)正中矢状面图像上显示硬膜囊的分割结果,DSC值为0.9;b)正中矢状面图像上显示脊髓的分割结果,DSC值为0.82;c)正中矢状面图像上椎体和椎间盘的分割结果,DSC值分别为0.86和0.84;d)左侧旁正中矢状面图像上显示椎间孔的分割结果,DSC值为0.70;e)右侧旁正中矢状面图像上显示椎间孔的分割结果,DSC值为0.73;f)模型分割结果的三维图像。图3 测试集病例T2WI上模型对颈椎各结构的分割结果。a)正中矢状面图像上显示硬膜囊的分割结果,DSC值为0.87;b)正中矢状面图像上显示脊髓的分割结果,DSC值为0.84;c)正中矢状面图像上椎体和椎间盘的分割结果,DSC值分别为0.87和0.8;d)左侧旁正中矢状面图像上显示椎间孔的分割结果,DSC值为0.72;e)右侧旁正中矢状面图像上显示椎间孔的分割结果,DSC值为0.72;f)模型分割结果的三维图像。
影像医师对测试集中模型分割结果进行主观评价,3D U-Net模型对颈椎所有结构的分割均能满足径线测量的要求。
X线、CT和MRI均已经被广泛应用于颈椎病的诊断,MRI相比X线和CT具有更高的软组织分辨力,可清晰显示脊髓和椎间盘等软组织结构,因此能够提供颈椎病诊断相关的定性和定量影像学信息。由于日常工作中对颈椎各结构的人工测量耗时较多,所以在实际临床工作中,影像科医师对于颈椎MRI报告的书写大多局限在定性诊断,较少进行定量指标的测量,导致影像报告的结果存在一定的主观性。在本研究中,我们训练了3D U-Net模型用于在矢状面MR图像中分割颈椎的主要结构,结果显示模型的分割结果较好,为后续自动定量测量奠定了基础。
既往有一些研究中提出了半自动或自动方法分割颈椎X线、CT或MR图像中的结构。在X线平片方面,Arif等[7]使用深度全卷积神经网络(fully convolu-tional neural networks,FCN)来定位颈椎X线侧位片中的颈椎区域,然后利用深度概率空间回归网络对颈椎椎体中心进行定位,最后采用形状感知深度分割网络对图像中的脊椎进行分割。最终得到了可在X线侧位片中自动分割颈椎椎体的模型,其DSC值为0.84,形状误差为1.69 mm。Shin等[8]利用深度学习系统(deep learning system,DLS)分析了韩国不同性别、不同年龄段人群中颈椎曲度的变化趋势,通过使用颈椎X线侧位片训练深度学习模型(训练集325例、调优集130例、测试集130例),并使用该模型对13691例颈椎侧位X线片进行了颈椎分段和曲度测量,该模型的DSC值达到了0.96。
在CT方面,Zhang等[9]采用自适应阈值滤波器从CT图像中分割颈椎椎体,将基于PointNet++的单椎体分割算法引入到颈椎分割中,最后利用基于边缘信息的融合分割算法清晰地区分出两个椎骨的边缘,该模型的DSC值为0.96,明显优于卷积神经网络(convolutional neural networks,CNN)分割模型。Bae等[10]使用2D U-Net模型实现了颈椎椎体及附件结构的三维分割,该模型的DSC值为0.94。Liu等[11]使用稀疏椎间盘组合模型(sparse intervertebral fence composition,SiFC),通过对椎间盘的分割来重建相邻椎体之间的边界,显著降低了颈椎分割的难度,该模型的DSC值为0.95。
在MRI方面,Daenzer等[12]提出了一种基于直方图特征的机器学习颈椎分割方法(histograms of oriented gradients for volumetric data,VolHOG)对C3~C7颈椎椎体分别进行分割,其DSC值达0.98。Rak等[13]使用CNN分割脊柱3D-MRI上的所有椎体,其DSC值为0.96。上述研究中使用的影像检查方法、模型分割的对象不尽相同(但大多集中在对颈椎椎体和附件的分割),结果和评价指标也不完全一致,多数研究中使用DSC作为评价指标。本研究中使用3D U-Net网络结构[14],以Coarse-to-Fine的方式序贯训练分割模型,进行分割的颈椎结构包括椎体、椎间盘、硬膜囊、脊髓和椎间孔等,最终建立的分割模型在测试集中对颈椎所有结构的分割结果与人工标注间的平均DSC值为0.80±0.13。本研究中建立的分割模型的客观评价指标值稍低于既往研究中单一分割模型,分析其原因可能是训练样本量较少、部分结构特征不典型所致。但主观评价的结果显示分割结果符合临床要求。
在本研究中,硬膜囊、脊髓、椎体和椎间盘的分割结果好于椎间孔的分割结果,分析其原因是由于椎间孔本身体积较小、与周围其它结构的重叠较多且信号强度接近,在标注时容易存在一定的主观偏差,故3D U-Net模型无法精准分割椎间孔的结构,这也导致了最终模型的客观评价结果低于既往研究中单一分割模型,虽然DSC值低于其它4个解剖结构,但考虑到椎间孔本身结构较小且无明确的分界标志,对于影像科医师及临床医师来说,模型将椎间孔区域分割出来即可达标,出现轻度偏差是可以接受的。
本研究是使用深度学习方法实现颈椎各径线自动测量的序贯任务之一,即先完成颈椎各结构的分割,在后续的研究中再开发算法测量相关径线,从而实现对颈椎病的定量诊断。在模型的准确性较高时,可以自动生成结构化报告,提高临床诊断的准确性和效率,目前正在进行的是增加颈椎横轴面MR图像的标注和迭代。由本研究已经完成的工作可知,在数据量并不大的情况下,不同厂商、不同场强MR扫描设备获得的图像均可达到较好的分割效果,可以预见在纳入更多的图像迭代后,模型对不同设备的适用性将不受限制。但就提高模型的泛化能力而言,仍需要严格制定和执行影像检查规范,以保证不同设备颈椎MR图像的检查质量,并在模型迭代过程中纳入各种有轻微伪影的病例,以提高模型在图像质量欠佳时的鲁棒性。
综上所述,本研究使用3D U-Net深度学习分割算法,建立了分割颈椎矢状面MR图像中椎体、椎间盘、硬膜囊、脊髓和椎间孔的自动分割模型,为下一步建立颈椎各结构径线自动测量和颈椎病的定量诊断模型提供了基础。