王芷凡,戴修斌,周炎锜,冒添逸,黄 虹,宋洪丞,王东苗
下牙槽神经损伤是下颌阻生智齿拔除相关的严重并发症之一,其发生率为0.26%~8.40%[1],主要表现为患侧下唇感觉异常或麻痹,严重影响患者的生活质量[2]。目前临床治疗手段局限,主要为对症处理,营养神经,促进其功能恢复[3]。下牙槽神经损伤与患者的年龄、性别、手术方法、手术者的技术水平、智齿阻生类型以及智齿牙根与下颌管接触与否密切相关[4]。
曲面断层片是下颌阻生智齿最为常用的术前影像学评估手段[5],其特征性影像是术前判断智齿牙根与下颌管是否接触的重要方式[6]。由于二维影像的固有缺陷,曲面断层片存在局部放大率不均等、影像结构重叠、易产生伪影等不足,特别是无法准确判断智齿牙根与下颌管的颊舌向关系,造成其诊断正确率不高[7]。锥形束CT(cone beam computed tomography,CBCT)因其能提供高精度的影像,逐步应用于下颌阻生智齿的术前评估[8]。然而,CBCT拍摄时间相对较长,放射剂量相对大,价格相对贵,特别是现有的研究表明,术前使用CBCT检查,不能预防或减少术后下牙槽神经损伤的发生[9]。因此,提高曲面断层片的诊断准确性具有重要的临床应用价值。
既往学者利用深度学习算法提升了曲面断层片在上颌窦炎[10]、牙根纵裂[11]、颌骨囊性病损[12]、下颌第一磨牙远中舌根[13]等诊断正确性。Vinayahalingam等[14]利用U-net模型尝试了分割智齿牙根与下颌管,但准确性欠佳,Fukuda等[15]首次利用AlexNet、GoogLeNet及VGG-16等网络模型进行了下颌智齿牙根与下颌管相关关系的判别取得了相对较好的效果,但其将专家的诊断作为参考,缺乏客观可靠的诊断金标准。
本研究拟以曲面断层片作为输入端,以配对CBCT诊断作为金标准,构建基于YOLO(You only look once)模型改良的轻量型单步深度学习网络算法模型(IAC-MTMnet),提升曲面断层片诊断下颌智齿牙根与下颌管位置关系的准确性,以减少非必要的CBCT拍摄。
选择2019年1月—12月在南京医科大学附属口腔医院就诊同时拍摄曲面断层片和CBCT的成年患者(年龄≥18岁),具体纳入标准如下:至少存在一颗下颌智齿,牙根发育完整,且无明显龋坏;两次影像拍摄时间间隔不超过6个月;两次摄片期间,下颌智齿位置无明显变化;下颌智齿区域无病变或者手术累及;影像清晰,不影响评估。最终纳入1 570例患者,共计2 543颗下颌智齿。曲面断层片尺寸为2 976×1 536像素,分辨率为0.07 mm×0.07 mm。本研究经南京医科大学附属口腔医院伦理委员会审查批准(PJ2020-125-001)。
曲面断层片评估指标及方法如下。下颌智齿牙根与下颌管垂直向关系分为:未接触(牙根与下颌管间存在距离),接触(牙根与下颌管骨白线上缘接触或重叠),详见图1;对接触病例进一步评估其是否存在特征性影像(包括根尖暗影、根尖弯曲、根尖狭窄、根尖分叉、下颌管骨白线连续性中断、下颌管方向改变和下颌管狭窄)[6]。将两者接触且存在特征性影像的病例,定义为智齿牙根与下颌管的直接接触(人工评价标准)。CBCT评估指标和方法:将Dicom格式数据导入NNT软件(NewTom,5.6版本),从冠状位、轴位和矢状位等多个平面进行评估,智齿牙根直接接触或突破下颌管骨白线者定义为两者直接接触(金标准),详见图1。所有影像学指标,均由两名研究者独立评价,诊断不一致时,协商后达成共识。
A:曲面断层片提示:38牙根与下颌管接触,48牙根未与下颌管接触;B: CBCT图像上48牙根未与IAC接触,B1轴位,B2冠状位;C:CBCT提示38牙根突破下颌管骨白线,与其直接接触,此为诊断金标准,C1冠状位,C2轴位
在曲面断层片标注矩形感兴趣区域(region of interest,ROI),包括下颌智齿及下颌管,范围如下:前缘到下颌第一磨牙牙冠近中,上缘为下颌第一、二及智齿牙冠的最上缘,后缘为下颌升支后,下缘为下颌骨体部,详见图2。需要说明的是,带有ROI标记的曲面断层片仅用于网络模型训练阶段。
在数据预处理阶段,首先将采集到的曲面断层片数据按照80%、10%、10%的比例分为训练集、验证集和测试集。再采用Mosaic数据增强方式扩充其中的训练数据集[16],即将训练集中的曲面断层片进行随机缩放、随机裁剪、随机排布后拼接在一起作为新的训练数据。
图2 感兴趣区域标注的示意图Fig.2 Region of interest (ROI) labeling
研究所用工作站硬件配置为Intel Xeon E5-2678 v3 2.50 GHz的双核CPU、内存32 GB、GeForce GTX 1080Ti GPU显卡1块。涉及主要参数设置如下:设训练迭代次数为1 200,batch size为6,学习率等于0.003 2;使用LeakyRelu作为激活函数;初始锚框的长宽设为[126,151],[122,169],[140,153],[135,168],[130,180],[144,176],[157,166],[139,194],[155,191]。为了适应网络模型对输入图像尺寸要求,曲面断层片大小将被以在图像边缘填充固定值的方式缩放至608×608像素。
本研究以YOLOv5深度检测模型为框架,构建了轻量型单步深度学习网络[17],并对YOLOv5模型的Backbone分支网络进行了改进,使其在大幅降低计算复杂度的同时保持提取出特征的表达效率。本研究构建的基于轻量型单步深度学习网络的下颌智齿牙根与下颌管关系自动检测方法分为训练阶段和测试阶段两部分,如图3所示。在训练阶段,首先从训练用曲面断层片对应的CBCT图像中获取下颌智齿牙根与下颌管位置关系标签值,并将此蕴含三维空间信息的标签值作为分类金标准。再协同扩充后训练集中的曲面断层片用于训练轻量型单步深度学习网络,使之同时学习图像特征与存在下颌智齿牙根与下颌管接触情况区域位置的非线性关系,以及图像特征与下颌智齿牙根与下颌管接触类别的非线性关系。当经过不断迭代训练后,模型预测值与金标准之间误差收敛时,即完成该网络模型的训练。
图3 IAC-MTMnet检测下颌智齿牙根与下颌管位置关系的流程图Fig.3 The protocol of detecting the proximity of mandibular third molar root and inferior alveolar canal with IAC-MTMnet
在测试阶段,将采集到新的曲面断层片划分成S×S个网格并作为已训练轻量型单步深度学习网络的输入,该网络模型将输出多个候选边界框的位置信息,这些候选边界框所在区域可能会存在下颌智齿牙根与下颌管发生接触的情况。在使用非极大值抑制方法从候选边界框中筛选出最终结果后,即可完成下颌智齿牙根与下颌管发生接触区域的回归预测任务。另外,该网络还将同时给出候选边界框对应的目标置信度和每个网格的类别置信度。将筛选出的最终边界框的目标置信度乘以所属网格的类别置信度即为该边界框包含区域存在下颌智齿牙根与下颌管接触情况的概率值。此时,下颌智齿牙根与下颌管是否接触的分类预测任务亦已完成。
定性资料采用率或者构成比描述。诊断性试验采用正确率、灵敏度、特异度、阳性预测值以及受试者工作特征(receiver operating characteristic,ROC)曲线及曲线下面积(area under the curve,AUC)进行评估。其中,TP(true positive)为真阳性,TN(true negative)为真阴性,FP(false positive)为假阳性,FN(false negative)为假阴性。同时比较YOLOv5以及人工诊断与IAC-MTMnet的差异:
如表1所示,共计纳入1 570例病例,含2 543颗下颌智齿,其中男667例(42.48%),女903例(57.52%),平均年龄为34.85岁(18~51岁)。597例患者为单侧纳入(右321例,左276例),其余患者为双侧纳入。
表1 1 570例下颌智齿患者的基本信息Tab.1 Descriptive epidemiological data of 1570 patients with mandibular third molars
经曲面断层片评估,1 095颗(43.06%)下颌智齿牙根与下牙槽神经管成接触或重叠状,其中779(30.63%)颗存在一个或多个特征性影像,经人工诊断为与下牙槽神经管接触。经CBCT评估,798(31.38%)颗下颌智齿牙根与下牙槽神经管直接接触。人工诊断的正确率为84.5%。
经过训练、验证和测试,IAC-MTMnet、YOLOv5以及人工诊断的相关参数详见表2。IAC-MTMnet的诊断正确率为0.885,灵敏度为0.747,特异度为0.956,阳性预测值为0.899,测试运行时间为0.059 s,表现出了优良的诊断性能,其正确率高于人工诊断和YOLOv5网络模型,且其耗时明显减少。图4比较了YOLOv5和IAC-MTMnet预测结果的ROC曲线,其中右下角显示了它们的AUC值。结果表明,IAC-MTMnet的AUC值(0.95)比YOLOv5的AUC值(0.94)更高,说明IAC-MTMnet利用曲面断层片检测下颌智齿与下颌管位置关系的诊断性能更强。
表2 YOLOv5模型、IAC-MTMnet以及人工评估的诊断性能及检测时间比较Tab.2 Diagnostic performance and time for testing among YOLOv5, IAC-MTMnet and manual diagnosis in detecting the proximity of the mandibular third molar and the inferior alveolar canal on panoramic radiographs
图4 YOLOv5网络和IAC-MTMnet对应ROC曲线及ROC曲线下面积Fig.4 Receiver operating characteristic (ROC) curves and area under the receiver operating characteristic curve (AUC) values of YOLOv5 and IAC-MTMnet
准确评估下颌智齿与下颌管空间位置关系,是下颌智齿术前影像学评估的重要内容,是下颌智齿手术制定的重要参考,是预防术后下牙槽神经损伤的重要手段[18]。既往学者通过曲面断层片,定义其特征性影像以预测两者关系[6],然而即使是经验丰富的口腔颌面外科/影像科医生也常因影像结构扭曲、重叠等干扰而无法准确判断。Su等[7]的Meta分析也提示曲面断层片特征性影像不足以预测术后下牙槽神经损伤。以深度学习算法为代表的机器学习为提升曲面断层片的诊断性能提供了新的可能性。
近年来,深度学习网络算法已逐步应用口腔颌面影像诊断领域[19]。众多学者致力于利用深度学习网络模型算法改进或提升曲面断层片的诊断性能[12,20-24],且取得了较好的效果。本研究构建并评估了轻量型单步深度学习网络模型IAC-MTMnet在检测曲面断层片中下颌智齿与下颌管空间位置关系的性能。与YOLOv5网络模型相比,IAC-MTMnet模型运行速度快、诊断正确率、特异度、阳性预测值以及AUC相对高,但敏感度相对低,表明改进算法后诊断性能得到了提高。与Zhu等[25]的研究相比,IAC-MTMnet模型的阳性预测值略高,而敏感度相对低,究其原因可能与病例的纳入标准、样本含量的大小以及样本中接触/未接触病例分布的不均衡有关。与Fukuda等[15]报道的AlexNet、GoogLeNet以及VGG-16网络模型相比,IAC-MTMnet模型的诊断正确率、敏感度、特异度接近或略低,但AUC较高,运行耗时明显减少,值得一提的是,与上述网络模型不同,IAC-MTMnet模型在测试阶段不需要对测试图片进行标记和裁剪。此外,YOLOv5 和 IAC-MTMnet模型的诊断性能均高于人工诊断,这与既往报道相一致,即深度学习网络的诊断性能与经验丰富的放射科医生相当或更好,这也表明了深度学习网络系统的潜在应用价值。
目前,CBCT已应用于高风险下颌阻生智齿的术前评估中[26]。牙根与下颌管的直接接触、下颌管皮质骨的局部缺损、下颌管位于牙根舌侧等特征性影像与术后下牙槽神经损伤的相关性已引起学者关注[27-28],近期Liu等[29]利用U-Net、ResNet-34网络模型对CBCT影像中下颌智齿牙根与下颌管的自动分割和位置检测,取得了较好的效果。因此,本研究的目的是提升曲面断层片的诊断性能,以减少非必要的CBCT拍摄。对于复杂疑难高风险病例,建议首选CBCT检查,以更好地进行手术方案的制定,以减少术后并发症的发生。
本研究同样存在一些局限性。第一,样本含量仍不够大,并且影像数据是单一中心来源;其次,受发生率影响,样本中牙根与下颌管接触/不接触病例的比例分布不均衡,从而可能干扰诊断性能的相关指标。后续计划采集多中心不同设备的影像数据,重点关注高风险病例,通过算法改进样本分布不均衡的问题,以提高诊断性能和临床应用价值。
综上所述,本研究通过算法改进构建了轻量型单步深度学习网络模型IAC-MTMnet,提升了曲面断层片诊断下颌智齿与下颌管位置关系的性能。