毛 映, 赵绿扬, 龙 洁
(口腔疾病研究国家重点实验室,国家口腔疾病临床医学研究中心,四川大学华西口腔医院创伤整形外科,四川 成都 610041)
人工智能(AI)指能够模仿人类认知技能进行 自动化决策、处理问题等的任何机器或技术。 目前,AI 包括机器学习、神经网络及深度学习,其中卷积神经网络(convolutional neural network,CNN)是计算机视觉中新兴的人工神经网络(artificial neural network, ANN)和深度学习的核心模型,该技术可在输入原始像素信息后自动提取图像特征,主要用于处理大型和复杂的图像。 医学图像分割与诊断是AI图像处理和模式识别技术应用的重要领域之一,基于图像的自动诊断已应用在多种疾病领域[1],包括肺癌、直肠癌、鼻咽癌等。 近年来,AI 也已被引入口腔颌面部临床诊疗[2],通过自动检测、预测或提出治疗方案, 为医学专业人员提供有价值的辅助信息。本文就AI 在口腔颌面部X 线及CT 图像信息分析处理中的相关应用进行综述。
牙齿的准确识别与分类不仅关乎口腔医学的诊疗, 也可在法医学鉴定中用于个体信息的甄别。目前, 已有学者将AI 应用于自动化识别并分类口腔颌面部X 线及CT 图像中的牙齿, 以辅助和简化上述工作。
Chen 等[3]收集了1 250 张口内根尖X 线片图像,基于CNN 图像学习实现了模型对单个牙齿的自动识别及分类标注,其准确率超过90%。 Tuzoff 等[4]基于全景片数据集,采用更为先进的Faster R-CNN 结合VGG-16 CNN 和启发式算法构建的模型,根据牙齿的空间排列规则进行检测、计数和分类。 该模型平均准确度较高,相当于高年资影像学专业人员的评判水平。
在对口腔锥形束CT (cone-beam computed tomography, CBCT)的图像处理中,Miki 等[5]使用从断层片中提取的单个牙齿感兴趣区域(region of interest, ROI)来训练深度卷积神经网络(deep convolutional neural network, DCNN),其平均牙齿识别及分类准确率可达88.8%。Esmaeilyfard 等[6]选择了CBCT图像中牙齿结构的9 个线性特征来训练朴素贝叶斯、 随机森林和支持向量机模型以预测患者性别,平均准确率为92.31%,其性别分类预测结果达到了可接受的水平。
上述研究结果表明,AI 具有辅助口腔医生记录牙齿并编号从而提高临床工作效率的潜能,同时可以作为法医人类学鉴定的辅助工具,丰富了鉴定手段。
龋坏发生在深窝沟、邻接区或修复体周围等隐蔽位置时难以被早期发现,多依赖于医生的经验性诊断,故存在一定的漏诊率及误诊率。 Lee 等[7]通过根尖片中的龋齿图像特征来训练DCNN 诊断龋齿性能,结果显示,受试者工作特征曲线(receiver operator characteristic curve, ROC)的曲线下面积(area under curve, AUC) 在前磨牙区和磨牙区分别为0.917 和0.890,该学者认为若扩大样本量并纳入病史、叩诊等其他临床检查参数,其智能诊断的准确度还可进一步提升。
在牙根及根尖病变成像诊断方面,Johari 等[8]设计了概率神经网络模型(probabilistic neural network,PNN)以诊断根尖片和CBCT 图像中离体单根前磨牙的牙根纵裂,其最大准确率分别为70.0%和96.6%。Ekert 等[9]基于全景片中根尖病变图像训练CNN 得到的模型AUC 为0.85。
在牙周炎诊治中常借助全景片来评估全口牙周骨质的情况。 Kim 等[10]结合DCNN、迁移学习和临床知识设计了DeNTNet 模型以评估全景片中牙周骨质丢失,并依据牙联标记获得病变区的牙齿数目,结果显示,平均AUC 大于0.90。 Chang等[11]在分类型传统计算机辅助诊断系统中加入改良CNN 后构建的混合框架, 实现了在全景片中对单颗牙齿牙周骨质丢失的自动检测、分类和牙周炎分期,模型准确度与经验丰富的放射科医生高度相近。
头影测量是正畸及正颌外科中必不可缺的常规诊疗手段。 Arik 等[12]首次将DCNN 应用于识别头颅侧位片,在选中的19 个标志点中,2 mm 内误差的检测成功率为76%。 Park 等[13]将标志点增加到80 个,并运用基于CNN 的YOLOv3 方法检测,其中19 个主要标志点2 mm 内误差范围的检测成功率为80.4%,与专业人员检测的平均误检差小于0.9 mm,且重复性明显高于人工标注。
在自动化标注基础上, 许多学者运用AI 进行后续的测量分析。 Jung 等[14]建立的决策系统根据头颅侧位片中12 个特征来预测正畸拔牙方案, 总决策准确率为93%。 Choi 等[15]设计的机器学习模型可通过侧位片对骨性错颌进行简单分类并决策是否需要介入手术,总分类和决策成功率分别为91%和96%。 以上智能模型虽准确度较高,但均没有纳入骨性不对称或颌面畸形的患者, 因此仍需进一步优化。
在骨质疏松的诊断中通常以骨密度仪测量的骨密度值作为参考标准, 但由于数据干扰因素较多,其结果存在一定偏差。 Lee 等[16]构建了单列DCNN、 数据增强的单列DCNN 和多列DCNN 3 种模型,其根据全景片诊断骨质疏松的AUC 为0.976 3~0.999 1, 模型准确度相当于经验丰富的放射科医生。 因此,对大样本人群老年患者骨质疏松的诊断可借助AI 经全景片进行有效筛查。
上颌窦炎在全景片中的表现易被临床医师忽视。Kim 等[17]运用华氏位X 线图像训练CNN 检测上颌窦炎,AUC 约为0.9。 Murata 等[18]基于全景片数据集训练的CNN 模型对上颌窦炎检测的准确率为87.5%。 这些智能模型的准确度较高,可为缺乏经验的医师提供诊断支持。
口腔癌是临床治疗的难点和重点,晚期癌症的治疗效果差且费用高,公众的认知缺乏和卫生人员的临床经验有限,常导致肿瘤延迟诊断。 常规筛查手段结合AI 自动检测系统有望为临床提供低成本但高效的诊断方法。 使用自适应中值滤波器和Gabor 滤波器预处理CT 二维图像并提取特征后,采用支持向量机分类器构建健康预警系统模型对图像进行良、恶性分类可获得较高的准确率。 Xu 等[19]在二维图像识别的基础上尝试提取肿瘤的三维空间信息, 同时结合肿瘤在动态增强CT 检查中的表现,构建了包含空间特征和空间动力学特征的三维CNN诊断模型以识别早期恶性肿瘤,结果显示,在层次结构相同的情况下,三维CNN 模型的诊断准确性显著高于二维CNN 模型。上述研究表明,在卫生资源有限的情况下,AI 的应用有助于远程医疗的积极推广。
在颌面部恶性肿瘤的治疗过程中,是否存在区域淋巴结转移可直接影响治疗方案的选择和预后情况。Ariji 等[20]使用AlexNet 模型及Caffe 框架学习口腔癌患者颈部淋巴结的增强CT 图像, 分析淋巴结转移和淋巴结结外侵犯的诊断准确率分别为78.2%和84.0%, 类似的智能模型可作为辅助工具指导头颈部癌症患者的临床决策。
综上所述, 近年来,AI 技术已经越来越多地应用于包括诊断成像在内的各医学领域。 本文检索的大多数研究都集中于基于CNN 和ANN 构建的AI模型, 这些模型通过对口腔颌面部X 线及CT 影像图像的分析有效地帮助了临床诊断和决策,所采用的AI 自动化系统表现出了稳定有效的性能。 AI 技术模仿受过严格训练的专业人员,在疾病的诊断中表现出了近似于甚至高于专业人员的准确度。 需要关注的是,AI 模型的准确率与纳入数据的数量密切相关, 目前报道的相关研究数据量都有限,海量数据库的出现是降低AI 计算错误的有效手段。假以时日, 通过数据的不断扩大及软件算法的进一步完善,AI 技术在临床诊断和治疗中将会有更广泛的应用, 从而减少临床实践差异并提高数字诊疗的高效性与精准性。