机器学习在鼻咽癌影像分析中的研究进展

2019-02-14 07:24:14叶裕丰黄炳升

国际医学放射学杂志 2019年1期

黄斌廖峰叶裕丰黄炳升*

鼻咽癌（nasopharyngeal carcinoma，NPC）是一种源自鼻咽部易扩散至淋巴的恶性肿瘤，有显著的地域差异，如在亚洲中部及东南部和非洲东部及北部发病率较高。中国处于NPC高发地区，其发病率呈南高北低态势，华南、西南各省发病率显著。放射治疗是目前的主要治疗方法。早期病人一般采用纯放疗手段，晚期采用以放疗为主的放化疗综合手段。治疗后总生存率大约为80%。

NPC的诊断、治疗以及疗效评估依赖于医生对病人影像、病理等信息的分析处理。目前，临床上对病人信息的分析处理都由临床医生来完成。但影像信息量庞大，人工分析处理需要耗费大量的时间与精力，且由于具有主观性使得准确性得不到保证。相对于人工诊治分析，计算机分析速度更快，而且分析结果更为客观，在一定程度上保证了准确度。机器学习在医学领域的应用令计算机辅助诊断（computer aided diagnosis,CAD）的准确性大大提高，在减轻医生工作量的同时，有望实现更准确高效的诊断。机器学习的主要应用包括病灶分类和疗效预测，其目的在于辅助医生分析医学影像，提高诊疗效率和精度。下面对机器学习在NPC诊治中的应用研究作一综述。

1 机器学习概述

机器学习是使计算机具有学习的能力。Alpaydin将机器学习定义为能够根据实例数据或过去的经验优化某种性能的计算机程序。机器学习技术中系统的任务即学习输入到输出的映射。在学习过程中，根据系统的输入输出方式可分为监督学习、无监督学习和增强学习。监督学习指每个输入具有对应的人为标定的输出，无监督学习则没有人为标定的输出，增强学习的输出是指能实现某个目标的动作序列。常用的机器学习算法有支持向量机（support vector machine,SVM）、马尔可夫随机场（Markov random field,MRF）、条件随机场（conditional random field，CRF）、自组织映射（self-organizing maps,SOM）、模糊C均值（fuzzy C-means,FCM）聚类算法、人工神经网络（artificial neural network,ANN）、K 最近邻算法（K-nearest neighbor,KNN）、随机森林（ran dom forest,RF）等。传统机器学习具有一定的局限性，如：①人为设计特征，在处理复杂问题时，需要耗费大量的时间与精力。②维数灾难，处理高维数据困难[1]。针对这些问题，机器学习技术发展出深度学习这一分支。深度学习是当前机器学习的热点，已在各个领域中有较好的应用，如人脸识别、自动驾驶等。深度学习能够使计算机通过原始数据直接提取特征，省去了人为设计特征的步骤。另一方面，深度学习技术自动提取的特征维度更高、更抽象，更适合计算机分析处理[2]。目前图像处理领域最流行的是卷积神经网络（convolutional neural network，CNN）。

表1 基于机器学习的NPC分割研究总结

2 机器学习在NPC影像中的应用

2.1 影像分割目前临床上对NPC肿瘤的影像分割大多由医生手动进行，耗时耗力且具有主观性。通过机器学习等图像处理技术在NPC影像上实现了肿瘤自动或半自动分割，能够减轻医生的工作量，提高诊疗效率。目前，在相关研究文献中所处理的图像主要来源于MRI、CT、鼻内镜。机器学习在NPC影像分割研究中常用的分割性能评价指标有敏感度、精确度、特异度、准确度、阳性预测值、Dice相似系数（Dicesimilarity coefficient,DSC）等（表 1）。

2.1.1 MRI影像分割基于MRI的NPC肿瘤区域分割已多有报道。Zhou等[3]应用二分类的SVM将病灶与非病灶分别作为两类训练SVM，成功利用机器学习实现了NPC肿瘤分割。Huang等[4]使用灰度预测模型粗略鉴别肿瘤区域，有利于减少假阳性，再用FCM细分割肿瘤以提高分割的准确率。Huang等[5]将空间加权度量作为区分肿瘤与非肿瘤的特征，应用谱聚类的方法对空间加权度量进行聚类来区分肿瘤与非肿瘤，其敏感度和阳性预测值高于传统的SVM方法，且聚类方法可以不需要定义标签。Huang等[6]在2013年的研究中，将之前研究[5]的采集样本方式由半监督改成无监督，使该方法的自动化程度更高。Huang等[7]首先通过长宽高计算得到鼻咽的区域以减少假阳性，再通过最近邻图模型和距离正则化水平集演化（distance regularized level set evolution，DRLSE）进行肿瘤粗分割，再用最大熵（expectation-maximization，EM）的隐 CRF 模型细化肿瘤细节。Deng等[8]根据不同组织的时间-灰度值曲线设计相应特征，成功利用了时间信息，并通过SVM实现了NPC肿瘤分割，提出应用动态成像信息的一种思路。Wang等[9]和Ma等[10]都应用基于小块的CNN实现了NPC肿瘤分割，省去了人工设计特征的步骤，较传统方法的分割性能也有一定提高。

2.1.2 CT影像分割在NPC的CT影像分割方面，Chanapai等[11]使用基于SOM的自适应阈值法，实现了基于CT图像的肿瘤区域的半自动分割。首先，研究应用SOM生成NPC图像的表达图，再根据表达图的灰度直方图选定NPC区域的阈值作为区域生长的边界停止条件，然后人工选取一个NPC内的点，最后基于此点进行区域生长分割NPC。Men等[12]通过端到端的深度CNN实现了NPC原发病灶与转移淋巴结的自动分割，与基于小块的CNN方法相比，其速度更快，且分割性能也不低。

2.1.3 鼻内镜影像分割在鼻内镜图像上，Mohammed等[13]通过区域生长法、K均值聚类和ANN，实现了基于鼻内镜图像的NPC自动分割与分类。文中使用K均值聚类对图像上的点进行分类，再将分类后的点输入人工神经网络提取特征，进而自动选择种子点，再基于该种子点进行区域生长以分割出肿瘤区域。

2.2 影像分割的优势和局限性综上，已有研究基于不同医学图像和机器学习方法较好地实现了NPC的分割，且在相应的数据集上取得了良好的结果。其中，SVM和聚类算法的应用率最高。可能由于医学影像中不同组织的数据分布通常为非线性，SVM作为非线性分类器能很好地对其进行分类[3]；而图像中NPC数据较为相似，采用聚类算法能够较好地对其进行分类。随着机器学习技术的发展，有研究者[9-10,12]将深度学习方法用于NPC肿瘤分割，结果显示比传统阈值方法表现更好。这些尝试是为了实现全自动分割，从而进一步减少医生的工作量。

然而，目前的研究仍存在以下问题：①大多数研究都集中在结构影像上，功能影像的研究则较少。但只有结构影像与功能影像相结合才能更精确地定位NPC肿瘤[14]，且能提供比单一结构或功能影像更多的解剖结构和人体代谢的信息。②部分研究仅对含有病灶的图像层进行处理，这极大地限制了自动或半自动分割技术在临床上的应用。③目前研究中样本量较小，即使数据最多的研究也只有120例病人，基于小样本得出的结果不能说明分割技术的泛化性和鲁棒性。④不同病人间的分割结果差异性较大，首先可能是NPC本身和周围组织的复杂性导致其较易被错分；同时，NPC有无淋巴转移也是影响分割结果的关键因素，存在淋巴转移的病人的分割结果通常较差[15]，原因很可能是这部分病人的肿瘤相对于原发灶体积更大、形状更复杂。

2.3 影像分类已有研究者通过机器学习等图像处理技术在NPC影像上实现了自动或半自动分类（表2）。Wu等[16]首先利用CT影像构建骨骼、脂肪、软组织像素与身体位置的变化曲线，确定全身三维影像中头颈部的位置，能够减少计算量以及假阳性，再通过局部阈值的区域生长法在PET上分割病变，最后通过SVM在配准后的PET/CT影像上实现NPC自动分类与检测。该方法主要利用CT定位头颈部，而病灶信息则主要依赖于PET影像识别。Farhidzadeh等[17]在 NPC的 MRI增强 T1WI上应用大津法（最大类间阈值法）将肿瘤分为高增强区域和低增强区域并分别提取纹理特征，再通过SVM预测疗效，结果表明低增强区的预测性能更好，说明低增强区具有更稳定的预测疗效。Liu等[18]分别在NPC 的 T1WI、T2WI、DWI、增强 T1WI影像上，利用灰度共生矩阵、灰度梯度共生矩阵、Gabor变换和强度-大小-空间矩阵提取纹理特征，将以上所提取特征作为KNN和ANN的输入，实现疗效预测。Zhang等[19]在MR影像上实现了NPC疗效预测，其创新点在于将机器学习应用在特征筛选阶段，并通过实验证明RF法能够较好地实现特征筛选和疗效预测。Mohammed等[13]通过K均值聚类和ANN实现了鼻内镜图像中有无NPC肿瘤的分类。

2.4 影像分类的不足目前许多研究都已证明了机器学习能够实现其相应目的，有利于NPC的快速诊疗。但目前关于病理图像方面的研究尚未见报道。如能实现病理图像的自动分类将极大地减少医生工作量。另外，目前分类的敏感度仍不能支持在临床上的应用，因为可能会导致漏诊。

表2 基于机器学习的NPC分类研究总结

3 小结与展望

机器学习在NPC影像的研究中展现了强大的数据处理能力，有利于医生更准确、迅速地对NPC进行诊断，同时可以提高治疗的效率，减轻了医生的负担。目前，机器学习在NPC影像的应用研究主要集中在影像中分割出NPC肿瘤区域和对NPC影像分类，并已取得良好的结果，特别是肿瘤区域的分割在NPC的诊疗中起到了关键作用。目前的研究大多使用的是传统机器学习方法，但随着诊疗技术的迅速发展，医学影像的数据将会越来越复杂，数据量越来越大，传统机器学习方法终将不能适应这种需求。近年来以CNN为代表的深度学习技术在图像处理领域表现优异，能够更好地对图像进行分析处理，目前其在医学影像方面已有大量的研究及应用，未来有望更多地应用于NPC影像的研究中，可以更好地为临床服务。