吴键 侯代伦
肺结核是一种严重的传染性疾病,影像学检查是肺结核筛查及治疗后疗效评估的主要手段之一。由于肺结核影像学形态的多样性,有时与肺部其他相关病变的影像特点相似而难以鉴别,因此,肺结核的影像诊断往往成为临床工作中的重点与难点[1]。而深度学习擅长识别大量成像数据中的复杂模式,并能够以自动化方式提供定量评估,因此,深度学习可以被整合到临床工作流程中,作为影像学的评估。医疗数据中超过90%的数据来自于医学影像[2],影像医师需要分析海量的图像信息,不可避免地会产生视力疲劳,容易漏诊。多学科相互渗透交叉是当前的临床医学发展的趋势,而深度学习与常规影像诊断的融合恰好可在学科发展方面查缺补漏。深度学习在肺结核影像上的应用不仅可以极大缓解放射科医生的工作压力[3],改善影像报告的质量控制和保证,还能提高影像医生的诊断效率和准确性[4]。笔者将对深度学习在影像诊断及肺结核影像诊断中的应用、不足及展望进行综述。
深度学习是一种涉及高阶思维能力的学习状态,具有自发性、高投入性、理解性、迁移性等特点[5]。1998年Lecun等[6]首次提出使用反传播算法训练多层神经网络,为深度学习的进一步发展奠定了坚实基础。随着深度学习技术在图像处理和计算机视觉领域的广泛应用,利用深度学习技术辅助临床诊断目前已成为医学图像分析领域的研究热点。深度学习的一些算法如 AlexNet、GoogleNet、 ResNet等在医学影像分类、定位、分割和重建等方面均取得了较好的效果[7-9]。此外,其他诸多深度学习网络模型如卷积神经网络[10]、循环神经网络[11]、全卷积神经网络[12]和U-net[13]等,均在针对不同领域的影像实际问题中展示了良好的潜力,有巨大的应用空间。因此,将诸多的深度学习方法与实际图像特点相结合,继而提高识别医学图像特征的准确率,必然是医学辅助诊断发展的重要趋势[14]。
近年来,深度学习在辅助X线影像诊断方面取得了快速发展。刘凯等[15]利用胸部X线摄片(简称“胸片”)深度学习模型就胸片对肺亚实性结节的检出效率与高年资医师做了对比,结果发现,深度学习模型的检出率高于医师组,但假阳性率偏高。此外,基于深度学习建立X线诊断乳腺癌[16]、肺炎[17]等模型,均取得了很好的预测及辅助诊断的效果。同时,深度学习在辅助CT影像诊断方面也逐渐得到认可。Ciompi等[18]检测肺结节利用深度学习技术使用计算机断层扫描中的二维视图,建立与三维视觉效果相似直观检测模型,最终测试模型检测肺结节的平均曲线下面积(area under curve,AUC)为0.868。Coudray 等[19]也研发了一种自动分析病理图像的深度学习模型,它可以区分正常组织和肿瘤组织,而且鉴别病灶性质与病理检查结果的一致性极高。如今,深度学习在辅助CT影像诊断中的应用也越来越广泛,可以对肺癌[20]、皮肤病变[21]、病理显微图像[22]、视网膜照片[23],以及放射资料[24]等各种医学影像进行诊断分析,明显提高了诊断准确性、稳定性和工作效率。
Maduskar等[25]使用自动读图软件(CAD4TB)对胸片上结核病病灶的诊断符合率与医师诊断结果进行对比,CAD4TB的准确率为73%,虽然CAD4TB软件可以针对胸片中的病灶区域进行辅助诊断肺结核,但诊断的准确率还有待提升。此后,Murphy等[26]对CAD4TB进行改进,使用了更加敏感的深度学习模型CAD4TB v6,同时训练分类和定位网络。这可在没有任何预先训练模型的情况下,仅采用图像层面的标记数据集就可给感兴趣区域进行精确定位,经过测试,新模型在90%的敏感度下取得了98%的特异度,相比CAD4TB有了明显提升[27]。Lakhani和Sundaram[28]提出在深度学习框架下以AlexNet和GoogLeNet网络模型相融合对X线影像进行检测,诊断准确率可提高至99%。这进一步表明,深度学习在胸部X线上准确诊断肺结核具有可行性及较高的诊断符合率。近年来,Hwang等[29]建立了一种基于深度学习的自动检测 (deep learning-based automatic detection,DLAD)算法,对这种算法的图像分类和病变定位性能与15名有经验的影像科医师进行对比,DLAD在两个分类性能的准确率均高于诊断医师。曹盼等[30]尝试在胸片上先进行人工标记结核病病灶,建立基于特征金字塔网络的诊断肺结核模型,通过测试集的100张肺结核患者胸片和100张健康人胸片来评价最终训练好的深度学习诊断模型,结果显示,此模型在分类效能、病灶检测、定位效能上均表现良好。
深度学习在肺结核CT影像辅助诊断中也具有重要价值,可以为人工智能在临床应用中诊断活动性肺结核打下坚实基础[31]。Huang等[32]研究了一种基于深度转移卷积神经网络和极端学习机的肺结核新型诊断方法,将两种算法的协同作用融合在一起,新型模型的准确度为94.57%,敏感度为93.69%,特异度为95.15%。Ma等[33]收集了846例患者的CT图像,使用U-Net深度学习算法以自动检测活动性肺结核病变,将病灶在二维图像上的表现通过组合的方式呈现在三维图像,测试结果显示深度学习工具的AUC为0.98,准确度、敏感度、特异度、阳性预测值和阴性预测值分别为 96.8%、96.4%、97.1%、97.1% 和 96.4%,与之前的方法相比,具有更可靠的效果。吴树才等[34]通过收集1764例结核分枝杆菌阳性并接受胸部高分辨率CT平扫检查患者的资料,并由4名影像科医师对含病变的20 139幅CT图像进行分类标注,建立基于CT图像的CNN诊断肺结核模型,CNN模型总体敏感度和准确度分别为 95.47%和 90.40%。但是,对CT图像进行分类标注不仅需要耗费大量时间,而且还需标注者对病灶的识别有着深刻的理解,Wang等[35]建立了一种无需标注的深度学习模型3D-ResNet,用来区分非结核分枝杆菌病和结核病,此模型在训练集、验证集、测试集上的准确率分别为90%、88%、86%,同时也验证了此模型在自动识别CT影像异常病灶的效率明显高于医师诊断。所以,基于深度学习技术的肺结核CT辅助诊断已具有较高的准确度和敏感度。
目前,深度学习已在计算机视觉任务处理中获得了卓越性能,在部分医学图像处理领域也取得了堪比临床专家的诊断效果。但是,总体来说,深度学习在医学图像处理领域仍存在很多挑战和限制[36]。第一,缺乏高质量的标注训练样本。在医学领域中,缺少高质量标注的影像数据会导致训练数据的类别不平衡,进而导致预测结果会偏向样本量多的类别,出现过拟合现象[37]。第二,深度学习技术的本质是一个类似“黑盒子”的模型,很难或几乎不可能解释其系统的技术和逻辑基础。因此,在医疗行业中是否能被认可也是一个问题。第三,使用深度学习辅助影像诊断也可能会使年轻医师产生一定的依赖性,导致诊断水平停滞不前。第四,使用临床医学图像数据促进基于深度学习系统的商业开发可能存在法律和伦理问题,因为该系统的性能高度依赖于训练数据的数量和质量。
深度学习在肺结核影像诊断中的应用研究还不尽完善,仍有值得改进的空间。笔者认为,未来可能的研究重点与方向包括:(1)建立全国多中心标注团队,如此,则既可以避免单一医疗机构收集训练样本造成的局限性,又能够在短时间内收集大量样本;(2)目前的深度学习技术还是以已标注图像的感兴趣区域进行学习为主,但在日常工作中,有大量的未标注的图像需要分析,所以日后需要越来越重视对无标注数据的学习,以及无标注数据自动添加标注信息的研究;(3)加强深度学习模型的理论研究,结合互补的多模态医学图像数据集和图像结构,改善深度学习模型提取特征的功能,进而提高提取特征分类和分割准确性;(4)目前,深度学习的算法及模型的验证是建立在大量样本的基础上,使用有效技术识别小样本数据的方法作为识别数据集,也是未来的研究方向。