陈世恩 连旭灿
[中图分类号]R563.1 [文献标识码]A
电子计算机断层扫描(computed tomography,CT)图片的采集速度快、可以被广泛应用各类病毒性肺炎的筛查和诊断。但是CT图像中切片数量多,需要花费医生较长的时间来分析诊断。利用人工智能(artificial intelligence,AI)技术,被证实可以高效地辅助医生进行快速地筛查和诊断。图像增强技术作为一种样本数据增强技术,也常被用于深度学习中。由于医学图像的特异性,一些常见的数据增强技术并不适用于CT图像。本文拟采用的CT图像增强技术包括了:中值滤波、直方图均衡和小波变换。
采用胸部cT图像在对新冠肺炎(corona virus disease 2019,COVID-19)提供准确、快速、廉价的筛查和检测方面很有前景。在本文中,研究采用了一个开源的COVID-CT数据集,其中包含275个COVID-19检测呈阳性的CT图像,有助于使用深度学习方法分析病人的CT图像并预测其是否患有新冠的相关研究和发展。研究采用的相关数据和代码:https:∥github.com/UCSD-A14H/COVID-CT。首先对数据集进行分配,训练集与测试集按8:2比例随机分配CT图片。由于本次研究的数据集较小,在学习过程中很容易出现过拟合现象。为了防止此类现象的发生,我们采用了残差网络(residual network,ResNet-34)进行学习,并对其进行参数优化。研究除了采用CT图像增强技术外,还进行了参数的优化研究。研究采用的优化器是二分类问题中常用的Adam算法(adaptive moment estimation,Adam)和随机梯度下降法(stochasticgradient descent,SGD)两种优化器。模型的学习率经过实验得出:当学习率为0.0006时可以获得最佳的准确率。模型采用的批处理参数(batch-size)为64,完成一次整个数据集的训练为1个epoch,我们将epoch设定为50。
3.1 SGD不同图像增强方法结果对比图
研究将原图按照三种图像增强方法分别增强后,并将原图和增强后的数据进行混合学习。在使用SGD优化器得出的学习结果如下图1所示。
图1 SGD不同图像增强方法结果对比图注:SGD为随机梯度下降法
从图1可以直观地观察到,采用不同的图像增强方法对于提高识别准确率的作用较小,识别的准确率一直保持在0.8附近。最佳的准确率为0.82。
3.2 Adam不同图像增强方法结果对比图
将SGD优化器更换为Adam优化器后,得出的结果如下图2所示。
图2 Adam不同图像增强方法结果对比图
注:Adam为Adam算法
从图2可以看出,准确率仍然是在0.8附近。最佳的准确率为0.84。
3.3运行50epoch的时间对比图
对比采用Adam和SGD优化器后发现两者学习时间有较大的差异,见图3。
图3 运行50epoch的时间对比图
从图3中可以采用Adam优化器在8个epoch后可以显著降低学习时间。
本文采用不同优化器Adam和SGD,并对比研究了采用不同图像增强方法时CT肺炎图片识别准确率不同。研究得出CT图像增强方法不能有效地提高识别准确率,采用优化器Adam可有效地降低学习时间。下一步擬增加普通肺炎CT图片数据并对网络进行进一步地优化,以获得更高的识别准确率。