DOI:10.19850/j.cnki.2096-4706.2021.09.004
摘 要:针对人工识别皮肤癌恶性肿瘤中不可避免的人为因素,以及效率低、设备要求高等问题,提出了一种基于EfficientNet网络的新的皮肤癌识别与分类方法。首先,由于样本数据量过小,通过数据预处理实现数据增强,从而防止训练模型出现过拟合的问题。然后将数据集在EfficientNet网络模型上进行训练,同时采用Adam调整学习率,进而实现皮肤癌图像的识别与分类。实验结果表明,该模型的准确率和查全率可分别达到90.78%和88.23%,在保证了准确率和查全率的前提下,参数量大大减少,可有效提升临床医学诊断的效率。
关键词:EfficientNet模型;Adam;皮肤癌识别
中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2021)09-0013-03
Skin Cancer Identification and Classification Based on EfficientNet
ZHANG Jiaying
(College of Computer Science and Technology,Huaqiao University,Xiamen 361021,China)
Abstract:A new method for skin cancer identification and classification based on the EfficientNet network is proposed,aiming at the inevitable human factors,low efficiency and high equipment requirements in the manual identification of skin cancer and malignant tumors. Firstly,since the sample data is too small,data enhancement is realized through data preprocessing,so as to prevent the problem of overfitting in the training model. Then,the data set is trained on its EfficientNet network model,with Adam adjusting the learning rate for skin cancer image identification and classification. The experimental results show that the accuracy and recall of the model can reach 90.78% and 88.23%,respectively. On the premise of ensuring the accuracy and recall,the number of parameters is greatly reduced,which can effectively improve the efficiency of clinical medical diagnosis.
Keywords:EfficientNet model;Adam;skin cancer identification
0 引 言
皮膚癌是最常见的癌症类型,常见的皮肤癌有基底细胞癌(Basal Cell Carcinoma,BCC)、鳞状细胞癌(Squamous Cell Carcinoma,SCC)、恶性黑色素瘤(Melanoma,ML)等[1]。2017年,仅美国新确诊ML患者就有85 686人,其中8 056人因此死亡,ML患病率已在所有癌症类型中排第六[2]。ML虽然只占所有皮肤癌的2%,但却最易导致死亡,BCC是最常见的皮肤癌类型,发展速度慢但具有局部侵袭性,SCC约占20%至30%,仅次于BCC[3]。目前常用的皮肤癌检测方法有皮肤活体组织检查和病理组织学检查,即使借助皮肤镜图像分析、共焦显微镜等可帮助医生更好地诊断,诊断结果仍然会受到主观因素的影响,不能保证诊断的准确率[4]。况且这种诊断只适用于一小部分掌握特征识别技巧的专业人士,不具有普适性,因此不能够帮助人们及时地识别出皮肤癌并且尽早地治疗皮肤癌。
为了减少模型训练参数,同时又能够确保皮肤癌识别和分类的准确率及查全率,本文利用EfficientNet模型实现皮肤癌的识别和分类,主要针对9种皮肤病症,分别是BCC、SCC、ML、光化性角化病(Actinic Keratosis,AK)、良性皮肤纤维瘤(Dermatofibroma,DF)、色素痣(Nevus,NV)、色素性良性角化病(Pigmented Benign Keratosis,PBK)、脂溢性角化病(Seborrheic Keratosis,SK)、血管病变(Vascular Lesion,VL)。
1 方法介绍
目前关于皮肤癌的研究主要是针对ML的识别,少有针对各种皮肤癌病症的分类,识别方法多是采用卷积神经网络(CNN),Ameri[5]采用的是AlexNet模型,Codella1等[6]则是在CNN基础上使用了稀疏编码算法从而实现了无监督学习。但是使用CNN实现皮肤癌的识别和分类,往往需要巨大的计算机资源才能达到较高的精度,显然这与皮肤癌的识别普遍化背道而驰。Tan等[7]提出的EfficientNet模型,通过固定训练参数,使得精确度在消耗更少资源的情况下得到提升,且模型具有较好的迁移效果[8],故本文采用EfficientNet模型对皮肤癌图像数据集进行训练,并在EfficientNet模型的基础上对数据进行预处理,并采用Adam算法进行学习率的调整,从而使得EfficientNet模型得到进一步优化。
1.1 数据预处理
数据集的大小一定程度上影响着模型的准确率,为了在已有的图像数据集的基础上扩大图像数量,通常会采用裁剪、平移、翻转、旋转、调整饱和度及对比度的方式对图像進行处理[9]。
在皮肤病图像数据集中,PBK图像数量最多,占462张,而DF、SK图像数量则较少,不足百张,故采用图像增广技术对数据进行处理。将输入数据集图像进行去中心化处理,同时利用标准差进行标准化;设置随机转动的角度为45°,对图像进行旋转处理,生成不同旋转角度的图像;对图像进行水平翻转和竖直翻转;设置偏移比例为0.2,使图像按照原图像高度的20%进行竖直偏移,按照原图像宽度的20%进行水平偏移。从而完成图像数据的预处理工作。
1.2 模型构建
1.2.1 Efficientnet网络
根据混合系数?取值的不同,有B0至B7共8种网络模型,其中EfficientNet-B0为基准网络,当?=1时,找出三个比例系数α,β,γ的最佳组合,然后固定三个比例系数,逐渐放大混合系数?,依次得到B1至B7网络模型。基准网络EfficientNet-B0的结构如表1所示。
EfficientNet通过平衡网络的宽度、网络的深度以及网络的分辨率得到了更高的精度及效率。这正是皮肤癌识别与分类在临床试验中需要用到的,故本文采用EfficientNet-B6网络模型对皮肤癌图像数据集进行训练,以更少的参数量训练出精度更高的网络模型。
1.2.2 Adaptive Moment Estimation
Adam优化器是由OpenAI的Diederik Kingma和多伦多大学的Ba等提出的[10]。计算简单且高效,对内存需求也较少,几乎适用于所有场景,尤其适用于大规模的数据及参数的场景,故采用Adam优化器对模型进行优化。Adam算法综合了Momentum算法和AdaDelta算法的特点,在两算法的基础上进行了改进。
2 实验
2.1 实验环境
本实验采用Python编程语言,CPU处理器为Intel(R) Core(TM) i7-6700K CPU @ 4.00 GHz×8,GPU处理器为NVIDIA GeForce GTX 2080Ti,内存(RAM)为16 GB,操作系统为64bit Windows 10专业版。
2.2 实验数据
数据集来自Kaggle提供的公开数据集,数据集中共有2 357张恶性和两性肿瘤图,包含了9类皮肤病症图像,分别是: BCC、SCC、ML、AK、DF、NV、色PBK、SK、VL。由国际皮肤影像协会(International Skin Imaging Collaboration,ISIC)提供并进行准确分类。
2.3 参数设置
选用EfficientNet-B6网络结构可以使得整个模型的准确率、查全率和效率达到最优的效果,同时又不会过度地浪费计算资源,使得算法对设备的要求提高。经多次实验后,得到了本模型的最优参数组合,设置图像标准化大小Norm_size为512×512,批量大小Batch_size为128,初始学习率Init_learning_rate为0.001,共迭代epoch100次。
2.4 实验结果及分析
2.4.1 准确率和查全率
采用识别的准确率(Accuracy)和查全率(Recall)来衡量模型的性能:
其中,TP(True Positive)为真正例的个数,TN(True Negative)为真负例的个数,FP(False Positive)为假正例的个数,FN(False Negative)为假负例的个数。根据准确率和查全率的计算方法可以得出,准确率越高,模型识别越准确,查全率越高,越能有效避免恶性肿瘤未被识别的情况,因此准确率和查全率越高,模型的性能越好。本实验最终准确率和查全率可分别达到90.78%和88.23%。
2.4.2 结果分析
数据集中的训练集和测试集已被分好,未进行预处理前,训练集数据量为2 239,测试集数据量为118,为了更准确地看出识别效果,在测试集上对每类皮肤病分别进行训练,得到的训练结果如表2所示。
从表中可以看出,各类皮肤病训练准确率均可达到85.5%以上,准确率最高可达到95.3%,对于皮肤病DF、SK准确率较低,一定程度上是由于DF、SK数据集的数量较低造成的,但总体所得准确率较为理想。
在模型训练的过程中,可看出模型训练的参数量较其他深度学习网络模型较小,与Resnet-50、Resnet-101对比可看出EfficientNet模型的优越性,参数量对比数据如表3所示。
本实验采用的是EfficientNet-B6模型,较Resnet-50、Resnet-101网络模型参数量已经显著减少,而EfficientNet- B0模型参数量又会比EfficientNet-B6模型小许多,可见EfficientNet模型在参数量上的优越性。
3 结 论
基于EfficientNet模型,本实验进行了皮肤癌的识别与分类,实现了BCC、SCC、ML、AK、DF、NV、PBK、SK、VL九类皮肤病的识别。方法的主要特点在于对图像数据进行了预处理,搭建了EfficientNet模型并利用Adam优化器进行学习率的调整。结果表明,本实验方法可以使得数据集中9种皮肤病症分类的准确率和查全率得到提升,并大大减少了深度网络模型训练的参数量。不足之处在于数据量不够充足,且各类皮肤病的数据量分布严重不均。今后的工作将会进一步改进。
参考文献:
[1] 许美凤,国雷达,宋盼盼,等.多卷积神经网络模型融合的皮肤病识别方法 [J].西安交通大学学报,2019,53(11):125-130.
[2] Centers for Disease Control and Prevention. United States Cancer Statistics:Data Visualizations [DB/OL].[2021-02-24].https://gis.cdc.gov/Cancer/USCS/#/AtAGlance/.
[3] LINARES M A,ZAKARIA A,NIZRAN P. Skin cancer [J].Primary Care:Clinics in Office Practice,2015,42(4):645-659.
[4] KOLM I,HOFBAUER G,BRAUN R P. Early diagnosis of skin cancer [J].Therapeutische Umschau.Revue Therapeutique,2010,67(9):439-446.
[5] AMERI A. A Deep Learning Approach to Skin Cancer Detection in Dermoscopy Images [J].Journal of biomedical physics & engineering,2020,10(6):801-806.
[6] CODELLA N,CAI J J,ABEDINI M,et al. Deep Learning,Sparse Coding,and SVM for Melanoma Recognition in Dermoscopy Images [C]//Proceedings of the 6th International Workshop on Machine Learning in Medical Imaging-Volume 9352.Cham:Springer International Publishing,2015:118-126.
[7] TAN M X,LE Q V. EfficientNet:Rethinking Model Scaling for Convolutional Neural Networks [J/OL].arXiv:1905.11946 [cs.LG].(2019-05-28).https://arxiv.org/abs/1905.11946v1.
[8] 張敏,赵雪青.基于EfficientNets的织物疵点图像分类方法 [J].纺织高校基础科学学报,2020,33(4):64-70.
[9] 龚安,郭文婷.基于卷积神经网络的皮肤癌识别方法 [J].计算机技术与发展,2020,30(10):167-172.
[10] KINGMA D P,BA J. Adam:A Method for Stochastic Optimization [J/OL].arXiv:1412.6980 [cs.LG].https://arxiv.org/abs/1412.6980.
作者简介:张嘉颖(2001—),女,汉族,山东枣庄人,本科在读,研究方向:图像处理、深度学习。
收稿日期:2021-04-13