基于CNN的COVID-19医学影像远程诊断算法与实现

2021-09-24 04:15谢豆郑菲陈涛刘文军
电脑知识与技术 2021年23期
关键词:医学影像标签卷积

谢豆 郑菲 陈涛 刘文军

摘要:借助人工智能技术以及信息化远程医疗技术,搭建基于人工智能的影像远程会诊平台,成为提高医学影像诊疗效率的一种有效手段。目前的新冠肺炎疫情检测方法有临床表现描述、病原学检测、血清学检测,以及使用肺部影像进行进一步的辅助诊断。探索建立医学影像远程诊断平台,并基于卷积神经网络VGG模型对X射线肺部影像进行诊断,这种自动化的方法能够对患者的辅助诊断起到一定的效果,从而减轻医生的工作量。

关键词:机器视觉;深度学习;计算机辅助诊断;VGG16;新型冠状病毒肺炎(COVID-19)

中图分类号: TP393      文献标识码:A

文章编号:1009-3044(2021)23-0137-03

Abstract: With the help of artificial intelligence technology and information telemedicine technology, the establishment of an artificial intelligence-based remote imaging consultation platform has become an effective means to improve the efficiency of medical imaging diagnosis and treatment. The current COVID-19 detection methods include description of clinical manifestations, pathogenic testing, serological testing, and the use of lung imaging for further auxiliary diagnosis. Explore the establishment of a medical imaging remote diagnosis platform, and diagnose X-ray lung images based on the convolutional neural network VGG model. This automated method can have a certain effect on the auxiliary diagnosis of patients, thereby reducing the workload of doctors.

Key words: machine vision; deep learning; computer aided diagnosis; VGG16; COVID-19

2019年底爆發至今的COVID-19肺炎是由SARS-CoV-2感染引起的一种严重急性呼吸综合症,伴有发烧、咳嗽、头痛、肌痛,在某些情况下还有肠道症状。疫情蔓延全世界,爆发初期病例呈指数增长,它被世界卫生组织(World Health Organization,缩写WHO)称为一种大流行病,每个国家都深受其害。面对COVID-19大流行,我国政府采取了科学、有力的防控措施,使得疫情在国内得以有效控制,但仍有大量的境外疫情输入威胁着人们的健康。

随着我国对COVID-19肺炎的临床表现、病理认知的深入和诊疗经验的积累,提早检测出COVID-19患者,阻止病情扩散成为控制疫情发展的关键。除了使用核酸检测进行是否患病的判断并及时进行相关人员的14天隔离,作为补充还可以使用肺部影像进行辅助诊断。因为COVID-19以肺脏和免疫系统损害为主,当成人肺内病变在短期内迅速发展、儿童影像学显示双侧或多肺叶浸润、胸腔积液或短期内病变加速,都是重型、危重型临床预警指标。由于需要筛查的人员数量众多,需要进行诊断的肺部影像基数大,放射科医生数量有限,这不仅让患者就诊时间增加,也给医院诊疗带来了压力。

当前存在多项采用卷积神经网络(Convolutional Neural Networks,CNN)分类方法辅助COVID-19的诊断相关研究[1]。为了缓解医患压力,缩短肺部医疗影像就诊时间,降低就诊成本,本文将深度学习算法与计算机视觉相结合,对肺部医疗影像进行处理,并将训练好的深度学习模型用于诊断用户是否患病。模型还可灵活部署于各种远程诊疗应用中,大大缩短了就诊时间,可用于辅助医生进行前期筛查诊断,提高就医效率。

1 预备知识

1.1 数据集

训练使用的数据集采用了X射线肺部影像。数据集为二分类数据集,一类为正常肺部影像4098张,用标签normal(正常)表示,另一类为COVID-19肺部影像4098张,用标签pneumonia(肺炎)表示。总的数据集为8196张图片,因为两类样本的数量相同,因此大大降低了二分类中常出现的样本不均衡问题发生降低性能的概率。与多分类比起来,二分类的复杂程度更低,从而使单类的判断确定性提高。

关于肺部影像除了X射线影像还有CT影像,如图1所示分别给出了两种图像类型在正常和异常(确诊)情况下的对比。图1中的CT图像数据集内容由Yang等人提供[2],而本文选用X射线影像的原因在于X射线图片更大更清晰,图片上的无用信息少,不容易干扰模型学习。相比之下,CT影像常常出现设备信息干扰模型学习。此外,X光机更便宜、操作速度更快,检测成本更加低廉。

1.2 数据预处理

卷积神经网络是深度学习代表性的网络,能够学习强大的表征空间,这是解决复杂学习任务所必需的。由于在训练过程中容易发生过拟合现象,因此需要适当的正则化。考虑到现有数据集数量有限,对原有的数据集进行图像处理增加图像数量继续训练的技术称为图像增强。图像增强是正则化中重要的一种形式,也是训练模型时常用的方式,它可以提高模型的鲁棒性,同时最大限度地提高模型的精度,使模型更加贴合真实的使用场景。

猜你喜欢
医学影像标签卷积
医学影像技术在医学影像诊断中的合理运用
《当代医学影像误诊学》出版
基于3D-Winograd的快速卷积算法设计及FPGA实现
《当代医学影像误诊学》正式出版
从滤波器理解卷积
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
基于傅里叶域卷积表示的目标跟踪算法
标签化伤害了谁
基于多进制查询树的多标签识别方法