李晓坤 郑永亮 邵娜
摘 要: 随着信息技术的飞速发展,AI技术在各个领域都得到了广泛研究并应用,更在一些领域打破了当下困惑,突破了瓶颈。将AI技术与医学影像处理结合是一项非常具有前景的项目。基于AI技术在医学影像领域的应用具备很多种可能。当下社会,癌症逐渐成为中共公民的致命杀手。最常见的诊断模式就是放射科医生根据CT影像诊断。但是以目前的条件,并不能保证患者在早期发现癌症,故而错失了最佳治疗时机。我们需要一种能够发现早期癌症并诊断的方法。正文主要介绍了AI技术与医学影像处理技术的发展历史及发展近况,研究目的及意义。通过AI技术建立影像识别模型从而引入医学影像处理技术中分析其发展前景。现如今人工智能已成为了当下的热门课题。深度学习的提出不仅拓展了AI技术的整体范围,还突破了当下许多技术难题。本文以肺部疾病为例,应用深度学习技术,探讨基于AI技术在医学影像处理的应用,从而达到促进医疗水平进步的目的。
关键词: AI技术;深度学习;医学影像
【Abstract】: With the rapid development of information technology, AI technology has been widely researched and applied in various fields, breaking the confusion in some fields and breaking through the bottleneck. The combination of AI technology and medical image processing image is a very promising project. There are many possibilities in the application of AI technology in the field of medical imaging. In the present society, cancer has gradually become a fatal killer of the citizens of the Communist Party of China. The most common diagnostic model is a radiologist based on CT imaging. But with the current conditions, it does not guarantee the early detection of cancer, so the best time for treatment is lost. We need a way to detect and diagnose early cancer. The text mainly introduces the development history and recent development of AI technology and medical image processing technology, and the purpose and significance of the research. The AI technology is used to establish the image recognition model and then introduce the medical image processing technology to analyze its development prospect. Now artificial intelligence has become a hot topic. The advanced study not only expands the overall scope of AI technology, but also breaks through many technical problems. Taking lung disease as an example, we apply deep learning technology to explore the application of AI technology in medical image processing, so as to achieve the goal of improving medical level.
【Key words】: AI technology; Deep learning; Medical images
0 引言
伴隨着人类几千年的进步,人类逐渐走向了信息化时代。在这个大环境下,AI技术得到了飞跃性的发展。AI技术已经融入了各行各业并得到了广泛的应用。包括由AI技术衍生的机器学习及深度学习技术都得到了众多科研人员的深入研究。基于AI技术在医学影像处理中的应用是非常具有前景的研究方向,该方面的研究成果对人类现代医学的进步起着促进作用。癌症已成为现如今最为致命的疾病。根据统计,中国在一年中大约产生429.2万新发癌症病例,约有281.4万人死于癌症。在这些统计数据中,新发现肺癌症73.3万例,大约有61万人死于肺癌,因而肺癌已经成为中国公民癌症人群中最致命的利刃。不仅在中国,在全世界范围内肺癌都是死亡率非常高的疾病[1]。肺癌之所以致死率极高,很大的原因是患者在早期未能及时发现,导致一旦发现病情已经处于晚期。因此对肺癌的诊断一定要具备时效性和准确性。目前最常规的诊断方式是放射科医生根据CT图像,通过大小、钙化形式、密度等诊断肺结节。随着发病率的居高不下,国内各大医院均呈现出一种人满为患的趋势,患者的数量与医生的数量不成正比。在防止病人疾病恶化的前提下,并不能保持一定的时效性。近些年人工智能技术已成为大热,尤其是深度学习技术在图像识别领域得到了飞跃性的进步[2]。因此基于AI技术在医学影像处理方面领域的应用是非常具备研究前景的。
计算机辅助检测(CADe),也被称为计算机辅助诊断(CADx),是帮助医生处理医学图像的系统。X射线、MRI和超声诊断中的成像技术中产生了大量的信息,放射科医生或其他医学专业人员必须在短时间内全面分析和评估。CAD系统处理并分析相应的医学图像。并标记相关部分,如可能获得的疾病,以便帮助医生作出医疗方案。CAD能够检测出特征异常的患者,早期靠人力并不能及时发现,例如糖尿病视网膜病变、乳腺结构扭曲[3]-[4]、CT中的磨玻璃结节[5-6]等。在肺癌的诊断中,建立了特殊的三维CAD系统,并考虑了相应条件[7]。在此基础上,编制并分析了多达3000个单一图像的体积数据集。圆形病灶1毫米可检出。肺癌的早期发现是非常具有价值的。肺癌的5年生存率率停滞在过去的30年,现在大约只有15%。肺癌比乳腺癌、前列腺癌和结肠癌的患者更多。这是由于这种癌症的无症状生长所致。在大多数情况下,如果患者的最初症状是成功治疗太晚。根据美国癌症学会估计,如果肺癌在早期被发现,生存率将提高到47%。虽然计算机CAD已经在临床环境使用40余年,但是该系统高度依赖人工设定的特征,并不能代替医生或专业人员,仅仅起到一个辅助作用。这种传统的浅层学习结构在面对复杂且庞大的数据时,并不能发挥其优势。
1 医学影像处理技术和AI技术的概述
1.1 AI技术概述
人工智能是一种由机器来独立运作的智能技术,与人类和其他动物展示的自然智能(NI)形成對比。计算机科学中的人工智能研究定义为“智能代理”研究:任何设备,感知其环境,并采取行动,最大限度地发挥其成功地实现其目标的机会[8]。“人工智能”应用机器模仿人类与人类其他大脑认知功能如“学习”和“问题解决”[9]。一个典型的人工智能能够感知其环境,并采取行动,最大限度地发挥其成功实现其目标的机会。人工智能的目标函数可以是简单的(如AI赢了围棋为“1”否则“0”)或复杂(在数学上采取类似的行动,得到回馈)。目标可以明确定义,或者可以诱导。如果AI编程是“强化学习”,目标可以隐式地通过奖励和惩罚某些行为从而进行学习。另外,进化系统可以诱导目标采用“健身功能”的变异和优先复制高得分的AI系统;这是类似于动物进化是靠天生的欲望达成某些目标,如寻找食物,或是狗可以通过人工选择培育具有所需性状。一些人工智能系统如近邻或类推;这些系统一般都不是给定的目标,但目标是某种程度的训练数据。人工智能通常围绕算法的使用。算法是机械计算机能够执行的一组明确的指令。复杂算法通常建立在其他简单算法之上。一个简单的算法例子是如下:在井字游戏中最佳打法。机器学习是人工智能研究的一个基本概念。无监督学习是在输入流中找到模式的能力。有监督学习包括分类和数值回归。分类是用来确定某物属于什么范畴。回归是试图产生一个函数来描述输入和输出之间的关系,并预测当输入改变时输出应该如何变化。在强化学习中,代理人因良好的反应而受到奖励,并因不良的行为而受到惩罚。代理使用这种奖励和惩罚的顺序,形成在其问题空间中运行的策略。这机器学习算法及其性能的数学分析是理论计算机科学的一个分支,被称为计算学习理论,为AI技术的打开了一扇崭新的大门。在发展机器人技术,发展学习
方法阐述让机器人通过自主学习积累新的技能,如人类教师的社会互动或引导机制的使用[10-11-12-13]。十一世纪,人工智能技术经历了计算机动力、大量数据和理论理解的同步发展,而人工智能技术已成为科技产业的重要组成部分,有助于解决计算机科学中许多具有挑战性的问题。
1.2 深度学习技术概述
杰弗里·辛顿等人在21世纪初提出了深度学习的技术。在当时的环境下,深层结构学习是一项难以攻克的技术难题。后来一种名为非监督逐层训练算法的算法被提出,突破了当时的技术瓶颈。后来又提出来一种能够利用空间关系的控制进而大幅度简化参数,从而达到提高训练性能的目的[14]。就是深层结构编码的编码器。深度学习是由多个深度神经网组成。在图像识别、医疗诊断、语音识别、社交网络、智能翻译等领域中均得到了可观的进展。有些领域,经过深度学习能力训练后,他的能力甚至要优于该领域的专家。深度学习是一种在海量数据中深度挖掘并学习的机器学习模式,深度学习的提出拓展了AI的范围,使得AI技术得到了进一步的发展。在特征的提取与转换过程中,与传统模式不同的是利用级联多个非线性处理单元。连续层之前的输入层与输出层之间互相转换,下一层利用上一层的输出层作为输入层。深度学习采取的是一种多层空间架构,不同层之间进行映射。若干个层次堆积起来形成一种多层次结构,采取一种坡度下降的模式来执行反向传播训练。深度学习中包含人工神经网络和隐含层。与此同时也可能包含深层学习模型中组织变量的潜变量。例如深层信念网络中所包含的节点和深度玻尔兹曼机。
2 数据来源及技术概述
2.1 数据来源
本文所使用的实验数据是来自于哈尔滨某影像数据中心的CT图像,包含了224个病例,其中共有563个结节,直径范围在3-30mm。使用的是美国通用公司的GE Discovery ST16 PET-CT机。
2.2 卷积神经网络
卷积神经网是机器学习领域范畴内的一种前馈人工神经网络,适合应用在图像识别、语音识别等领域。CNN具备变化多层感知器,对预处理的要求最小[15]。这是一种具备空间稳定性的神经网络,同时具备权重共享的特点[16-17]。卷积神经网络的灵感来源于生物学[18],借鉴了动物视觉皮层组织结构。只有受约束的可观测区域会刺激独立的神经单位,这被称作感受野。这意味着深度网络引用了传统算法中手工设计的过滤器。在特征设计中,这种独立于先前知识和人工学习的独立性是一个主要优点。卷积神经网络在图像识别、语音识别、推荐系统[19]和语言识别分析等领域都有广泛应用[20]。其结构图如图1所示。
2.3 深度卷积神经网络
深度卷积神经网络是属于多层范畴内的神经网络。传统神经网络大多采取层与层全连接的架构模式,而该网络采取的是一种稀疏式连接。这种连接方式的优势是可以深入分析该神经网络层与层之间的相关性,在提取具有因果关系数据的过程中效果显著。在图像识别、语音识别、语义分析等领域都比较适用。在本文中以肺癌PET-CT图像为例,每一卷积层的偏执项及权重矩阵等参数相同,对图像中进行特征提取计算,最终得出输入端的特征图。这种权重共享的模式其中最大优点就是可有有效的降低网络架构中的参数,大幅减少在网络中的计算成本。相对于原始的神经网络,该神经网络的架构通常是由卷积层与池化层组合搭建,并且层的数量也相对较多。其结构特征图如图2所示。当下深度卷积神经网络通过梯度下降法来降低大量运算过程中的数据丢失,从而对各个参数进行反向调节,利用多次迭代训练的方式加强该神经网络的训练能力[21]。
2.4 3D卷积神经网络
3D CNN相对于传统的卷积神经网络来说能够更有效的捕捉时间与空间的数据信息。3D CNN对影像处理的时间维度为3。换一种说法就是将对连续的3帧影像进行卷积操作,通过3D卷积捕捉多个连续的帧用来组成一个立方体,之后输入该立方体运用卷积核计算。在这个架构中之中,卷积层中的特征map会和上一层的多个连续帧相连接,从而达到捕捉运动信息的目的。因为在3D CNN中权值是共享的,所以3D卷积核只允许从cube中提取一种类型的特征[23]。结构特征图如图3所示。
3 医学影像处理建模实验
本节将基于AI技术在医学影像处理的应用进行实验,从而计算出不同方法的准确率、敏感度以及特异性。
准备阶段:本节所使用的实验数据是来自于哈尔滨某影像数据中心的CT图像,包含了224个病例,其中共有563个结节,直径范围在3-30mm。使用的是美国通用公司的GE Discovery ST16 PET-CT机。
3.1 实验步骤
首先对图像进行预处理,将图像中背景等影响消除,得到肺部独立的图像。并且对肺结节部位进行定位选做ROI.如图4所示。在数据的处理方面,将数据集中的CT图像的HU值限定在(-1000-400)。以便高效率的进行对有效组织的训练与学习,以此过滤掉噪声等对对肺部图像计算的影响。然后将HU值通过标准化處理限定在0-1之间,从而为训练提速。对于普通神经网络,将CT图像从512?512px改变成为260?260px,目的是降低图像计算程度,提高计算效率。在3D CNN架构中,在结节中选取一个中心点为坐标,组合成一个16?16?16px的小立方体,用作输出。在检测出结节后,根据其大小外表特征等对其分类判断是否为恶性结节从而进行诊断。该实验将分别选取CNN、DCNN、3D CNN模型进行实验,与此同时选取AlexNet这种经典模型进行比较。
3.2 实验结果及分析
依照实验步骤计算可得出结果如表1所示。
通过上述过程,得出使用不同神经网络的灵敏度、特异性、正确率以及假阳性率的差异,在人工智能技术得到广泛应用的前提下,我们选取了经典的神经网络AlexNet、CNN以及新型的神经网络架构DCNN、3D CNN。根据表1可以看出3D CNN的对于肺结节的检测能力要优于其他模型。更加证明了基于AI技术在医学影像处理方面的应用是非常具有发展前景的。
4 结论
根据上述实验可以看出,基于AI技术在医学影像处理中的应用是一种高效而精准的途径。选取四个神经网络模型进行对比。从灵敏度的对比中可以看出,3D CNN比AlexNet高了4.17%,比CNN高了4.98%,比3D CNN高了1.17%;从特异性的对比中可以看出,3D CNN比AlexNet高了4.98%,比CNN高了5.29%,比3D CNN高了1.2%;从正确率的对比中可以看出,3D CNN比AlexNet高了7.77%,比CNN高了8.76%,比3D CNN高了2.89%;从假阳性率的对比中可以看出,3D CNN比AlexNet低了1.2%,比CNN低了1.42%,比3D CNN低了0.56%。对以上数据我们分析其原因,DCNN网络相对于传统神经网络来说层数较多,并且卷积层与池化层相结合,在通过梯度下降的方式尽量减少了函数的损失,进而提高了计算能力。3D CNN相对于其他模型来说表现更好,主要是因为3D CNN网络能够对空间特征进行分析并学习。
随着中国公民生活水平的大幅度提高,人口基数不断增长但也同时增加了大量的患者,尤其是癌症患者的发现率常年居高不下。随着计算机技术的高速发展,近年来医学影像设备的成像水平与质量稳步提升[24],医学未来发展四大方向个性化、精确化、微创化与远程化在计算机技术的辅助下也逐渐步清晰明了[25]。将AI技术引入医学影像识别领域是一项造福人类的工程。结合人工智能对医学影像进行分析能够极大的降低成本,并且有效的提高效率,但是,在医学图像处理的实际应用中,应根据被处理图像的实际特点,因地制宜[26]。人工智能发展开始进入了一个全新的时期[27],人工智能在专业应用领域发展迅速,许多技术尽管现在距离实用差距很大,但在未来十到十五年极有可能实现[28]。本文希望通过基于AI技术在医学影像处理的应用研究,能够缓解当前的医疗困境,突破技术瓶颈,能够更加有效的对医学影像进行识别,加强人工智能对医疗领域的帮助,降低医疗成本,从而促进医疗水平进步。
参考文献
Chen W Q, Zheng R S, Zhang S W, et al, Cancer statistics in China, 2015[J]. CA Cancer J Clin, 2016, 66(2): 115-132.
Zhou S K, Greenspan H, Shen D. Deep learning for medical image analysis[M]. NewYork: Academic Press, 2017.
Bird R. E, Wallace, T. W, Yankaskas, B. C. Analysis of cancers missed at screening mammography[J]. Radiology. 1992, 184: 613-617.
Baker, J. A., Rosen, E. L; Lo, J. Y.; et al. Computer-Aided Detection (CAD) in Screening Mammography: Sensitivity of Commercial CAD Systems for Detecting Architectural Distortion[J]. American Journal of Roentgenology. 2003, 181: 1083-1088.
Jang, H. J.; Lee, K. S.; Kwon, O. J.; et al. Bronchioloalveolar carcinoma: focal area of ground-glass attenuation at thin- section CT as an early sign[J]. Radiology. 1996, 199: 485-488.
Suzuki K, Li F, Song, S, Doi, K. Computer-aided diagnostic scheme for distinction between benign and malignant nodules in thoracic low-dose CT by use of massive training artificial neural network[J]. IEEE Transactions on Medical Imaging. 2005, 24: 1138-1150.
Abe, Yoshiyuki, Hanai, Kouzo, Nakano Makiko, Ohkubo, Yasuyuki, Hasizume, Toshinori, Kakizaki, Toru, Nakamura, Masato, Niki, Noboru; Eguchi, Kenji. A Computer-aided Diagnosis (CAD) System in Lung Cancer Screening with Computed Tomography[J]. Anticancer Research. 2005, 25 (1B): 483-488.
Russell Stuart J, Norvig Peter. Artificial Intelligence: A Modern Approach (2nd ed.)[M]. New York; Prentice Hall, 2003: 124-175.
Russell Stuart J, Norvig Peter. Artificial Intelligence: A Modern Approach (3rd ed.).[M]. New York; Prentice Hall, 2009: 128-175.
Weng, J.; McClelland; Pentland, A.; Sporns, O.; Stockman, I.; Sur, M.; Thelen, E. Autonomous mental development by robots and animals[J]. Science. 2001, 291: 599-600.
Lungarella M, Metta G, Pfeifer R, Sandini G. Developmental robotics: a survey[J]. Connection Science. 2003, 15: 151- 190.
Asada M, Hosoda K, Kuniyoshi Y, Ishiguro H, Inui T, Yoshikawa Y, Ogino M, Yoshida C. Cognitive developmental robotics: a survey[J]. IEEE Transactions on Autonomous Mental Development. 2009, 1(1): 12-34.
Oudeyer P-Y.. On the impact of robotics in behavioral and cognitive sciences: from insect navigation to human cognitive development[J]. IEEE Transactions on Autonomous Mental Development. 2010, 2(1): 2-16.
孫志军, 薛磊, 许阳明, 王正. 深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806-2810.
LeCun, Yann. LeNet-5, convolutional neural networks[J]. Retrieved 16 November. 2013.
Zhang, Wei . Shift-invariant pattern recognition neural network and its 2optical architecture[C]// Proceedings of annual conference of the Japan Society of Applied Physics. 1988.
Zhang, Wei. Parallel distributed processing model with local space-invariant interconnections and its optical architecture[J]. Applied Optics. 1990, 29(32): 4790-7.
Matusugu, Masakazu; Katsuhiko Mori; Yusuke Mitari; Yuji Kaneda. Subject independent facial expression recognition with robust face detection using a convolutional neural network[J]. Neural Networks. 2003, 16(5): 555-559.
van den Oord, Aaron; Dieleman, Sander; Schrauwen, Benjamin. Burges, C. J. C.; Bottou, L.; Welling, M.; Ghahramani, Z.; Weinberger, K. Q., eds. Deep content-based music recommendation[J]. Curran A ssociates, Inc. pp. 2013: 2643- 2651.
Collobert, Ronan; Weston, Jason A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning[C]// Proceedings of the 25th International Conference on Machine Learning. 2008: 160-167.
Murphy K, van Ginneken B, Schilham A M R, et al. A large-scale evaluation of automatic pulmonary nodule detection in chest CT using local image features and k-nearest- neighbour classification[J]. Med Image Anal, 2009, 13(5): 757-770.
楊晶晶, 王骞, 宣晓华. 基于深度卷积神经网络算法的肺结节检测模型[J]. 数学建模及其应用, 2017, 6(04): 19-91.
Ji, Shuiwang, et al. 3D Convolutional Neural Networks for Human Action Recognition[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence. 2012: 221-231.
董默, 赵若晗, 周志尊, 等. 医学图像三维重建系统设计与应用[J]. 软件, 2018, 39(1): 87-90.
董默, 赵若晗, 周志尊, 等. CAD技术在医学信息化发展中的应用介绍[J]. 软件, 2018, 39(4): 33-35.
郭璇, 郑菲, 赵若晗, 等. 基于阈值的医学图像分割技术的计算机模拟及应用[J]. 软件, 2018, 39(3): 12-15.
梁子鑫. 探讨新时代背景下新兴技术在人工智能中的应用[J]. 软件, 2018, 39(7): 166-169.
汪子尧, 贾娟. 人工智能的前生、今世与未来[J]. 软件, 2018, 39(2): 223-226.