林雪莹,韩贵来,江剑龙,黎雯,李卓文,黄砥
(海南医学院医学信息学院,海口 570100)
早期肺癌CT图像的计算机辅助诊断技术
林雪莹,韩贵来,江剑龙,黎雯,李卓文,黄砥
(海南医学院医学信息学院,海口 570100)
肺癌是一种众所周知的疾病,也是当今最常见的癌症之一。经过调查发现,以往几十年里肺癌的死亡率及其发病率一直高居榜首,给人们带来了极大的恐慌。恶性肿瘤的治疗需要及时的发现治疗,否则到了后期更难处理。肺癌早期一般表现为肺结节,其主要检测方式为CT影像。而医院每天产生的大量CT图像不仅加重了医生的负担,还容易造成漏诊、误诊的情况。为减少影像科医生的阅片时间,提高诊断的准确率,分析利用计算机辅助诊断(CAD)技术来帮助医生筛选出可能患有肺癌的CT图像。
CAD;肺结节分割;特征提取;分类判别
癌症已成为当今社会中严重危害人类健康的重大疾病之一,据调查显示,如今肺癌在人群中的发病率越来越高,而在我国肺癌的发病率每年增长大约26.9%。如果不采取行之有效的措施,2025年左右得了肺癌的患者将达到100万甚至超过100万。而到时候我国也同时将成为肺癌患者最多的一个国家[1]。
肺癌早期总以肺结节表现出来。肺结节是指肺部类直径3~30mm间的局灶性不透明病灶,其中直径在3~10mm间的肺结节称作微结节,直径在10~20mm间的肺结节称作小结节[2]。计算机断层图像(CT)是检查肺结节的重要方法。但随着日趋成熟的图像处理技术,一次肺部的CT扫描图像数量就有几十张,甚至达到上百张。CT图像的增多和肺结节的微小病灶都给医生带来极大的挑战。这些问题的出现不仅不能减少医生工作量,还影响了医生的工作效率,有时甚至使得误诊几率大大增加。
近年来,计算机辅助诊断系统(Computer-Aided Di⁃agnosis,简称CAD)为肺癌的早期检测和诊断提供了强有力的支持,医生可以综合计算机技术的分析判断和现有的医学知识,以及自身的经验进行更加准确的诊断,在提高了工作效率的基础上减少误诊几率。由此可知CAD对于肺癌的诊断有极大的好处。
第一步:早期肺癌CT图像的肺实质分割和肺结节分割;
第二步:早期肺癌CT图像区域边界的确定、相关图像特征的计算;
第三步:早期肺癌CT图像的分类判别建模;
第四步:查准率和查全率分析;
第五步:软件集成调试。
系统主要框架包括两部分:一是样本图像的学习,二是待检图像的检测。本系统的流程如图1所示。
样本图像的学习过程是在获取了样本图像后,对目标区域进行肺实质分割,分割提取出肺实质部分,再从中分割提取出肺结节部分,并对真肺结节进行标注,最后把提取到的特征进行分类判别建模。
再者是待检图像的检测过程,在获取了待检图像后,同样本图像学习过程一样,对其进行肺实质分割,再在肺实质图像上分割肺结节,对肺结节进行特征提取,最后分类识别出真肺结节并进行标记。
图1 系统流程图
肺结节生长在肺实质中,而且一般只占一小部分,所以直接对肺结节进行分割效果不是很理想。为了方便后面能有效的分割并提取肺结节,肺实质的分割是必不可少的步骤。本系统结合了最大类间方差法(Os⁃tu法)和区域生长法两种方法对肺实质进行分割。
首先对原图像进行二值化处理,原图像如图2所示,得到二值化的图像如图3所示。再进行开运算,得到开运算后的图像如图4所示。对图4进行区域生长得到图5,将二者做减法运算得到肺实质的最初模板如图6所示。最后直接将模板和原图像进行掩膜运算,提取出肺实质,得到的肺实质图像如图7所示,但通过肺实质初始模板(图8),得到的肺实质不能消除气管。
肺结节分割是肺结节检测的至关重要的一步,作为肺结节特征提取和分类识别的前期准备工作,它的准确度对后续的工作有很大的影响。本系统通过结合区域生长和Ostu法从肺实质图像中分割出肺结节。
首先使用Ostu法从肺实质图像中找到目标肺实质图像的一个合适的阈值,再使用im2bw函数将灰度图像转化为二值图像,如图10所示。再对二值图像进行开运算操作,得到如图11所示的图像,再用区域生长法对其进行操作,从而得到如图12所示的肺结节图像。
图2 原图像 图3二值化图像 图4二值化图像开运算后的图像 图5胸腔填充
图6 图5-图4 图7肺实质模板 图8肺实质图像 图9肺实质图像
图10 二值化图像 图11开运算操作 图12肺结节 图13特征数值
怎样准确地描述并提取肿瘤区域的特征是本项目要解决的另一个主要问题,本系统拟采用查资料和咨询肿瘤医生的方法获取肿瘤区域的精确描述,并采用降维的方法筛选出最佳的用于模式识别的肿瘤特征。
血管和气管是形成假阳结节的主要干扰部分,其在二维图像中主要表现为条状结构,而孤立型肺结节具有明显的类圆形特征,根据不同组织的表现形态不同,因此可用基于特征的方法滤除假阳结节,针对感兴趣区域提取了面积、紧凑度、圆形性、一阶不变矩、二阶不变矩、三阶不变矩和傅里叶描述子等特征,计算了以上特征的分类准确率,从而考察这些特征对结节的区分能力[3]。通过计算一系列的数值(图13),然后对图像进行特征提取,得到图14的病灶特征。
图14 病灶
模式识别方法主要有统计决策法、结构模式识别方法、模糊模式识别方法和基于人工智能方法。本项目采取统计决策法,统计决策法以概率论和数理统计为基础,它包括参数方法与非参数方法,应用于图像分割、图像复原以及图像识别等方面。其基本模型为:对大量的肺癌CT图片进行统计分析,分析其图片病变部位中的色率、纹理、面积等,从而找出规律性的认识,并储存于类库中。当有CT图片需要被辨别时,就只选取反映图片的本质特征进行分类识别。
统计识别系统可分为两种运行模式,一种是训练模式,另一种是分类模式。在训练模式中,预处理模块负责将可能病变的部位特征从CT图片中分割出来、去除其他干扰和不必要因素并进行其它操作,特征选取模块主要负责找到合适的特征表示输入模式,分类器负责训练分割特征空间;在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个制定的类库[4]。
新型“互联网+医疗”正在推动着传统医疗行业的创新变革。目前的互联网医疗发展到“轻问诊模式”,各种预约挂号、缴费、咨询和报告查询等一系列服务已经方便了一大批患者,而智能检测技术必然是互联网+医疗的一个重要发展方向。
肺癌发病率和死亡率的逐年增长给人们带来不少担忧,它严重威胁着人们的生命健康,早发现、早诊断、早治疗是至关重要的。肺癌早期一般表现为肺结节,其主要检测方式为CT影像。医生需要从大量的CT图像中阅读肺结节的一些细微病灶,耗费大量时间和精力。肺癌CAD系统可以辅助医生进行诊断,提高医生工作效率,减少漏诊误诊的概率。
软件最终能实现的主要功能有:
(1)能分割出完整的肺结节并标注真肺结节。
(2)辅助医生进行诊断,减少错检而误判的几率。
[1]李伟杰.C-VATS、VAMT和传统开胸手术治疗NSCLC术后早期CRP、TNF-α和IL-6变化的研究[D].广州医科大学硕士学位论文,2013,5.
[2]罗坤.肺结节CT图像特征提取及SVM分类方法研究[D].西华大学硕士学位论文,2013.
[3]曹丽.基于CT图像的肺结节检测方法研究[D].沈阳工业大学,2013.
[4]叶铂.基于统计学方法的水面目标特征提取与识别方法的研究[D].哈尔滨工程大学,2010.
Abstract:Lung cancer is a well-known disease and one of the most common cancers today.Through investigation,it has been found that the mortality and morbidity of lung cancer have been in the first place in the past few decades,which has brought great panic to people.The treatment of malignant tumor needs to be discovered and treated in time,otherwise it will be more difficult to deal with in the later stage.In the early stage of lung cancer,pulmonary nodules are commonly seen,and the main detection methods are CT images.And the large amount of CT images produced by the hospital not only aggravates the burden of doctors,but also leads to misdiagnosis and misdiagnosis.In order to re⁃duce the reading time of radiologists,improve the accuracy of diagnosis,analyzes the use of Computer Aided Diagnosis(CAD)technology to help doctors select CT images may be suffering from lung cancer.
Keywords:Computer Aided Diagnosis;Segmentation of Lung Nodules;Feature Extraction;Classification and Discrimination
Technology of Computer-Aided Diagnosis of Early Lung Cancer CT Images
LIN Xue-ying,HAN Gui-lai,JIANG Jian-long,LI Wen,LI Zhuo-wen,HUANG Di
(Institute of Medical Information,Hainan Medical University,Haikou 570100)
海南医学院创新创业训练计划项目(No.HYCX2014068、No.HYCX20150086)
1007-1423(2017)26-0063-04
10.3969/j.issn.1007-1423.2017.26.016
林雪莹(1995-),女,海南三亚人,本科,研究方向为信息管理与信息系统(医学信息方向)
韩贵来(1977-),海南海口人,副教授,硕士,研究方向为医学图像处理与分析,Email:77238579@qq.com
江剑龙(1994-),男,广东云浮人,本科,研究方向为信息管理与信息系统(医学信息方向)
黎雯(1995-),女,湖北襄阳人,本科,研究方向为信息管理与信息系统(医学信息方向)
李卓文(1995-),男,广东深圳人,本科,研究方向为信息管理与信息系统(医学信息方向)
黄砥(1994-),男,宁夏银川人,本科,研究方向为信息管理与信息系统(医学信息方向)
2017-06-06
2017-09-05