高歌, 马帅, 王霄英
·影像信息学专题·
计算机辅助诊断在医学影像诊断中的基本原理和应用进展
高歌, 马帅, 王霄英
计算机辅助诊断(CAD)技术可以自动提取图像特征并应用机器学习算法进行病变检出和诊断,目前已广泛应用于多种疾病的多模态影像图像的分析,从而提高医学影像检查的价值。本文对CAD基本原理及其在乳腺癌、肺结节、结肠息肉及前列腺癌诊断等领域的研究进展进行综述。
诊断,计算机辅助; 多模态磁共振成像; 医学图像; 人工智能
随着影像技术的快速发展,X线、CT、MRI以及超声等影像技术已逐渐成为肿瘤检出、分期及随访的重要手段。大量影像数据和功能成像数据分析在提高疾病诊断准确性的同时,增加了疾病诊断的复杂性和对医师经验的依赖性。1966年Lodwick[1]提出利用计算机进行医学影像数据分析,即计算机辅助诊断(computer-aided diagnosis,CAD)这一概念,但受技术水平的限制,此后十几年对CAD的研究发展较慢。直到20世纪80~90年代,随着计算机技术、数学算法及统计学的发展,CAD在医学影像诊断领域获得了快速发展,针对不同疾病的CAD研究大量涌现。根据输出结果的不同,CAD分为两种类别,包括计算机辅助检出(computer-aided detection,CADe)和计算机辅助诊断(computer-aided diagnosis,CADx)[2]。本文将分别对CAD基本原理和主要应用领域进行综述。
理论上,CAD可以应用于多种影像技术对疾病进行检出和诊断,虽然不同CAD的数据模态和诊断效度存在很大差别,但CAD系统的工作流程基本相同,即数据预处理-图像分割-样本采集-特征提取-分类器-结果输出。
1.数据预处理
大多数CAD系统需要对输入数据进行预处理,包括矫正由于设备和/或检查环境所致图像灰度值的不均匀性、降低图像噪声和数据再抽样等,其目的在于去除不同类型或不同来源数据间的差异。数据预处理并非CAD系统的必要组成结构,但若不对数据进行预处理,不同数据间的差异将会导致CAD系统的误判。
2.图像分割
将图像分割为不同解剖区域,对图像中特定目标特征识别和提取,决定了CAD系统对病灶检出和识别的准确性。图像分割方法包括人工分割和自动分割,由于人工分割较为耗时,且存在主观性强、重复性差、不易实现三维分割等缺陷,因此自动分割技术是目前医学影像图像分析领域的研究热点之一。目前,自动分割算法主要包括基于阈值选取的图像分割方法、基于区域的图像分割方法、基于边缘检测的分割方法以及基于特定理论的分割方法等。由于医学图像的复杂性和多样性,上述算法的精度都有待提高,仍处于研究阶段,实现真正临床应用的案例较少。
3.样本采集
对需要CAD分析的区域进行识别和采样,主要包括肿瘤疾病的可疑癌灶、乳腺微钙化灶、结肠息肉等可疑异常区域。样本采集要求CAD系统具有较高的敏感性,而对特异性要求较低。后续对所采集样本的图像特征提取和分析将提高CAD系统的特异性。
4.图像特征提取
基本所有CAD系统均使用向量空间模型对采集样本进一步分析,即对上一步采集的所有病灶的图像特征进行提取和选择。常用图像特征包括图像信号强度相关统计量、边缘特征、纹理特征及分形维度等,反映图像信号强度、病灶边缘以及组织纹理等特征,反映血管或病灶灌注情况的动态增强成像的定量和半定量参数也是常用的图像特征。图像特征的提取和选择是CAD分析中的关键步骤,直接影响CAD系统的诊断效能。提取图像特征并非越多越好,与之相反,选择性地利用高效参数可减少CAD系统的运行时间,提高病灶检出和诊断效率。
5.分类器
CAD将提取的图像特征用向量进行表示,即特征向量。CAD使用分类器对目标病灶的图像特征向量进行分类,通过对机器学习算法的培训和测试对其分类,最终建立某种疾病的CAD系统。
近年来,随着机器学习理论的发展,机器学习算法获得了长足地进步。根据算法功能和形式的类似性,可以将机器学习算法分为回归算法、基于实例的算法、正规化算法、决策树学习、贝叶斯方法、基于核的算法、聚类算法、关联规则学习、人工神经网络、深度学习、降低维度算法和集成算法。其中,人工神经网络(artificial neural network,ANN)具有自学习、自适应等特点,同时还具有并行处理、分布式存储和容错性等优势,是目前应用较为广泛的学习算法[3]。但是人工学习ANN网络训练时间较长,同时可解释性相对较差。支持向量机(support vector machine,SVM)和随机森林(random forest,RF)技术被逐渐应用于CAD研究,并获得满意结果,前者在解决小样本、非线性和高维的机器学习问题中表现出优势[4],而后者无需对输入变量进行过多处理,因此在处理大数据集时显现出明显优势[5]。
然而,上述学习方法均属于浅层机器学习算法,虽然多数研究取得了较为满意的研究结果,但是浅层学习方法由于用于分类器训练的样本有限,使其对复杂分类问题的泛化能力受到限制。2006年Hinton等[6]在《Science》发表了一篇关于深度学习的研究,探索了深度学习算法在CAD系统的应用,后续有研究团队尝试应用深度学习来解决医学图像的分析问题。
CAD可应用于多种影像技术的疾病诊断,主要集中在乳腺钼靶检查、胸部CT肺结节检出及CT虚拟结肠内镜(CT colonography,CTC)息肉检出等领域[7]。随着计算机算法的不断发展,前列腺多参数MR成像(multiparametric MRI,mpMRI)、乳腺MRI及肝脏CT等领域的CAD应用正逐渐成为计算机医学图像分析的新研究热点。
1.肺结节CAD
胸片影像分析是CAD最早应用的领域[8]。然而,由于胸片上支气管血管束、肋骨等正常解剖结构的重叠,容易导致对早期肺癌病变和小结节灶等病变的漏诊。随着多排螺旋CT的发展,美国国家肺癌筛查试验(national lung screening trial,NLST)等多项随机对照研究证实:相对于胸片,对特定人群进行低剂量CT(low-dose CT,LDCT)肺癌筛查能够显著降低肺癌的死亡率[9]。然而胸部LDCT产生的大量影像数据,增加了肺癌筛查的临床工作量;同时,早期肺癌的检出具有很强的经验依赖性,因此基于胸部LDCT的肺结节CAD成为近几年研究的热点。
由于部分实性结节和磨玻璃结节的CAD检出仍然有技术难度[10],因此目前肺结节CAD主要用于实性肺结节的筛查检出和诊断预测。提高肺结节检出敏感性、降低假阳性率、结节类型诊断以及系统算法优化是目前肺结节CAD研究的重点[7]。研究证实,联合CAD系统可显著提高肺结节检测的敏感性,但伴随而来的假阳性率增高成为该技术的难点。导致假阳性的原因主要包括肺部正常结构(血管、支气管等)和呼吸运动伪影等。近几年,机器算法的改进明显提高了肺结节CAD的效能,可在保持一定敏感性的前提下有效降低假阳性率[11]。除此之外,应用机器学习算法对肺结节的纹理特征、边缘特征和形态特征等参数进行分析,可建立肺结节预测模型。
2.乳腺癌CAD
基于钼靶的乳腺癌筛查是目前CAD最广泛的应用领域,1998年,美国R2公司研发的乳腺钼靶CAD系统是首个获得FDA批准上市的CAD系统。目前已有多种CAD系统被应用于乳腺癌钼靶筛查,其效能已被几个大型前瞻性研究所证实[12-13]。
乳腺CAD研究热点主要集中在提高肿块和钙化灶的检出准确性,而检出效能主要受乳腺腺体类型和肿瘤组织学类型的影响[14-15]。乳腺CAD对微钙化灶的检出效能较好,敏感度约为86%~99%[15-16],而对肿块的检出率因受腺体密度的影响而相对较低,约83%~90%[17],有待进一步提高。
20世纪90年代初,随着超声和MR成像技术在乳腺癌检出中的广泛应用,出现了超声或MRI乳腺CAD。形态学分析是乳腺超声CAD的关键依据,包括形状、分叶、左右径/前后径以及后方声影等参数[18]。加拿大Medipattern公司研发的B-CAD是首个商用乳腺超声CAD软件。相对于乳腺钼靶和超声CAD,乳腺MR-CAD则依据增强扫描时病灶摄取对比剂的药代动力学定量和半定量参数进行病灶的检出和定性,而非单纯的依赖形态学参数[19]。目前,2004年由Comfirma公司研发的Cadstream是首个商用的乳腺MR-CAD软件。
3.CT结肠成像CAD
有证据显示早期检出并切除结肠息肉可有效降低结肠癌的发病率[20],而CT结肠成像又称CT虚拟结肠镜(CTC)检查是检出结肠息肉的首选无创性检查手段[21]。但有研究显示CTC对于结肠息肉的检出效能欠佳[22],考虑可能原因是由于CTC大量的图像数据降低了结肠息肉的检出效能。应用CAD系统可有效解决大量图像数据对病灶检出效能的影响,在减少CTC图像分析时间的同时,提高结肠息肉检出的敏感性。由于结肠息肉CAD检出模型相对简单,因此CTC-CAD发展迅速,已有多家公司研发出商用CTC-CAD软件[23]。
CTC-CAD主要目的是减少诊断时间,同时提高对非典型形态或非好发部位病灶的检出,从而提高CTC对结肠息肉和结肠癌的检出效能。尽管目前已有商用CTC-CAD软件研发成功,但软件的临床应用及诊断效能仍有待大规模随机临床试验的验证,尤其是对CTC-CAD临床角色的研究,使CAD在CTC应用领域的效能得到最大的发挥。
4.前列腺mpMRI-CAD
相对于上述3种应用领域,CAD在前列腺癌诊断领域的应用起步较晚。1994年Snow等[24]首先将ANN应用于前列腺癌CAD的研究,但主要基于临床数据,如年龄、直肠指诊、血清前列腺特异性抗原(prostatic specific antigen,PSA)等指标进行预测,诊断效能欠佳,尽管后期整合入前列腺超声数据,CAD效能仍未有明显提高。随着MR成像技术的发展,mpMRI在前列腺癌诊断中的地位不断提高[25-26],基于mpMRI的前列腺癌CAD系统大量涌现,并获得了较为满意的研究结果。
目前,由于对前列腺临床显著癌的筛查和预后评估仍缺乏有效的解决方案,随着机器算法的发展,CAD为上述问题的解决提供了新思路。建立基于mpMRI的前列腺CADe预测模型,提高mpMRI对前列腺临床显著癌的检出效能,进而有效弥补前列腺癌传统筛查手段——血清PSA特异度较低的问题;亦或是建立基于mpMRI和临床数据的前列腺CADx系统,对前列腺癌的侵袭性和预后进行预测和评估,建立前列腺癌预后预测模型,从而为前列腺癌临床处理方案的制定提供依据。
总体而言,CAD目前还处于研究的初步临床应用阶段,检出和预测效能以及临床应用流程均有待进一步探索。CAD为诸多临床问题的解决提供了新的思路和方向,是影像信息学发展的方向之一。CAD因其可精确定量、重复性好的优势,未来将可能被应用于更多疾病的诊断,其针对数据大、问题简单的情况,做出定量诊断、建立预测模型等有重要价值。
受到输入参数质量控制、图像分割和机器学习算法以及训练和测试数据的选择的限制,CAD对于医学图像分析的效能尚难达到有经验的诊断者的效能。CAD的发展仍需要工程研发人员和医学工作者的多方面协作,优化图像处理、机器学习和医学应用效能研究。总之,CAD是一个跨学科的研究领域,积极推动CAD发展将会促进多领域多学科的发展。
[1] Lodwick GS.Computer-aided diagnosis in radiology:a research plan[J].Invest Radiol,1966,1(1):72-80.
[2] Giger ML,Chan HP,Boone J.Anniversary paper:history and status of CAD and quantitative image analysis: the role of medical physics and AAPM[J].Medi Phys,2008,35(12):5799-5820.
[3] 吕冬姣,张珏,王霄英,等.人工神经网络在前列腺癌诊断中的应用[J].北京大学学报(医学版),2009,41(4):469-473.
[4] Data Min,Knowl Disc,Burges CJC.A tutorial on support vector machines for pattern recognition[J].Data Min Knowl Disc,1998,2(2):121-167.
[5] Criminisi A,Shotton J,Konukoglu E.Decision forests:a unified framework for classification,regression,density estimation,manifold learning and semi-supervised learning[J].Foundations and Trends in Computer Graphics and Vision,2011,7(2-3):81-227.
[6] Hinton GE,Salakhutdinov RR.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[7] van Ginneken B,Schaefer-Prokop CM,Prokop M.Computer-aided diagnosis:how to move from the laboratory to the clinic[J].Radiology,2011,261(3):719-732.
[8] Yerushalmy J.The statistical assessment of the variability in observer perception and description of roentgenographic pulmonary shadows[J].Radiol Clin North Am,1969,7(3):381-392.
[9] Pinsky PF,Church TR,Izmirlian G,et al.The national lung screening trial:results stratified by demographics,smoking history,and lung cancer histology[J].Cancer,2013,119(22):3976-3983.
[10] Lee N,Laine AF,Marquez G,et al.Potential of computer-aided diagnosis to improve CT lung cancer screening[J].IEEE,2009,2(1):136-146.
[11] Tan M,Deklerck R,Jansen B,et al.A novel computer-aided lung nodule detection system for CT images[J].Med Phys,2011,38(10):5630-5645.
[12] Dean JC,Ilvento CC.Improved cancer detection using computer-aided detection with diagnostic and screening mammography: prospective study of 104 cancers[J].AJR,2006,187(1):20-28.
[13] Noble M,Bruening W,Uhl S,et al.Computer-aided detection mammography for breast cancer screening:systematic review and meta-analysis[J].Arch Gynecol Obstetr,2009,279(6):881-890.
[14] Brem RF,Hoffmeister JW,Zisman G,et al.A computer-aided detection system for the evaluation of breast cancer by mammographic appearance and lesion size[J].AJR,2005,184(3):893-896.
[15] Birdwell RL,Ikeda DM,O'Shaughnessy KF,et al.Mammographic characteristics of 115 missed cancers later detected with screening mammography and the potential utility of computer-aided detection[J].Radiology,2001,219(1):192-202.
[16] Warren Burhenne LJ,Wood SA,D'Orsi CJ,et al.Potential contribution of computer-aided detection to the sensitivity of screening mammography[J].Radiology,2000,215(2):554-562.
[17] Wei J,Sahiner B,Hadjiiski LM,et al.Computer-aided detection of breast masses on full field digital mammograms[J].Med Phys,2005,32(9):2827-2838.
[18] Shen WC,Chang RF,Moon WK,et al.Breast ultrasound computer-aided diagnosis using BI-RADS features[J].Acad Radiol,2007,14(8):928-939.
[19] Kurz KD,Steinhaus D,Klar V,et al.Assessment of three different software systems in the evaluation of dynamic MRI of the breast[J].Eur J Radiol,2009,69(2):300-307.
[20] Winawer S,Fletcher R,Rex D,et al.Colorectal cancer screening and surveillance:clinical guidelines and rationale-Update based on new evidence[J].Gastroenterol,2003,124(2):544-560.
[21] Yee J,Akerkar GA,Hung RK,et al.Colorectal neoplasia:performance characteristics of CT colonography for detection in 300 patients[J].Radiology,2001,219(3):685-692.
[22] Rockey DC,Paulson E,Niedzwiecki D,et al.Analysis of air contrast barium enema,computed tomographic colonography,and colonoscopy: prospective comparison[J].Lancet (London,England),2005,365(9456):305-311.
[23] Regge D,Halligan S.CAD:how it works,how to use it,perfor-mance[J].Eur J Radiol,2013,82(8):1171-1176.
[24] Snow PB,Smith DS,Catalona WJ.Artificial neural networks in the diagnosis and prognosis of prostate cancer:a pilot study[J].J Urol,1994,152(5 Pt 2):1923-1926.
[25] Panebianco V,Barchetti F,Sciarra A,et al.Multiparametric magnetic resonance imaging vs standard care in men being evaluated for prostate cancer:a randomized study[J].Urol Oncol,2015,33(1):171-177.
[26] Futterer JJ,Briganti A,De Visschere P,et al.Can clinically significant prostate cancer be detected with multiparametric magne-tic resonance imaging? A systematic review of the literature[J].Eur Urol,2015,68(6):1045-1053.
100034 北京, 北京大学第一医院医学影像科
高歌(1988-),女,河南郑州人,博士研究生,主要从事MRI新技术和影像信息学研究。
王霄英,E-mail;cjr.wangxiaoying@vip.163.com
R814.4; R445.2
A
1000-0313(2016)12-1127-03
10.13609/j.cnki.1000-0313.2016.12.004
2016-10-20
2016-10-08)