1.广州市番禺中心医院放射科(广东 广州 511400)
2.华南理工大学计算机学院(广东 广州 510640)
3.广州市番禺区市桥医院外科(广东 广州 511400)
何俊诗1 梁 鹏2 罗英华3 史瑞雪1姬智艳1 陈汉威1 黄 益1
MSCT孤立肺小结节的神经网络模型的应用研究分析*
1.广州市番禺中心医院放射科(广东 广州 511400)
2.华南理工大学计算机学院(广东 广州 510640)
3.广州市番禺区市桥医院外科(广东 广州 511400)
何俊诗1梁 鹏2罗英华3史瑞雪1姬智艳1陈汉威1黄 益1
目的 研究神经网络模型(SVM)在MSCT孤立肺小结节(SPN)良恶性判断中的应用。方法收集2000例经病理证实的SPN临床表现及影像学特征,采用SPSS 13.0统计学软件将各观察指标进行多因素回归分析,与SPN病理相关指标作为SVM分析参数,对1500例进行训练,另对500例进行预测,对照病理结果分析。结果与病理对照,500例SVM中良性正确预测238(98.5%)例,错误预测4(1.5%)例;恶性正确预测250(97%)例,错误预测8(3%)例。结论SVM能有效地对SPN良恶性进行较精确的预测,对医生正确诊断有很好的帮助。
孤立性肺小结节;MSCT;计算机;神经网络模型
对孤立性肺小结节(SPN)定性诊断的研究一直是影像学诊断的热点和难点。SPN螺旋CT征象较多,每一征象其良恶性相关的程度不同。本研究针对这方面,分别收集六家大医院近年的MSCT孤立肺小结节的征象和临床资料,采用SPSS 13.0统计学软件将各观察指标进行多因素回归分析,建立神经网络模型(SVM),并与病理结果进行分析比较。
1.1 一般资料2007年1月-2010年8月六家大医院收治的肺孤立结节(SPN)患者,均进行胸部螺旋CT或HRCT扫描。收集2000例肺孤立结节的临床表现及影像学特征。其中男1074例,女926例;年龄31~73岁,平均52.3岁。恶性1038例,良性962例。
1.2 观察指标(1)性别;(2)年龄:>40岁,≤40岁;(3)位置:上叶、中/舌叶、下叶;(4)形态:不规则、圆形、类圆形;(4)边缘:模糊、清晰;(5)分叶:浅分叶、深分叶、无分叶(6)棘状突起:无突起、有突起;(7)毛刺:无毛刺、短毛刺、长毛刺;(8)血管集束:无集束、有集束;(9)卫星灶:有卫星灶、无卫星灶;(10)胸膜凹陷:无凹陷、有凹陷;(11)密度:不均匀、均匀;(12)空泡征:无空泡、有空泡;(13)空洞位置:无空洞、近心端、中心、远心端;(14)钙化形态:斑片状、细小点状、无钙化;(15)钙化位置:无钙化、弥漫性、偏心、中心;(16)临床症状:无症状、咳嗽咳痰、胸痛、胸痛咳嗽咳痰;(17)病理:恶性、良性。对上述观察指标进行量化分级赋值。见表1。
1.3 各观察指标的比例及量化赋值见表2。
1.4 统计学处理采用SPSS 13.0统计学软件将各观察指标进行多因素回归分析,计算出回归系数B、标准误差、F值、t值、显著性概率,找出与SPN良恶性相关的观察指标进行下一步分析。
1.5 神经网络(SVM)预测采用SVM对1500例进行训练,另对剩下的500例进行预测,与病理结果进行对比分析。
方差分析显示,该模型的F值是643.772,显著性概率<0.001,表示回归极其显著,即观察指标与SPN病理结果之间相关性很大。
回归系数结果显示, SPN良恶性与年龄(X1)、分叶(X6)、位置(X3)、密度(X12)、空泡征(X13)等指标显著负相关,其回归系数分别是-0.108、-0.555、-0.077、-0.137、-0.251,与形状(X4)、边缘(X5)、血管集束(X9)、卫星灶(X10)、胸膜凹陷(X11)等指标显著正相关,其回归系数分别是0.039、0.161、0.041、0.027、0.036。表示上述观察指标与SPN的良恶性密切相关。
2.3 神经网络(SVM)预测根据上述对观察指标的分析,我们对显著相关的指标进行预测训练:年龄(X1)、位置(X3)、形状(X4)、边缘(X5)、分叶(X6)、血管集束(X9)、卫星灶(X10)、胸膜凹陷(X11)、密度(X12)、空泡征(X13)等。
SVM模型的输入是观察指标的集合:
经SVM模型预测后,结果y=0,则表示该病例是恶性;如果y=1,则表示该病例是良性。根据预测结果与病理结果进行比较,得到SVM模型预测的准确率和错误率(如表3)。
用1500例病例进行SVM模型训练,剩下的500例病例(258例恶性、242例良性)用于预测实验。SVM的分类结果如表4所示,其中良性正确预测的是238 (98.5%)例,错误预测的是4(1.5%)例;恶性正确预测的是250(97%)例,错误预测是8(3%)例。
SPN螺旋CT征象较多,每一征象其良恶性相关的程度不同,文献报道多种鉴别方法。李复等[1]采用最大似然法对SPN的HRCT影像学征象进行分类统计分析,将其各种征象转化为记分值,以数值的大小来判定肺结节所属的类型。周旭辉等[2]采用正向概率判别法进行肺结节病灶常见的CT征象进行分析总结,并转化为概率值后判定结节的性质。Wormanns D.等[3]对SPN的CT征象进行X2检验分析。魏颖等[4]研究肺癌感兴趣区域(ROI)的特征提取与分类方法,采用概率分布可分性对原始提取特征进行特征选择,利用SVM对选择的特征进行定量描述,采用特征量化参数对Mahalanobis距离进行加权改进。
表1 SPN相关观察指标量化赋值
表2 各观察指标的比例及量化赋值
本组前期研究[5]的“肺孤立小结节良恶性鉴别系统”中,由于样本量相对少,对观察指标的分析有一定的影响。本组本次大样本资料研究显示,各种观察指标中,其与SPN良恶性相关非线性关系,且某些指标相关性不大。故本组研究采用SPSS 13.0统计学软件将各观察指标进行多因素回归分析,计算出回归系数B、标准误差、F值、t值、显著性概率,找出与SPN良恶性相关的观察指标进行神经网络(SVM)预测分析。发现SPN良恶性与年龄(X1)、分叶(X6)、位置(X3)、密度(X12)、空泡征(X13)等指标显著负相关,与形状(X4)、边缘(X5)、血管集束(X9)、卫星灶(X10)、胸膜凹陷(X11)等指标显著正相关,表示上述观察指标与SPN的良恶性密切相关。相关系数的绝对值越大,关系越密切,从表3可以看出,分叶(X6)、空泡征(X13)、边缘(X5)、密度(X12)的相关系数的绝对值较其他指标大,表示其与SPN的良恶性关系越密切,这与文献报道较接近[1、2、6]。本次研究发现各观察指标与SPN良恶性相关非线性关系,进一步修正前期研究的结果,使本次预测分析更准确。
表3 预测结果
本组研究采用神经网络模型――支持向量机(Support Vector Machines -SVM)进行SPN良恶性预测。神经网络模型是近年来在模式识别与机器学习领域中出现的新工具,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他问题中。目前在医学领域中已在胸部诊断、肺癌诊断、胃癌诊断、肝癌CT诊断等多方面应用神经网络模型辅助诊断[7-10],随着数字图像处理技术、模式识别技术以及机器学习技术的不断成熟,SVM的应用,不仅在一定程度上给临床医生一定的指导,而且减少了低年资医生漏诊、误诊的发生,提高了诊断正确率。
本组研究用1500例病例进行SVM模型训练,剩下的500例病例(258例恶性、242例良性)用于预测实验。SVM的分类结果中良性正确预测的是238(98.5%)例,错误预测的是4(1.5%)例;恶性正确预测的是250(97%)例,错误预测是8(3%)例。本研究MSCT孤立肺小结节神经网络模型预测实验表明,SVM能够有效地对SPN良恶性程度进行精确预测,帮助医生对观察指标进行判断,能有效提高诊断正确率。
1.李复,王淼淼,伍建林,等. 肺内常见的孤立性肺结节鉴别诊断方法的探索研究——应用最大似然法[J]. 中国CT和MRI杂志,2008,6(2):43-46.
2.周旭辉,李子平,谭国胜,等. 高分辨率CT正向概率判别法在肺结节鉴别诊断中的应用研究[J]. 中华放射学杂志,2005,39(1):29-33.
3.Wormanns D.Diederich S.Characterization of Small Pulmonary Nodules by CT[J]. Eur Radiol,2004,14(8):1380-1383.
4.魏颖,郭薇,孙月芳. 面向肺癌CAD系统的感兴趣区域特征选择与分类算法[J]. 信息与控制,2008,36(4):445-452+458.
5.何俊诗,罗英华,郭桂明,等. 肺孤立小结节良恶性鉴别诊断计算机应用软件分析[J].中国误诊学杂志,2009,25(9):6103-6104.
6.李月河,赵志梅,全松石,等. 多层螺旋CT同层动态增强扫描对孤立性肺结节的诊断意义[J].临床放射学杂志,2007,26(3):259-262.
7.苗延巍,伍建林. 人工神经网络在医学影像领域的应用进展[J].实用放射学杂志,2008.24(3):404-407.
8.杨钧,周新华,马大庆. 人工神经网络及其在胸部放射学中的应用[J].中华放射学杂志,2004,38(2):96-98.
9.韩小宏,毛巧霞,李晓春,等. 基于生物信息学方法的血清标记物模型在胃癌诊断中应用[J]. 中国癌症杂志,2010,20(5):364-368.
10.张波,张治英,徐德忠,等. 人工神经网络肝癌CT影像辅助诊断模型的建立.实用放射学杂志[J]. 2006,22(9):1079-1082.
The Study of Application Analysis of SVM in SPN During MSCT Scanning*
HE Jun-shi1, LIANG Peng2, LUO Ying-hua3, et al. 1.Department of Radiology, Central Hospital, Panyu District, Guangzhou 511400; 2.Computer Institute, South China University of Technology Guangzhou 510640; 3.Surgery Department, Shiqiao Hospital, Panyu District, Guangzhou 511400
ObjectiveTo study the application of SVM in differential diagnosis of benign and malignant SPN.MethodClinical and imaging characteristics of 2000 SPN cases confirmed by pathology were collected. The SPSS 13.0 system was applied to analyze the data Multiple Regression Analysis on all observed indexes. We used pathological relative index of SPN as analysis parameters of SVM.1500 cases were trained and 500 were predicted. It was analyzed comparing with the pathological results.ResultsResult of 500 SVM cases were correlated with pathology, of which correct prediction were 238 cases (98.5%) and false prediction 4 cases (1.5%) in benign while correct prediction were 250 cases (97%) and false prediction 8(3%) in malignant respectively.ConclusionsSVM can accurately forecast benign and malignant SPN and it is very helpful to doctor’s accurate diagnosis.
SPN; MSCT; Computer; SVM
R563;R814.4
A
广州市番禺区科技局(编号:2009-Z-92-1)
10.3969/j.issn.1672-5131.2011.06.013
何俊诗,女,医学影像专业,副主任医师,主要研究方向为医学影像诊断。
何俊诗
2011-10-21