喻微,叶波,续力云,王兆宇,王善军,曹捍波,陈志军,张永奎
(1.温州医科大学附属舟山医院 胸心外科,浙江 舟山 316021;2.上海交通大学附属胸科医院 胸外科,上海 200030;3.温州医科大学附属舟山医院 舟山市肺癌研究中心,浙江 舟山 316021;4.温州医科大学附属舟山医院 病理诊断中心,浙江 舟山 316021;5.温州医科大学附属舟山医院 放射诊断中心,浙江 舟山 316021)
预测恶性孤立性肺结节logistic回归诊断模型的建立
喻微1,叶波2,续力云3,王兆宇4,王善军5,曹捍波5,陈志军1,张永奎1
(1.温州医科大学附属舟山医院 胸心外科,浙江 舟山 316021;2.上海交通大学附属胸科医院 胸外科,上海 200030;3.温州医科大学附属舟山医院 舟山市肺癌研究中心,浙江 舟山 316021;4.温州医科大学附属舟山医院 病理诊断中心,浙江 舟山 316021;5.温州医科大学附属舟山医院 放射诊断中心,浙江 舟山 316021)
目的:建立一个预测孤立性肺结节恶性可能性的logistic回归模型,为临床诊断提供参考。方法:回顾性分析温州医科大学附属舟山医院2012年1月至2015年12月期间经胸部CT检查发现且有手术病理证实的良性孤立性肺结节患者90例和2013年1月至2013年12月期间经胸部CT检查发现且有手术病理证实的恶性孤立性肺结节患者122例,共计212例的临床资料和CT影像资料。多因素回归分析得出孤立性肺结节恶性可能性的独立预测因素,建立logitic回归预测模型,并用另外242例有明确病理诊断的孤立性肺结节患者验证此logistic回归预测模型。结果:212例孤立性肺结节患者中58%的结节为恶性,42%为良性。Logistic回归分析显示结节类型、边界清楚、分叶、毛刺、胸膜牵拉征等特征在良性结节与恶性结节间差异均有统计学意义(P<0.05),是孤立性肺结节恶性的独立预测因素。预测模型为:P=ex/(1+ex),X=-1.252-(0.741×混杂磨玻璃结节)-(3.712×实性结节)+(2.301×边界清楚)+(1.589×分叶征)+(1.269×毛刺征)+(1.528×胸膜牵拉征),e为自然对数。此模型的灵敏度为81.8%,特异度为85.7%,阳性预测值为88.2%,阴性预测值为78.3%。结论:本研究建立的预测模型能准确评估孤立性肺结节恶性可能性,能为孤立性肺结节的临床诊断提供依据。
logistic回归模型;孤立性肺结节;多因素分析;独立预测因素
Abstract: Objective:To establish a logistic regression model for predicting the probability of malignancy in solitary pulmonary nodules (SPNs) and provide guidance for the diagnosis.Methods:The clinical data and computed tomography (CT) images of 212 patients with a clear pathological diagnosis of SPNs were retrospectively analyzed from Zhoushan Hospital Affiliated to Wenzhou Medical University were analyzed retrospectively,among which, benign SPNs were collected from January 2012 to December 2015, and malignant SPNs were collected from January 2013 to December 2013. To estimate the independent predictors of malignancy of SPNs,multivariate analysis was used. A logistic regression prediction model was subsequently created. Data from an additional 242 patients with pathologic diagnosis of SPNs were used to validate this logistic regression prediction model.Results:Fifty-eight percent of the nodules from 212 SPNs patients were malignant and 42% were benign.Logistic regression analysis showed that there were significant differences in nodule type, clear border, lobulation, spiculaion, pleural retraction sign between subgroups with benign and malignant SPNs (P<0.05). Thesefactors were identified as independent predictors of malignancy in SPNs. In our model, sensitivity was 81.8%,specificity was 85.7%, positive predictive value was 88.2%, and negative predictive value was 78.3%. Conclusion:The prediction model established in this study can be used to assess the probability of malignancy in SPNs,thereby providing help for the diagnosis of SPNs.
Key words:logistic regression model; solitary pulmonary nodules; multivariate analysis; independent predictors
孤立性肺结节定义为肺内单发,圆形或者卵圆形且直径小于3 cm的非透明病灶,该病灶周围由肺实质包绕,并不伴有肺不张、纵膈淋巴结肿大或者胸腔积液[1]。近年由于CT的广泛使用,孤立性肺结节的检出率显示出明显增加的趋势。在孤立性肺结节患者中,恶性结节占5%~69%,平均为40%[2-3]。恶性结节的早期诊断和治疗能够显著提高肺癌患者的总生存率和预后。然而,孤立性肺结节通常是小的,且位于肺实质的深部,并经常有非典型的影像学表现,因此,孤立性肺结节的正确诊断还存在一定困难。以往对于孤立性肺结节的术前早期诊断基本上是基于临床和放射科医师的主观经验性预测,为了减少人为因素的干扰并提高诊断准确率,本研究通过对孤立性肺结节患者的临床CT诊断与病理诊断进行对比分析,根据良、恶性孤立性肺结节的临床特征和CT影像特征的差异性,建立logistic回归模型,探讨其在孤立性肺结节良恶性鉴别诊断中的应用价值。
1.1 对象 本研究纳入了温州医科大学附属舟山医院2012年1月至2015年12月间经胸部CT检查发现且有手术病理证实的良性孤立性肺结节患者90例和2013年1月至2013年12月期间经胸部CT检查发现且有手术病理证实的恶性孤立性肺结节患者122例,共计212例,男99例,女113例,年龄21~80岁,平均(56.7±10.9)岁,该组样本定义为建立回归模型的训练样本。另外纳入上海交通大学附属胸科医院2015年1月1日至2015年12月31日经手术病理证实的孤立性良、恶性肺结节患者242例,该组样本定义为回归模型的验证样本,其中男108例,女134例,年龄28~86岁,平均(57.1±10.3)岁。所有孤立性肺结节患者的手术方式包括肺楔形切除、肺段切除和肺叶切除,且由1名高年资病理医师进行明确的病理诊断。
1.2 临床和CT影像资料 收集的临床资料包括患者性别、年龄、吸烟史、肿瘤家族史、肿瘤既往史。另由1名高年资放射科医师收集CT影像资料,包括结节的位置、直径、类型、边界、边缘、空气支气管征、血管集束征、胸膜牵拉征、钙化和空洞等。
1.3 统计学处理方法 采用SPSS20.0统计软件进行数据统计与分析。采用单因素分析法筛选出可能影响孤立性肺结节良恶性的因素,采用二分类非条件logistic回归分析选择独立预测因子,并建立诊断孤立性肺结节良恶性的数学预测模型。确定合适的诊断临界值,计算该模型诊断验证组样本的敏感性、特异性、阳性预测值、阴性预测值和准确率。P<0.05为差异有统计学意义。
2.1 病理诊断 在训练组,有122例患者(占57.55%)诊断为恶性孤立性肺结节,包括腺癌113例(占92.6%),鳞状细胞癌6例(占5.0%),大细胞神经内分泌癌2例(占1.6%),淋巴上皮瘤样癌1例(占0.8%)。90例诊断为良性孤立性肺结节,包括错构瘤20例(占22.2%),炎性假瘤19例(占21.1%),非特异性炎症15例(占16.7%),硬化性肺泡细胞瘤9例(占10.0%),结核9例(占10.0%),淋巴结炎6例(占6.7%),隐球菌感染5例(占5.6%),肉芽肿性炎4例(占4.4%),纤维钙化结节1例(占1.1%),血管球瘤1例(占1.1%)和曲霉菌感染1例(占1.1%)。在验证组,有137例恶性孤立性肺结节患者和105例良性孤立性肺结节患者。2组的性别、结节直径比较差异无统计学意义(P>0.05)。
2.2 孤立性肺结节独立预测因子的单因素和多因素分析 研究变量的赋值情况见表1,单因素分析显示良性和恶性孤立性肺结节患者在年龄、结节类型、边界清楚、边缘光滑、分叶征、毛刺征、空泡征、空气支气管征、血管集束征、胸膜牵拉征、钙化等临床和CT影像上的差异有统计学意义(P<0.05),见表2。将单因素分析均有统计学意义的11个临床和CT影像特征作为自变量,通过二分类非条件logistic回归分析筛选自变量,最后结节类型、分叶征、毛刺征、边界清楚、胸膜牵拉征共5个自变量选入模型,这5个因素是恶性孤立性肺结节的独立预测因子,见表3。
表1 临床和CT影像特征得赋值情况
2.3 logistic回归诊断模型的建立 孤立性肺结节恶性可能性的预测模型:P=ex/(1+ex),X=-1.252-(0.741×混杂磨玻璃结节)-(3.712×实性结节)+(2.301×边界清楚)+(1.589×分叶征)+(1.269×毛刺征)+(1.528×胸膜牵拉征)。其中e是自然对数;因结节类型为三分类变量,故在模型设置上引入2个哑变量代替“结节类型”变量,分别为D1(1=混杂磨玻璃结节;0=非混杂磨玻璃结节)、D2(1=实性结节;0=非实性结节),即当肺结节是纯磨玻璃结节,则混杂磨玻璃结节=0,实性结节=0;如果肺结节是混杂磨玻璃结节,则混杂磨玻璃结节=1,实性结节=0;如果肺结节是实性结节,则混杂磨玻璃结节=0,实性结节=1;如果肺结节边界清楚,有分叶征,毛刺征,胸膜牵拉征,则用1表示,否则为0。
2.4 训练样本的自身检验 将训练样本各数据分别代入回归方程,回归方程计算结果P≥0.5判断为恶性,P<0.5判断为良性作为判断标准时,准确率为84.0%(178/212),灵敏度为91.8%(112/122),特异度为91.8%(66/90),阳性预测值为82.4%(112/136),阴性预测值为86.8%(66/76),见表4。
2.5 验证样本的外部检验 将验证样本各数据分别代入回归方程,计算结果P≥0.5判断为恶性,P<0.5判断为良性作为判断标准时,准确度为83.5%(202/242),灵敏度为81.8%(112/137),特异度为85.7%(90/105),阳性预测值为88.2%(112/127),阴性预测值为78.3%(90/115),见表5。
肺癌是世界范围内发病率最高的癌症,也是癌症死亡的首位病因[4-5]。由于近年吸烟人数的减少,戒烟人数的增加,治疗手段的进步,肺癌的病死率已经大大降低[6-8]。然而,肺癌的预后较差,5年生存率只有16%[9]。近年来随着CT的广泛使用,肺结节的检出率和诊断准确率显著提高,有助于肺结节患者早期发现和治疗,患者的生存质量和生存率均可明显提高,CT已成为肺结节早期诊断的首选方法。孤立性肺结节由于其病因的多样性和高度恶性的潜能,已成为临床上的一个巨大挑战和沉重负担。晚期肺癌的预后极不理想,而临床I期的非小细胞肺癌5年生存率为60%~80%[10-11]。因此对孤立性肺结节应该早期诊断,恶性结节要及时手术治疗,良性结节则要避免侵入性的治疗手段。
以往对于孤立性肺结节的诊断基本上是基于临床和放射科医师的经验性诊断。本研究建立了一个基于logistic回归分析的数学预测诊断模型。多因素logistic回归分析显示结节类型、边界清晰、分叶征、毛刺征、胸膜牵拉征是恶性孤立性肺结节的独立预测因子。
据相关研究报道,边界清楚高度提示为良性结节,有一个清楚的边界,孤立性肺结节的恶性可能性会降低75%[12]。而我们的研究显示边界清楚为恶性孤立性肺结节的独立预测因子。可能是本研究纳入的良性患者里非特异性炎性结节比例偏高,而非特异性炎性结节的边界是模糊的。毛刺是由于肿瘤细胞沿着肺泡壁、淋巴管壁、血管壁生长或者纤维组织增生引起。毛刺的出现高度提示恶性,SWENSEN等[13]研究显示毛刺出现的孤立性肺结节恶性可能性为88%~94%。本研究显示,分叶征和胸膜牵拉征也高度提示孤立性肺结节为恶性。
年龄是最重要的临床因素之一,随着年龄的增长,人体体细胞的自我修复能力逐渐降低,被致癌物损伤的上皮细胞的修复能力也在下降。但在本研究中年龄差异无统计学意义,可能是因为本研究纳
入的都是<3 cm的肺结节,处于较早阶段,和良性肺结节的发生时间类似,所以良、恶性肺结节在年龄上差异无统计学意义。吸烟和肺部肿瘤的发生密切相关,但本研究显示吸烟史差异无统计学意义,可能原因是本研究纳入的恶性孤立性肺结节患者的腺癌比例偏高,而腺癌和吸烟史的关系并不明显。肿瘤既往史差异无统计学意义,可能是因为孤立性肺结节患者有恶性肿瘤史的很少,也可能是样本量过少。有研究[14]显示,结节位置是恶性孤立性肺结节的独立预测因子,然而,本研究结果显示,结节位置不是恶性孤立性肺结节的独立预测因子,可能原因是中国人有较高的结核发生率,在本研究的良性患者里结核患者有一个比较高的比例。而结核好发于上叶,和恶性肺结节类似,所以导致了良、恶性孤立性肺结节在结节位置上差异无统计学意义。
表2 训练组患者临床及CT影像特征单因素分析
本研究基于我院的孤立性肺结节病例建立的logistic回归数学诊断模型,经内部验证和外部验证,都显示了一个较好的诊断效能。该模型能提高临床医师诊断肺结节的诊断准确率。预测模型的准确诊断,一方面能及时对恶性孤立性肺结节进行早期诊断和治疗,另一方面,也能避免良性孤立性肺结节的不必要的侵入性检查和外科治疗。当然,这个模型也存在着一些缺陷,收集纳入研究的因素只包括临床资料和CT影像资料,而没有肿瘤标记物,另外,纳入研究的样本量过少,有待于进一步扩大样本量,而且,纳入的患者都是经过外科手术治疗,而不是基于全部的人群,存在着选择偏倚。
续表2
表3 多因素logistic回归分析结果
表4 用所得方程检测训练样本所得结果(n)
表5 用所得方程检测验证样本所得结果(n)
本研究通过二分类logistic回归分析,得到logistic回归方程,回归值P≥0.5时预报为恶性,P<0.5时预报为良性,方程预报准确率为84.0%。回归模型虽然不能完全替代临床医师的经验性判断,但可以提高临床医师和放射科医师对孤立性肺结节良恶性判断的信心,提高工作效率,对于回归模型P值接近0.50,而有一项或数项恶性临床和CT影像特征时,建议进行紧密的随访观察,可减少肺癌的漏诊。
[1] 林洁, 唐坤, 殷薇薇, 等. P E T/C T及其数学预测模型对孤立性肺结节诊断价值的研究[J]. 温州医科大学学报, 2 0 1 5,4 5(5): 3 5 4-3 5 8.
[2] TRUONG M T, KO J P, ROSSI S E, et al. Update in the evaluation of the solitary pulmonary nodule[J]. Radiographics, 2014, 34(6): 1658-1679.
[3] KROCHMAL R, ARIAS S, YARMUS L, et al. Diagnosis and management of pulmonary nodules[J]. Expert Rev Respir Med, 2014, 8(6): 677-691.
[4] FERLAY J, SHIN H R, BRAY F, et al. Estimates of worldwide burden of cancer in 2008: GLOBOCAN 2008[J]. Int J Cancer, 2010, 127(12): 2893-2917.
[5] JEMAL A, SIEGEL R, XU J, et al. Cancer Statistics, 2010[J]. CA Cancer J Clin, 2010, 60(5): 277-300.
[6] GODTFREDSEN N S, PRESCOTT E, OSLER M. Effect of smoking reduction on lung cancer risk[J]. JAMA, 2005, 294(12): 1505-1510.
[7] FIELD J K, OUDKERK M, PEDERSEN J H, et al. Prospects for population screening and diagnosis of lung cancer[J]. Lancet, 2013, 382(9893): 732-741.
[8] ZHOU C, WU Y L, CHEN G, et al. Erlotinib versus chemotherapy as first-line treatment for patients with advanced EGFR mutation-positive non-small-cell lung cancer (OPTIMAL, CTONG-0802): a multicentre, open-label, randomised,phase 3 study[J]. Lancet Oncol, 2011, 12(8): 735-742.
[9] RAMI-PORTA R, BOLEJACK V, GOLDSTRAW P. The new tumor, node, and metastasis staging system[J]. Semin Respir Crit Care Med, 2011, 32(1): 44-51.
[10] TANOUE L T, DETTERBECK F C. New TNM classification for non-small-cell lung cancer[J]. Expert Rev Anticancer Ther, 2009, 9(4): 413-423.
[11] LI Y, CHEN K Z, WANG J. Development and validation of a clinical prediction model to estimate the probability of malignancy in solitary pulmonary nodules in Chinese People[J].Clin Lung Cancer, 2011, 12(5): 313-319.
[12] KHAN A, HERMAN P G, VORWERK P, et al. Solitary pulmonary nodules: comparison of classification with standard,thin-section, and reference phantom CT[J]. Radiology, 1991,179(2): 477-481.
[13] SWENSEN S J, SILVERSTEIN M D, ILSTRUP D M, et al.The probability of malignancy in solitary pulmonary nodules. Application to small radiologically indeterminate nodules[J]. Arch Intern Med, 1997, 157(8): 849-855.
[14] GOULD M K, ANANTH L, BARNETT P G, et al. A clinical model to estimate the pretest probability of lung cancer in patients with solitary pulmonary nodules[J]. Chest, 2007, 131(2): 383-388.
(本文编辑:赵翠翠)
Establishment of logistic regression diagnosis model predicting malignant solitary pulmonary nodules
YU Wei1, YE Bo2, XU Liyun3, WANG Zhaoyu4, WANG Shanjun5, CAO Hanbo5, CHEN Zhijun1, ZHANG Yongkui1.1.Department of Cardiothoracic Surgery, Zhoushan Hospital Affiliated to Wenzhou Medical University,Zhoushan, 316021; 2.Department of Thoracic Surgery, Chest Hospital Affiliated to Shanghai Jiaotong University,Shanghai, 200030; 3.Lung Cancer Research Center of Zhoushan City, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021; 4.Pathology Diagnosis Center, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021; 5.Radiology Diagnosis Center, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021
R604
A
10.3969/j.issn.2095-9400.2017.09.007
2016-10-07
国家卫生计生委科研基金—浙江省医药卫生重大科技计划(省部共建计划)(WKJ2014-2-021);浙江省科技厅公益技术社会发展项目(2015C33254)。
喻微(1990-),男,浙江义乌人,硕士生。
张永奎,主任医师,Email:zyk801801@126.com。