仲艳 王芬 张腾 沈杰 俞同福 袁梅
随着CT 普及,越来越多的孤立性实性肺结节(solitary pulmonary solid nodule,SPSN)在筛查时被发现[1],其中肺癌最为常见[2]。近年来,随 着对 隐球菌的认知及临床诊治水平的提高,肺隐球菌病发现率逐渐上升,其中表现为孤立性结节肿块型肺隐球菌病引起越来越多的重视[3],因其可表现出诸多类似肺腺癌的CT 征象,如分叶、毛刺、胸膜牵拉、空泡等。肺隐球菌患者临床症状缺乏特异性,血清隐球菌荚膜多糖抗原(cryptococcal capsular polysaccharide antigen,CrAg)检测的敏感性不高,导致术前诊断困难[4]。如果该类结节被误诊为肺癌,患者可能会接受不必要的手术及过度医疗。因此,开发一种无创的、有效的方法在术前鉴别不确定的SPSN 至关重要。
影像组学作为近年来医学影像领域的新兴技术,应用高通量数据特征化运算法,量化捕获病灶内部构造的空间异质性,在鉴别良恶性病变、预测肿瘤分级、生存期和治疗反应等方面被广泛研究[5-8]。本研究拟构建基于CT 高维定量信息的影像组学模型,并联合临床影像特征建立孤立性肺结节型的肺隐球菌和肺腺癌的鉴别诊断模型。
回顾性分析2015 年1 月~2021 年6 月在本院行胸部CT 患者的临床影像资料。纳入标准:(1)经皮肺穿刺活检或手术切除,并经病理确诊的肺隐球菌病和肺腺癌患者;(2)CT 表现为孤立性实性肺结节(直径小于等于30 mm);(3)活检或手术与术前最近一次CT 检查间隔时间不超过2 周;(4)术前最近一次CT 层厚不超过1.5 mm。排除标准:(1)纯磨玻璃或混杂磨玻璃结节;(2)肺结节数量超过1 枚或原发结节周围多发小结节;(3)结节内存在明显钙化;(4)患者有恶性肿瘤病史。最终纳入62 例肺隐球菌病和62 例肺腺癌患者(由于肺隐球菌病样本量远小于肺腺癌样本量,连续随机匹配了符合标准的62 例肺腺癌),并收集两组的临床特征(年龄、性别和吸烟情况)。
采用多排螺旋CT 薄层扫描(Siemens Somatom Definition 及Somatom Definition AS+),扫描参数如下:管电压120 kV,管电流200/110 mAs,重组层间距1 mm,层厚1.5 mm。所有检查均具纵隔窗(窗宽400 HU;窗位40 HU)和肺窗(窗宽1200 HU;窗位-600 HU),可通过适当调节窗宽、窗位进行特征评估。
所有CT 图像以DICOM 格式导出保存,再导入内部图像处理软件(MultiLabel;ECNU,Shanghai,China)。随机选取20 例患者,由两位分别有3 年和10 年资历的胸部影像诊断医师独立对病灶边缘进行逐层勾画获得兴趣体积(volume of interest,VOI),采用组内相关系数(intraclass correlation coefficient,ICC)对两位诊断医师提取的影像特征进行一致性分析,ICC 大于0.75 认为一致性很好。其余病灶由3 年资历的胸部影像诊断医师勾画VOI,尽可能覆盖整个病灶区域,同时避免病灶边缘正常的肺部结构。由10 年资历的胸部影像诊断医师对VOI 进行校正。
将原始图像及VOI 导入基于Python 的FeAture Explorer(FAE)平台(程序代码:http://github.com/salan668/FAE),共提取出479 个影像组学特征,包括形态特征、一阶直方图特征、纹理特征和基于小波变换的高阶特征。首先对数据进行Z-score 标准化预处理。然后以7∶3 的比例拆分为训练集和测试集。其中训练集用于建立模型,测试集用于评估模型。采用皮尔森相似度(Pearson correlation coefficient,PCC)进行降维处理,最后通过方差分析(analysis of variance,ANOVA)选择特征,使用逻辑回归(logistic regression,LR)进行预测分类建模。
在不知道病理结果的情况下,分别由上述3年和10 年资历的胸部影像诊断医师对病灶影像学特征进行评估,并记录以下病灶特征:直径(病灶在最大轴位层面上的最长径)、部位(左上叶、左下叶、右上叶、右中叶、右下叶)、分叶(图1a)、毛刺(图1b)、空泡(图1c)、边界、晕征和胸膜关系(图1d)。当两位医师之间存在评估不一致时,由一名15 年资历的胸部影像诊断医师评判。
图1 CT 轴位示4 例孤立性肺实性结节均为肺隐球菌病。a)~d)分别为分叶征、毛刺征、空泡征、胸膜牵拉征
所有数据均使用IBM SPSS 软件(Version 25.0)进行分析。两组之间连续变量的差异性用t 检验或Mann-Whitney U 检验进行分析,分类变量用卡方检验进行分析。二元Logistic 回归用于多因素分析。使用MedCalc 软件绘制受试者工作特征(receiver operating characteristic,ROC)曲 线,来 评估各模型的分类性能,以曲线下面积(area under the curve,AUC)作为评判标准。P<0.05 为具有统计学差异。
肺隐球菌病患者62 例,男37 例,女25 例,平均年龄51 岁;肺腺癌患者62 例,男37 例,女25例,平均年龄54 岁。两组的临床影像特征详见表1,其中吸烟、分叶、边界和晕征在两组间具有统计学意义(P<0.05)。
表1 患者的临床和影像特征
通过一致性检验、皮尔森相关系数法降维、方差分析和分类器筛选后,从479 个放射组学特征中,筛选出11 个对鉴别肺隐球菌病和肺腺癌最具有价值的特征,包括3 个一阶直方图特征(wavelet-HL_firstorder_Minimum、wavelet-HH_ firstorder_90Percentile、original_shape_Flatness),3 个灰度共生矩阵特征(wavelet-LH_glcm_Imc2、wavelet-HL_glcm_Imc2、wavelet-HH_glcm_Imc2),1 个灰度相关矩阵特征(wavelet-LL_gldm_DependenceEntropy)和4 个灰度区域大小矩阵特征(wavelet-LL_glszm_HighGrayLevelZoneEmphasis、original_glszm_SmallArea LowGrayLevelEmphasis、original_glszm_LowGrayLevel ZoneEmphasis、original_glszm_GrayLevelVariance)。
临床影像特征中吸烟、分叶、边界和晕征在两组间具有统计学意义,进一步多因素分析,分叶、边界和晕征是独立危险因素(图2),建立临床影像特征的Logistic 回归模型,AUC 值0.792(敏感度63.2%、特异度82.3%)。用筛选出来的11 个影像组学特征建立Logistic 回归模型,AUC 值为0.953(敏感度88.9%、特异度90.3%)。将筛选出来的临床影像特征和影像组学特征联合构建Logistic 回归模型,AUC 值0.971(敏感度92.6%、特异度93.5%)。可见联合模型的诊断效能较高(表2、图3)。
图2 多因素分析显示临床影像特征中晕征、边界和分叶是独立因素,用来构建临床影像特征模型
图3 三种模型(临床影像模型、影像组学模型、联合模型)的ROC曲线
表2 三种模型(临床影像模型、影像组学模型、联合模型)的诊断效能
肺隐球菌病主要是通过呼吸道吸入隐球菌孢子后引起的的亚急性/慢性肺部真菌感染性疾病,主要发生于免疫功能受损者,也可见于免疫正常人群[9]。免疫 功能正常者多以结节或肿块为主[10],易误诊为肺腺癌。本研究构建了表现为孤立性肺结节型的肺隐球菌病和肺腺癌的鉴别诊断模型,且取得了较高的诊断效能。
虽然有文献[11]表明血清CrAg 是一种有效的诊断方法,但是临床上还是有很多肺隐球菌病患者血清CrAg 呈阴性。Min 等[12]的研究表明,肺隐球菌病表现为孤立性病灶时患者血清CrAg 多呈阴性。可见,对于表现为肺孤立性病灶的肺隐球菌病,血清CrAg 检测有一定局限性。
既往有很多学者探讨是否有特异的临床因素或影像特征来鉴别肺隐球菌病和肺腺癌。Deng等[13]研究表明没有特异性的临床或影像特征来诊断肺隐球菌病。有研究表明吸烟是侵袭性真菌感染的危险因素[14],但其影响机制尚不完全清楚。本研究中单因素分析显示吸烟在鉴别肺隐球菌和肺腺癌中具有统计学差异,但在多因素分析中吸烟不是独立危险因素,可能与病例样本量有关。Chen等[15]研究发现肺隐球菌病表现为孤立性肺结节时更易出现支气管充气征、卫星灶和晕征。本研究显示晕征、分叶和边界清楚是鉴别肺隐球菌病和肺腺癌的独立因素,分叶和边界清楚更提示肺腺癌的诊断,而晕征更倾向于肺隐球菌病的诊断。由于肿瘤的生长张力较大,生长速度不均,病灶更倾向于呈分叶,而孤立性肺隐球菌病生长张力较小,生长速度相对均匀,出现分叶的可能较小。由于肿瘤细胞浸润肺泡壁肺泡腔生长,边界相对清楚,而肺隐球菌病由于炎性浸润或肺泡出血,边界相对欠清,目前未有研究表明分叶和边界是肺隐球菌病和肺腺癌的鉴别因素。晕征组织学提示与肉芽肿性炎症有关,高度提示肺隐球菌的诊断,与前述既往研究相符。但这三者构建的临床影像特征模型的诊断效能不高(AUC 值为0.792)。
影像组学具有较好的客观量化分析功能,近年来成为影像诊断的研究热点[16,17]。本研究共提取出479 个影像组学特征,筛选出11 个对鉴别肺隐球菌病和肺腺癌最具有价值的影像组学特征,包括3 个一阶特征和8 个灰度特征。小波变换可以对低频分量提供良好的频率分辨率,对高频分量提供较高的时间分辨率[18],具有较高的模型贡献度。但是影像组学特征和病灶复杂的病理生理之间的关系,目前还不确切[19]。通过Logistic 回归建立影像组学特征模型(AUC 值为0.953),具有很高鉴别能力。
本研究将临床影像特征和影像组学特征相结合构建联合诊断模型,结果显示联合模型AUC(0.971)的诊断效能较高。联合诊断模型的优势在于不仅融合病灶的形态学特征,还融合了病灶内部微观结构异质性信息,对肺隐球菌病和肺腺癌的鉴别诊断提供了可靠的依据。
目前影像组学研究存在几个方面的挑战:一方面,有许多机器学习方法用于建立基于影像组学特征的预测模型,最常见且通俗易懂的是Logistic回归模型,还有随机森林、支持向量机、交叉验证、聚类分析、人工神经网络等,研究结果的可重复性相对较差,有必要对影像组学研究方法进行专业对比和行业规范;另一方面,单一的影像组学特征在评估和预测方面存在一定局限性,尚需联合基因、病理和影像等不同维度的信息,更全面地提供病变内部异质性,为临床提供更重要的价值;此外,影像组学研究成果转化需要高质量的大数据样本。
本研究的局限性。首先,由于回顾性研究的特性,选择偏倚在样本选择中不可避免。其次,单中心研究,样本量相对较少。最后,对于VOI 的勾画,本研究仅局限于病灶本身,仅提供病灶内的信息。有研究表明,病灶外也包含大量的生物学信息,有利于鉴别良恶性、预测治疗反应和生存期[20,21],这需要未来提取病灶外区域的影像组学特征来进一步研究确认。
综上所述,本研究通过筛选影像组学特征及临床影像特征,建立一个鉴别孤立性肺结节型肺隐球菌病和肺腺癌的联合诊断模型,该模型具有较高的准确性,有望未来辅助临床医师诊断和决策,避免误诊和不恰当的治疗。