苏秀芳 徐坤财 段晓蓓 冯宝 陈业航 李坤炜 李荣岗 陈相猛
1 江门市中心医院放射科,江门 529030;2 桂林航天工业学院电子信息与自动化学院,桂林 541004;3 江门市中心医院核医学科,江门 529030;4 中山大学附属第五医院放射科,珠海 519000;5 江门市中心医院病理科,江门 529030
胸腺上皮性肿瘤(thymic epithelial tumor, TET)是起源于胸腺上皮细胞的肿瘤,约占纵隔肿瘤的20%和前上纵隔肿瘤的47%[1]。参考2021 年5 月国际癌症研究机构(IARC)出版的《WHO 胸部肿瘤分类(第5 版)》[2]中组织病理学分类标准,可根据胸腺上皮细胞形态和淋巴细胞与上皮细胞的比例,将TET 分为胸腺瘤A、AB、B1、B2 和B3 型;同时可根据肿瘤病理生物学侵袭程度,将TET 分为低危组(A、AB、B1 型)和高危组(B2、B3 型)。手术完整切除是治疗TET 患者的重要手段,低危组接受手术完整切除通常可以达到治愈,从而长期获益;然而,高危组患者手术切除具有一定困难,需要接受术前新辅助治疗提高可切除比例[3]。因此,术前准确鉴别TET 的危险程度,对临床制定个性化治疗方案和预后评估具有重要意义。
胸部增强CT 是治疗前评价TET 的首选影像检查方法,在TET 的影像诊断和鉴别诊断上具有重要作用[4-5]。然而,CT 影像征象在不同组织病理学亚型TET 之间存在一定程度的重叠,给临床诊断和评估带来困难和挑战[6]。计算机图像分析是一种可应用于多种脏器病变的辅助诊断方法,并被证实具有较高的临床价值[7-8]。使用计算机算法从CT图像中提取的熵特征,包括一阶熵特征和二阶熵特征,可以直接反映病灶体素单位内灰度值的分布和变化趋势,并能够进一步进行量化分析[9]。目前有研究者探讨使用CT 熵特征预测孤立性肺结节的良恶性和评估食管癌的淋巴结转移等[10-11]。
本研究回顾性分析了经手术和组织病理学检查结果证实的TET 患者,基于术前胸部增强CT 图像,使用计算机算法提取、筛选熵特征,结合临床特征构建组合模型,探讨熵特征联合传统影像征象在TET 危险程度预测中的应用价值,为临床精准诊疗提供帮助。
回顾性分析2008 年10 月至2021 年5 月在江门市中心医院和中山大学附属第五医院经手术和组织病理学检查结果证实的178 例TET 患者的临床资料[男性83 例、女性95 例;年龄(52.7±12.4)岁,范围26~83 岁]。纳入标准:(1)经手术完整切除并被组织病理学检查结果证实为TET;(2)术前2 周内接受胸部CT 平扫和双期增强扫描;(3)CT 图像可以通过影像储存且可通过传输系统(PACS)获取原始DICOM 图像;(4)CT 图像层厚≤3.0 mm。排除标准:(1)经CT 引导下穿刺活检确诊的患者;(2)CT 图像质量达不到诊断要求;(3)术前接受新辅助放化疗等治疗;(4)有既往恶性肿瘤病史。本研究通过了江门市中心医院医学伦理委员会批准[批准号:2021(59)],患者均签署了知情同意书。
按照纳入患者的诊疗时间顺序,以6∶4 的比例,将所有患者分为3 个独立数据集:训练集86例[男性46 例、女性40 例;年龄(52.0±12.0)岁,范围27~81 岁],2008 年10 月至2017 年6 月于江门市中心医院收集;内部验证集51 例[男性22例、女性29 例;年龄(55.6±11.3)岁,范围26~77 岁],2017 年7 月至2019 年10 月于江门市中心医院收集;外部验证集41 例[男性15 例、女性26 例;年龄(50.8±13.7)岁,范围28~83 岁],2014 年5 月至2021 年5 月于中山大学附属第五医院收集。其中,内部验证集和外部验证集合称为全部验证集,共92 例[男性37 例、女性55 例;年龄(53.5±12.7)岁,范围26~83 岁]。
使用日本东芝公司的 Aquilion One 64 排CT 和德国西门子公司的双源Force CT 进行胸部CT 平扫和增强扫描。采集参数:管电压120 kV、管电流采用自动毫安秒技术、螺距0.875~1.500、准直0.625~2.500 mm、旋转时间0.5~1.0 s、视野350 mm×350 mm、矩阵512×512。嘱患者仰卧位,双臂上举,扫描前进行深吸气屏气呼吸训练,胸部CT 扫描范围为胸廓入口处至双侧肺底水平。CT 增强扫描使用高压注射器静脉团注非离子型碘对比剂(碘海醇注射液,美国GE 公司),浓度350 mgI/ml,总量60~80 ml,速度2.5~3.5 ml/s,分别获取动脉期 (30~35 s)、静脉期 (60~70 s)图像。多平面重组图像包括:纵隔窗横断位,层厚2.5~3.0 mm;冠状位和矢状位,层厚3.0 mm。
在未知晓临床病史和病理诊断结果的前提下,由2 名胸部放射学专业的高年资医师(15 年和25年)共同阅读CT 图像,意见不统一时协商达成一致。分别使用纵隔窗(窗位30 HU、窗宽350 HU)和肺窗(窗位-600 HU、窗宽1 500 HU)进行观察。
阅读和记录TET 病灶的CT 征象,包括以下几个方面。(1)位置:左侧、右侧和中间;(2)径线:测量方法为选取静脉期横断位最大层面,测量长径和垂直短径,取二者平均值;(3)边缘光整:是、否;(4)形态:圆形或卵圆形定义为形态规则;(5)周围侵犯:病灶邻近纵隔脂肪或肺实质模糊,病灶邻近胸膜增厚,纵隔或肺门血管腔内出现充盈缺损等表现;(6)钙化:有、无;(7)增强均匀程度和强化程度:选择病灶实质区域,避开钙化区、坏死区或囊变区,与CT 平扫相比,静脉期病灶实质成分最大强化CT 值增加<20 HU 为轻度,20~40 HU 为中度,>40 HU 为重度[12-13]。
手术切除标本经过甲醛固定、石蜡包埋、常规制片和苏木精-伊红染色,由1 名胸部病理学专业的高年资医师(20 年)参考2021 年《WHO 胸部肿瘤分类(第5 版)》[2]进行组织病理学诊断。依据肿瘤上皮细胞形态及淋巴细胞与上皮细胞比例,将所有TET 患者分为低危组(A、AB、B1 型)和高危组(B2、B3 型)。
基于MATLAB R2016 工作平台(美国MathWorks公司)的开发软件获取病灶ROI,包括以下步骤:(1)选择胸部增强CT 静脉期的横断位图像,标记病灶的起始层和终止层,计算机自动获取病灶全部连续层面的二维CT 图像;(2)由放射科医师在横断位二维CT 图像上,逐层勾画病灶边界,得到全部二维ROI;(3)使用插值算法,将病灶全部二维ROI 重建为三维容积感兴趣区(volume of interest,VOI)。
为了提高特征的稳定性,需对VOI 进行预处理,降低图像采集过程中的干扰因素。(1)采用小波算法对图像进行去噪处理,去噪参数分别设置为1/2、2/3、1.0、3/2 和2.0;(2)采用各向同性重采样技术,降低熵特征在肿瘤三维方向上的依赖,重采样参数分别为pixelW、0.8、1.0、1.2、1.5 和2.0;(3)分别采用Equal 和Lloyd 量化算法将肿瘤区域的强度范围量化为更小的灰度范围,灰度级参数分别为8、16、32 和64。
基于MATLAB R2016 工作平台开发熵特征提取算法。使用MATLAB 软件对病灶VOI 自动计算一阶熵特征和二阶熵特征。熵特征类型分别包括灰度共生矩阵(gray level co-occurence matrix,GLCM)、灰度区域大小矩阵(gray level size zone matrix,GLSZM)和邻域灰度差分矩阵(neighbouring gray tone difference matrix,NGTDM)。具体由整体熵Global-entropy、联合熵GLCM-Joint_entropy、和熵GLCM-Sum_entropy、差熵GLCM-Diff_entropy、运行熵GLRLM-Run_entropy、区域熵GLSZM-Zoon_entropy 和复杂度熵NGTDM-Complexity_entropy构成。
一阶熵特征的计算公式如下:
其中,entropy 表示熵特征;K表示VOI 内体素密度i的数量;pi表示VOI 内体素密度i的概率,其计算方法是通过体素密度i的个数除以VOI 内体素值的总数。
二阶熵特征的计算公式如下:
欧洲央行成立伊始便有争议,特别是近几年来欧债危机以及欧元区经济持续低迷,欧洲央行不可避免地成为众多批评者的指责的对象。一些批评者质疑欧洲央行的货币一体化,因为,欧元区各国的经济基础、主导产业和经济发展水平并不统一,而货币一体化仅仅是欧元区各国让渡了一部分主权和经济权利而形成的,并没有形成一种包含财政政策、税收体系等在内的整体经济系统作为货币支撑,是导致债务危机的主要原因之一。
其中,entropy 表示熵特征;K表示VOI 内体素密度i的数量;p(i,j)表示第i行第j列中GLCM 元素的概率。
应用SPSS 20.0 软件和RStudio 软件进行统计学分析。符合正态分布的计量资料以±s表示,2 组间比较采用独立样本t检验(方差齐);不符合正态分布的计量资料以M(Q1,Q3)表示,2 组间比较采用Mann-WhitneyU检验。计数资料以例数表示,2 组间比较采用χ2检验。采用Mann-WhitneyU检验对计算机提取的熵特征进行统计分析,筛选出差异有统计学意义的特征。在MATLAB R2016工作平台上,采用极限学习机(ELM)分类算法计算熵特征权重和熵标签值,即随机给定输入层的权重和隐藏层的偏置,通过优化最小二乘法,计算输出层的熵特征权重;基于筛选出的核心熵特征构建熵标签值作为预测结果。采用多因素Logistic回归分析,分别从临床、CT 和熵特征中筛选独立预测因素,分别构建临床模型、熵模型和组合模型。绘制3 个预测模型的ROC 曲线,并计算灵敏度、特异度、准确率和AUC。在训练集、内部验证集、外部验证集和全部验证集上分别进行测试,对比临床模型、熵模型和组合模型的诊断效能。采用Delong 检验和综合判别改善指数(integrated discrimination improvement,IDI)对预测模型的诊断效能进行对比分析。P<0.05 为差异有统计学意义。
178 例TET 患 者 中,低 危 组83 例(A 型19例、AB 型44 例、B1 型20 例),其中男性38例、女性45 例,年龄(52.8±12.4)岁,范围26~83 岁;高危组95 例(B2 型70 例、B3 型25 例),其中男性45 例,女性50 例,年龄(52.0±12.0)岁,范围27~80 岁。训练集中低危组和高危组TET 患者在性别和年龄分布上的差异均无统计学意义(χ2=3.629,P=0.140;t=1.404,P=0.164),见表1。
表1 178 例胸腺上皮性肿瘤患者在训练集和验证集中的临床和CT 特征对比Table 1 Comparison of clinical and CT manifestations of 178 patients with thymic epithelial tumor in training and validation cohorts
全部TET 的径线为(4.36±2.07) cm,范围0.95~11.50 cm。训练集中低危组和高危组径线分别为4.31(2.94,6.34) cm 和3.39(2.68,5.47) cm,2 组间的差异无统计学意义(Z=-1.191,P=0.234)。训练集中低危组和高危组TET 在位置、边缘、形态、钙化、增强均匀程度和强化程度上的差异均无统计学意义(χ2=0.036~5.757,均P>0.05)。训练集中高危组TET 较多出现周围侵犯(32.6%,15/46),明显高于低危组(10%,4/40),且差异有统计学意义(χ2=5.108,P=0.024),见表1。以周围侵犯为独立预测因素建立临床模型,其诊断效能见表2。
表2 临床模型、熵模型和组合模型在胸腺上皮性肿瘤危险程度预测中的诊断效能Table 2 Diagnostic efficiency of clinical model, entropy model and combined model in differentiating risk status of thymic epithelial tumor
从增强CT 静脉期图像中共提取出1 680 个初始熵特征,其中一阶特征240 个、二阶特征1 440个。为了降低特征冗余,采用Mann-WhitneyU检验进行统计分析,最终得出21 个核心熵特征在低危组与高危组TET 间的差异有统计学意义,包括10 个GLCM 熵特征、8 个GLSZM 熵特征和3 个NGTDM 熵特征,见图1。由21 个核心熵特征构建并计算熵标签值。训练集中,通过ELM 计算得出的低危组熵标签值为(0.519±0.21),明显低于高危组(0.997±0.23),组间差异有统计学意义(t=-9.747,P<0.001),见表1 和图2。内部验证集、外部验证集和全部验证集中,熵标签值在低危组和高危组TET 患者间的差异均有统计学意义(t=-4.867,P<0.001;t=-3.657,P=0.001;t=-5.658,P<0.001),见表1。
图1 训练集胸腺上皮性肿瘤患者21 个核心熵特征的信号强度分布图21 个核心熵特征包括10 个GLCM 熵特征、8 个GLSZM 熵特征和3 个NGTDM 熵特征。GLCM 为灰度共生矩阵,反映肿瘤内部灰度级的均匀性和有序性;GLSZM 为灰度区域大小矩阵,反映肿瘤内部邻域不同体素之间的紧密性;NGTDM 为邻域灰度差分矩阵,反映病灶的粗糙性、动态性和复杂性。矩形区域颜色越深表示该熵特征权重越大Figure 1 Thermal intensity distribution diagram of 21 core entropy features in the training cohort of patients with thymic epithelial tumor
图2 低危组和高危组胸腺上皮性肿瘤患者CT 静脉期(A、D)、计算机三维(B、E)和组织病理学检查图(C、F,苏木精-伊红染色,×40) A~C 为低危组患者(男性,32 岁),右前上纵隔软组织肿块,均匀强化,熵标签值为0.368,组织病理学检查结果证实为胸腺瘤AB 型;D~F 为高危组患者(男性,42 岁),右前上纵隔软组织肿块,不均匀强化,熵标签值为0.867,组织病理学检查结果证实为胸腺瘤B3 型Figure 2 Venous phase CT (A, D), computer three dimensional (B, E) and histopathological examination (C, F, hematoxylin-eosin staining,×40) images in low-risk and high-risk thymic epithelial tumors
多因素Logistic 回归分析结果显示,周围侵犯(OR=6.343;95%CI:1.009~36.604;P=0.039)和熵标签值(OR=20.145;95%CI:5.887~68.936;P<0.001)是低危组和高危组TET 之间的独立预测因素,共同构建组合模型。
熵模型和组合模型在训练集的AUC 分别为0.929(95%CI:0.876~0.983)和0.941(95%CI:0.894~0.987);在内部验证集的AUC 分别为0.832(95%CI:0.723~0.941)和0.871(95%CI:0.775~0.968);在外部验证集的AUC 分别为0.802(95%CI:0.666~0.939)和0.819(95%CI:0.689~0.949);在全部验证集的AUC 分别为0.803(95%CI:0.715~0.890)和0.840(95%CI:0.761~0.919),见表2 和图3。
图3 临床模型、熵模型和组合模型预测胸腺上皮性肿瘤危险程度的受试者工作特征曲线 A 为训练集;B 为内部验证集;C 为外部验证集;D 为全部验证集。AUC 为曲线下面积;CI 为置信区间Figure 3 Receiver operating characteristic curves of clinical model, entropy model and combined model in distinguishing risk status of thymic epithelial tumors
本研究探讨了基于胸部增强CT 图像的熵特征与TET 危险程度之间的相关性。我们筛选出21 个熵特征用来鉴别低危组和高危组TET,进一步融合临床特征和熵标签值构建组合模型,可以准确预测TET 的危险程度,对于治疗方案的制定具有重要临床意义。
既往研究结果显示,CT 表现可以预测TET 的组织病理学亚型和预后生存情况[13]。Han 等[14]的研究结果显示,轮廓光滑、包膜完整、强化均匀的病灶倾向于归入低危组。而高危组病灶通常生长活跃、血供丰富,易发生缺血坏死,增强后大部分表现为重度、不均匀的强化[12]。有研究报道,纵隔脂肪和大血管侵犯可用于区分低危组和高危组TET,高危组经常出现肿瘤-纵隔脂肪交界面模糊,血管分界不清等表现[15]。本研究CT 征象分析结果显示,高危组TET 病灶发生周围侵犯的比例(35.8%,34/95)明显高于低危组(14.5%,12/83),并且是TET 危险程度的独立预测因素。然而,CT 征象在不同危险程度的TET 病灶之间存在重叠,同时不同年资放射科医师的视觉评估结果存在差别,可能会导致临床误判和不适当的诊疗行为[16]。
计算机熵特征可以定量描述CT 图像中体素密度的变化,反映肿瘤内部成分的异质性。当病灶内部体素密度值基本相同或者接近时,熵标签值趋近于0;当体素密度值分布变得不规则时,熵标签值增大。有研究者使用熵特征鉴别肺癌的分化程度,结果表明浸润性腺癌的熵标签值明显高于浸润前病变[17]。本研究中,高危组熵标签值明显高于低危组(P<0.001),可能与胸腺上皮来源肿瘤的组织病理学异质性有关[18-19]。(1)高危组肿瘤细胞数量多,排列紧密,细胞核大深染,形态不规则,对应CT图像体素密度分布不均匀,熵标签值明显增大;(2)高危组内部含有更为复杂的微观结构和多种组织成分,合并坏死、出血和炎症反应细胞等,亦会引起CT 图像体素密度混杂且排列不对称,熵标签值亦随之增大。另外,核心熵特征均属于二阶熵特征,用于衡量相邻体素在不同方向上的强度变化,既反映了体素的信号强度分布,又涵盖了空间位置信息,在鉴别分化程度相似的组织上更为准确和全面。
Iannarelli 等[20]报道了熵特征与TET 病理分级的相关性,发现熵特征对胸腺瘤WHO 病理分级和分期有较好的预测价值,但该研究的样本量较少(n=16),且没有建立预测模型。既往研究结果显示,基于二维CT 图像的计算机特征分析方法不能全面体现肿瘤的复杂程度[21]。本研究中,我们使用全瘤体积重建算法,覆盖病灶全部体素,可以更完整地反映TET 内部的异质性。本研究中,我们联合临床特征和熵标签值构建组合模型,结果显示其诊断效能高于单独的熵模型和临床模型,Delong检验和IDI 结果显示,组合模型在内部验证集和外部验证集中均稳定地提高了诊断效能。
本研究尚存在一定的局限性。首先,本研究为回顾性分析,难免出现选择性偏倚,需要增加样本量和多中心单位来进一步验证研究结果。其次,本研究中病灶分割为手动勾画完成,花费较多时间和精力,需要更加先进的图像分割技术,完成计算机图像预处理的过程。
综上,基于胸部增强CT 图像提取的熵特征可以无创、定量、客观、稳定地反映TET 的病理生物学行为。融合临床特征和熵标签值的组合模型,可以准确地预测TET 的危险程度,为患者的个性化治疗提供科学依据。
利益冲突 所有作者声明无利益冲突
作者贡献声明 苏秀芳负责研究过程的实施、论文的撰写;徐坤财负责影像图像的计算机分析;段晓蓓负责内部训练集和验证集数据的收集与分析;冯宝负责论文的审阅与修改;陈业航负责预测模型的构建;李坤炜负责外部验证集数据的收集与分析;李荣岗负责病理图像的阅读与分析;陈相猛负责论文命题的提出与设计