刘妮,谢元亮,黄增发,王翔
甲状腺恶性结节的发病率呈逐年上升趋势,手术切除为主要治疗方式[1],多数研究者认为颈部淋巴结转移(cervical lymph node metastasis,CLNM)是甲状腺乳头状癌(papillary thyroid carcinoma,PTC)复发及远处转移的高危因素[2]。因此,术前准确检出CLNM对选择治疗方案、评估预后有重要价值。超声是甲状腺术前检查的常规方法,但检出CLNM的敏感性较低[3]。影像学组学作为一项新兴技术,可以高通量地从影像数据中提取大量肉眼无法识别的特征信息,对影像数据进行更深层次的挖掘、预测和分析[4]。目前应用影像组学预测甲状腺癌伴有CLNM的相关研究较少,因此本研究旨在探讨CT组学特征对PTC伴有颈部淋巴结转移的预测价值。
1.研究对象及分组
搜集2019年6月-2019年12月在本院经手术病理证实(无论超声或CT提示有无淋巴结转移,均行可疑区域颈部淋巴结清扫术,术后获取病理检查结果)且行CT增强扫描的甲状腺结节患者的病例资料。纳入标准:(1)为避免因设备不同造成图像参数和质量等的差异,仅纳入使用Siemens双源CT机进行检查的患者;(2)为避免甲状腺多个或弥漫性结节影响对责任病灶的确定,仅纳入甲状腺内仅单个结节灶的患者;(3)为避免不同病理学类型的生物学及影像学差异,仅纳入病理证实为PTC的患者。排除标准:(1)结节长径小于1 cm;(2)CT图像伪影较大,影响对甲状腺结节的形态观察和范围测量;(3)病灶内有大面积钙化或囊变(钙化及囊变面积占病灶面积的1/2或以上)。最终纳入130例PTC患者,女92例,男38例;年龄27~72岁,平均(60±13)岁;结节直径1.00~4.23 cm,平均(2.12±0.61) cm;CLNM组65例,无淋巴结转移(nCLNM)组65例。
2.CT检查方法
使用Siemens Somatom Definition Flash CT机,扫描范围自颅底至胸廓入口水平,所有患者行静脉期增强扫描,经肘静脉注射非离子型对比剂碘海醇(0.3 mg I/mL),剂量1 mL/kg,注射流率3.0 mL/s,随后以相同流率注射30 mL生理盐水,延迟时间50 s,其它扫描参数:100 keV,自动mAs,二代迭代重建技术,螺距0.984,视野30 cm ×30 cm,矩阵512 ×512,层厚和层间距均为5.00 mm,重建层厚1.25 mm。
3.纹理分析方法
将CT增强图像(DICOM 格式)导入Mazda 4.6软件(波兰Institute of Electronics公司)进行影像组学分析。首先,由两位高年资主治医师在肿瘤最大层面手动勾画ROI,意见不一致时请一位副主任医师阅片,最终协商确定。自每个ROI提取6大类近300个纹理参数,详见表1。
其中,直方图纹理特征为一阶纹理参数,灰度共生矩阵(grey-level co-occurrence matrix,GLCOM)、灰度游程矩阵(grey-level run length matrix,GLRLM)、梯度模型、自回归模型和小波转换(wavelet transform)类的纹理特征属于二阶及高阶纹理参数。然后,使用Mazda软件提供的3种降维方法,即Fisher相关系数、分类误差概率和平均相关系数(classification error probability and average correlation coefficients,POE+ACC)及交互信息(mutual information,MI),分别筛选出能鉴别两组的10个最佳纹理特征。随后,分别使用Mazda 软件中的B11模块中提供的4种统计方法,包括原始数据分析(raw data analysis,RDA)、主成分分析(principal component analysis,PCA)、线性判别分析(linear discriminant analysis,LDA)和非线性判别分析(nonlinear discriminant analysis,NDA)进一步对纹理特征进行分类和筛选。将不同统计学方法与不同降维方法组合,分别建立相应的影像组学模型,采用错判率这一指标来描述各个模型的诊断效能,错判率越小则说明该方法提取的纹理特征在鉴别PTC有无淋巴结转移中的准确性越高、价值越大。
4.统计学分析
根据Mazda软件的输出结果,使用SPSS 25.0统计软件进行统计学分析,采用Fisher确切概率法(四格表中至少有一个格子的理论频数<1)对同一种降维方法与不同统计学方法(NDA、RDA、PCA和LDA)组合建立的组学模型、同一种统计学方法与不同降维方法组合建立的模型对CLNM评估所得的错判率均进行统计学检验。以P<0.05为差异有统计学意义。
1.最佳纹理特征的筛选
每种降维方法筛选出10个最佳纹理特征,共获得30个最佳纹理特征,其中21个特征属于GLRLM类,5种属于小波转换类,3种属于GLCOM类,1种属于直方图参数。
在3种降维方法中均被筛选出的纹理特征有游程长度不均匀性45°方向(45 degree run length non uniformity,45dgr_ RLN)、游程长度不均匀性垂直方向(vertical RLN,Vertl_RLN)、垂直方向(Vertl_)灰度不均匀性(grey-level non uniformity,GN);在3种降维方法中被筛选出2次的纹理参数有水平方向(Horizonl,Horzl)_RLN、135dgr_RLN、Horzl_GN、135dgr_GN、45dgr_GN、小波转换系数s-2(Wavelet energy with low pass and high pass frequency bands with scale factors 2,WavEnLH_s-2),前8种属于GLRLM类参数,最后一项属于小波转换类参数。
2.组学模型的判别结果
不同统计学方法与不同降维方法组合下的组学模型(如图1,以MI降维算法分别与4种统计学方法组合)对PTC合并GLNM的判别结果见表2。分别与4种统计学方法组合,Fisher系数法组学模型的错判率为3.08%~16.92%,POE+ACC法为3.08%~15.38%,MI法为3.08%~14.68%。四种统计学方法(RDA、PCA、LDA、NDA组合不同降维方法建立的组学模型中,以NDA法的判别结果最稳定,组合3种降维方法的3个组学模型之间的判别结果基本一致,且错判率最低(3.08%),敏感度和特异度最高(分别为98.46%和95.38%)。
图1 Mazda软件中B11模块提供的4种统计学方法与MI降维算法组合建立的组学模型的分析结果。数字1(红色)代表甲状腺乳头状癌伴颈部淋巴结转移,数字2(绿色)代表甲状腺乳头状癌不伴淋巴结转移。两种颜色的数码字分的越开、重叠越少,提示该方法的鉴别能力越高、误判率越低。a)RDA;b)PCA;c)LDA;d)NDA。
表2 不同特征分类法的预测结果
3.错判率的比较
同一种降维方法分别与4种统计学方法组合,所建立的4个组学模型之间错判率的差异有统计学意义(P<0.05)。而每种统计学方法分别与3种降维方法进行组合,所建立的3个组学模型之间错判率的差异无统计学意义,RDA、PCA和LDA组对应的P值分别为0.73、0.71和0.87,而NDA组合的3种降维方法建立的组学模型之间错判率完全相同,均为3.08%。
颈部淋巴结是PTC发生淋巴结转移的第一站,又称为前哨淋巴结。超声检查对颈部淋巴结的显示不佳,而仅通过颈部淋巴结的CT形态学特征来诊断是否发生转移有较大的局限性。在术前准确诊断PTC有无颈部淋巴结转移是临床上一直以来的热点和难点。有研究结果显示,PTC有无淋巴结转移与原发灶的CT形态学特征及病理亚型有关[5-6]。恶性肿瘤的生物学异质性与影像纹理特征的异质性有一定相关性,基于CT或MRI提取的纹理特征可用于评估肿瘤的性质[7]。基于上述研究背景,本研究中应用纹理分析软件对PTC原发灶的CT增强图像进行纹理分析,提取CT图像上大量肉眼无法识别的病灶的特征信息,旨在为临床术前诊断PTC有无颈部淋巴结转移提供参考依据。据文献报道,当ROI的直径小于1.0 cm时,影像组学分析软件的准确性会下降[8]。因此本研究中排除了结节长径小于1.0 cm的病例。
本研究结果显示,3种纹理特征降维方法的错判率均较低,检出敏感度最高可达98%,有文献报道,超声新技术(如超声造影、弹性成像、超声引导下细针穿刺抽吸细胞学检查等)在鉴别甲状腺癌颈部淋巴结转移的符合率可达92%~97%[9]。黄益龙等[10]报道双能CT碘图评估甲状腺微小乳头状癌颈部淋巴结的符合率约75.8%。王娴等[11]报道多b值DWI鉴别甲状腺癌甲状腺外侵犯的阳性预测值约77.6%。与以上几种方法的结果相比,本研究中采用的影像组学方法的诊断价值并不逊色,提示影像组学在鉴别PTC颈部淋巴结转移中有一定临床应用价值。
本研究中利用3种降维方法分别筛选出10个最佳纹理参数,45dgr_RLN、Vertl_RLN、Horzl_RLN、135dgr_RLN、Vertl _GN、Horzl_GN、135dgr_GN、45dgr_GN和WavEnLH_s-2这几个纹理特征分别出现在2种或3种方法的筛选结果中,除最后一个参数属于小波转换类,前8个参数均属于灰度游程矩阵类。小波转换和灰度游程矩阵类的纹理参数均属于二阶及高阶纹理特征。在30个纹理参数中,仅有1个参数方差(variance)来源于直方图(一阶纹理参数),表明基于PTC结节CT图像的二阶及高阶纹理特征在预测颈部淋巴结转移中有较大价值,而一阶纹理参数的作用有限。Kim等[12]的研究结果显示,基于PTC原发灶提取的直方图参数(平均值、标准差、偏度、峰度和熵)对预测淋巴结转移无效。本研究结果进一步验证了上述研究结果。谢文君等[13]认为PTC病理组织学亚型与颈淋巴结转移具有紧密的关系,可能的原因是不同病理组织学亚型,肿瘤细胞的致密性不一,或者伴有CLNM的PTC病灶的代谢较活跃,原发癌灶易发生坏死致肿块密度不均,而灰度游程矩阵可以反映图像纹理的粗细程度和不均匀程度[14],所以在本研究中灰度游程矩阵类别的纹理参数能在一定程度上预测颈部淋巴结转移,而一阶纹理特征不能很好地反映PTC原发灶的空间异质性改变。
目前大多数研究中关于纹理特征的提取是依赖于纹理分析软件,而对最佳纹理特征进行筛选分析常用的是传统的、单一的统计学分析方法[15],这会导致模型的单一性,在一定程度上影响纹理分析的准确性。Mazda软件自带4种模型的统计分析方法:线性分类(RDA、PCA、LDA)和非线性分类(NDA),可以对上述三种降维方法得到的纹理参数进行分析和评判。本研究结果显示,NDA与3种降维方法组合的组学模型的分析结果稳定,且在各组中错判率最低,为3.08%。表明非线性分类方法较线性分类方法更有效,错判率最低,这可能与NDA算法更适用于CT图像有关。因为CT 图像数据通常是高维度、非线性数据,而 NDA 的特点是通过选择使用合适的支持向量机,把非线性、不可分离数据转化成三维空间分布的、可分离的线性数据[16]。而RDA、PCA、LDA特征分类法是线性变换,在将非线性数据转换为线性数据方面具有局限性。
本研究中的主要局限性在于仅阐述了CT组学特征在预测甲状腺癌颈部淋巴结转移中有一定的预测价值,主要体现在二阶及高阶纹理参数中,但是没有进一步探讨具体参数的数值、阈值及曲线下面积,离广泛应用于临床还有一定的距离。影像组学在甲状腺病变的研究中,大多数处于对结节良、恶性的判断,对影像组学在预测甲状腺癌颈部淋巴结转移中作用的文献报道较少,且大多为超声资料,目前笔者尚未查阅到探讨Mazda软件在相关领域的研究报道,所以笔者先探讨Mazda软件在预测甲状腺癌淋巴结转移中是否有可行性,在可行的基础上,下一步将分析相关参数的数值、计算阈值及曲线下面积,并与传统影像学方法进行比较,这些工作将在今后研究中逐步开展。