李宁,阚艳敏,李晓松,王艺桦,张曼,孟健,马琳
本研究创新性:
(1)分别基于甲状腺乳头状癌患者结节常规超声、实时剪切波弹性成像、超声造影检查结果构建决策树模型,归纳出各超声检查技术诊断甲状腺乳头状癌的要点;(2)构建基于多模态超声的甲状腺乳头状癌决策树模型,为综合利用多种超声检查技术及进行分层、逐步诊断提供了参考依据;(3)通过评估各决策树模型诊断效能发现,基于多模态超声的甲状腺乳头状癌决策树模型的诊断效能明显高于基于常规超声、实时剪切波弹性成像、超声造影的甲状腺乳头状癌决策树模型,为临床提供了新的诊断思路。
甲状腺乳头状癌(papillary thyroid carcinoma,PTC)是最常见的甲状腺癌病理类型,据统计,其在全球范围内快速增长的癌症患者中所占比例高达90%[1]。通常情况下,PTC生长缓慢、预后良好,但仍有部分PTC具有侵袭性,因此及早发现并明确诊断对指导临床早期干预具有重要意义[2]。
随着机器学习方法、人工智能技术及医院信息化管理的快速发展,可靠性高的临床辅助诊断决策系统的研制成为近年来提升PTC诊断精度和治愈率的重要方向。作为一个分类器,决策树模型可将检查结果逐层分类为正确与错误,进而获得最优诊断方案。目前,决策树模型已较广泛地用于多种疾病的诊断、预后管理等[3-5],但关于其在甲状腺癌中应用的研究报道较少。本研究旨在构建基于多模态超声的PTC决策树模型并评估其诊断效能,为临床提供新的诊断思路。
1.1 研究对象 选取2018 年1月至2020年10月在华北理工大学附属医院住院并行甲状腺结节切除术的PTC患者180例,其中男66例,女114例;年龄23~72岁,平均年龄(47.5±10.5)岁。本研究在180例PTC患者中共发现186个结节,其中良性结节99个(包括结节性甲状腺肿57个,桥本甲状腺炎18个,甲状腺腺瘤14个,亚急性甲状腺炎6个,滤泡乳头状增生4个)(非PTC组),恶性结节87个(均为PTC)(PTC组)。纳入标准:(1)常规超声检查提示甲状腺结节美国放射学会(American College of Radiology,ACR)TI-RADS分类为3类及以上,有手术需求并行甲状腺结节切除术,术后经病理检查证实为PTC;(2)经超声引导下穿刺检查证实为PTC并行甲状腺结节切除术;(3)常规超声、实时剪切波弹性成像(shear wave elastography,SWE)及超声造影(contrast-enhanced ultrasound,CEUS)检查资料完整。排除标准:(1)因颈部肌层较厚、结节位置较深等而造成弹性成像不理想者;(2)存在手术禁忌证者;(3)无法进行超声引导下穿刺检查或术后病理检查者;(4)因对鸡蛋、牛奶等过敏而无法完成CEUS检查者。本研究经华北理工大学附属医院伦理委员会审批通过(审批号:20210130001),所有患者在受检前被告知检查方法及目的并签署知情同意书。
1.2 超声检查 由两位高年资医师(职称为副主任医师及以上)记录、解读超声检查结果。
1.2.1 常规超声检查 使用法国声科超声诊断仪(SuperSonic Imagine Aixplorer)、线阵探头L15-4(频率为4~15 MHz)进行常规超声检查,主要为确认目标结节并记录甲状腺结节大小(最大径)、位置(分为左叶、右叶、峡部)、回声(分为等回声或高回声、低回声、极低回声)、纵横比(分为≥1、<1)、边缘(分为光滑、分叶状或不规则、向甲状腺被膜侵犯)、局灶强回声(分为无、粗大钙化或周边钙化、点状强回声)及血流分布。甲状腺结节血流分布采用Adler分级标准[6]:结节内未发现血流信号为0级;结节内有少量血流、可见1~2个点状或细短棒状血管为Ⅰ级;结节内有中量血流、可见3~4个点状或1支较长血管(血管长度接近或超过结节半径)为Ⅱ级;结节内有大量血流、可见5个及以上点状或2支较长血管为Ⅲ级。
1.2.2 SWE检查 在常规超声检查确认目标结节后切换至SWE模式,上方图像为基于常规超声检查的弹性成像模式图,可用于观察结节及周边组织硬度并测得感兴趣区域的杨氏模量值;下方图像则为常规超声图像,可双幅对比观察。在SWE检查过程中选取大小合适的取样框,嘱患者屏气以使图像趋于稳定后静置3 s,定帧、存图;采用Q-Box测量软件测量相关参数,包括弹性最大值(maximum elasticity,Emax)、弹性最小值(minimum elasticity,Emin)、弹性均值(mean elasticity,Emean)、弹性标准差(standard deviation of elasticity,Esd)、与周围正常组织弹性比值(elasticity ratio to normal surrounding tissue,Eratio);测量时需选用2 mm取样框,并于结节最硬处、同水平正常甲状腺组织处各测量3次取平均值。
1.2.3 CEUS检查 使用德国西门子S2000超声诊断仪、线阵探头L9-4(频率4~9 MHz)进行CEUS检查,造影剂选用声诺维(SonoVue)。在常规超声检查确认目标结节后选取结节血供最佳的切面并切换到超声造影模式,注意保持探头稳定;采用0.9%氯化钠溶液5 ml将造影剂配置为六氟化硫微泡混悬液,连续震荡约30 s后抽取2.5 ml并经肘正中静脉团注,而后快速注入0.9%氯化钠溶液5 ml进行冲管,动态观察CEUS图像3 min并记录、存盘。CEUS检查主要观察甲状腺结节增强程度(分为无增强、低增强、等增强、高增强)、增强特点(分为向心性增强、环状增强、无规律)、造影剂分布(分为均匀、不均匀)、造影剂进入及消退时间(分为早于周围甲状腺组织、同步、晚于周围甲状腺组织)等,同时通过造影时间-强度曲线分析甲状腺结节达峰浓度(peak concentration,Peak)、达峰时间(time to peak,TP)、时间-强度曲线下面积(area of timeintensity curve,AUCt)、平均渡越时间(mean transit time,MTT)。
1.3 统计学方法 建立数据库并采用SPSS 22.0统计学软件进行数据分析。计量资料若符合正态分布则以(±s)表示,两组间比较采用独立样本t 检验;不符合正态分布的计量资料以M(P25,P75)表示,两组间比较采用秩和检验。计数资料以相对数表示,组间比较采用χ2检验或Fisher's 确切概率法。采用决策树卡方自动交互检测(chi-squared automatic interaction detection,CHAID)算法建立PTC预测模型,并采用十折交叉验证法进行测试,最后通过计算灵敏度、特异度、准确率、阳性似然比、阴性似然比、Kappa值评估其诊断效能。以P<0.05为差异有统计学意义。
2.1 超声检查结果
2.1.1 常规超声检查 PTC组、非PTC组结节最大径分别为0.66(0.48,1.12)、0.70(0.48,1.19)cm,两组结节最大径比较,差异无统计学意义(Z=-0.732,P=0.464)。两组结节位置、血流分布比较,差异无统计学意义(P>0.05);两组结节回声、纵横比、边缘、局灶强回声比较,差异有统计学意义(P<0.05),见表1。
表1 PTC组与非PTC组常规超声检查结果比较(个)Table 1 Comparison of routine ultrasonic examination results between PTC group and non-PTC group
2.1.2 SWE检查 两 组结节 Emax、Emin、Emean、Esd、Eratio比较,差异有统计学意义(P<0.05),见表2。
表2 PTC组与非PTC组SWE检查结果比较Table 2 Comparison of SWE examination results between PTC group and non-PTC group
2.1.3 CEUS检查 两组结节增强程度、增强特点、造影剂分布、造影剂进入时间、造影剂消退时间及Peak、AUCt、MTT比较,差异有统计学意义(P<0.05);两组结节TP比较,差异无统计学意义(P>0.05),见表3~4。
表3 PTC组与非PTC组CEUS检查结果比较(个)Table 3 Comparison of CEUS examination results between PTC group and non-PTC group
表4 PTC组与非PTC组CEUS检查结果比较〔M(P25,P75)〕Table 4 Comparison of CEUS examination results between PTC group and non-PTC group
2.2 基于单一超声检查及多模态超声的PTC决策树模型的构建 以两组结节间差异有统计学意义的超声检查结果为自变量,以PTC为因变量分别构建基于常规超声、SWE、CEUS及多模态超声的PTC决策树模型,结果显示其根节点分别为局灶强回声、Emax、AUCt、Emax;十折交叉验证法测试结果显示,基于常规超声、SWE、CEUS、多模态超声的PTC决策树模型误判率分别为33.9%、19.4%、37.6%、7.0%(图1~4)。
图1 基于常规超声的PTC决策树模型Figure 1 Decision-making tree model for the diagnosis of PTC developed based on routine ultrasound
图2 基于SWE的PTC决策树模型Figure 2 Decision-making tree model for the diagnosis of PTC developed based on SWE
图3 基于CEUS的PTC决策树模型Figure 3 Decision-making tree model for the diagnosis of PTC developed based on CEUS
图4 基于多模态超声的PTC决策树模型Figure 4 Decision-making tree model for the diagnosis of PTC developed based on multimodal ultrasound
2.3 基于多模态超声的PTC决策树模型的诊断效能以超声引导下穿刺或术后病理检查结果为“金标准”,则基于多模态超声的PTC决策树模型的灵敏度、特异度、准确率、阳性似然比、阴性似然比、Kappa值分别为88.5%、99.0%、94.1%、88.5、0.12、0.880,诊断效能明显高于基于常规超声、SWE、CEUS的PTC决策树模型(表5)。
表5 基于常规超声、SWE、CEUS、多模态超声的PTC决策树模型的诊断效能Table 5 Diagnostic efficiency of decision-making tree models for the diagnosis of PTC developed based on routine ultrasound,SWE,CEUS and multimodal ultrasound
近年来,随着超声检查仪器分辨率的不断提高及SWE、CEUS等超声检查技术的发展,超声检查已成为甲状腺结节的重要影像学检查方法。同时,医疗卫生系统信息化建设使得医院信息系统中储存了大量、丰富的甲状腺疾病患者就诊/医疗信息,而通过科学的方法对甲状腺疾病患者超声检查结果进行挖掘与分析对辅助临床医生实现甲状腺疾病诊疗的个体化、精准化具有重要现实意义。
本研究在180例PTC患者中共发现186个结节,其中恶性结节常规超声检查主要特征包括低回声、纵横比≥1、边缘分叶状或不规则、局灶点状强回声,与李保启等[7]研究结果一致。分析PTC患者常规超声检查呈现如上特征的原因主要包括以下4个方面:(1)癌细胞重叠、排列在纤维血管轴心周围且间质成分少,无法形成强烈的散射界面;(2)癌细胞通常无包膜,呈浸润性生长;(3)癌细胞排列致密并导致其后方存在一定程度的衰减;(4)恶性肿瘤生长速度快,新生血管因无法满足快速增殖的癌细胞对氧及营养的需求而出现钙沉积[8-9]。
SWE检查主要通过测量杨氏模量值而对组织硬度进行定量分析,杨氏模量值越大则组织硬度越大。本研究在180例PTC患者中共发现186个结节,其中恶性结节SWE参数均较高,表明结节硬度较高[10],究其原因为:正常甲状腺腺体滤泡腔内含有大量胶质,滤泡间和间质内结缔组织、血管和淋巴管含量少,因此正常甲状腺质地较软,而PTC患者甲状腺结节的腺体细胞遭破坏、变性,加之淋巴小结形成、纤维结缔组织增生等,最终造成结节硬度增加[11]。
CEUS检查主要通过观察组织内微血管而评估其内微循环情况,进而判断肿瘤良恶性。本研究在180例PTC患者中共发现186个结节,其中恶性结节CEUS检查主要呈不均匀增强、向心性增强、低增强,且Peak、MTT、AUCt均较低,与既往研究结果相符[12]。分析PTC患者CEUS检查呈现如上特征的主要原因:虽然恶性肿瘤新生血管较多,但其走形、分布紊乱且功能尚不成熟,加之部分肿瘤细胞缺血、坏死及新生血管内纤维组织较多等,导致其血液存储功能下降[9,13]。
上述研究结果提示常规超声、SWE、CEUS对PTC具有一定诊断及鉴别诊断,但单一超声检查与常规超声、SWE、CEUS联合的诊断效能是否相同,应如何对超声检查结果进行最大限度地挖掘和利用以提高诊断准确率等,均有待进一步研究。
作为常用的数据挖掘方法,决策树模型主要反映属性和对象类别之间的映射关系,并通过一系列规则对数据进行分类,从而建立决策树的节点并根据该属性字段的不同取值建立下一级分支(子分支),最后在子分支中重复建立下层节点及下一级分支,整体分类结果简单、清晰、直观[14]。本研究以两组结节间差异有统计学意义的超声检查结果为自变量,以PTC为因变量分别构建基于常规超声、SWE、CEUS及多模态超声的PTC决策树模型,结果显示其根节点分别为局灶强回声、Emax、AUCt、Emax,提示甲状腺结节超声检查应重点关注上述图像特征或参数。鉴于通过决策树模型内部训练集的交叉验证可有效删除部分对未知检验样本的分类没有意义的节点以避免“过度拟合”,因此笔者采用十折交叉验证法分别对决策树模型进行修剪,以构建一个更简单、更容易理解和应用的决策树模型。本研究十折交叉验证法测试结果显示,基于常规超声、SWE、CEUS、多模态超声的PTC决策树模型误判率分别为33.9%、19.4%、37.6%、7.0%,表明基于多模态超声的PTC决策树模型误判率明显低于基于常规超声、SWE、CEUS的PTC决策树模型;进一步分析发现,基于多模态超声的PTC决策树模型的准确率、Kappa值分别为94.1%、0.880,明显高于基于常规超声、SWE、CEUS的PTC决策树模型,提示其诊断效能较高,也进一步证实了决策树模型在肿瘤良恶性判断方面的应用价值[15-16]。
综上所述,随着机器学习方法和人工智能技术的快速发展,临床辅助诊断决策系统能通过有效学习专业知识和临床经验而有效减少医疗差错,有利于为甲状腺癌患者提供精准的诊断和治疗[17]。本研究基于多模态超声成功构建了PTC决策树模型,并具有较高的诊断效能,但该模型需结合多种超声检查技术并综合多个参数,这无疑会增加超声科医师工作量,但随着超声检查仪器的不断发展,该模型所涉及超声检查技术及参数有望在同一台仪器上较快地完成,并将整合的辅助诊断功能通过超声检查仪器输出[18]。此外,基于多模态超声的PTC决策树模型还可以弥补单一超声检查技术对甲状腺结节性质评价的不足,有利于提高PTC的诊断准确率并为临床提供新的诊断思路,但本研究仍存在如下不足之处:(1)样本量较小,今后需进行大样本量研究以进一步验证本研究结果;(2)本研究为回顾性研究,存在仪器操作者操作方法、水平不一等混杂偏倚,今后研究需注意制定统一操作标准或由专人完成操作。
作者贡献:李宁、阚艳敏负责研究的实施、撰写论文并对文章整体负责;李宁、阚艳敏、李晓松负责研究的设计;李宁、阚艳敏、李晓松、王艺桦、张曼进行资料收集与整理;王艺桦、张曼、孟健进行研究的评估与可行性分析;阚艳敏、马琳负责文章质量控制及审校。
本文无利益冲突。