陈璟泰,侯令密,唐云辉,钱双强,蒲虹羽,高砚春
根据报道,19%~68%的人存在甲状腺结节[1]。甲状腺结节是甲状腺癌最常见的临床表现,准确鉴别甲状腺结节良恶性对于患者治疗方式的选择至关重要。彩超因无创、无电离辐射且价格低廉而被广泛接受为甲状腺结节的一线影像学检查手段,但其诊断准确性常与医生的经验、水平相关[2]。
计算机辅助诊断(computer aided diagnosis,CAD)技术是人工智能与现代医学研究的热点之一。近年来,随着构建人工智能的技术进步,人们已经开发了基于超声的CAD系统,并被引入商用的超声诊断软件[3],在乳腺和甲状腺肿瘤检查工作中,其有效性得到了初步验证[4-5]。人工智能与超声影像结合可简化操作步骤、避免主观差异性、节约医师资源、缩短报告时间、提高诊断效率,具有广阔的应用前景。
S-Detect是目前常用的一项针对甲状腺结节的超声CAD技术,通过前期数据学习及算法优化,该技术可对甲状腺结节的良性或恶性进行鉴别诊断。本研究广泛纳入国内外多篇文献进行定量合成,旨在明确S-Detect对甲状腺结节良恶性的鉴别诊断价值。
1.1 文献纳入与排除标准
1.1.1 文献纳入标准 (1)评估S-Detect诊断准确性的研究;(2)必须通过病理学检查明确甲状腺结节的良恶性;(3)应提供或可以计算出相应的诊断准确性的统计信息,包括真阳性(TP)、假阳性(FP)、假阴性(FN)、真阴性(TN)。
1.1.2 文献排除标准 (1)研究没有提供足够的数据来计算TP、FP、FN和TN;(2)重复研究,低质量研究,信函,会议论文,病例报告,综述;(3)与本研究主题无关。
1.2 文献检索策略 计算机检索PubMed、EMBase、Web of Science、the Cochrane Library、万方数据知识服务平台、中国知网、维普网和中国生物医学文献服务系统,检索时限为建库至2021-01-06。中文检索词包括:甲状腺、S-Detect、计算机辅助诊断。本研究搜索了相关主要出版物中的参考文献,以确定其他符合条件的研究,并对最终被纳入的研究所包含的参考文献进行了审查,扩大了搜索范围,以确定其他潜在的相关研究。英文检索词包括S-Detect,thyroid,computer aided diagnosis,Artificial Intelligence等。以PubMed为例,其文献检索策略见表1。
表1 PubMed文献检索策略Table 1 Search strategy used to identify studies about the value of S-Detect in differentially diagnosing thyroid nodules in PubMed database
1.3 资料提取与质量评价 由2名评价者根据文献纳入与排除标准独立筛选文献,确定最终纳入研究的文献。对于文献检索过程中出现的争议,由第3名评价者与前2名评价者共同分析,得出一致的结论。最终,提取和录入纳入文献的基本资料,包括第一作者、发表时间、国家、例数、年龄、性别、结节数目、探头频率、仪器、TP、FP、FN、TN。纳入研究的方法学质量评价采用 QUADAS(Quality Assessment for Diagnostic Accuracy Studies)工具[6]。QUADAS工具共包括14项条目:每项条目以“是”“否”或“不清楚”进行评价。以上过程均由2名评价者按照标准独立进行。
1.4 统计学方法 采用Meta-Disc 1.4和Stata 15软件进行统计学分析。通过绘制集成受试者工作特征(SROC)曲线观察图形是否为“肩臂状”,再通过计算Spearman秩相关系数判断是否存在阈值效应。通过I2判断研究的异质性大小,I2<50%且P>0.1时采用固定效应模型进行分析,否则采用随机效应模型。统计指标为合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比和受试者工作特征(ROC)曲线下面积(AUC);检验水准α=0.05。采用“逐一排除法”进行敏感性分析;绘制Deek漏斗图判断发表偏倚,P<0.10时表明存在发表偏倚。
2.1 文献检索结果 共检出相关文献962篇,经逐层筛选后,最终纳入16篇文献[5,7-21]、2 453例患者,其中 4 篇为中文文献[7-10]、12 篇为英文文献[5,11-21]。文献筛选流程见图1。纳入文献的基本特征见表2。根据QUADAS工具评价结果,纳入文献中评价为“是”的条目数均≥11项,可见纳入文献的质量较好,文献质量评价结果见表3。
表2 纳入文献的基本特征Table 2 Basic characteristics of included studies
表3 纳入文献的质量评价结果Table 3 Quality assessment of included studies
图1 文献筛选流程图Figure 1 Flowchart of literature screening
2.2 Meta分析结果 SROC平面散点图未呈明显“肩臂状”,Spearman秩相关系数为0.193,P=0.474,提示各文献间不存在由阈值效应引起的异质性。所有结局指标I2>50%,故采用随机效应模型进行Meta分析。Meta分析结果显示,S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比、AUC分别为0.84〔95%CI(0.81,0.86),P=0.003 6〕、0.71〔95%CI(0.69,0.73),P<0.000 1〕、3.31〔95%CI(2.45,4.47),P<0.000 1〕、0.22〔95%CI(0.17,0.29),P=0.000 6〕、15.93〔95%CI(9.85,25.78),P<0.000 1〕、0.89〔95%CI(0.84,0.94)〕。详见图 2~7。
图2 S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度Figure 2 Pooled sensitivity of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
图3 S-Detect鉴别诊断甲状腺结节良恶性的合并特异度Figure 3 Pooled specificity of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
图4 S-Detect诊断甲状腺结节良恶性的合并阳性似然比Figure 4 Pooled positive likelihood ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
图5 S-Detect诊断甲状腺结节良恶性的合并阴性似然比Figure 5 Pooled negative likelihood ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
图6 S-Detect诊断甲状腺结节良恶性的合并诊断比值比Figure 6 Pooled diagnostic odds ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
图7 S-Detect诊断甲状腺结节良恶性的SROC曲线Figure 7 SROC curves of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
2.3 敏感性分析 逐一剔除单项研究后对其余研究重新进行Meta分析,结果显示各结局指标合并效应量均未发生明显变化,提示本研究结果稳定、可靠。
2.4 发表偏倚 Deek漏斗图基本对称且趋近于垂直(图8),P=0.38,提示无发表偏倚。
图8 Deek漏斗图Figure 8 Deek's funnel plot for assessing the publication bias of included studies
近年来甲状腺结节发病率逐年升高[22],超声检查已被广泛应用于甲状腺结节的诊断。随着医学影像技术的发展,弹性成像、超声造影及人工智能等新技术被更多地应用于甲状腺疾病的辅助诊断。为加快诊断过程并减少观察者之间的差异,目前已开发CAD系统以帮助放射科医生对超声图像进行解释,其中S-Detect是第一个可商购的甲状腺超声CAD系统[23],目前其已在多个国家广泛应用。为验证S-Detect的临床应用价值,本研究纳入多篇文献对其在区分甲状腺结节良恶性方面的诊断性能进行了全面评估。
本研究广泛收集了国内外关于S-Detect对甲状腺结节良恶性鉴别诊断价值的文献并进行了Meta分析,结果显示,S-Detect鉴别诊断甲状腺结节良恶性的合并灵敏度为0.84,合并特异度为0.71,表明有84%的恶性结节和71%的良性结节能被S-Detect鉴别;此外,合并阳性似然比为3.31,合并阴性似然比为0.22,AUC=0.89。诊断比值比是检测诊断准确性的重要指标,其数值越大表明诊断准确性越高,本研究得出的合并诊断比值比为15.93,表明S-Detect的总体准确性较高。从以上结果可以看出,S-Detect鉴别诊断甲状腺结节良恶性的灵敏度较佳,但特异度稍低,这可能与S-Detect主要是评价结节的形状、方向、边界、后方特征、回声等,对肿块内部的钙化灶并不敏感,而肿瘤内部的微钙化常是诊断甲状腺癌的可靠征象;因此,单独应用S-Detect鉴别诊断甲状腺结节的良恶性可能会增加不必要的穿刺或手术,需要继续改进算法,增加阴性病例学习数量以提高特异度及S-Detect的诊断效率,而S-Detect要替代经验丰富的影像科医师还有很长的路要走。YOO等[17]研究表明,与单独的影像科医师相比,CAD系统辅助影像科医师的诊断灵敏度更高,这意味着CAD系统使影像科医师能够检测出更高比例的真正的恶性肿瘤,因此,S-Detect可用于彩超图像的辅助判断,为影像科医师的决策提供参考。
本研究纳入的文献质量较高,且敏感性分析结果较稳定,Deek漏斗图提示无明显发表偏倚,表明本研究分析结果稳定、可信,但本研究也存在局限性:(1)仅纳入了中、英文文献,可能存在语言偏倚;(2)多个结局指标中存在明显的异质性,可能与纳入研究间的结节大小、疾病谱构成等有关;(3)S-Detect是对录入的二维超声图像进行分析,采用不同标准切面时S-Detect诊断符合率有差异,存在一定误差;(4)纳入的研究多为单中心研究,且样本量较小,研究结果可能具有局限性。
综上所述,当前的证据显示,S-Detect对甲状腺结节良恶性的鉴别诊断价值较高,可以作为常规彩超检查的有益补充;但是,目前尚不建议将其作为甲状腺结节良恶性诊断的单一确定性检测方法。此外,为进一步评估S-Detect的价值,还有必要在各个地区进行大量高质量、多中心、大样本量前瞻性研究。
作者贡献:陈璟泰、侯令密、高砚春进行文章的构思与研究的设计;陈璟泰、侯令密、唐云辉进行研究的实施与可行性分析;陈璟泰、唐云辉、蒲虹羽进行数据收集及整理;陈璟泰、钱双强进行统计学处理,结果的分析与解释;陈璟泰撰写论文;侯令密进行论文的修订;侯令密、高砚春负责文章的质量控制及审校;高砚春对文章整体负责,监督管理。
本文无利益冲突。