金启成 吕江红 许立龙 魏洪芬 汤桐芳 张传菊 李世岩
浙江大学医学院附属邵逸夫医院超声医学科(杭州 310016)
乳腺癌是女性最常见的恶性肿瘤[1]。超声检查是乳腺癌筛查的理想方式之一[2]。基于人工智能的计算机辅助诊断系统已逐步得到应用[3-11]。S-Detect 技术可自动对乳腺病灶进行识别及良恶性鉴别[2],具有显著临床应用价值[13-16]。然而,病灶的病理类型、最大径、年龄、所在象限以及深度均会对S-Detect 结果产生影响[17]。因此,如何正确使用S-Detect 技术,避免影响因素对其诊断准确性的干扰,也成为需要重点关注的一个问题。超声成像参数的理想调节是获得准确诊断的前提。那么不同的超声成像参数调节是否会对S-Detect 技术产生影响尚未明确。本研究将通过在不同超声成像参数设置的条件下,利用S-Detect 技术对乳腺病灶的良恶性进行判断,旨在分析其影响并探讨可能最佳的成像参数条件。
1.1 研究对象前瞻性选取2021年10月至2022年3 月期间因乳腺结节就诊于我院的患者。入选标准:(1)常规超声检查发现乳腺肿块型病灶;(2)病灶大小范围适中(能清楚分辨病灶形状,同时最大径小于单一切面显示范围,本研究中范围为0.5 ~7.0 cm 之间)。排除标准:(1)检查前已接受术前新辅助治疗的患者;(2)检查前已于外院进行手术或穿刺活检者;(3)采集数据不完全者。本研究方案经过我院伦理委员会审批通过(编号:2022-0354),所有入选患者均对研究内容知情,且同意参加。最终入选133 例患者,143 个病灶。
1.2 仪器与方法
1.2.1 仪器采用三星RS80A 型彩色多普勒超声诊断仪,L3-12A 线阵探头,频率3.0 ~ 12.0 MHz。采用乳腺超声检查预设置。
1.2.2 图像采集所有图像采集由3 名具有乳腺超声检查5 年以上经验的超声医师独立完成。患者取平卧位,双侧上臂高举,充分暴露乳腺区域。首先使用常规超声全面扫查双侧乳腺,发现病灶后对其位置、大小等信息进行记录,以便同侧乳腺发现多个结节时,能够将超声检查与病理组织学检查一一对应。于病灶最大径切面采集二维图像,采集时将根据研究设计方案对超声成像参数分别进行调节,具体包括以下5 种情况:(1)基准图(Basic parameter image, BPI):单个焦点,焦点位于病灶中部水平。扫查深度适中,即将目标病灶大部分置于图像的正中部位。辉度适中,能清晰显示图像及周边正常组织(图1A)。(2)双焦点图(Dual focus image, DFI):两个焦点,焦点位于病灶中部水平。其余参数调节与BPI 一致(图1C)。(3)焦点过浅图(Superficial focus location image, SFLI):单个焦点,焦点位于图像最表浅处。其余参数调节与BPI 一致。因焦点深度最浅为0.4 cm,若病灶腹侧面距皮肤距离≤ 0.4 cm,则放弃该组图像的采集(图1E)。(4)焦点过深图(Deeper focus location image, DFLI):单个焦点,焦点位于图像最深处。其余参数调节与BPI 一致(图1G)。(5)扫查深度过深图(Scanning too deep image, STDI):扫查深度过深,将病灶置于整个图像的上三分之一水平。其余参数调节与BPI 一致(图1I)。
图1 同一乳腺结节在不同参数设置条件下的二维超声图像及其对应的S-Detect 分析图Fig.1 Two-dimensional ultrasound images of the same breast nodule under different parameter settings and their corresponding S-Detect analysis images.
1.2.3 S-Detect 技术将采集好的图像分别进行S-Detect 辅助诊断,应用“Target Point”标定功能,点击病灶中央部位后,机器自动识别并勾画病灶边界。若自动识别与实际肉眼观察差别较大,则稍移动目标位置,再次自动识别,直至满意为止,若尝试3 次均无法达到满意效果,则启动“Point Edit”功能,对勾画边界进行调整。待达到理想勾画边界之后,S-Detect 将自动给出“可能良性”或“可能恶性”的诊断意见。同时,系统会自动识别病灶的相关特征,包括病灶形状、方位、内部回声、后方特征等。此时,保存静态图像以备后续分析统计(图1B、D、F、H、J)。
1.3 “金标准”获得为了分析不同成像参数设置条件下的诊断效能,本研究采用组织病理学诊断为“金标准”,病理标本的获得方式包括手术切除或超声引导下穿刺活检。对于同时存在手术切除病理及穿刺活检病理的病灶,且患者在手术切除之前未进行新辅助化疗者,以手术病理结果为准;若患者在手术切除之前已接受了新辅助化疗,则以治疗前穿刺活检病理结果为准。所有作为“金标准”的病理结果,与S-Detect 超声检查之间的时间间隔均不超过1 个月。
对于未获得病理结果的入选病灶,因其不影响S-Detect 给出良恶性诊断意见及超声特征判读,因此仅纳入一致性分析研究。
1.4 统计学方法采用SPSS 26.0 软件对获得的数据进行统计学分析。以BPI 为对照,采用kappa检验及McNemar 检验对不同成像参数条件下的诊断一致性进行分析,并统计各个成像参数设置条件下对病灶形状、方位、后方特征、内部回声四个超声特征判读的一致性。将Kappa 值0.8 ~ 1.0 设置为一致性完美,Kappa 值0.6 ~ 0.8 为一致性良好,Kappa 值0.4 ~ 0.6 设置为一致性中等[18]。根据“金标准”绘制上述BPI 及不同成像参数条件下的受试者操作特征(receiver operating characteristic,ROC)曲线,并计算曲线下面积(area under curve,AUC),评价不同成像参数条件下的诊断效能。AUC 间的比较采用Delong 检验。以P< 0.05 为差异有统计学意义。
2.1 一般情况最终入选133例患者,共143个病灶,患者年龄16 ~ 76 岁,平均(44.01 ± 1.25)岁。病灶最大径0.53 ~ 6.31 cm,平均(1.93 ± 0.88 )cm。所有入选病灶的图像采集情况及病理结果获取情况见表1。110 个有病理结果的结节中,良性病灶44 个,恶性病灶66 个。在诊断一致性分析中,4 种不同设置分别与BPI 比较,所有采集了相应图像的病灶均纳入统计分析。在诊断效能比较中,排除无病理结果的33 个病灶,另110 个病灶纳入统计分析。
2.2 不同成像参数条件下的诊断一致性对比本研究首先针对不同成像参数条件下S-Detect 所获得的病灶形状、方位、后方特征、内部回声这四个相对常用的超声特征进行一致性分析(见表2-5)。结果显示,在STDI 条件下,S-Detect 判断的病灶形状和内部回声与BPI 的判读一致性为各个参数条件中最低,并且存在显著性差异。在DFLI 条件下,S-Detect 判断方位及内部回声与BPI 的判读一致性为中等,但差异无统计学意义。
表2 病灶形状在不同成像条件下与BPI 的比较Tab.2 Comparison of the lesion shape with BPI under different imaging conditions例
表3 方位在不同成像条件下与BPI 的比较Tab.3 Comparison of the lesion orientation with BPI under different imaging conditions例
表4 后方特征在不同成像条件下与BPI 的比较Tab.4 Comparison of the lesion posterior features with BPI under different imaging conditions例
表5 内部回声在不同成像条件下与BPI 的比较Tab.5 Comparison of the lesion echo pattern with BPI under different imaging conditions
此后,再针对不同成像参数条件下S-Detect 所获得的良恶性判断结果进行一致性分析(表6)。同样可以看出,在STDI 条件下,S-Detect 判断病灶良恶性与BPI 的诊断一致性为最低,且存在显著性差异。其余各参数条件下对良恶性判断与BPI的一致性为完美或者良好,且差异均无统计学意义。
表6 良恶性判断在不同成像条件下与BPI 的比较Tab.6 Comparison of the judgment of the nature (benign of malignant) of lesions under different imaging conditions with BPI 例
2.3 不同参数设置条件下诊断效能的比较本研究共纳入143个病灶,获得明确病理结果者110例,其中恶性66例,良性44例。根据在BPI、DFI、DFLI、STDI 四种参数设置条件下S-Detect 获得的良恶性判断结果,分别绘制ROC 曲线,其判断乳腺病灶良恶性的AUC 依次为0.788(0.697 ~ 0.879),0.723(0.623 ~ 0.824),0.807(0.719 ~ 0.895),0.716(0.618 ~0.814),各参数设置条件分别与BPI 对比,所获得的AUC之间差异均无统计学意义(P= 0.343、1.232、0.289,图2)。
图2 同一乳腺结节在基准条件、双焦点条件、焦点过深条件、扫查深度过深条件下的诊断效能比较Fig.2 Comparison of diagnostic efficacy of the same breast nodule under BPI, DFI, DFLI, and STDI
由于部分病灶(51 个)位置过浅,病灶腹侧面距皮肤距离≤ 0.4 cm,无法进行焦点过浅的参数设置,因此在SFLI 中,共采集92 个病灶,其中有病理结果的71 例,包括恶性45 例,良性26 例。绘制针对该71 例样本的ROC 曲线,BPI 条件下S-Detect 针对乳腺病灶良恶性的AUC为0.778(0.660 ~ 0.897),SFLI 条件下的AUC 为0.748(0.625 ~ 0.872)。二者比较,差异无统计学意义(P= 0.730,图3)。
图3 同一乳腺结节在基准条件、焦点过浅条件下的诊断效能比较Fig.3 Comparison of diagnostic efficacy of the same breast nodule under BPI and SFLI
在临床诊断工作中,超声图像质量是影响诊断准确率的重要因素[19]。既往研究显示不同的参数条件设置会影响超声图像的分辨力。例如焦点位置对横向分辨力的影响较显著,焦点过浅会导致远场声束过于分散,从而降低超声图像的分辨力;焦点过深则指向性不明显,同样降低超声图像的分辨力[20-21]。
本研究相对于基准参数(BPI)条件,选取了双焦点(DFI)、焦点位置过浅(SFLI)、焦点位置过深(DFLI)、扫查深度过深(STDI)4 种参数调节设置,对比研究其对S-Detect 技术判读乳腺病灶结果的影响。结果显示,在各个参数条件下,相比于BPI 条件而言,均具有良好及以上的诊断一致性(Kappa均 > 0.6),但STDI 条件下诊断一致性最低,且与BPI 差异有统计学意义(P< 0.05)。本研究进一步探讨了病灶形状、方位、后方表现、内部回声这四个超声特征在不同参数设置条件下的一致性。结果显示,方位及后方表现在不同参数条件设置下的判读一致性处于中等或良好水平(Kappa均 > 0.5)。在常规超声判断病灶良恶性的过程中,形状及内部回声是相对重要的两个特征。然而,对于形状特征而言,受到STDI 条件的影响较大(Kappa=0.489),对于其余三种参数条件设置下,其判读的一致性处于良好水平(Kappa均 > 0.6)。对于内部回声特征而言,DFLI 及STDI 两个设置条件下的判读一致性较低,均处于中等水平(Kappa值分别为0.549 和0.442),但只有STDI 与BPI 差异有统计学意义(P< 0.05),同时,其余设置的内部回声判读一致性处于良好水平(Kappa均 > 0.6)。通过对诊断效能的研究可以看出,相对于BPI 设置而言,其他各个参数条件下S-Detect 对乳腺病灶的诊断效能差异无统计学意义,但对于上述四项设置,STDI 的诊断效能最低,且与BPI 之间的差距最大,而DFLI 条件下的诊断效能最佳。
由此可见,虽然焦点位置过深或过浅均会降低图像的分辨力,但相对于其他设置而言,焦点位置引起的分辨力降低对于S-Detect 的诊断及特征判读的影响较小。同时,虽然在上述各个超声参数设置条件下进行比较,S-Detect 对乳腺病灶良恶性判断均有较高的诊断一致性,但是,由于STDI对于形状特征及回声特征的影响较大,因此其诊断效能也相对最低。
有研究[10-11,22-23]表明,日常工作中容易造成漏诊及误诊的原因,常常在于对细小特征的识别及判读,例如边界模糊、内部回声弱、病灶形态不规则、后方回声衰减等,而初级医师对上述细微特征的辨别能力及诊断经验不足,造成漏诊及误诊的几率明显高于高年资医师。S-Detect 技术通过神经网络深度学习,同样是对乳腺病灶细微特征的辨别,其诊断能力高于初级医师水平,与高年资医师水平相当[24-28]。同时S-Detect 技术通过采用原始超声射频信号进行分析,减少了部分超声成像参数调节对图像信息的影响。但是,直接调节超声波发射及接收的参数设置仍然会对图像信息产生一定的影响,进而有可能影响到S-Detect 的判断结果。STDI 设置时,在同等分辨率前提下病灶显示的相对更小,对于病灶边缘形状的规则程度及内部细小回声特征的辨别能力均会受到影响,从而可能造成其特征判读的一致性降低,这也可能是其诊断效能相对最低的主要原因。
因此,在日常应用S-Detect 技术对乳腺病灶进行良恶性判断时,应尽量采用合适的扫查深度,尽量将病灶放置在整个图像的中央部位,且在完整显示的前提下被足够放大,从而避免因扫查深度过深而带来的诊断效能影响。
本研究的局限性在于:(1)参与采集数据人员较多,虽然制定了较为严格的、明确的采图规范,但是不同医师其采集手法造成的误差无法避免。(2)对于乳腺病灶的大小未进行分组。有文献[13]表明,不同大小乳腺病灶的诊断准确率存在一定的差异。(3)未对乳腺病灶的具体病理类型进行分类,文献[22]表明计算机辅助诊断系统对不同病理类型恶性病灶的敏感性不同,且差异具有统计学意义。这些不足之处都有待后续进一步展开研究。
通过对比不同超声成像参数条件下S-Detect技术对乳腺病灶超声特征判读及良恶性判断的一致性和诊断效能,本研究发现,扫查深度若调节的过深,其特征判读的一致性将会降低,特别是对于病灶形状及内部回声,同时,其对乳腺病灶良恶性判断的诊断效能也较其他成像参数条件更差,且与基准参数设置之间的差距最大。因此,在日常应用SDetect 技术对乳腺病灶进行判断和分析时,虽然可以适当的对焦点个数、焦点位置等超声成像参数进行调节,但应尽量避免使用过深的扫查深度。
【Author contributions】JIN Qicheng performed the experiments and wrote the article. LV Jianghong and XU Lilong conducted preliminary research. WEI Hongfen, TANG Tongfang and ZHANG Chuanju performed the experiments and took ultrasound pictures. LI Shiyan revised the article and Identified the manuscript.