哈婷婷,潘 俊,王洪光,张 滨
(北京大学首钢医院影像科,北京 100144)
乳腺癌是女性发病率、死亡率均最高的癌症[1]。乳腺X线摄影是检测乳腺疾病的重要影像学手段。近年来,以深度学习(deep learning, DL)为代表的人工智能(artificial intelligence, AI)技术发展极大提升了图像识别的准确率[2],可有效辅助影像科医师提升工作效率,并减少漏诊[3-4]。本研究与临床报告对比分析基于DL的乳腺X线影像检出系统的临床应用价值。
1.1 研究对象 回顾性分析2015年1月—2019年1月于我院接受常规乳腺X线检查的484例女性患者,年龄36~84岁,平均(55.3±9.7)岁。纳入标准:①摄片质量合格,包括完整的双乳头足位(cranio-caudal view,CC)和内外斜位(medio-lateral oblique,MLO)乳腺X线影像和诊断报告;②摄片前无乳腺活检、手术、放射治疗和化学治疗等病史。排除标准:①摄片质量不佳或投照位缺失;②触诊或其他影像学检查显示阳性,但X线片中未见病灶。
1.2 影像采集 采用GE Senographe Essential数字乳腺机,阳极靶面材料为钼,滤过材料为钼和铑。采用全自动压迫系统和全自动曝光系统,曝光电压22~49 kV,曝光电流为4~500 mAs,采集方法符合中华医学会2016年制定的技术标准[5]。
1.3 DL病变检出系统 使用Dr.Wise乳腺X线影像辅助诊断系统(以下简称AI,北京深睿博联科技有限责任公司)。以标准协议的Dicom数据作为输入,自动检出并分5类显示病变,即典型良性钙化、可疑钙化、肿块、非对称和结构扭曲,本研究纳入后4种作为阳性发现。
1.4 影像报告与审核 由1名低年资(不足5年乳腺X线阅片经验)放射科医师书写、1名高年资(10年以上乳腺X线阅片经验)放射科医师审核,参考美国放射学院2013年第5版BI-RADS标准[6]和中华医学会放射学分会《乳腺X线摄影检查和诊断共识》[7]出具诊断报告。
1.5 验证方案 进行AI检测,针对 BI-RADS 3类以上病例判读AI是否检出相应病变;对报告为BI-RADS 1类和2类、但AI有阳性发现的病例,由3名高年资(10~30年乳腺X线阅片经验)影像科医师审核,并给出相应BI-RADS分类,意见不一致时,经讨论得出最终结论。AI不确定是否为病变时,统一归为BI-RADS 0类。
1.6 统计学分析 采用 Python 3.6.2统计分析软件,评价AI对BI-RADS 3类以上病例的检出敏感度,并分别统计不同BI-RADS分级钙化、肿块、非对称和结构扭曲的敏感度,结合双向表χ2检验验证不同种类病变敏感度的差异。对于BI-RADS 1类和2类病灶,按照病变类别、ACR腺体构成分类、BI-RADS分类分别统计AI多检出且审核结果为BI-RADS 0类、3类及以上病变,结合双向表χ2检验验证病变数量差异。P<0.05为差异有统计学意义。
2.1 AI检出敏感度 报告显示230例存在BI-RADS 3类及以上病灶。分别有99、73、19、33和6例存在BI-RADS 3、4a、4b、4c和5类病变。其中BI-RADS 3、4a、4b、4c和5类病灶数量分别为103、79、23、40和11个,AI检出敏感度分别为82.52%(85/103)、97.47%(77/79)、100%(23/23)、100%(40/40)和100%(11/11),总敏感度为92.19%(236/256),见表1。根据后续活检、手术病理结果,53例证实为恶性病变,AI全部检出。钙化、肿块、非对称和结构扭曲数量分别为74、128、48和6个,AI检出敏感度分别为98.65%(73/74)、92.19%(118/128)、81.25%(39/48)和100%(6/6)。AI对不同BI-RADS分类、不同类型病灶的检出敏感度差异均无统计学意义(P均>0.05),见表1,但存在一定数量漏检(图1~3)。
2.2 AI多检出病灶 报告显示254例存在BI-RADS 1类和2类病灶,其中203例AI提示阳性,经审核75例(80个病灶)确定为BI-RADS 0类,21例(23个病灶)确定为BI-RADS 3类或以上,其中1例包含2个BI-RADS 3类肿块,1例包含BI-RADS 4a和4b类肿块各1个。AI多检出的BI-RADS 0类病灶数量可观,且病灶类型分布与报告不同(P<0.05),而多检出的BI-RADS 3类及以上病灶类型分布则与报告相符(P>0.05),见表2。AI多检出的BI-RADS 3类及以上病灶类型和BI-RADS分布见表3和图4~6。
表1 不同BI-RADS分类下、不同病灶类型AI检出情况[%(个)]
注:*:表示对应的总数为0,检出率无意义
表2 AI多检出的病灶及同原始报告的分布对比[个(%)]
图1 患者女,55岁,AI漏检钙化,报告提示团簇分布的圆形点状钙化,BIRADS 3类 A.左乳MLO位; B.左乳MLO位病灶区域特写; C.左乳CC位;D.左乳CC位病灶区域特写
2.3 ACR腺体构成分类对检出病灶的影响 统计不同ACR腺体构成分类下的病灶数量,诊断报告中各BI-RADS类别的病灶分布、AI多检出的BI-RADS 0类和3类及以上病灶分布与总体分布一致(P均>0.05),见表4。
3.1 AI的检出敏感度分析 本研究中,对于230例诊断报告BI-RADS 3类及以上病灶,AI总敏感度为91.74%,尤其对于钙化的敏感度接近100%,高于肿块和非对称,与文献[4,8]报道类似,且发现AI敏感度与病灶恶性程度呈正相关,其对BI-RADS 4a类及以上病灶的敏感度高达98.47%(129/131),4b类及以上病灶敏感度为100%(58/58)。AI漏检主要集中在BI-RADS 3类病灶,包括1个团簇分布的圆形点状钙化,AI检出但判断为典型良性钙化;漏检肿块则以腺体遮蔽、直径较小者为主。
本研究结合双向表χ2检验,发现AI对不同类型及不同BI-RADS分类病灶的敏感度差异均无统计学意义,验证了AI系统的稳定性。
3.2 AI对减少影像医师漏诊的价值 AI系统在诊断报告BI-RADS 1类和2类病变的254例中多检出75个BI-RADS 0类和21例存在BI-RADS 3类及以上病例,分别占29.53%和8.27%,前者需要结合其他检查进一步确诊,后者则需要随访或穿刺活检,提示AI可以有效减少医师对于有临床意义病灶的漏检,与既往研究[9-10]结果相符,后者均系以AI作为第二阅片人,统计AI帮助影像医师多检出的病灶,而本研究则从新的角度验证了AI对减少漏诊的有效性。
以病灶为单位统计,本研究AI多检出80个BI-RADS 0类,其中非对称占比过半(41/80,51.25%),这是因为对应病例中90%以上为ACR c和d类,致密的纤维腺体结构遮挡会降低X线影像的可靠性;23个BI-RADS 3类以上病灶,其中3个钙化均为无定形形态,指南统计显示,该形态钙化阳性预测值高达21%[6],且密度较低,接近于纤维腺体,有重要临床意义,但易漏诊。AI还有助于减少由于纤维腺体遮蔽导致的漏检肿块和非对称。
图2 患者女,61岁,AI漏检肿块,报告提示卵圆形、边缘遮蔽、等密度,BIRADS 3类 A.左乳MLO位; B.左乳CC位病灶区域特写; C.左乳CC位; D.左乳MLO位病灶区域特写 图3 患者女,39岁,AI漏检非对称,报告提示结构不对称,BIRADS 3类 A.右乳CC位; B.左乳CC位
图4 患者女,44岁,报告遗漏可疑钙化,团簇分布的无定形钙化,BIRADS 4b类 A.右乳CC位; B.右乳CC位病灶区域特写; C.右乳MLO位; D.右乳MLO位病灶区域特写 图5 患者女,46岁,诊断报告遗漏结构不对称,BIRADS 3类 A.右乳CC位; B.左乳CC位
表3 AI多检出且审核确认为BI-RADS 3类以上的病灶统计[个(%)]
注:括号内为相应病灶数占该类型病灶总数的比例
表4 在不同ACR腺体构成分类下原始报告和AI多检出病灶分布对比[个(%)]
注:括号内数字为病灶数占所在BI-RADS分类总数的比例
图6 患者女,41岁,报告遗漏2个肿块,第一行示形状不规则、边缘模糊的等密度肿块,BI-RADS 4b类;第二行示形状不规则、边缘遮蔽的等密度肿块,BI-RADS 4a类 A.左乳MLO位;B.左乳MLO位上象限病灶区域特写;C.左乳MLO位下象限病灶区域特写;D.左乳CC位;E.左乳CC位上象限病灶区域特写;F.左乳CC位下象限病灶区域特写
本研究主要局限性:为单中心研究,需多中心研究结果加以验证;同时,经多名医师验证的假阴性病例仅21例,有待进一步统计分析病灶类型分布。
综上所述,基于DL的乳腺X线影像病灶检出系统对于BI-RADS 3类及以上病灶具有较高敏感度,并可有效减少医师漏诊。