王小琦,刘 鹏,陈 赜,张番栋
(1.甘肃省肿瘤医院放射科,甘肃 兰州 730050;2.深睿人工智能研究院,北京 100080)
微小钙化是早期乳腺癌的重要甚至唯一征象[1]。乳腺X线片对于钙化敏感度很高,是早期发现和诊断乳腺癌的重要手段。根据中华医学会放射学分会《乳腺X线摄影检查和诊断共识》[2]和美国放射学院2013年第5版BI-RADS标准[3],可从形态和分布两个维度来描述可疑恶性钙化,形态主要分为无定形模糊钙化、粗糙不均质钙化、细小多形性钙化和线样或线样分支钙化4种,分布包括区域性、团簇状、线样及段样分布。由于阅片过程中的视觉疲劳、注意力集中度下降等主观因素,影像科医师易遗漏直径较小(如团簇分布,直径≤2 cm)、密度较低(如无定形模糊形态)的可疑钙化。本研究对比基于深度学习(deep learning, DL)的乳腺X线摄影钙化检测系统(简称DL系统)与影像医师对不同类型可疑钙化的检出敏感度,探讨DL系统辅助影像医师减少漏检的应用价值。
1.1 一般材料 回顾性性分析2011年11月—2015年6月932例于甘肃省肿瘤医院放射科接受乳腺常规X线检查的女性患者,共3 728幅乳腺X线片,其中头足位(cranio-caudal view, CC)、内外斜位(medio-lateral oblique, MLO)各1 864幅;患者年龄17~74岁,平均(50.2±9.6)岁。纳入标准:①影像学检查方法符合2016年中华医学会制定的《乳腺影像检查方法专家共识》[4];②采集影像前未做过乳腺手术、穿刺等。排除标准:①影像采集条件不达标;②缺失CC或MLO片。
1.2 图像获取与处理 采用Siemens Mammomat Inspiration数字乳腺机摄片。先由低年资医师A和B(工作年限均不足10年)以盲法独立阅片,勾画可疑钙化范围轮廓,如果1个病灶中包含多种可疑形态钙化,则记录阳性预测值(positive predict value, PPV)最高者。同步采用DL系统自动检出钙化,利用多边形轮廓标记钙化。之后由高年资医师C(15年以上乳腺X线诊断经验),对医师A、B及DL系统的结果进行复阅,将所得记为最终结果,并参照文献[3]记录其BI-RADS类别、分布及形态。
1.3 统计学分析 采用Python 2.7.10统计分析软件。以χ2检验对比DL系统与医师A、B的检出敏感度。采用双向表χ2检验对比可疑钙化的不同BI-RADS分类、分布、形态等对于DL系统与医师A、B敏感度的影响。P<0.05为差异有统计意义。
932例中,共标记可疑钙化274个(CC 片140个,MLO 片134个),见表1。DL系统共检出7 684个钙化,其中可疑恶性钙化273个(273/7 684,3.55%),典型良性钙化5 884个(5 884/7 684,76.57%),假阳性1 527个(1 527/7 684,19.87%);DL系统对可疑恶性钙化的检出敏感度为99.64%(273/274),漏检病例见图1。医师A共检出可疑钙化210个,敏感度76.64%(210/274);医师B共检出可疑钙化225个,敏感度82.12%(225/274)。DL系统检出但医师漏检的可疑钙化形态见图2。DL系统敏感度高于医师A(χ2=67.146 8,P<0.000 1)及医师B(χ2=48.645 3,P<0.000 1)。
图1 患者女,51岁,DL系统漏检团簇分布无定形钙化,BI-RADS 4b类
不同BI-RADS分类钙化的检出结果见表2。对于BI-RADS 4a、4b、4c和5类钙化,DL系统均有较高敏感度,除漏检1例BI-RADS 4b类病灶外,对其余分类的敏感度均为100%。结合双向表χ2检验分析,BI-RADS分类对于DL系统检出敏感度无显著影响(χ2=0.558 8,P=0.905 8),而对医师有所影响(医师A:χ2=9.989 9,P=0.018 7;医师B:χ2=14.663 1,P=0.002 1)。
不同可疑形态钙化的检出结果见表3。DL系统除漏检1例无定形模糊钙化之外,对粗糙不均质、细小多形性和细线或细线分支样等3种形态的敏感度均为100%。医师A和B对于细小多形性和细线或细线分枝样钙化检出敏感度均>85%,但对无定形模糊钙化的检出率(60.83%,64.17%)显著低于其他3种形态(医师A:χ2=28.256 7,P<0.000 1;医师B:χ2=44.696 0,P<0.000 1)。结合双向表χ2检验分析,钙化形态对于DL系统检出敏感度无显著影响(χ2=1.287 9,P=0.732 0),而对医师有所影响(医师A:χ2=30.180 4,P<0.0001;医师B:χ2=48.046 2,P<0.000 1)。
对不同分布钙化检出结果对比见表4。DL系统除漏检1例团簇分布钙化之外,对其余区域、线样和段样等3种分布的钙化敏感度均为100%。医师A和B对于段样分布的钙化检出敏感度均>90%,对区域分布的钙化检出敏感度均>85%,而对团簇样的检出敏感度均<75%,显著低于其余分布(医师A:χ2=7.776 7,P=0.005 3;医师B:χ2=8.145 2,P=0.004 3)。结合双向表χ2检验分析,钙化分布对于DL系统检出敏感度无显著影响(χ2=1.387 6,P=0.708 5),而对医师有所影响(医师A:χ2=21.2768,P=0.000 1;医师B:χ2=11.4410,P=0.009 6)。
表1 高年资医师检出钙化数量统计
表2 不同BI-RADS可疑钙化检出比较[个(%)]
表3 不同形态可疑钙化检出对比[个(%)]
国内外均已针对AI检出乳腺X线摄影片中的可疑恶性钙化展开研究。有学者基于矩形滤波器、高斯差分滤波器、小波变换等[5-6]自动提取微钙化点,但仅能检测单个钙化点,缺乏对于成簇可疑钙化的分析;也有学者基于DL的卷积神经网络自动检测可疑钙化[7-8],但敏感度均不到90%,临床意义有限。既往对现有基于人工智能技术的钙化检测系统研究[9-11]检出可疑钙化的敏感度在86%~98%,临床医师(尤其是年资较低的医师)在人工智能检测辅助下检出可疑钙化的敏感度有显著提升[12-13],但上述研究病例数量有限,且均缺乏对于不同BI-RADS分类、钙化形态与分布的深入分析。BI-RADS分类反映医师对于钙化恶性概率的评估,而钙化形态和分布也对应不同的阳性预测值,漏诊不同类型钙化的风险也不尽相同,而完善的辅助系统应可稳定检出各种类型钙化。
本研究观察DL系统对可疑钙化检出的敏感度与稳定性,并与2名独立盲法阅片的低年资医师进行比较,着重对比分析DL系统检出不同BI-RADS分类、形态与分布的可疑钙化的敏感度,发现DL系统对于检出可疑钙化敏感度较高,显著高于2名低年资医师,274例可疑钙化中,DL系统仅漏检1例团簇分布的无定形钙化,其密度很低,有一定检测难度,且2名低年资医师亦均未能检出,由高年资医师在复阅时发现。本组2名低年资医师对于不同BI-RADS分类、形态、分布可疑钙化的检出敏感度差异有统计学意义,对BI-RADS 4b类的钙化敏感度明显低于其他类别。从形态上分析,医师漏检者主要为密度较低的无定形钙化;从分布上看,医师对线样分布、直径较小的团簇样钙化漏检相对更多,原因主要是这些钙化易受腺体等的干扰,受医师精力有限、视觉疲劳、注意力集中度下降等主观因素影响而漏检。DL系统检出可疑钙化灶则不受BI-RADS分类、形态及分布的影响,故可作为辅助,有效提升医师检出可疑钙化的敏感度。
图2医师漏检可疑钙化病例 A.患者女,61岁,团簇分布无定形钙化,BI-RADS 4b类; B.患者女,40岁,团簇分布无定形钙化,BI-RADS 4b类; C.患者女,58岁,团簇分布无定形钙化,BI-RADS 4b类; D.患者女,39岁,团簇分布细小多形性钙化,BI-RADS 4b类; E.患者女,44岁,区域分布无定形钙化,BI-RADS 4b类; F.患者女,55岁,线样分布无定形钙化,BI-RADS 4c类
表4 不同分布可疑钙化检出对比[个(%)]
本研究的主要局限性首先在于缺乏钙化的病理金标准或随访信息;其次,部分形态和分布的钙化数量较少。需继续扩大样本量完善研究。
综上所述,基于DL的乳腺X线钙化检出系统对可疑形态钙化的检出敏感度高且稳定性强,有望辅助临床医师减少漏检。