朱人杰 叶春明* 范璐敏 王书卜 沈玲丽 周程辉
数字乳腺断层合成摄影(digital breast tomosynthesis,DBT)局部多个连续视图的三维重建能克服腺体组织对重叠病变的影响[1].与传统的2D乳腺X线摄影相比,DBT在肿块检测、结构扭曲和不对称方面提供优势[2-3].已经证明DBT在增加乳腺癌检测和降低召回率方面具有优势[4-5].但DBT有一些局限性,如较长的图像解释时间以及对大容量存储的需求.此外,其需要专用工作站来分析DBT图像[6].医学影像归档和通信系统(PACS)能够使用DICOM标准格式存储DBT数据,从而使得放射科医师能够使用PACS来评估DBT图像的可能.通过使用PACS进行DBT阅片,可更轻松地存储图像数据及访问病例.若使用PACS读取DBT不会影响诊断的准确性和效率,DBT的可及性和放射科医师的便利性将得到改善.因此,本研究拟比较使用PACS和专用工作站解释DBT图像的诊断准确性和效率的差异.
1.1 一般资料 2015年12月至2016年5月期间,连续选择接受DBT筛查和诊断目的女性病例(包括在专用工作站和PACS上存储且可用于读取的DBT图像).在120例女性中,排除有手术病史和术后手术瘢痕的12例女性.共纳入108例接受DBT诊断(n=55)和筛查目的(n=53)的女性(年龄23~78岁,中位年龄50岁).所有恶性和良性肿瘤通过穿刺活检或手术切除后组织病理学证实,所有在2年后进行数字乳腺X线摄影随访的患者均未发现乳腺恶性肿瘤的患者被认为是阴性或良性发现.本研究为回顾性研究,得到本院伦理委员会的批准,并且豁免了知情同意权.
1.2 图像采集 所有DBT和数字乳腺X线摄影均由一位专业技术人员使用Selenia Dimensions系统(Hologic,Bedford,MA)进行,该设备使用定制设计的高功率钨阳极X射线管和铑、银、铝X射线滤波器.基于乳房的厚度/组成产生最佳X射线光谱(20~49kVP),DBT和数字乳腺X线摄影成像模式中的不同滤光器使用自动曝光控制.在每侧乳房中获得DBT和数字乳腺X线摄影图像,包括头尾位和内外侧斜位.当压缩乳房时,X射线球管旋转15°,采取一系列超低剂量的乳房X线摄影.DBT图像层厚1mm,重建投影以创建乳房的三维图像集.使用DICOM二次捕获对象格式在专用工作站中存储所有DBT图像,并在PACS中使用DICOM数字乳腺断层合成摄影对象格式.
1.3 图像准备和显示 使用PACS观察器(INFINITT PACS;Infinitt Healthcare,Seoul,South Korea) 和专用工作站(SecurView工作站;Hologic,Bedford,MA,USA)和两个21英寸黑白显示器(ME 551i2;Totoku,Tokyo,Japan)评估DBT图像.显示器的矩阵为2048X2560,最大亮度为750cd/m2,监视器亮度按照供应商的建议进行校准.两个相同的显示器并排放置在标准阅片室的同一桌子上.在每个显示器中使用1X1布局显示图像,并以堆叠或电影模式查看.在同一房间内使用PACS和专用工作站读取DBT.
1.4 图像分析 三名研究者首先接受100例DBT的教学文件进行训练.正式实验开始后,研究者使用专用工作站独立阅读97例DBT图像,间隔2个月后使用PACS阅片.每次图像分析时,图像随机化并以交替顺序呈现,所有图像都是匿名的,评定者无法获得患者任何其他相关图像,对患者的组织学诊断以及任何临床或实验室信息不知情.要求每位观察者使用带有图形界面的标准化记录纸记录所有病变的数量和位置,参照第5版乳腺影像报告及数据系统(BI-RADS)对肿块型病变进行评估,进行BI-RADS分类和乳腺致密度分类,分类为BI-RADS 1,2或3的病例,归为正常或良性,BI-RADS 4或5的病例归为异常或恶性.BI-RADS分类c、d归为致密型乳腺,a、b归为非致密型乳腺[2,7].分别记录使用专用工作站或PACS的每个案例的阅片时间.最后做图像质量评估,如果PACS的图像质量不足以做出诊断,将该病例评估为"不能诊断";如果PACS上的图像质量与专用工作站相比较差,但不影响诊断,则评估为"低质量但具有诊断性";如果PACS和专用工作站之间的图像质量没有差异,评估为"相等".
1.5 统计学分析 采用SPSS 19.0和MedCalc 12.7统计软件包.采用受试者操作特征曲线评估不同观察者在PACS和专用工作站检测病变的诊断灵敏度和特异性,并与组织病理学结果和随访数据进行比较.观察者间一致性评估采用Kappa分析,一致性差(κ<0.20),一 般(κ=0.21-0.40), 中 度(κ=0.41-0.60), 良好(κ=0.61-0.80)和非常好(κ=0.81-1.0).双尾P<0.05则认为差异具有统计学意义.
2.1 患者临床及病理特征 108例患者中,23例为恶性肿瘤,30例为良性肿瘤,55例为阴性.见表1.
表1 108例患者的临床及病理特征
2.2 不同观察者使用PACS和工作站对恶性肿瘤ROC分析比较 见表2.典型病例见图1.
2.3 阅片时间比较 不同观察者在工作站和PACS上解释DBT图像的时间见表3.在PACS(1.67min/例)上解释DBT图像的平均时间长于在工作站上的时间(1.30min/例)(P=0.009).
表2 使用PACS和专用工作站分析恶性肿瘤的灵敏度和特异性、ROC曲线下面积比较
表3 不同观察者图像观察时间(±s)
表3 不同观察者图像观察时间(±s)
PACS 工作站总共用时(min) 每例用时(min) 总共用时(min) 每例用时(min)观察者1 152.3 1.41±0.30 132.8 1.23±0.33观察者2 189.0 1.75±0.45 143.6 1.33±0.23观察者3 200.9 1.86±0.52 145.8 1.35±0.29合计 180.7 1.67±0.46 140.8 1.30±0.28
2.4 图像质量评价 PACS上显示的大多数DBT图像质量被评估为相等(83.3%)或低于工作站上显示的图像质量但具有诊断性(16.4%)(见表3).只有一个病例认为需要使用工作站重新分析(观察者4),使用PACS,该病例被解释为区域分布的点状钙化,最终评估为BI-RADS 3(图2A).使用工作站,该病例被解释为精细、多形性微钙化,最终评估为BI-RADS 4A(图2B).另外两位观察者将该病例解释为无定形或精细多形微钙化,最终评估为BI-RADS 4B或4C,与显示方法(PACS或工作站)无关.该病例的参考标准是弥漫性、点状钙化,最终评估为BI-RADS 3类,在2年的影像学随访后没有乳腺恶性肿瘤的证据.根据观察者3,PACS上显示的该病例的图像质量是不可诊断性,需要在工作站上重新进行阅片.但是,观察者使用PACS的阅片解释是正确的,但使用工作站反而不正确.因此,假设即使PACS上显示的DBT的图像质量主观上比工作站上显示的更差,也不会影响诊断性能.
图1 45岁,女性患有浸润性导管癌DBT图像[在极其致密的乳腺组织左上部区域显示出轻微的不对称性(箭头),观察者1在PACS(1A)上将此判为阴性,但在工作站(1B)上判为阳性]
图2 44岁,女性左乳房微钙化DBT图像[观察者3认为有必要使用工作站重新分析,在工作站(2A)比在PACS(2B)上更清晰地看到微钙化]
表4 不同观察者图像质量评定结果[n(%)]
2.5 观察者间一致性结果 使用PACS,观察者1和2之间的κ=0.595(P<0.001),观察者1和3之间的κ=0.553(P<0.001),观察者2和3之间的κ=0.611(P<0.001),具有中等一致性.而使用工作站的具有良好一致性:观察者1和2(κ=0.768,P<0.001),观察者1和3(κ=0.695,P<0.001),观察者2和3(κ=0.799,P<0.001).
为了充分利用DBT图像,通常需要专有的图像显示器,使用供应商的图像可以顺利地在另一个平台上查看.以适当的速度和刷新率处理增加的图像量并执行专门的后处理(例如合成的2D视图和平板视图)也很重要.使用最近开发的技术,标准DICOM格式的重建部分图像推送到PACS并以堆叠或电影模式观看,类似于其他容积或堆叠图像序列[5-6].对于普通用户,PACS的功能足够强大,尤其是具有兼容性PACS,图像显示合理的时间长度,并且能以可接受的步骤执行图像的操作和注释.
本研究中,假设使用PACS系统解释DBT图像将产生与使用专用工作站获得的相似诊断性能.从筛查和诊断人群中选择正常和异常病例,三名观察者对患者资料数据不知情的情况下使用专用工作站和PACS以2个月间隔读取DBT图像两次.总体而言,诊断性能和灵敏度相当,但PACS系统的特异性较低.本研究结果表明,在大多数临床病例中,PACS可用于解释临床实践中的DBT图像,而不是仅专用工作站.然而,在专用工作站上进行分析时,特异性高于PACS.这可能是由于在工作站上对肿块的形状或边界的评估比在PACS上更准确.因此,使用工作站进行表征病变的最终评估可能比PACS更准确.本研究中仅有一名观察者在使用PACS评估DBT图像时需要使用工作站重新分析一个病例,并且使用PACS检测乳腺癌的灵敏度与工作站相当,因此,建议首先使用PACS解释DBT图像,以后使用专用工作站进行更好的表征.
使用PACS解释DBT图像的阅片时间长于使用专用工作站.以前的一项研究表明,使用专用于单一成像模式的工作站使放射科医生每天浪费28min.此外,工作站中可用的工具和选项的多样性可能使放射科医师浪费更多时间,每天多达18min.因此,使用专用工作站时,可能需要更长的时间来解释图像.然而,本研究中仅比较阅片时间,发现使用PACS以堆栈模式上传和操作DBT图像耗时更多,结果与之前的研究不一致.可能使用更高级的软件技术可以解决整体阅片时间更长的问题.
本研究的局限性:首先,采用回顾性研究,且入选病例数仍然偏少.其次,由于研究样本包括来自筛查和诊断人群的患者,无法提供关于特定人群的诊断性能或解释时间的不同数据.有必要开展更大规模的研究,以满足筛查或诊断人群的需求.第三,仅评估了单一类型的DBT和PACS系统,结果不能外推至DBT和PACS机器的所有其他供应商设备.