谢亚咩,朱 樱,柴维敏,宗绍云,张晓晓,詹维伟
1.上海交通大学医学院附属瑞金医院超声科,上海 200025;
2.上海交通大学医学院附属瑞金医院放射科,上海 200025;
3.昆明理工大学医学院附属第一人民医院超声科,云南 昆明 650500
2020年中国女性乳腺癌的新发病例达42万例,占全球乳腺癌的18%,在全国女性癌症中发病率排名第一,死亡率排名第四[1],中国女性乳腺癌发病率呈逐年上升趋势[2-3],且发病年龄集中于50~59岁。提高早期乳腺癌的检出率并进行及时、有效的治疗是降低乳腺癌死亡率的有效措施。对于非致密型乳腺患者,乳腺X线摄影为首选的检查方法,但对于亚洲地区致密型乳腺患者,超声、磁共振成像(magnetic resonance imaging,MRI)检查更具有优势,因此对于高危患者实行3种影像学联合检查在乳腺癌早期诊断方面尤其重要。Eghtedari等[4]建议将每种影像学检查单独描述,最终得出统一分类。目前,国内超声科独立于放射科单独存在,无法得出统一的乳腺影像报告和数据系统(Breast Imaging Reporting and Data System,BI-RADS)分类,因此本研究的主要目的是尝试在此基础上将三大影像学检查联合临床特征,构建一个多模态影像BI-RADS模型。
收集2019年8月—2020年9月在上海交通大学医学院附属瑞金医院术前均行超声、乳腺X线摄影及MRI检查的患者,共计1 695例患者(1 717个乳腺肿块),其中7例为男性,其余为女性,年龄16~88岁,平均年龄(51.2±14.4)岁。纳入标准:① 患者的影像学图像清晰;② 临床病理学资料完整;③ 3种影像学检查在1个月内完成。排除标准:① 影像学图像质量不佳;② 临床资料不完整;③ 已知恶性病变被排除在外。所有患者的病理学类型均经手术后病理学检查证实。
乳腺X线摄影检查采用美国GE公司的Senographe 2000D全野数字化乳腺机,投照体位主要为内外斜位与头尾位,必要时予以局部加压放大照射及特殊体位照射。MRI检查采用德国Siemens公司的Magnetom Aera 1.5 T超导型MRI仪,使用18通道乳腺专用相控阵线圈,患者采取俯卧位,双乳自然悬垂于乳腺线圈内。扫描范围包含双侧腋窝及双侧乳腺上下界。先横轴位扫描,扫描序列:T2加权脂肪抑制序列;弥散加权成像(diffusion-weighted imaging,DWI)b值为10 00 s/mm2;T1加权动态增强扫描,1期平扫(90 s)+5期增强扫描(90 s×5)。造影剂为钆喷替酸葡甲胺,剂量为0.1~0.2 mmol/kg,流速为2.0 mL/s,静脉注射后以同样速率注入15 mL 生理盐水冲洗管腔,后期将图像上传至影像存储与传输系统(picture archiving and communication system,PACS),在后处理工作站上进行冠状位及矢状位重建,在DWI图像上勾画感兴趣区(region of interest,ROI),测量表观弥散系数(apparent diffusion coefficient,ADC),获得时间信号强度曲线(time-signal intensity curve,TIC);超声仪采用意大利Esaote公司的MyLab90、深圳迈瑞生物医疗电子股份有限公司的Mindray Resona7,线阵探头频率为4.0~14.0 MHz,选择乳腺模式,扫查范围从腋后线到胸骨旁线,以乳头为中心放射状扫查整个乳腺、乳头-乳晕复合区、乳腺尾叶以及其附属的淋巴结,有副乳的患者应注意扫查副乳腺区域。检查病灶内血流时,探头应轻放不宜加压,以免小血管受压消失。于2D图像上清晰显示病灶最长轴切面行剪切波弹性成像(shear wave elastography,SWE),探头注意轻放。
本研究所分析的图像下载自医院PACS,格式为DICOM,由2名从事乳腺疾病研究方向(工作年限分别为3、5年)同时精通超声、乳腺X线摄影与MRI诊断的影像科医师,在不知道病理学检查结果的情况下分别对超声、MRI、乳腺X线摄影图像进行评估(肿块与非肿块的鉴别以其中一种检查呈明显肿块为肿块型,反之为非肿块)。对每个肿块特征依据BI-RADS描述记录,同时MRI纳入ADC、DWI、减影;超声纳入血流、弹性、肿块最大径(以2 cm为分界线)等指标。注意当3种影像的重复指标如形状、边缘(以MRI与超声为主)、钙化形状(超声结合乳腺X线摄影)将最可疑的特征作为最终结果。对于定性数据结论有分歧时,与第三名医师(年资>10年)讨论后达成一致,并行BI-RADS分类。超声、MRI、乳腺X线摄影各得出一个分类,最终取三者最大分类(图1)。结合患者临床特征,如年龄分组(50岁为分界线)、临床触诊活动度、激素使用情况、家族史、胸部手术史、有无触痛进行综合影像BI-RADS模型的构建。
图1 典型病例1(患者,女性,52岁,乳腺浸润性导管癌)影像
所有统计分析都采用SPSS 26.0进行。在单因素分析中,计量资料的描述采用±s,行组间独立样本t检验。计数资料采用构成比/率描述,采用χ2检验或Fisher精确概率法分析,参数入选标准为P<0.05。模型的参数选择基于最大似然估计的向前逐步回归法的多元logistic回归分析法。以单因素分析有统计学意义的影像评估指标及临床征象为自变量,以乳腺肿块的BI-RADS最大分类为因变量,构建多元logistic回归模型。模型的诊断效能采用受试者工作特征(receiver operating characteristic,ROC)曲线来评估。
组织病理学检查结果显示良性病变658个,恶性病变1 059个。恶性病变包括629例浸润性导管癌(invasive ductal carcinoma,IDC),25例浸润性小叶癌(invasive lobular carcinoma,ILC),206例乳腺导管内原位癌(ductal carcinomain situ,DCIS)及199例其他类型恶性病变(乳头状癌、化生性癌、黏液癌、鳞状细胞癌、淋巴瘤)。
将单因素分析P<0.05的指标进一步纳入多元logistic回归分析,筛选出敏感参数以构建回归模型。基于最大似然估计的向前逐步回归法筛选出有统计学意义的指标(表1)。
表1 进入方程的各参数似然比检验结果
模型预测肿块的BI-RADS分类见表2,每个类别良恶性占比的条形图见图2,结果符合BI-RADS指南类别的恶性概率,将BI-RADS 2、3类归类为良性,BI-RADS 4、5类归类为恶性。模型的灵敏度为100.00%(1 059/1 059),特异度为4.41%(29/658),准确度为63.37%(1 088/1 717);阳性预测值为62.74%(1 059/1 688);阴性预测值为100.00%(29/29)。模型的曲线下面积(area under curve,AUC)为0.955(图3)。模型的预测分类与实际分类比较见表3,一致性检验呈中等一致性(Kappa=0.526)。
表2 肿块预测BI-RADS分类情况
表3 模型预测 BI-RADS分类与实际BI-RADS分类情况n(%)
图2 BI-RADS分类良恶性占比条形图
图3 模型区分肿块良恶性的ROC曲线
BI-RADS自成立以来已发展成为一种简短的影像词典和报告指南,适当地使用BI-RADS可以较准确地评估肿瘤的恶性风险。2013年第5版BIRADS[5-6]将乳腺X线摄影、超声及MRI上的术语、报告结构、评估类别及管理建议进行统一。虽然BI-RADS MRI 4类病变仍没有进行细分,但Elezaby[7]与Honda[8]等人在常规临床实践中对乳腺BI-RADS MRI 4类细分的可行性提供了数据支持,进一步证实笔者将MRI的BI-RADS 4类细分为4A、4B与4C类与超声或乳腺X线摄影一样,可增加其临床效用。但国内的现状是当患者同时行3种检查得到的肿块类别可能不一致,给患者带来极大困扰的同时,临床医师应以哪个检查类别为准仍无定论。随着3种检查评估标准趋向一致,为综合影像指标的建立奠定基础。
在原本BI-RADS分类标准的基础上,加入临床指标及经研究可提高良恶性诊断区分度的其他指标,可能会导致模型预测与实际类别有所偏差,但最终模型预测结果仍符合BI-RADS分类标准。kappa值是检测一致性最直观的指标,经分析,模型预测分类与实际分类一致性中等。对此模型的分类差异进行分析,结果发现,相似度最高的是4A类与5类(分别为78.53%与75.69%),其次为4C类、4B类与3类,3类的一致性最差,实际归为3类的病灶有77%被模型判为4A类。可能与模型纳入的临床因素中某些指标所占的权重较高有关。
有研究[9]基于MRI增强图像的纹理特征来鉴别乳腺良恶性肿块,其灵敏度为82.93%、特异度为94.87%。本研究的主要目的是构建多模态影像BI-RADS分类预测模型,得到的BI-RADS最终类别与临床应用更为相符。模型预测类别的阳性预测值与BI-RADS的符合率是模型效果好坏最直观的判断指标,本研究以病理学结果为金标准,统计出每个预测分类中肿块的实际恶性概率,在指南参考范围之内,模型对于因变量区分度的优劣可用AUC来衡量[10],预测模型的AUC为0.955,说明模型在区分肿块良恶性方面效果显著。在乳腺癌的诊断中,单独使用MRI检查的AUC高于单独使用乳腺X线摄影或单独使用超声检查,乳腺X线摄影在腺体致密型患者中的漏诊率高达86.7%,提示超声和MRI在中国年轻女性乳腺检查中发挥着重要作用,联合诊断的灵敏度达98.2%[11-12]。
本研究仍存在一些局限性:首先,我们没有评估肿块BI-RADS分类在观察者间的一致性,鉴于既往研究[13]表明基于BI-RADS分类标准的规范性,无论是经验丰富的高级职称医师还是初级职称医师,均可以对肿块提供较一致的描述和评估;其次,模型灵敏度高,特异度低,需要深入探讨提高特异度的方法;第三,选取行3种检查的患者入组进行建模,难免存在选择偏移、恶性率偏高等问题,如进一步构建两两影像结合模型,临床适应性可能会更强。
总之,本研究模型的灵敏度高,对恶性肿块的诊断达到无一例漏诊。模型简单易懂,有较高的临床应用价值,使临床医师能准确地得到肿块的最终分类,从而针对不同的患者给出明确的诊断意见,减少了与患者的沟通障碍。