武敬平,于蕾,赵玉珍*,王瑛,郭丹丹,刘健
乳腺结节的良恶性鉴别诊断一直是乳腺超声检查的重要内容,随着美国放射学会乳腺影像报告和数据系统(BI-RADS)[1]的应用,乳腺超声有了相对规范的评分系统。但其评分细则缺乏统一标准,尤其是针对BIRADS 4级乳腺结节,没有提出乳腺超声亚分类的划分原则[1-3]。部分学者对BI-RADS 4级的亚分类进行了探索[4-8]。本研究基于《中国浅表器官超声检查指南》[2]和美国放射学会BI-RADS第五版[1]中有关乳腺超声的内容,对乳腺结节超声征象进行加权评分,旨在探索可行的乳腺超声评分路径,并为BI-RADS的细化提供统一标准。
1.1 一般资料 选择2012年1月—2016年12月于中日友好医院超声诊断科进行乳腺检查的患者。纳入标准:患者在本院进行手术并获得相关病理结果。排除标准:(1)无法获得病理结果;(2)无法配合乳腺超声检查、超声评分;(3)病理结果示交界性肿瘤。共有185例患者的194个结节纳入本研究,其中男1例,女184例;结节直径0.5~9.3 cm;恶性结节103个,其中浸润性导管癌80个,导管内癌12个,浸润性小叶癌2个,黏液癌2个,低分化癌2个,髓样癌1个,恶性叶状瘤1个,导管内癌并浸润性导管癌1个,导管内乳头状癌并导管原位癌1个,浸润性导管癌并浸润性小叶癌1个;良性结节91个,其中纤维腺瘤47个,腺病20个,叶状瘤8个,导管内乳头状瘤7个,脂肪坏死4个,炎性病变2个,脂肪瘤1个,错构瘤1个,表皮样囊肿1个。
1.2 仪器与方法 应用GE Voluson E8 彩色多普勒超声诊断仪,采用高频探头(11 L),首先对乳腺进行全面扫查,发现病变后对病灶部位进行多切面扫查并留取典型切面图片存储。参照《中国浅表器官超声检查指南》[2]对结节的形态、方位、边缘、回声模式、后方回声特征、周边高回声晕环、微钙化等进行描述并对乳腺结节良恶性进行鉴别诊断。(1)对每个恶性超声征象(形态不规则、非平行方位、边缘不规整、低回声、后方回声衰减、高回声晕环、微钙化)进行特异度研究。根据特异度的范围对超声征象进行评分:≤50%评0分,>50%~60%评1分,>60%~70%评2分,>70%~80%评3分,>80%~90%评4分,>90%~100%评5分;1个结节可以有多个恶性征象,将所有恶性超声征象评分相加得出加权评分总分。边缘不规整包括边缘模糊、边缘成角、边缘微小分叶、边缘毛刺4项,对各个征象分别进行评分,并取最大值作为结节边缘的评分;后方回声衰减要除外粗大钙化灶后方的衰减和侧方声影干扰;低回声表示结节全部或大部分区域回声低于皮下脂肪。(2)以1.5 cm为界,分为小结节(≤1.5 cm,81个)和大结节(>1.5 cm,113个),研究加权评分法对所有结节及大、小结节良恶性的诊断价值。
1.3 统计学方法 应用SPSS 17.0统计学软件进行数据处理。计量资料以(±s)表示,绘制加权评分法诊断乳腺结节良恶性的受试者工作特征曲线(ROC曲线),并计算ROC曲线下面积(AUC)、灵敏度、特异度、阳性预测值、阴性预测值、正确率;良恶性结节加权评分比较采用非参数检验;计数资料比较采用χ2检验。以P<0.05为差异有统计学意义。
表1 加权评分中各征象特异度及评分Table 1 Sepecificity and score of different signs in the diagnosis of benign and malignant breast nodules
2.1 加权评分中各征象特异度及评分 评分较低的征象(非典型征象):低回声0分,形态不规则、边缘模糊、边缘微小分叶1分;评分较高的征象(典型征象):边缘毛刺、后方回声衰减、非平行方位、高回声晕环,均为5分(见表1)。
2.2 良恶性结节加权评分 良性结节加权评分为0~20分,平均(3.0±4.0)分(见图1、2);恶性结节加权评分为0~25分,平均(11.8±6.6)分(见图3、4)。恶性结节加权评分大于良性结节,差异有统计学意义(Z=-9.270,P<0.001)。
2.3 加权评分法诊断乳腺良恶性结节的价值 加权评分法诊断所有结节、小结节、大结节良恶性的AUC分别为0.884、0.785、0.953(见图5~7、表2)。加权评分法诊断大结节良恶性的正确率高于小结节,差异有统计学意义(χ2=12.949,P<0.001)。
据统计,我国每年女性乳腺癌发病16.9万,居女性常见恶性肿瘤第二位;女性乳腺癌死亡人口约为4.5万,乳腺癌是女性第六位常见的恶性肿瘤死亡原因[9]。超声在乳腺结节良恶性鉴别诊断方面发挥着重要作用。BI-RADS在临床中应用越来越多,但是对于4a、4b、4c、5级之间的界限划分没有统一的标准。本研究基于乳腺结节的各个征象,对恶性超声征象进行加权评分,从而探讨其应用价值。
表2 加权评分法对乳腺结节良恶性鉴别诊断价值Table 2 Value of ultrasound weighted score in differential diagnosis of benign and malignant breast nodules
图1 乳腺纤维瘤加权评分0分Figure 1 0 weighted score of breast fibroma
图2 乳腺纤维腺瘤加权评分11分Figure 2 11 weighted score of fibroadenoma of the breast
图3 浸润性乳腺癌加权评分20分Figure 3 20 weighted score of invasive breast cancer
图4 低分化癌加权评分0分Figure 4 0 weighted score of low differentiated cancer
乳腺结节的恶性超声征象很多,包括形态不规则、非平行方位、低回声、微钙化等[1-3],但是,对于每个征象,超声评分多少才是比较客观的呢?显然,某些征象一看到就想到了恶性可能(如边缘毛刺),而某些征象则不然(如低回声)。为了更加客观地对研究指标进行量化评分,本研究引入了特异度这一概念。特异度是指某项诊断实验的真阴性率[10],而误诊率=1-特异度。也就是诊断特异度越高,其误诊率越小。如指标1特异度为50%,误诊率就是50%;指标2特异度是90%,误诊率就是10%,指标1的误诊率是指标2的5倍。本研究结果显示,评分较低的非典型征象有低回声、形态不规则、边缘模糊、边缘微小分叶,评分较高的典型征象有非平行方位、边缘毛刺、高回声晕环、后方回声衰减。上述评分相对公平地体现了各个指标的诊断权重。本研究中超声征象分类与部分研究类似[5,8],亦与部分研究存在差异[6-7]。原因可能为超声检查的人为因素干扰,例如边缘模糊一项,不同医师可能看法不同。现在非常热门的人工智能则有可能减少人为因素的干扰。
图 5 加权评分法对所有结节良恶性鉴别诊断的ROC曲线Figure 5 The ROC curve in the differential diagnosis of all breast nodules by weighted score
图6 加权评分法对大结节良恶性鉴别诊断的ROC曲线Figure 6 ROC curve in differential diagnosis of breast nodules more than 1.5 cm by weighted score
图7 加权评分法对小结节良恶性鉴别诊断的ROC曲线Figure 7 ROC curve in differential diagnosis of breast nodules less than or equal to 1.5 cm by weighted score
本研究结果显示,恶性结节的加权评分明显高于良性结节。对所有结节而言,加权评分法的最佳诊断截点是5.5分,说明加权评分法对乳腺结节良恶性诊断有较高的应用价值。但是,对于某些特征不明显的良恶性结节,良恶性结节评分之间存在部分交叉关系。为了进一步研究加权评分法在大小结节的诊断价值,本研究对于直径≤1.5 cm结节而言,最佳诊断截点是4.5分,诊断灵敏度、特异度、阳性预测值、阴性预测值、正确率分别为80.5%、65.0%、70.2%、76.5%、72.8%;对于直径>1.5 cm结节而言,最佳诊断截点是5.5分,诊断灵敏度、特异度、阳性预测值、阴性预测值、正确率分别为93.5%、90.2%、92.1%、92.0%、92.0%。小结节的诊断正确率低于大结节。原因可能为大结节肿瘤侵袭性较强,恶性超声特征表现比较明显;另外,由于乳腺腺体与甲状腺腺体不同,不是均匀回声的结构[2](终末导管小叶单元等回声或低回声,而腺叶之间的间质为高回声),因此,当结节体积较小时,其恶性特征容易混淆[11],如微钙化过于细小,超声无法分辨;结节与腺体中的相邻终末导管小叶单元相邻,判断结节的边界或是否存在成角就比较困难。因此,加权评分法对大结节有更高的应用价值。
超声加权评分法如何应用于BI-RADS呢?理论上讲,加权评分越高结节恶性可能性越大,当样本量足够大时,可以根据结节恶性率来判断分级,在一定程度上减少了主观因素的干扰。上述划分方法简单实用,由于观察指标相对较少,因此也有利于临床推广。
作者贡献:武敬平参与试验设计、实施、论文撰写;赵玉珍进行实验设计;于蕾、王瑛、郭丹丹、刘健参与资料收集;赵玉珍负责质量控制及审校,对文章整体负责,并进行监督管理。
本文无利益冲突。