彭程宇,刘万花*,叶媛媛,王瑞,高飞,张番栋
1.东南大学附属中大医院放射科,江苏南京 210009;2.深睿医疗人工智能研究院,北京 100080;3.北京大学工学院,北京 100871;4.北京大学前沿交叉学科研究院,北京 100871; *通讯作者 刘万花 liuwanhua.com@126.com
早期发现和确诊乳腺癌可有效降低病死率。乳腺X线摄影是目前乳腺疾病的首选影像学检查方法。影像组学可定量提取影像图像的大量特征信息,并对所获得的特征数据进行挖掘分析[1],有助于鉴别病灶性质、区分病理类型、评估预后等[2-3]。本研究拟探讨影像组学特征分析对不同X线表现类型(肿块、钙化、非对称及结构扭曲)乳腺病灶的良恶性鉴别诊断效能,并评估在常规放射科医师阅片的基础上联合使用影像组学特征分析是否可以提高其鉴别诊断效能。
1.1 研究对象 回顾性分析2013年5月—2018年5月东南大学附属中大医院乳腺影像诊断中心符合以下标准的女性患者,纳入标准:①行数字化X线摄影检查,且为单侧单病灶,每个病灶均具有头尾位及侧斜位两个不同方向的标准投照体位;②X线摄影检查后经穿刺活检或手术获得明确病理结果。排除标准:①行数字化X线摄影检查前接受过其他治疗,包括手术、化疗或放疗、抗HER-2 治疗;②X线图像存在伪影。纳入816例患者,年龄19~85岁,平均(52±12)岁。恶性组481例,年龄26~85岁,平均(54±12)岁;病理类型:浸润性导管癌386例,浸润性小叶癌10例,导管原位癌54例,小叶原位癌3例,乳头状癌11例,其他恶性病灶17例,包括化生癌2例、黏液腺癌10例、髓样癌1例、管状癌1例、原发性乳腺淋巴瘤1例、神经内分泌癌1例、转移癌1例。良性组335例,年龄19~84岁,平均(47±12)岁;病理类型:纤维腺瘤157例,腺病121例,乳头状瘤18例,囊肿20例,炎症13例,良性叶状肿瘤5例,脂肪坏死1例。根据病灶的不同X线表现类型分为肿块型、钙化、非对称及结构扭曲4 组,并对肿块型病灶参照其最大径线分为最大径>2 cm 的大肿块组及最大径≤2 cm 的小肿块组进行亚组分析[4]。本研究获得东南大学附属中大医院临床研究伦理委员会批准( 批准号2018 ZDSYLL101-P01)。
1.2 图片分析 采用GE Senographe 2000D system 及Siemens Mammomat Inspiration 进行X线检查,以DICOM 格式从图像存储与传输系统中导出X线图像。每例患者的双侧乳腺均行头尾位及内外侧斜位的标准位置投照。由3名分别具有3年、12年、25年乳腺影像工作经验的诊断医师按照第5版乳腺影像报告和数据系统(breast imaging report and data system,BIRADS)对所有病灶进行回顾性评定,如有分歧协商达成一致。依据分类方法[5]将BI-RADS 2、3和4a 类病灶归为影像诊断良性病灶,4b、4c和5 类病灶归为影像诊断恶性病灶。以上影像诊断良恶性分类与病理结果进行比较,评估放射科医师的鉴别诊断效能。
1.3 影像组学分析(图1) 每个病灶的标准头尾位及侧斜位图像均纳入分析,由2名具有10年以上诊断经验的放射科医师采用盲法手动绘制每个乳腺病变的感兴趣区。标定钙化型病灶的方法是将有意义的钙化依据分布范围标定在感兴趣区内;对于肿块型病灶及非对称和结构扭曲,标注者需尽可能精确地描绘出病变的边界,即与周围腺体密度差异较大的边缘。手动分割完成后,下一步即自动提取影像组学特征。最后,使用逻辑回归分类器进行后续分类,以区分良、恶性病变。
图1 影像组学特征分析与分类器构建流程。乳腺X线摄片局部放大图的组合框中,左上角、右上角、左下角及右下角所对应的X线表现类型分别为肿块型、结构扭曲、非对称及钙化
根据原始图像和相应的小波图像从每个乳腺病变中提取788个影像组学特征(表1),根据计算方法分为6 类,包括直方图、形态、灰度共生矩阵、灰度游程步长矩阵、灰度区域大小矩阵及灰度依赖矩阵。
表1 乳腺X线图像的影像组学特征
1.4 分类器构建 在输入分类器之前,影像组学特征需要先进行均值为1和方差为0 的标准化预处理,然后对预处理后的特征进行特征选择,本研究使用F检验进行特征选择。然后是分类器训练和测试。使用五折交叉验证方法进行分类,在每个交叉验证迭代中分别进行特征选择,并在同一迭代中将其用于逻辑回归分类器进行分类。在每次迭代中均分为2个数据集:80%作为训练集,20%作为测试集。
1.5 统计学方法 采用SPSS 19.0 软件,符合正态分布的计量资料以±s表示。使用受试者工作特征(ROC)曲线及曲线下面积(AUC)评估影像组学分类器及放射科医师鉴别诊断良、恶性病变的能力,多组间比较采用单因素方法分析,两组间比较采用LSD法。P<0.05 为差异有统计学意义。
2.1 BI-RADS 分类结果及不同X线病灶表现类型恶性及良性病灶BI-RADS 分类及不同X线病灶表现见表2。
2.2 影像组学特征分类器对不同X线表现类型乳腺病灶的鉴别诊断效能 基于影像组学特征的分类器对肿块、钙化、非对称及结构扭曲良恶性的鉴别诊断效能AUC 依次为0.82±0.02、0.75±0.07、0.61±0.05、0.58±0.10(P<0.05),其中肿块型病变AUC值最高,结构扭曲AUC值最低(表3,图2)。对肿块型病变,直径>2 cm 的大肿块较直径≤2 cm 的小肿块具有更好的鉴别诊断效能(P<0.05,表3)。
影像组学特征中最具显著性的10个特征包括小波图像的短游程高灰度强调、小波图像相关性信息、原始图像的短游程低灰度强调、小波图像的小区域强调、原始图像的小区域强调、小波图像的短游程强调、原始图像的最大2D 列直径、小波图像的依赖方差、小波图像的区域熵、小波图像的一阶熵。
表2 BI-RADS 分类及不同X线表现类型比较[例(%)]
2.3 影像组学特征分类器与放射科医师阅片联合应用的诊断效能 对于肿块型病灶、钙化及非对称,联合使用影像组学特征与放射科医师阅片,未能在常规医师阅片的基础上提升鉴别诊断效能(P<0.05);但对于结构扭曲,当两者联合后诊断效能较放射科医师的鉴别诊断效能有所提高,AUC值由0.78±0.08 上升至0.82±0.08(P<0.05,表3)。
表3 影像组学特征分类模型、放射科医师诊断及两者联合对不同X线表现类型乳腺病灶鉴别诊断的AUC 比较
图2 影像组学特征分类器对不同X线表现类型乳腺病灶鉴别诊断的ROC 曲线
3.1 乳腺病灶X线表现类型的多样性 目前基于X线影像组学[6]研究乳腺病灶良恶性鉴别诊断[7]的报道较少,研究主要针对单纯肿块型或单纯钙化灶[7],而在较大样本量的基础上,对多种X线表现类型(肿块、钙化、非对称及结构扭曲)的探讨和比较研究不多,更加贴合临床实际价值的X线多种表现亚型的研究应更具科学性和实用价值。
3.2 影像组学特征对肿块型病灶的良恶性诊断价值Li 等[5]基于302例肿块型病灶的研究显示,放射科医师、影像组学分析方法以及两者结合鉴别诊断良、恶性病灶的AUC值分别为0.87、0.86和0.96;而本研究中的AUC值分别为0.94、0.82和0.94,单独基于影像组学分析方法的AUC值略低于上述研究,而单独基于放射科医师阅片的鉴别诊断效能远高于上述研究,其原因可能是本研究中BI-RADS 分类采用三级评估制度,且各级诊断医师均专职乳腺影像诊断,造成放射科医师的诊断效能远高于上述研究结果,单纯使用影像组学分析方法对于鉴别诊断乳腺良、恶性病灶具有一定的价值。
本研究进一步根据肿块大小进行亚组分析,结果显示影像组学方法对于直径>2 cm 的大肿块的鉴别效能明显高于直径≤2 cm 的小肿块,AUC值分别为0.85及0.72,与彭文静等[8]针对小结节研究所得AUC值0.74 的结果相符合。直径<2 cm 的肿块在图片上会被周围腺体组织遮盖,从而造成形态特点显示不明确,干扰诊断医师,同时也会导致图像分割后组学特征提取达不到显著性。
3.3 影像组学特征对非肿块型病灶的良恶性诊断价值 本研究对钙化、非对称和结构扭曲3 类非肿块型病灶分别进行亚型研究,尤其关于非对称及结构扭曲的研究目前鲜有报道,结果显示对钙化型病灶,基于影像组学特征分类模型鉴别诊断效能达到中等水平AUC=0.75,低于Chen 等[9]报道的0.834,其原因可能是由于感兴趣区分割方法的差异,该研究的分割方法需将图像显著放大,要求勾画出每个微钙化点的准确边界,较为精准但耗时过长,而本研究仅勾画出钙化分布范围,操作简单、耗时短,具有普适性。
对于非对称和结构扭曲,影像组学特征分类模型AUC 为0.61和0.58,显示诊断价值有限。但对于结构扭曲,在医师阅片诊断的基础上联合运用影像组学分析方法可以在一定程度上提高其鉴别诊断效能。值得注意的是,由于结构扭曲型病灶例数较少,这一结果是否可靠稳定尚需要大样本研究加以验证。
3.4 本研究的局限性 本研究为单中心研究且部分亚组分析的样本量较小,只能选用五折交叉验证方法,需今后进一步扩大样本量及开展多中心研究;此外,手动分割方法的稳定性已得到证实[10],但分割的准确性会受观察者间差异的影响,未来可以尝试使用自动分割方法节省分割时间并消除观察者间的差异。