乳腺X线摄影影像组学特征预测三阴性乳腺癌

2021-06-28 08:40谭红娜孙慧芳耿亚媛高剑波
中国医学影像技术 2021年6期
关键词:组学乳腺乳腺癌

王 博,谭红娜,周 燕,孙慧芳,耿亚媛,高剑波*

(1.郑州大学第一附属医院放射科,河南 郑州 450052;2.河南省人民医院医学影像科,河南 郑州 450003;3.北京慧影医疗科技公司,北京 100080)

三阴性乳腺癌(triple negative breast cancer, TNBC)指雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone receptor, PR)及人表皮生长因子受体2(human epidermal growth factor receptor 2, HER-2)表达均呈阴性的乳腺癌,具有明显肿瘤异质性,是恶性程度最高、侵袭性最强、预后最差的乳腺癌分子亚型[1-2]。乳腺X线摄影可用于筛查和诊断乳腺癌,但其鉴别TNBC的价值有限[3-4],目前常通过对手术切除标本行免疫组织化学检查以评估ER、PR及HER-2来诊断TNBC。影像组学是采用自动化、高通量特征提取方法将影像转化为可挖掘的特征数据,从而全面、定量评估肿瘤异质性的无创方法[5]。本研究评估乳腺X线摄影影像组学特征预测TNBC的价值。

1 资料与方法

1.1 一般资料 回顾性分析2017年1月—2019年6月177例乳腺癌患者(177个病灶),均为女性,年龄26~84岁,中位年龄为49岁,其中77例TNBC和100例非TNBC。纳入标准:①首次经手术病理证实组织细胞分型为非特殊类型的浸润性乳腺癌,免疫组织化学检查ER、PR、HER2及Ki-67表达结果完整,并根据结果分为TNBC和非TNBC[6];②术前接受乳腺X线摄影。排除标准:检查前接受组织穿刺活检或新辅助化学治疗。按照7∶3比例将患者随机分为训练集(n=123)和验证集(n=54)。训练集含54例TNBC和69例非TNBC,验证集含23例TNBC和31例非TNBC。

1.2 仪器与方法 采用Hologic Selenia数字乳腺机行乳腺X线摄影,选择自动滤过曝光模式,采集双侧乳腺内外侧斜位(mediolateral oblique, MLO)和头足位(cranial caudal, CC)片。

1.3 影像组学特征提取、筛选及分析 由2名具有5年以上乳腺X线诊断经验的主治医师在放射组学云平台(V3.1)[慧影医疗科技有限公司(北京)]上于CC位和MLO位图像上分别手动勾画肿瘤感兴趣区(region of interest, ROI)(图1),平台自动计算并输出其影像组学特征参数。

图1 于乳腺CC位和MLO位图像上分别手动勾画肿瘤ROI(红色区域)示意图 A.CC位; B.MLO位

为降低特征冗余度,采用Select-K-Best、最小绝对值收敛和选择算子(least absolute shrinkage and selection operator, Lasso)方法筛选与TNBC相关性最强的影像组学特征,以Select-K-Best方法计算影像组学特征与最终组学标签间的相关性,保留最佳影像组学特征,有效降低Lasso的代价函数,Lasso函数中所用代价函数为:

其中,X表示影像组学特征矩阵,y代表样本标签列,n代表样本量,w是回归模型的系数矩阵,α‖w‖1表示Lasso惩罚,α是常数因子,‖w‖1是系数矩阵的1范式。对数据行标准化处理,并采用5折交叉验证,经2 000次迭代后,根据最小均方误差得到最优α值,依据最优α值筛选与TNBC相关性最强的影像组学特征集,分别计算其Lasso系数。

针对获得的影像组学特征集,以支持向量机(support vector machine, SVM)建立预测TNBC模型。

1.4 统计学分析 采用SPSS 22.0统计分析软件。计量资料符合正态分布时以±s表示,否则以中位数(上下四分位数)表示。采用独立样本t检验或Mann-WhitneyU检验比较训练集与验证集患者年龄、病灶最大径及Ki-67增殖指数的差异;以χ2检验比较训练集与验证集病灶病理学分级、ER、PR及HER-2表达的差异。以受试者工作特征(receiver operating characteristic, ROC)曲线分析影像组学特征及预测模型预测TNBC的效能。P<0.05为差异有统计学意义。

2 结果

2.1 临床病理特征 训练集和验证集患者年龄、病灶最大径、病理学scarff-bloom-richardson(SBR)分级、ER表达、PR表达、HER-2表达、Ki-67增殖指数及腋窝淋巴结转移差异均无统计学意义(P均>0.05),见表1。

表1 训练集与验证集临床病理特征比较

2.2 影像组学特征 自CC位和MLO位图像各获得1 033个2D高维影像组学特征,包括18个一阶统计量特征、10个形状特征、75个纹理特征(24个灰度级共生矩阵特征,16个灰度区域矩阵特征,16个灰度游程矩阵特征,5个领域灰度差异矩阵特征,14个灰度级依赖矩阵特征)及滤波变换生成的930个影像组学参数特征。训练集中,经Select-K-Best方法和Lasso回归分析,分别于CC位图像(图2)、MLO位图像和CC+MLO位图像中各筛选出7个与TNBC相关性最强的影像组学特征,并分别建立预测模型。

图2 采用Lasso算法筛选影像组学特征 A.Lasso path图示最佳α值为0.039,-log(α)=1.41; B.采用5折交叉验证获得均方误差; C.根据最优α值获得CC位图像中与TNBC相关性最强的影像组学特征及其Lasso系数

2.3 乳腺X线影像组学特征及预测模型预测TNBC的效能 ROC曲线显示,在训练集和验证集中,CC位预测模型预测TNBC的准确率高于MLO位及CC+MLO位预测模型,见表2及图3。基于CC位图像筛选的7个与TNBC分类预测相关性最强的影像组学特征中,灰度级依赖矩阵中的Maximum Probability、经过滤波变换的Gray Level NonUniformity及Large Dependence Low Gray Level Emphasis预测TNBC的AUC为0.587、0.599及0.615(P均<0.05),见表3。

图3 训练集(A)和验证集(B)中CC位、MLO位和CC+MLO位预测模型预测TNBC的ROC曲线

表2 各预测模型预测TNBC的ROC曲线结果

表3 CC位图像影像组学特征预测TNBC的效能

3 讨论

乳腺癌是女性最常见的恶性肿瘤之一,且发病率逐年增加[7]。不同分子亚型乳腺癌呈现不同的生物学行为,预后差异较大。2013年St.Gallen国际乳腺癌会议发布了参照乳腺癌生物学标记物及基因表达谱定义的乳腺癌分子分型标准[6],包括Luminal A型、Luminal B型、HER-2阳性型和TNBC,现已广泛用于临床指导选择治疗方案及评估疗效。其中TNBC恶性程度最高、预后最差[1-2],且缺乏靶向治疗药物,使得早期诊断成为改善患者预后的重要手段。

目前需要通过手术或活检获取组织学标本,经免疫组织化学检查诊断TNBC,具有创伤性。影像学检查常用于术前评价肿瘤异质性,但相关乳腺癌分子分型研究[4,8-10]仅根据X线摄影、MRI等影像学征象预测TNBC,在一定程度上评估肿瘤表型的异质性,无法进行定量分析,且均为单中心回顾性研究,样本量相对较小。影像组学可全面、定量、无创评估肿瘤异质性,可为临床制定治疗决策提供帮助[11]。乳腺X线摄影对于乳腺疾病的诊断、临床分期及预后评估等具有高度实用价值,其中TNBC多表现为不伴钙化的肿块或结构扭曲[4,10],难以与其他亚型乳腺癌相鉴别。本研究提取乳腺癌X线摄影影像组学特征,评估其用于预测TNBC与非TNBC的价值。

既往研究[12-13]结果显示,基于乳腺X线摄影影像组学特征预测TNBC的效能不高。马文娟等[12]报道, CC+MLO双视角图像影像组学模型的预测价值高于单独CC及MLO位图像影像组学模型;其所筛选的影像组学特征均为纹理特征,未经验证集验证,且其中TNBC(n=34)与非TNBC样本量(n=102)相差较大。本研究于乳腺CC位、MLO位和CC+MLO位图像各筛选出7个与TNBC关系最密切的影像组学特征,构建预测TNBC模型,发现CC位预测模型在验证集中的AUC值、准确率最高,分别为0.82、81.48%,且其在训练集及验证集中的AUC值及准确率基本一致,表明该模型相对稳定。本研究进一步分析基于CC位图像选出的7个与TNBC分类预测相关性最强的影像组学特征,其中灰度级依赖矩阵中的Maximum Probability及滤波变换的Gray Level NonUniformity和Large Dependence Low Gray Level Emphasis分类预测TNBC的AUC为0.587、0.599及0.615,有助于鉴别诊断TNBC与非TNBC。本组CC位模型预测TNBC的AUC稍高于ZHANG等[13]的结果,但仍不甚理想,可能与选择的预测模型较单一以及数据处理过程中过拟合有关,有待加大样本量开展多中心研究加以验证。

本研究的局限性:①手动勾画病灶ROI,难以避免阅片者主观因素的影响;②TNBC发生率较低,本研究随机选取100例非TNBC与77例TNBC匹配,并以7∶3比例随机分为训练集和验证集,配比效果是否最佳有待证实;③纳入病例均为非特殊类型浸润性乳腺癌,病种相对单一。

总之,乳腺X线影像、尤其乳腺CC位图像影像组学特征对术前预测TNBC有一定临床应用价值。

猜你喜欢
组学乳腺乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
乳腺结节状病变的MRI诊断
乳腺癌是吃出来的吗
口腔代谢组学研究
胸大更容易得乳腺癌吗
体检查出乳腺增生或结节,该怎么办
别逗了,乳腺癌可不分男女老少!
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
得了乳腺增生,要怎么办?
代谢组学在多囊卵巢综合征中的应用