基于磁共振图像的乳腺癌分子分型研究进展

2021-11-12 02:02聂生东
中国生物医学工程学报 2021年4期
关键词:亚型分型乳腺

孙 榕 聂生东# 魏 珑

1(上海理工大学医疗器械与食品学院医学影像技术研究所,上海 200093)2(山东建筑大学计算机科学与技术学院,济南 250101)

引言

近年来,在人口结构老龄化、生育率不断降低及各类风险因素的共同影响下,乳腺相关疾病的发病率正逐年增加。据我国癌症中心2019年最新报告显示[1],全国女性中每年新增的乳腺癌病例达30.4万,已成为严重威胁我国女性生理健康的恶性肿瘤之一。因此,实现乳腺癌筛查早期化、诊疗高效个体化以及预后精准化的目标刻不容缓。

乳腺癌是一种异质性极为显著的恶性肿瘤,在组织结构形态、病理特征及治疗疗效等方面个体差异明显[2]。随着科技的不断创新以及医疗机构对疾病遗传因子认知的不断深入,乳腺癌评估分类实现了由传统的临床病理 (tumor node metastasis,TNM) 分期到肿瘤内分子分型的巨大突破,这主要得益于高通量芯片技术的支持。21世纪初,Perou等[3]利用基因互补DNA微阵列测序 (microarray) 检测到在基因表达谱上乳腺癌特征之间存在差异后,首次提出了4种乳腺癌分子亚型,包括管腔上皮 (luminal) 型、人类表皮生长因子受体 (human epidermal growth factor receptor 2,HER 2) 过表达型、基底细胞样 (basal-like) 型和正常乳腺样 (normal-like) 型。Sorlie等[4]在对534种固有基因表达数据的层次聚类分析基础上,进一步指出了乳腺癌易感基因 (breast cancer susceptibility protein,BRCA1) 突变与基底细胞样型乳腺癌显著相关,BRCA1是一种家族性乳腺癌抑癌基因,在一定程度上影响该类患者的预后。此外,该研究还通过测定雌激素受体α (estrogen receptor alpha,ESR1) 基因表达情况,将管腔上皮luminal型乳腺癌更细致地划分为luminal A型和luminal B型,以期为乳腺癌的精确分类提供更为重要的科学依据。目前,虽然分子亚型的分类类别日趋多样化,但是已达成共识的标准依旧是在2013年St.Gallen国际乳腺癌会议上所确立的乳腺癌分类标准[5],即将乳腺癌分子亚型定义为:luminal A型、luminal B型、HER 2过表达型、基底样型/三阴性型 (triple negative breast cancer,TNBC) 以及其他特殊类型。

为提高基因芯片分析结果的临床实用性同时降低检测成本,免疫组织化学标记技术通过对标记物染色[6],检测雌激素受体 (estrogen receptor,ER)、孕激素受体 (progesterone receptor,PR)、人表皮生长因子受体2和增殖细胞核抗原 (Ki-67)[7]的表达状态,进而实现乳腺癌分子亚型的精准分类评估,这已成为病理科常用的分子生物学技术之一。各分子分型不同免疫组化特征表现如下:luminal A型为ER+和/或PR+,HER 2-,Ki-67<14%;luminal B型分为两种,luminal B HER 2 阴性为ER+和/或PR+,HER 2-,Ki-67≥14%,而luminal B HER 2 阳性为ER+和/或PR+,HER 2+;HER 2过表达型为ER-,PR-,HER 2+;TNBC型为ER-,PR-,HER 2-。目前,众多统计学研究表明,在基因水平上的不同分子亚型与乳腺癌的肿瘤直径、组织学分级、淋巴结转移情况等临床病理特征及预后分期存在较大的差异[8-13]。因此,深入研究并预测乳腺癌分子亚型对提高个性化治疗方案的准确性具有重要的临床应用价值。

文中以乳腺癌分子分型为研究对象,归纳各亚型在磁共振成像 (magnetic resonance imaging,MRI) 下的影像表现,并对近年来国内外研究现状做全面综述,同时依据方法的主要技术路线将基于MRI的乳腺癌分子分型的研究分为两类:一是利用统计学回归模型,分析医学影像中病灶形态学特征、表观扩散系数以及时间信号强度曲线类型等血流动力学参数与各亚型的关系[5, 14-15];二是通过机器学习,研究影像组学特征与乳腺癌分子分型的内在关联,以构建合理的乳腺癌分子分型预测模型[16-18];最后总结并展望乳腺癌影像基因组学的未来发展方向。

1 乳腺MRI诊断技术

现代医学影像学的蓬勃发展为乳腺癌的早期筛查与诊疗创造了有力条件。除了基础的乳腺钼靶X线摄影 (mammography,MM) 和超声 (ultrasonography,US) 成像外,常用的乳腺相关疾病的影像学检查还包括:反映腺体组织结构定位信息的计算机断层 (computed tomography,CT) 成像、磁共振成像,以及凸显功能性信息的正电子发射断层 (positron emission tomography,PET) 成像等诊断技术。虽然已有研究表明乳腺钼靶X线摄影和超声成像中定量特征信息与乳腺相关疾病的生物学行为相关联[19-21],但是这两种常见的乳腺癌早期筛查方式存在一定的局限性。比如,乳腺钼靶难以凸显高密度腺体组织的特征,超声成像无法准确检测出微小钙化灶等。而MRI技术,不仅能够保持乳腺软组织的高分辨率,还能对转移性癌细胞有更明确的显示,同时避免了骨伪影干扰。与传统的乳腺钼靶X线成像诊断技术相比,MRI具有无电离辐射损伤、多方位成像等独特优势,已成为乳腺癌患者术前计划制定、乳房三维重建、新辅助治疗疗效评估等临床实践中高敏感性的成像方式之一。其中,基于组织微循环功能的动态增强磁共振 (dynamic contrast enhanced MRI,DCE-MRI) 成像检查,通过测定时间信号强度曲线 (time-signal intensity curve,TIC) 类型、容量转运常数 (volume transfer constant,Ktrans) 及速率常数 (reflux constant,Kep) 等各参数,从血流动力学角度,反映感兴趣区域内组织血管的通透性及血流灌注等功能性信息,为乳腺肿瘤病灶分割、肿块检测、良恶性鉴别诊断及基因分型等方向提供了新的影像学研究依据。DCE-MRI成像的原理是:因为乳腺癌瘤灶内组织的微循环状态或较肿瘤形态大小更早发生改变,故经静脉注入对比造影剂后,通过动态分析各时相的组织信号强度变化,同时合理选择药代动力学模型,引入动脉输入函数 (arterial input function,AIF),计算一系列的定量参数,揭示病变微循环结构的改变。与常规的磁共振增强扫描相比,DCE-MRI不仅能够清晰地反映肿瘤形态学结构等特征,更能客观地评估乳腺病灶及正常腺体间的功能代谢差异。另外,基于磁共振弥散加权成像 (diffusion weighted imaging,DWI) 可通过定量表观扩散系数 (apparent diffusion coefficient,ADC), 衡量人体体素内水分子扩散运动状态的微观变化。一般而言,相对于正常腺体组织,乳腺肿瘤细胞的高密度特征,使得自由水分子的扩散力受到显著性约束,ADC值降低,DWI呈明显增强,从而间接地反映肿瘤的侵袭能力[14]。目前,联合DCE-MRI与DWI影像序列,从多模态磁共振成像的角度分析乳腺癌的分子分型已成为该领域的一大研究热点。

2 基于统计学分析的分子分型关联性研究

2012年,基于MRI的乳腺影像基因组学研究初步开展[22]。从分子生物学角度而言,MRI技术为乳腺癌不同分子机制的探究及解析提供了更具直观性的影像支持,同时也将各分型预测方法提升到了一个新高度,而且MRI技术能够有效地抑制有创性穿刺活检所带来的并发症风险。基于MRI的乳腺癌分子分型的早期研究主要集中于探寻各亚型与影像学表现间的关联,如肿瘤形态边缘、强化方式,腋窝淋巴结受侵率及血流动力学参数等。

毛刺征与强化方式属于DCE-MRI重要的形态学特征,其中,毛刺征用于提示患者肿瘤细胞朝向瘤周组织的浸润程度。Vilar等[15]在回顾性分析201名浸润性乳腺癌患者的MRI检查结果后发现,瘤巢边缘模糊,呈毛刺(星芒状或放射状)样特征与luminal型乳腺癌相关,与刘静等[23]的报道一致。然而,这种增生的乳腺纤维结缔组织却鲜见于三阴性型乳腺癌中,三阴性型乳腺癌内多见边缘平滑,形状不规则的单发肿块样病变。有研究推测,毛刺征是反映肿瘤的侵袭能力的重要表现之一[24],但尚未达成领域内共识。而强化方式则是反映肿块内部成分病理改变与否的特征性表现。Jeh等[16]经统计学研究表明,肿瘤边缘强化常见于三阴性分子亚型乳腺癌,可能是因为三阴性型乳腺癌肿瘤的实性部分增殖过快,血运富集,微血管密度增大,致使病灶区域中央多出现液化坏死信号。而非TNBC型大多以不均匀强化为主,这两组强化方式间的差异具有统计学意义。此外,趋化因子及其相应受体也是影响新生血管增殖的重要因素之一[18]。

作为影响乳腺癌预后的关键指征,众多研究者认为腋窝淋巴结转移 (axillary lymph nodes,ALN) 与肿瘤分子亚型存在特殊的关联[17, 25-28]。Chas等[25]对所纳入的1 444名诊断为浸润性乳腺癌患者的数据综合分析后发现,不同分子亚型均存在ALN转移的特定预测信息,且在luminal B乳腺癌中癌细胞的腋窝淋巴结更易遭受转移的风险(转移率达42.6%),与Babyshkina[26]和Gangi[27]的观点相符。该两位学者还指出三阴性型乳腺癌淋巴结转移率较低,但是文献[28]却提出淋巴结转移倾向更侧重于HER 2亚型,少见于luminal A型乳腺癌的观点。这些不同观点的存在可能与各实验的样本分布不均,行前哨淋巴结检验时的误差有关。

除此之外,联合DCE-MRI与DWI影像序列,通过测定不同参数亦能间接地反映出乳腺癌病灶的微循环结构改变,这对于鉴别乳腺癌的分子病理分型有重要的提示作用。相关研究表明,luminal A型、luminal B型和HER 2过表达型乳腺癌的时间信号强度曲线多呈Ⅱ期平台型变化,三阴性型乳腺癌更易表现为Ⅲ期廓清型[29]。在表观扩散系数方面,三阴性型乳腺癌的表观扩散系数测量值相对低于另外3种亚型[30],这与三阴性型乳腺癌的癌细胞密度大,肿瘤中央易坏死特征相吻合。但三阴性型乳腺癌患者Ktrans和Kep定量参数则相对较高,与瘤内血管内皮生长因子异常增加有关[31]。除此之外,各分子亚型与早期强化率、达峰时间等半定量参数也具有一定的相关性,但无显著性差异[32-33]。

综上所述,不同乳腺癌分子亚型的MRI表征存在一定的区别。Luminal型肿瘤边缘更易表现出毛刺样特征及不均匀性强化,而在TNBC型肿瘤中,边缘光滑环形强化的单发肿块病变较为常见。此外,luminal型和HER 2过表达型乳腺癌的腋窝淋巴结转移率均高于TNBC亚型,其中,luminal B型的ALN转移风险最高。在研究MRI参数方面,呈Ⅱ期平台型变化的TIC曲线与非TNBC型乳腺癌之间具有显著相关性,且这3种亚型ADC值较高。因此,时间信号强度曲线类型及表观扩散系数测量值可作为区分TNBC型与非TNBC型乳腺癌的影像学参考标志。

通过统计学回归模型,对MRI中病灶形态学特征以及血流动力学参数进行分析,不仅能够初步预测乳腺癌的分子亚型,还能提升影像诊断的灵敏度。然而,这些回顾性研究均存在样本量较小,各分子亚型病例选择失衡的缺陷,仅仅凭借浅层次的可视化特征终究无法准确评估乳腺癌病灶的异质性。

3 基于机器学习的分子分型预测性研究

近年来,机器学习的快速发展为进一步探索出乳腺癌分子分型的影像标记物提供了新的工具。研究人员主要利用计算机自动或半自动提取乳腺癌肿瘤的各阶特征,并输入分类器进行训练与学习,继而使得分类器能够自主找出与乳腺癌各分子亚型最相关特征,以进行分型的预测。

3.1 基于传统的机器学习方法

传统的机器学习方法将特征工程作为研究手段,选取及优化数据中的隐藏信息,并通过所构建的机器分类模型来整合相应规律,实现新情境下任务的判定。2014年,Mazurowski等[34]初次通过机器学习实现了乳腺癌分子分型与MRI影像学特征的关联性分析。实验中,通过模糊C均值聚类 (fuzzy C-means clustering,FCM) 自动将乳腺癌感兴趣区域 (regions of interest,ROI) 与背景实质分割,并构建多元逻辑回归模型,进而探究成像特征与各个特定亚型之间的关系。结果发现,乳腺病灶区域的MRI动态增强与背景实质MRI动态增强同luminal B分子亚型之间存在显著相关性 (P=0.001 5),但未发现与其他亚型相关的影像学特征 (P> 0.25)。次年,该研究团队在上述研究方法的基础上继续扩大样本量,进一步指出肿瘤纤维腺组织增强率和增强峰值是预测luminal A和luminal B的重要影像学特征 (P< 0.1)[35]。Fan等[36]从60例乳腺癌患者诊疗前MRI及病理分析报告中选出24个特征作为最优特征子集,并借助多元逻辑回归分类器模型加以训练,该模型在总体预测及各个亚型的预测任务上都表现出明显的优越性。除上述多元逻辑回归分类器外,有研究者还利用支持向量机 (support vector machine,SVM) 等其他分类器对特定亚型进行预测,如在鉴别三阴性型乳腺癌的任务中,Wang等[37]首次将标准的临床特征和肿瘤周边定量背景实质强化 (background parenchymal enhancement,BPE) 特征同时考虑在内,对84例浸润性乳腺癌患者共88处病灶行DCE-MRI扫描,提取包括形态、密度、纹理等共计85个影像学特征,利用序列浮动前向选择搜索算法降维后,选取SVM 及k均值聚类 (k-means clustering,KM) 分类器分别进行乳腺癌亚型的监督学习和BPE特征的无监督学习。实验中用于定量分析的特征类型如表1所示。结果显示,所建立的机器学习分类模型对TNBC的鉴别具有良好的应用价值,对比增加BPE前后的实验,AUC由0.782升至0.878 (P< 0.01),分类准确率也由86.9%增至90%。类似地,Agner[38]在借助线性判别分析 (linear discriminant analysis,LDA) 提取出优化特征后,采用SVM实现了TNBC型乳腺癌的预测。其中,动态纹理特征在TNBC亚型乳腺癌及疑似恶性的纤维瘤间存在显著差异性,因此可作为区分上述两种乳腺肿瘤的影像学标记 (AUC=0.97)。

表1 文献[37]中动态增强磁共振影像特征Tab.1 DCE-MRI image features in reference [37]

与采用较为单一的分类算法不同,Li等[39]提出基于多模型的递归特征消除策略 (multimodel-based recursive feature elimination,mmRFE),即同时考虑优化特征在逻辑回归 (logistic regression,LR),SVM,随机森林 (random forest,RF) 以及梯度提升迭代决策树 (gradient boosting decision tree,GBDT) 等4种不同分类器下的性能,进一步改善分子分型预测方法的分类效果。结果表明,基于69种优化特征,GBDT在乳腺癌分子分型任务中各项评价指标皆优于其他3类模型,且在各类样本分布不均的情况下,GBDT能够更加准确地判断出每一类分子亚型,分类评估指标F1-score可达0.87。由上述算法可以看出,借助计算机提取定量预测特征有望为乳腺癌分子分型高通量预测提供重要的影像学支持。

3.2 基于深度学习方法

作为机器学习的分支之一,深度学习已广泛运用于疾病检测、病灶分割建模、良恶性鉴别等医学影像处理领域[40-44]。这种高度并行化的算法,通过相应维度滤波器自动学习影像特征,可以高效地完成分类预测的任务,也打破了传统机器学习探索性分析等一系列复杂操作流程的格局。

3.2.1基于卷积神经网络的分子分型预测模型

目前,基于人类视觉感知系统的卷积神经网络 (convolutional neural network,CNN) 已被广泛应用于特征学习和图像处理分析等领域,其基本思想是当一幅原始图像输入网络时,网络的底层卷积核对像素级信息直接进行卷积运算,所获取的特征图作为下一层输入依次进行特征提取,同时池化层的降维处理用于减少数据处理量,加快训练网络的运行速度。经多次重复,全连接层抽样细化,最终生成利于网络分类识别的特征以送入分类器得到最终预测结果。

Zhu等[45]率先利用3种基本的深度学习卷积神经网络框架实现luminal A型乳腺癌的自动鉴别,这3种神经网络分别为:GoogLeNet、VGG19和CIFAR。同时还比较了在不同训练方式下网络预测的性能,即:权重随机初始化的从头学习法、微调预训练权重的迁移学习法和已知深度特征法,其中,深度已知是指将网络模型作为特征提取器,提取图像深层特征送入具有多项式核函数的支持向量机等传统分类器中进行训练及验证。结果表明,相对于前两种网络训练方式,基于GoogLeNet的已知深度特征法表现出了最佳的分子亚型预测性能,AUC值达0.65,模型具体结构如图1所示。然而,该研究仅仅局限于乳腺癌luminal A型的判别,并未考虑其他的分子分型。为此,Richard等[46]在回顾性分析了216例乳腺癌患者诊疗前MRI及免疫组化信息后,设计一种基于残差块 (residual block) 的14层卷积神经网络用于预测乳腺癌4种分子亚型,结

图1 基于GoogLeNet的已知深度特征法结构[45]。(a)网络模型;(b)基层结构;(c)Inception结构Fig.1 The structure of off-the-shelf deep features based on GoogLeNet[45]. (a) Schematic diagram of network structure; (b) Schematic diagram of stem layer structure; (c) Schematic diagram of inception structure

构如图2所示。按照8∶2的比例划分训练集与验证集后,通过最小化类敏感代价函数对网路参数不断的更新与优化,最终总分类准确率为70%,且模型对luminal A和luminal B亚型的鉴别能力最强。上述两种方案皆表明,基于卷积神经网络的深度学习算法在乳腺癌分子分型任务中的良好应用前景,但在临床应用之前,仍需进行多中心大样本的深入探究。为此,Zhang等[47]首次借助两个独立数据集分别进行预训练模型微调和验证。该方法创新性地将磁共振动态增强前后时间序列影像结合,共同构成了32×32×5的图像块作为输入,然后通过自设计的7层卷积神经网络进行参数预训练,结构如图3所示。采用外部测试集1微调后,用外部测试集2进行最终的测试,在3种分子亚型分类任务中平均准确率可达78%,来自多中心的样本预测结果证实了该方法具有一定的普适性。

图2 基于残差块的卷积神经网络结构[46]。(a)网络模型;(b)残差块结构Fig.2 The convolutional neural network structure based on residual blocks[46]. (a) Schematic diagram of network structure; (b) Schematic diagram of residual blocks structure

图3 卷积神经网络结构[47]Fig.3 The convolutional neural network structure[47]

上述研究表明,与传统机器学习算法相比,深度学习方法降低了对人为选取关键特征的依赖性,通过调整各隐藏层的连接方式和激活函数自动从大规模影像数据中直接获取高阶特征,这种高度并行化计算方式大幅度提升了对乳腺癌各分子亚型的精确鉴别的能力。

3.2.2基于循环神经网络的分子分型预测模型

与传统的卷积神经网络不同的是,在循环神经网络 (recurrent neural networks,RNN) 中各隐藏层的输出可以在下个时刻再次被利用,也就是说,这种包含特殊反馈神经元的网络结构不仅关注当前时序输入,同时也对之前传递的信息有一定捕捉能力,但无法避免时间轴上出现“梯度消失”或“梯度爆炸”问题。为此,各种改进型网络相继提出[48-50],其中,作为循环神经网络的一种特殊变体,长短时记忆网络 (long short-term memory,LSTM) 通过在各隐藏层中引入3种门控单元,即输入门、遗忘门和输出门,自适应地取舍时序特征和空间特征。在解决RNN梯度消失和梯度弥散问题的同时,也能很好地提取输入序列间复杂的远程依赖信息。进而,Shi等[51]又提出将卷积运算与LSTM结合,构成卷积长短时记忆网络 (convolutional long short-term memory,CLSTM),除了对时间序列建模外,也增加了网络对特征学习的能力。

Zhang等[47]在考虑到动态增强磁共振影像时序性的基础上,收集244例乳腺癌DCE-MRI增强前后共5个时间序列的影像数据,利用含有7个隐藏层的CLSTM搭建分子分型预测模型,网络结构如图4所示。实验结果显示,经过迁移学习和独立数据集微调后,三分类平均准确率可达74%,说明CLSTM在处理DCE-MRI等长时间序列影像上有较高的精度,但预测效果仍有待提升。

图4 CLSTM网络结构[47]。(a)网络模型;(b)CLSTM单元结构Fig.4 Schematic diagram of CLSTM structure[47]. (a) Schematic diagram of network structure; (b) Schematic diagram of CLSTM cell structure

虽然将循环神经网络运用于鉴别乳腺癌分子分型的研究尚在起步阶段,但于传统卷积神经网络而言,该模型在分析时序性较强的动态磁共振信息方面更为适用,也更符合人脑记忆规律。

上述研究表明,相对于仅通过统计学分析研究影像学特征与乳腺癌分子分型关联性来说,基于机器学习的分类算法借助计算机深入挖掘影像学数据中的隐藏特征,实现了与分子分型相关信息的自主学习,减少了人为主观影响,泛化能力更强。该种分类方法也为乳腺MRI影像的精确性分析,建立合理的辅助预测模型,从而实现高准确率和高时效性诊疗提供了新的思路。表2将代表性的机器学习方法汇总归纳,以便进一步比较各方法的特性。

表2 基于机器学习的预测算法对比Tab.2 Comparison of algorithms based on machine learning

4 总结与展望

通过总结近年来国内外MRI图像的乳腺癌分子分型研究发现,从最初利用统计学回归模型探寻基因型与影像学特征间的关联,到如今建立基于人类视觉感知系统的深度神经网络以实现乳腺癌分子分型的初步预测,这一突破预示着影像组学在乳腺相关疾病中的应用迈上了新台阶。但该领域距离辅助临床诊断,精确化个体化治疗目标的达成还有着一定的差距,具体的局限性可归纳为3个方面:一是,各分型的非均衡性占比问题普遍存在,尤其是TNBC亚型和HER 2过表达型数据量不足,这极大地限制了分子分型预测算法的泛化能力。二是,在当前大部分研究中,luminal B HER 2 阴性与luminal B HER 2 阳性被统一归类为luminal B型,然而这两种分子亚型的乳腺癌在治疗方式等方面有明显差异。因此,有必要设计出更为精准的乳腺癌分子分型预测模型。三是,目前基于乳腺钼靶X线摄影或常规MRI序列的乳腺癌分子分型的研究也正在进行,但因成像机理和形式存在差异,单一的医学成像检查技术难以全面描述乳腺组织的形态及功能信息。

未来,利用多模态医学图像融合技术将功能成像与解剖图像有机结合,除了可以增强乳腺影像的空间分辨率和密度分辨率外,更利于机器监测和人为判读。通过建立规范标准化的免疫组化分子分型数据库,使研究焦点更多地聚焦在算法的性能之上。此外,可尝试将深度学习灵活地运用于各分型的任务中,同时研究特征筛选算法的优化,以进一步提高分类结果的准确性。同时,将乳腺BI-RADS临床分级纳入乳腺癌分子分型的影响因素,也是未来探索的重要方向之一。相信随着大数据的推广和带有高性能的GPU计算机的支持,基于影像组学的乳腺癌分子分型预测研究势必会开拓出更大的发展空间,表现出更佳的临床应用前景。

猜你喜欢
亚型分型乳腺
失眠可调养,食补需分型
体检查出乳腺增生或结节,该怎么办
便秘有多种 治疗须分型
得了乳腺增生,要怎么办?
Ikaros的3种亚型对人卵巢癌SKOV3细胞增殖的影响
基于分型线驱动的分型面设计研究
容易误诊的高回声型乳腺病变
ABO亚型Bel06的分子生物学鉴定
HeLa细胞中Zwint-1选择剪接亚型v7的表达鉴定
颈椎病中医辨证分型与影像探讨