杜松丽,樊 莉,陈茂山,周 恋,华帮江,杨宏伟,
(1.遵义医科大学 研究生院,贵州 遵义 563099;2.遂宁市中心医院 乳腺甲状腺外科,四川 遂宁 629000)
全球癌症统计数据显示,乳腺癌发病率位居女性恶性肿瘤首位,占所有恶性肿瘤的24.5%,严重危害女性身心健康[1]。乳腺癌是一种具有高度异质性的恶性肿瘤,根据肿瘤表达的ER、PR和HER2状态可将乳腺癌划分为Luminal A样、Luminal B样、HER2阳性和三阴性4种亚型,不同亚型乳腺癌的生物学行为及预后存在显著差异。Luminal A样和Luminal B样型乳腺癌统称为激素受体(Hormone receptor, HR)阳性乳腺癌,在乳腺癌中占比为60%~70%[2]。内分泌治疗(Endocrinetherapy, ET)是该类型乳腺癌的重要治疗方式,能显著提高HR阳性乳腺癌患者的预后,然而约30%的HR阳性乳腺癌患者在内分泌治疗过程中出现耐药导致疾病复发转移。因此,能预测HR阳性乳腺癌发生ET耐药的标志物和能逆转耐药的治疗靶点,为进一步提高HR阳性患者的预后具有非常重要临床意义。
随着生物信息技术的不断发展,基因芯片技术广泛应用于医学基础研究领域,能为肿瘤等各种疾病深入了解基因层面的差异和开展机制研究,为临床诊断、治疗、预后评估等方面提供非常重要的信息[3-4]。高通量基因表达数据库涵盖世界各机构提交的各种肿瘤的基因芯片数据,为乳腺癌ET耐药问题的深入研究提供了可能。目前,乳腺癌ET耐药的具体机制尚不清楚。本研究利用基因芯片数据进行耐药差异基因分析,探索耐药可能相关的信号通路,并通过临床标本进行初步验证。本研究通过遂宁市中心医院科研伦理委员会审批(编号:LLSLH20210060)。
1.1 芯片数据的选择 本研究使用美国国立生物技术信息中心的基因表达汇编(Gene Expression Omnibus,GEO)数据库(https://www.ncbi.nlm.nih.gov/geo),采用“breast cancer”和“endocrine therapy”为关键词在数据库内进行检索,获得乳腺癌内分泌治疗相关的基因芯片数据。筛选得到他莫昔芬耐药和他莫昔芬非耐药细胞系的基因数据集(GSE 67916),芳香化酶抑制剂耐药细胞系和芳香化酶抑制剂非耐药细胞系的基因数据集(GSE 51390)。
1.2 差异表达基因的筛选 采用 GEO2R筛选对HR阳性乳腺癌内分泌治疗敏感组与耐药组的差异表达基因(DEGs)。以调整后P<0.05、|logFC|≥1作为筛选标准。然后,运用Venn diagram软件获取两个基因芯片的共同DEGs。logFC≥1定义为上调基因,logFC≤-1定义为下调基因。
1.3 PPI网络的构建及关键基因的筛选 采用STRING(Search tool for the retrieval of interacting genes/proteins)对DEGs进行蛋白-蛋白相互作用网络(Protein-protein interaction,PPI)分析。进一步运用 Cytoscape 3.8.0(http://www.cytoscape.org/)进行蛋白之间的潜在相关性分析,筛选出与周围蛋白有高度连通性(度值degree)的前20个蛋白。
1.4 差异基因的生物功能及作用通路分析 采用注释、可视化和集成发现数据库(The database for annotation,visualization,and integrated discovery,DAVID)对筛选的前20个蛋白对应的DEGs进行基因本体(Gene ontology,GO)和京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)分析,了解基因的作用及相关通路。
1.5 关键基因的生存分析 运用Kaplan-Meier Plotter在线数据库(http://www.kmplot.com/analysis/)对筛选出的20个关键蛋白对应的基因进行预后分析,确定其与HR阳性乳腺癌患者无复发生存(Recurrence-free survival,RFS)的相关性,并绘制生存曲线。
1.6 差异基因蛋白表达的验证 选取遂宁市中心医院数据库中病例及对应的石蜡标本,采用免疫组化(IHC)法检测筛选出的20个关键蛋白,验证分析蛋白在乳腺内分泌治疗敏感和耐药人群中的表达情况。具体方法如下:
1.6.1 标本的选择 在本中心数据库中初筛接受规范诊疗、有随访信息及病理标本的HR阳乳腺癌病例,再利用随机数字表法按1∶1筛选ET敏感和耐药病例各21例。于病理科借取相应患者的原发灶手术石蜡标本或穿刺石蜡标本。
1.6.2 主要试剂 一抗、二抗、EDTA修复液(免疫组化法)、DAB显色液、缓冲液(PBS磷酸盐法)、苏木素等。
1.6.3 免疫组化Enivision法染色 将存档的非特殊浸润性乳腺癌组织蜡块2 μm厚连续切片制作载玻片,室温TO液脱蜡后PBS液及EDTA修复液处理,分别用一抗、二抗处理后DAB显色,苏木素复染微波炉烤片后加入细胞保存液封片。具体操作步骤严格按照试剂盒说明书要求操作。
1.6.4 实验结果评判 由两位工作5年以上的副主任医师盲态下独立阅片,参照《免疫组织化学反应结果的判断标准》[5],在400倍高倍镜下,随机选择5个视野,根据相应抗体的表达部位进行判读。染色强度评分:无色计0分,浅黄色计1分,棕黄色计2分,棕褐色计3分;阳性的细胞占比评分:0为0分,≤10%为1分,11%~50%为2分,51%~75%为3分,>75%计4分。将两个评分乘积作为该视野的IHC得分。计算两位医师评出的每个视野的平均分作为该视野最终得分。每个标本的5个视野平均分,作为该标本的IHC最终得分。
1.7 统计学分析 符合正态分布的数据组间比较采用独立样本t检验,不符合者采用Wilcoxon秩和检验。分类变量组间比较采用卡方检验或Fisher确切概率法。采用单因素Logistic回归分析ET耐药可能相关的因素,单因素分析P<0.05的变量进入多因素Logistic回归分析耐药独立相关因素。生存分析采用Kaplan-Meier法,各基因不同表达水平患者间的RFS比较采用log-rank检验。所有检验均为双侧,P<0.05为差异有统计学意义。
2.1 差异基因的筛选 按照“Breast cancer”和“Endocrine therapy resistance”在GEO数据库共检索到168个相关芯片数据集,进一步精确筛选后得到GSE 67916和GSE 51390两个数据集,其中GSE 67916对他莫昔芬耐药细胞系TamR与他莫昔芬敏感细胞系MCF7/S0.5进行了基因阵列分析,进行差异基因分析获得1 787个DEGs;GSE 51390检测了对芳香化酶抑制剂耐药细胞系A3与敏感细胞系T-47D的基因表达,差异基因分析获得5 665个DEGs。两个数据集DEGs的火山图分别见图1~2。进一步运用Venn diagram在线工具对两个数据集的 DEGs取交集。得到同时在他莫昔芬耐药和芳香化酶抑制剂耐药细胞系表达的基因,绘制韦恩图(见图 3)。最终筛选出184个DEGs,其中上调基因68个,下调基因116个。
图1 GSE 67916 差异表达基因
图2 GSE 51390差异表达基因
A:68个上调基因;B:116个下调基因。图3 184个共同的差异表达基因
2.2 差异基因的富集分析
2.2.1 GO分析 使用DAVID对184个DEGs进行GO分析,结果显示:(1)在细胞组分上,主要富集于细胞膜、质膜、细胞质、胞外外泌体等处(见图4);(2)在生物学过程中,主要在信号转导、RNA聚合酶Ⅱ启动子转录的正调控、信号转导、细胞粘附等方面富集(见图5);(3)在分子功能上,主要在蛋白质结合、蛋白质同源二聚化活性、相同的蛋白质结合等方面富集(见图6)。
图4 细胞组分
图5 生物过程
图6 分子功能
2.2.2 KEGG分析 KEGG分析(见图7),DEGs在癌细胞中主要富集于蛋白聚糖、钙信号通路、Rap1信号通路、催产素信号通路、细胞粘附分子、甲状腺激素信号通路等通路。
图7 KEGG富集通路分析
2.3 PPI网络的构建及关键基因的筛选 用184个共同DEGs在STRING数据库初步构建PPI网络图,获得各基因相应蛋白质与蛋白质之间的相互作用的信息。将结果导入Cytoscape 3.8.0中运用cytohubba插件对PPI网络进行运算,按Degree 算法选择蛋白质之间相互作用最密切的前20个蛋白(见图8;表1),并将这20个蛋白及对应的基因为研究对象。
图8 前20个蛋白质互作关系
2.4 关键基因的生存分析 运用Kaplan-Meier plotter中乳腺癌数据库患者生存资料对筛选出的20个基因进行生存分析,结果表明20个关键基因中有11个基因与HR阳性患者的RFS呈相关性(P均<0.05),其中基因和基因等基因高表达的患者RFS更短(P均<0.05),表明这2个基因可能是HR阳性乳腺癌疾病进展的危险因素;而PTPN11、ITPR1、GATA3、PLCG2、ESR1、ERBB4、TP53、FGFR2 及PGR这9个基因高表达则可能是乳腺癌患者疾病进展的保护性因素(P均<0.05,见图9)。
表1 前20个枢纽基因
2.5 对差异基因行免疫组化验证 阅读文献及结合预实验结果,IHC方法检测乳腺癌组织中ITPR1、FGFR2相应的蛋白,结果极少阳性表达甚至不表达[6]。已有文献证实ESR1、CD24基因与乳腺癌内分泌耐药相关[7]。本研究对上述4个蛋白未重复验证。结合查阅文献,本研究选取ERBB4、PTPN11、GATA3、TP53、PGR、PLCG2和SDC1基因相应的蛋白进行IHC检测。结果显示:PGR、PLCG2和SDC1基因蛋白在ET敏感和耐药两组之间的表达差异有统计学意义(P均<0.05),TP53、ERBB4、GATA3和PTPN11基因蛋白在两组之间的表达水平差异无统计学意义(P均>0.05,见图10),并通过免疫组织化学法验证各差异基因在乳腺癌组织中的表达情况(见图11~17)。
7个基因敏感组与耐药组相比,P值分别为0.033、0.008、0.460、0.213、0.793、0.082。图10 7个基因相应蛋白验证结果
A:阴性表达;B:阳性表达,×200。图11 IHC法检测PGR在乳腺癌中的表达
A:阴性表达;B:阳性表达,×200。图12 IHC法检测PLCG2在乳腺癌中的表达
A:阴性表达;B:阳性表达,×200。图13 IHC法检测SDC1在乳腺癌中的表达
A:阴性表达;B:阳性表达,×200。图14 IHC法检测TP53在乳腺癌中的表达
A:阴性表达;B:阳性表达,×200。图15 IHC法检测GATA3在乳腺癌中的表达
A:阴性表达;B:阳性表达,×200。图17 IHC法检测ERBB4在乳腺癌中的表达
激素受体(Hormone receptor, HR)阳性乳腺癌的预后与基因表达情况密切相关,如ESR1基因、PIK3CA/mTOR通路的改变,抑制CDK4/6、mTOR和PI3K等通路均显示可提高内分泌治疗(Endocrine therapy, ET)的临床疗效。但仍有部分HR阳性乳腺癌对内分泌不够敏感,出现原发或继发性ET耐药。目前,ET耐药的详细机制尚不明确。本研究利用生物信息技术从GEO数据库筛选出GSE67916和GSE51390芯片,对可能与乳腺癌ET耐药密切的基因和蛋白进行分析,发现SDC1和CD24基因高表达与HR阳性乳腺癌患者无复发生存(Recurrence-free survival, RFS)更差相关(P均<0.05),同时发现PTPN11、ITPR1、GATA3、PLCG2、ESR1、ERBB4、TP53、FGFR2及PGR这9个基因高表达则与患者更优的RFS相关(P均<0.05)。本研究发现的这11个基因及蛋白有可能为预测HR阳性乳腺癌ET敏感性提供参考信息。
SDC1(Syndecan-1)是一种细胞表面硫酸乙酰肝素蛋白聚糖,通常主要由上皮细胞和浆细胞表达,在乳腺癌的基质成纤维细胞中异常表达,可存在于各种正常和恶性组织中。SDC1在乳腺癌微环境中存在特定于生态位的功能,介导Wnt级联信号并可能调节乳腺癌细胞的迁移[8],它主要通过影响肿瘤发生发展相关配体和受体而影响肿瘤进展。SDC1的高表达被证明是乳腺癌的一个新的独立预后因素,SDC1过表达与ER表达呈负相关,主要通过调节血脑屏障的相关细胞因子促使乳腺癌细胞跨血脑屏障迁移而促进乳腺癌脑转移[9]。SDC1基因参与调控的PI3K/AKT信号通路在乳腺癌内分泌耐药过程中发挥着重要作用[10]。
PLCG2(Phospholipase Cγ2)与细胞增殖、转化和肿瘤生长的调节有关,在三阴性型乳腺癌中PLCG2表达上调[11]。大部分关于PLCG2的研究主要与阿尔兹海默病、消化道肿瘤、慢性淋巴细胞性白血病耐药等领域。与原发肿瘤相比,PLCG2是转移性乳腺癌患者淋巴转移中表达差异最大的基因之一,且与乳腺原发肿瘤相比,PLCG2mRNA在淋巴转移中的数量增加[12-13],这可能预示PLCG2表达与更具侵袭性的分子亚型相关。
ERBB4是ERBB受体酪氨酸激酶家族的成员,它在肿瘤不同微环境状态下中具有促癌和抗癌活性。ERBB4负调节人乳腺癌细胞中的血管生成拟态(VM)的形成,其突变点可能成为乳腺癌的有效治疗靶标[14]。Kawahara等[15]学者探讨ERBB4在人类肿瘤中作为生物标志物发挥作用的可能性,分析ERBB4在人类肿瘤分期中的潜在作用以及ERBB4功能如何决定人类肿瘤的治疗,均表明本研究所筛选出的ERBB4基因对调节人类肿瘤微环境起重要作用。
PGR由位于11q22.1的PGR基因编码,在乳腺的发育以及乳房的恶性肿瘤的发生发展中起着重要作用。Hisham等研究结果表明,在雌激素允许的条件下,激活的PR通过重新定向ERα染色质结合和改变靶基因的表达,诱导乳腺细胞从增殖状态向分化状态的转换,在ER乳腺肿瘤中起增殖抑制作用[16]。PGR基因组位点的基因组改变使PR表达降低从而增加乳腺癌的风险的一种相对常见的机制,这可能导致ERα染色质结合和靶基因表达模式的改变,PGR还可以调节ER结合位点和转录活性,选择性PR调节剂药物可以与他莫昔芬协同作用,使小鼠肿瘤消退[16-17]。在本研究中,PGR在内分泌治疗耐药组与敏感组的表达差异有统计学意义,进一步证实PGR与乳腺癌ET耐药相关。
ESR1、PTPN11、TP53和ITPR1等基因与人类肿瘤的发生发展密切相关。在转移性激素受体阳性乳腺癌中,ESR1突变是继发耐药的常见原因[18],可见ESR1基因是降低HR阳性乳腺癌内分泌治疗耐药的潜在保护基因。PTPN11在急性髓系粒细胞白血病(AML)中RAS信号超激活、白血病转化及化学耐药等信号通路中皆具有重要作用[19]。TP53的突变是导致乳腺癌转移极重要的遗传变化,5%~8%的30岁以下患有乳腺癌的女性带有种系TP53基因突变,而携带TP53基因种系突变的女性在60岁时患乳腺癌的风险高达85%,与患者不良预后高度相关[20]。
本研究通过生物信息技术筛选出可能与乳腺癌ET敏感性相关的基因,通过单中心病理标本初步验证证实SDC1、PLCG2、ERBB4、PGR、ESR1、PTPN11、TP53和ITPR1等基因可能为乳腺癌ET敏感性提供参考信息。受限于基因数据库信息的局限性,仍存在乳腺癌耐药基因筛选不全、基因或蛋白在信号通路间的交互作用、基因差异与现实中患者ET敏感性不吻合等情况,后续将进一步对本研究发现的耐药基因和蛋白进行深入研究和机制探索。