柴慈曼,杨绍时
(天津医科大学第二医院甲状腺乳腺外科,天津 300211)
根据《2015年中国肿瘤登记年报》,乳腺癌在我国女性恶性肿瘤中高居榜首,占女性癌症总人数的15%,且发病率逐年递增,2015年我国新发乳腺癌27.24万人,死亡7.07万人[1]。根据乳腺癌分子分型,约70%是雌激素受体(ER)和或孕激素受体(PR)阳性型,肿瘤生长具有雌激素依赖性[2]。对于这类患者,阻断雌激素相关通路的内分泌治疗是经济、有效、低毒性的治疗方法,也是目前国内外乳腺癌诊治指南中的标准治疗方案,临床上他莫昔芬作为乳腺癌内分泌治疗的经典药物,在治疗过程中常发生耐药现象,约40%的ER阳性乳腺癌患者初始治疗即对他莫昔芬不敏感(即原发性耐药),另有约25%的患者初始治疗有效,长期用药后出现耐药(即获得性耐药)[3]。目前对于他莫昔芬治疗出现耐药而发生复发转移的病人并没有针对性的治疗方法。虽然对此问题的研究逐年增多[4-5],但目前仍然缺乏确切有效的治疗靶点。本研究利用Gene Expression Omnibus(GEO)公共数据库提取ER阳性乳腺癌mRNA表达谱芯片测序数据,应用生物信息学方法,筛选ER阳性型乳腺癌患者群体中出现他莫昔芬耐药的关键分子和信号通路,从而深入了解乳腺癌他莫昔芬耐药的分子机制。
1.1 材料 从NCBI的基因表达综合数据库(gene expression omnibus,GEO)下载获取乳腺癌他莫昔芬敏感和耐药细胞系的mRNA表达谱芯片,芯片号GSE26459,提交者为Gonzalez-Malerva L等。mRNA表达谱数据来源于AffymetrixHuman Genome U133 Plus2.0Array实验平台,平台号GPL570,包含和24个样本(12个MCF7vs12个MCF7TAM),样本号为GSM649484~GSM649507,样本分 4 组处理:(1)去雌激素血清(对照组);(2)雌激素(9~10 mol/L);(3)他莫昔芬(1 μmol/L);(4)雌激素+他莫昔芬同时处理。
1.2 生物信息学分析
1.2.1 数据处理与差异表达基因分析 从GEO数据库中选择生物芯片GSE26459下载的mRNA表达谱芯片数据集导入到R 3.4.3软件(https://cran.rproject.org/),其中bioconductor具有强大的生物信息分析处理功能。基于clusterProfiler中的raw实现数据标准化,利用limma筛选出两组差异表达基因。选择他莫昔芬耐药细胞系MCF7TAM与他莫昔芬敏感细胞系MCF7两组进行t检验,以P-value<0.05并且FDR<0.1并且Fold Change>2为标准,筛选他莫昔芬耐药细胞系MCF7TAM与他莫昔芬敏感细胞系MCF7的mRNA差异表达,利用R软件中的ggplot2绘制热图。
1.2.2 差异基因的Gene Ontology(GO)富集和KEGG通路富集分析 利用基因功能注释分析工具DAVID(https://david.ncifcrf.gov/)版本6.8对差异基因中显著上调和下调的基因进行Gene Ontology富集分析和KEGG通路富集分析(筛选标准:P<0.01),发现与ER阳性乳腺癌细胞系中他莫昔芬耐药潜在的显著相关生物学过程。
1.2.3 差异基因的相互作用网络分析 利用STRING(http://string-db.org/)版本 10.5,将获得的差异基因进行蛋白相互作用网络分析。获得中心节点蛋白,及其与其他蛋白的相互作用关系。
1.2.4 GSEA富集分析 利用GSEA软件(Gene set enrichment analysis,网址 http://gsea.org/)版本 3.0,利用已筛选出的差异基因集,将差异基因按照在两类样本(他莫昔芬耐药细胞系和他莫昔芬敏感细胞系)中的差异表达程度排序,然后检验预先设定的基因集合是否在这个排序表的顶端或者底端富集,number of permutations=1 000。
1.2.5 验证候选目标分子-ACSL1 结合乳腺癌内分泌耐药中关键机制及相关分子筛选出候选目标分子-ACSL1。Western-blotting验证ER阳性乳腺癌他莫昔芬耐药细胞中ACSL1的表达变化情况。同时结合CCLE数据库(https://portals.broadinstitute.org/ccle)在RNA-seq芯片中验证ACSL1的组织表达情况,在 GEPIA 数据库(http://gepia.cancer-pku.cn/)验证ACSL1组织表达情况,同时分析乳腺癌患者中ACSL1高表达组和低表达组的生存差异。
2.1 数据处理与差异表达基因 分析数据标准化后,对筛选出来的差异基因进行聚类分析绘制热图,见图1。
图1 他莫昔芬耐药细胞系MCF7TAM与敏感细胞系MCF7对照共差异基因热图Fig 1 Heat map of DEGs expression in tamoxifen-resistance group and tamoxifen-sensitive group
2.2 Gene Ontology富集分析结果和KEGG通路富集结果 GO富集分析结果显示分子功能富集到辅酶A连接酶的活性、细胞骨架蛋白连接、蛋白酶连接等功能结构域(表1)。KEGG通路富集到PPAR信号通路、细胞粘附因子、脂肪酸代谢信号通路、胰岛素抵抗通路、AMPK信号通路、FoxO信号通路等信号通路(表 2)。
表1 Gene Ontology富集分析结果(分子功能)Tab 1 GO categories of DEGs(Molecular Function)
2.3 差异基因的蛋白-蛋白作用网络 蛋白-蛋白作用网络结果分析显示,整个网络以ACSL1、ACACB、IRS1、TGFB1、COLOA1、CD36、EDN1、TIMP1、TIMP3、LGALS3BP、HIST1H4J、HIST1H2BK、HIST1H2AE、HIST1H2BH、DNAJC12、SLC30A4等蛋白在蛋白作用网络中心位置,是蛋白作用网络的关键节点(图2)。
表2 KEGG通路富集结果(前12条)Tab 2Kyoto Encyclopedia of Genes and Genomes pathway enrichment analysis
图2 差异基因对应蛋白相互作用网络分析Fig 2 Protein-protein interaction network
2.4 GSEA富集结果 GSEA富集分析得到了差异基因富集的通路,其中以脂肪酸代谢通路为代表,ES值为正数,提示基因富集在他莫昔芬耐药组。在脂肪酸代谢通路中富集的差异基因,其中ACSL1基因在他莫昔芬耐药组比在敏感组中显著高表达且差异最显著(图3)。
图3 GSEA富集分析部分结果-脂肪酸代谢通路Fig 3 Gene Set Enrichment Analysis(GSEA)report-Fatty acid metabolism
GSM649484~GSM649495为他莫昔芬敏感细胞系MCF7,GSM649496~GSM649507为他莫昔芬耐药细胞系MCF7TAM,通路富集结果为耐药组vs敏感组
2.5 验证候选目标分子-ACSL1
2.5.1 western-blotting实验验证ACSL1表达 WB实验结果显示ACSL1在通过MCF7诱导的他莫昔芬耐药细胞系(MCF7TAM)中ACSL1蛋白表达显著高于他莫昔芬敏感的(MCF7)细胞系(图4)。
2.5.2 数据库验证ACSL1组织表达差异和生存差异 在CCLE数据库和GEPIA数据库中查找ACSL1在不同组织中表达情况得到了相似的结果,ACSL1在脂肪组织和乳腺组织中均有较高表达。
图4 WB验证耐药细胞系中ACSL1表达变化Fig 4 Western-blotting shows the differences of ACSL1 expression
GEPIA数据库分析乳腺癌患者中ACSL1高表达组和低表达组的生存曲线(图5)。发现高表达ACSL1的患者总生存时间有低于ACSL1低表达组的趋势。ACSL1在他莫昔芬耐药中表达量显著变化,提示其可能是他莫昔芬耐药过程中的重要分子。
图5 GEPIA数据库中ACSL1不同表达量情况下的总生存差异Fig 5 Over survival with different expression quantities of ACSL1 in GEPIA database
本研究经过乳腺癌他莫昔芬耐药相关基因及通路的筛选分析发现,差异基因中在脂肪酸代谢相关的生物学过程中显著富集。这提示耐药机制中与脂肪酸代谢相关的分子信号通路和生物学过程发生了改变,从而引起耐药的发生和ER阳性乳腺癌的进展。近年来研究发现肥胖与乳腺癌发生及侵袭转移有很高的相关性[6],而这一通路中涉及胰岛素抵抗、脂肪酸代谢、糖异生等代谢相关的生物学改变[7],本研究的分析结果高度提示这些信号通路在他莫昔芬耐药的过程中也扮演了重要的角色。
本研究筛选出他莫昔芬耐药乳腺癌中的候选关键基因,也是脂肪酸代谢信号通路中的关键分子ACSL1。ACSL1属于长链脂肪酸连接酶A家族的同工酶,这个家族的所有同功酶促进游离长链脂肪酸转化为脂肪酰酯,从而在脂质合成和脂肪酸降解中发挥关键作用。ACSL有4种类型,包括ACSL1、ACSL2、ACSL3、ACSL4,其中在转移性乳腺癌中ACSL1表达情况ER阳性型显著低于其他类型[8],但是在耐药细胞系中ACSL1却明显异常高表达,提示ACSL1与他莫昔芬耐药相关。本研究进一步对ACSL1进行了实验和数据库的双重验证,显示ACSL1在ER阳性乳腺癌内分泌治疗耐药过程中是候选关键基因,ACSL1表达上调参与诱导内分泌耐药发生,降低患者生存率和生存时间。
本研究富集到了脂肪酸代谢、细胞粘附因子、胰岛素抵抗等他莫昔芬耐药相关分子信号通路。(1)脂肪酸代谢通路可能在他莫昔芬耐药机制中起了关键作用。脂肪酸代谢是细胞生命活动中的重要一环,对于癌细胞生存来说尤为重要,不停生长的癌细胞需要大量脂肪酸来组成它的磷脂膜以及提供能量。脂肪代谢参与肿瘤调控,可能的作用机制最近有新的研究报道,脂肪细胞中的P62蛋白失活会抑制哺乳动物雷帕霉素靶蛋白,从而促进前列腺肿瘤细胞关闭脂肪组织耗能过程,使得肿瘤细胞吸收脂肪酸和其他能量,加快肿瘤生长和转移[9]。哺乳动物雷帕霉素靶蛋白抑制剂已经被应用在很多癌症的治疗上[10],为新的肿瘤治疗靶点提供了理论依据。脂肪酸代谢途径中关键酶-脂肪酸合成酶(Fatty AcidSyntheses,FAS)在乳腺癌细胞比正常乳腺细胞显著高表达,而FAS拮抗剂则可以抑制肿瘤细胞的生长,同时FAS被认为是乳腺癌复发的可靠预测指标[11-12]。脂肪酸代谢过程受到固醇调节元件结合蛋白(SREBP)调节,它在受到生长因子包括胰岛素、表皮生长因子等刺激后,激活FAS、ACSL等脂质合成的靶基因,促进内源脂质的合成,而内源脂质是肿瘤细胞主要脂质来源,从而促进肿瘤生长[13],也有学者提出生长因子通过Akt-SREBP-FAS信号途径调节脂质代谢[14]。耐药过程中很可能发生了脂肪酸代谢通路中关键基因的改变,脂肪酸代谢通路被异常激活,促进了乳腺癌细胞增殖或迁移。但该机制尚待进一步验证。另一个可能的机制是脂肪因子通过激活FoxO信号通路参与内分泌耐药。已有的研究证实PI3K-AKT-FoxO信号轴是一个雌激素非依赖性乳腺癌进展的关键因素。PI3K-AKT途径的激活,导致FoxO肿瘤抑制功能下调,驱动乳腺癌的增殖[15]。(2)胰岛素抵抗途径通过调控了AMPK信号通路,激活PI3K信号通路,激活c-Jun NH2,从而参与乳腺癌的进展[16]。(3)细胞粘附因子通路与已经发表的实验结论相符,实验证实在雌激素抵抗的乳腺癌的内分泌耐药机制中细胞粘附通路起到重要作用,其中c-src激酶是一个重要节点[17],非雌激素依赖的乳腺癌中细胞粘附分子如E-钙粘蛋白表达下调,在细胞间粘附不强的乳腺癌细胞中,src激酶过度活化可以激活多种信号途径,促进乳腺癌细胞的增殖。
本研究利用生物信息学有效分析他莫昔芬耐药乳腺癌的基因芯片数据,获取他莫昔芬耐药机制的关键信息,为筛选重要的分子标志物提供依据。