年轻女性乳腺癌潜在核心基因的生物信息学分析

2020-07-08 04:11:40赵卫红秦博宇焦顺昌
解放军医学院学报 2020年4期
关键词:通路乳腺癌核心

陶 然,赵卫红,秦博宇,焦顺昌

解放军总医院第一医学中心 肿瘤内科,北京 100853

乳腺癌是世界范围内女性最常见的恶性肿瘤,严重威胁女性生命健康。近年来与西方发达国家比较,我国女性乳腺癌发病率和死亡率快速上升,且呈现出年轻化趋势[1]。与中老年女性乳腺癌相比,年轻乳腺癌患者(≤35岁)就诊时病理学分期更晚、组织学分级更高、侵袭性更强,同时也更容易出现多器官转移及骨髓侵犯[2-4]。由于该年龄段患者数量的限制,目前针对年轻女性乳腺癌相关基因的分子生物学功能及通路分析国内外鲜有报道。本研究通过生物信息学方法处理医学癌症数据库(The Cancer Genome Atlas,TCGA)中年轻女性乳腺癌相关转录组数据,筛选出差异表达基因的同时构建蛋白质相互作用网络,并着重对网络中表达上调的核心基因进行分析。初步探索年轻女性乳腺癌在分子水平的发生发展机制。

资料与方法

1 资料 通过TCGA数据库(https://gdc-portal.nci.nig.gov)下载女性乳腺癌相关转录组数据集(RNA-seq v2 level3),检测平台均为Illumina HiSeq 2000 RNA Sequencing。在保留筛选条件为年龄≤35岁的样本数据后共得到了32例样本,其中包括29例肿瘤组织样本和3例正常乳腺组织样本。

2 差异表达基因筛选 采用R3.4.1中的Limma程序包(Version 3.32.5)对TCGA数据库中年轻女性乳腺癌转录组数据集归一化处理并与正常乳腺组织的基因表达值进行比对筛选差异表达基因(differentially expressed genes,DEGs)。对筛选出的差异表达基因采用R3.4.1中的Pheatmap Version 1.0.8包绘制火山图以及双向层次聚类热图。差异表达基因筛选条件为|log2FC|>0.5同时FDR<0.05。

3 蛋白质相互作用网络构建及核心基因筛选利用蛋白质相互作用数据库STRING(Version:10.0,https://string-db.org)构建差异表达基因编码蛋白质相互作用网络(protein-protein interaction network,PPI)。通过Cytoscape Version 3.6.1对网络进行可视化展示。进一步利用Cytoscape软件中的MCODE(Molecular Complex Detection)插件筛选网络中与年轻女性乳腺癌显著相关的核心基因。

4 核心基因的GO功能及KEGG通路分析 着重对网络中表达上调的核心基因进行基于DAVID6.8在线分析工具的基因本体(gene ontology,GO)功能与京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。并通过超几何分布Fisher exact检验计算显著性水平(显著性筛选标准:P<0.05)。

结 果

1 差异表达基因筛选 对年轻女性乳腺癌肿瘤组织及正常组织基因数据采用Limma程序包进行预处理及筛选,共得到720个满足设定阈值(|log2FC|>0.5且FDR<0.05)的差异表达基因。对比正常组织,癌组织中上调基因173个,下调基因547个(图1)。

2 编码蛋白质相互作用网络构建及筛选核心基因利用STRING数据库对筛选出的720个差异表达基因进行分析处理,在保留相互作用预测得分高于0.4的作用对后共得到了1 061对连接对,以此构建差异表达基因编码蛋白质相互作用网络并使用Cytoscape对网络进行可视化展示(图2A)。通过MCODE(Molecular Complex Detection)插件对该蛋白质相互作用网络进行分析,得出两个核心基因模块,进一步筛选出核心基因NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8、CXCL2、CXCL3、CXCL5、PPBP、CCL16。 其 中 NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8在年轻女性乳腺癌肿瘤组织中表达上调,CXCL2、CXCL3、CXCL5、PPBP、CCL16在 肿 瘤组织中表达下调(图2B)。

3 核心基因的功能及通路分析 着重对网络中表达上调的核心基因进行GO功能和KEGG通路富集分析。结果显示上调核心基因主要参与有丝分裂、细胞增殖正向调控和免疫应答等生物学过程,同时与趋化因子信号通路以及神经活性配体-受体相互作用等KEGG信号通路关系密切(图3)。

讨 论

图1 差异表达基因火山图(A)及表达水平双向层次聚类热图(B)蓝点为差异表达基因Fig. 1 Volcano map (A) and Heatmap of DEGs (B)Blue dots represent the DEGs

本研究通过对年轻女性乳腺癌肿瘤组织及正常乳腺组织的转录组数据分析,共筛选得到720个差异表达基因,其中上调基因173个,下调基因547个。进一步构建差异表达基因编码蛋白质相互作用网络,最终得到与年轻女性乳腺癌显著相关的核心基因NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8、CXCL2、CXCL3、CXCL5、PPBP、CCL16。以上核心基因中NCAPG、NCAPH、MELK、PBK、CDCA5、CDCA8、CCNB2、CCNA2、SPC25、SKA1、NPY1R、CXCL9、CXCL10、GALR2、CCR8在年轻女性乳腺癌组织中表达上调,CXCL2、CXCL3、CXCL5、PPBP、CCL16在 癌 组织中表达下调。着重对表达上调的核心基因进行GO与KEGG富集分析,显示有丝分裂、细胞增殖正向调控和免疫应答等生物学功能与其存在显著相关性,同时趋化因子以及神经活性配体-受体相互作用等信号通路与表达上调核心基因关系密切。

图3 蛋白质相互作用网络中上调核心基因的GO和KEGG通路分析Fig. 3 GO and KEGG pathway analysis of up-regulated critical genes in protein-protein interaction network hsa: homo sapiens; MF: molecular function; CC: cellular component; BP: biological process

非染色体结构维护凝缩蛋白Ⅰ复合体G亚基 (non-SMC condensingⅠcomplex subunit G,NCAPG)是凝缩蛋白复合物Ⅰ中的一个SMC调节亚基。既往研究初步证实NCAPG可能通过PI3K/AKT信号系统参与了多种肿瘤的发病过程并与预后不良相关[5-6]。利用siRNA-NCPAG技术可显著抑制肿瘤细胞的增殖率及侵袭程度[7]。非染色体结构维护凝缩蛋白Ⅰ复合体H亚基(non-SMC condensingⅠcomplex subunit H,NCAPH)作为另一种SMC调节亚基,是拓扑异构酶Ⅱ(TopoisomeraseⅡ)活性的重要调控元件。NCPAH在黑色素瘤中可促进DNA修复和细胞周期蛋白表达上调,同时在非小细胞肺癌中NCAPH的过表达与预后不良相关[8-9]。

细胞周期蛋白A2(CCNA2)和细胞周期蛋白B2(CCNB2)通常与细胞增殖密切相关,研究表明CCNA2缺失会抑制不同类型恶性肿瘤的发生[10],CCNB2则在恶性肿瘤中广泛过表达[11]。细胞分裂周期相关蛋白5(cell division cycle-associated 5,CDCA5)作为细胞周期的核心调节因子被证实在肺癌发生过程中存在表达水平升高且与预后不良相关[12]。细胞分裂周期相关蛋白8(cell division cycle-associated 8,CDCA8)是染色体乘客复合体(chromosomal passenger complex,CPC)的组成部分,对CDCA8基因分析结果显示其在人类胚胎干细胞(human embryonic stem cells,hESCs)和肿瘤细胞中高表达,在正常细胞中弱或无表达[13]。

PDZ连接激酶/T-LAK细胞源蛋白激酶(PDZ-binding kinase/T-LAKcell-originatedproteinkinase,PBK/TOPK)是丝裂原活化蛋白激酶激酶(mi-togen activated protein kinasee,MAPK)家 族 的 丝 -苏氨酸激酶。PBK/TOPK在乳腺癌中可激活p38及MAPK信号通路促进肿瘤细胞增殖[14],在肺癌中通过激活PI3K/PTEN/AKT通路促进上皮间质转化(epithelial-mesenchymal transition,EMT), 最 终 导致肿瘤细胞迁移[15]。

纺锤体和动粒关联蛋白-1(spindle and kinetochore-as-sociated complex subunit1,SKA1)是SKA蛋白复合体的成员,病理条件下SKA1可通过加快细胞周期检查点转换诱导肿瘤细胞增殖。目前证实SKA1在恶性肿瘤组织中表达增高且与肿瘤临床分期密切相关[16]。Spc25(Spindle pole body compo-nent 25 homol)是核分裂周期蛋白80(nuclear division cycle 80,Ndc80)复合体的组成成员。初步报道Spc25在CpG岛甲基化表型(CIMP)阳性肾细胞癌中表达升高,同时在某些特殊病理类型乳腺癌基底部位高表达且与生存率相关[17-18],其意义仍有待进一步明确。

神经肽Y1受体(neuropeptide Y1 receptor,NPY1R)参与调节垂体激素的合成与分泌。实验证实经雌激素处理过的大鼠下丘脑中NPY1R-mRNA转录水平上升,同时NPY1R可通过调控雌激素分泌进一步诱导乳腺癌细胞增殖[19]。近期报道甘丙肽(galanin,GAL)及其受体系统(galanin receptor,GALR)与肿瘤发生发展密切相关。乳腺癌中甘丙肽前体基因(11q13)位点发生经常性扩增,同时GAL蛋白表达水平受雌激素分泌影响[20],提示其在肿瘤分子诊断方面的潜在价值。

母体胚胎亮氨酸拉链激酶(maternal embryonic leucine zipper kinase,MELK)是AMPK/snf1蛋白激酶家族的一种性丝-苏氨酸激酶。沉默MELK会增加p53的表达水平[21],同时MELK抑制剂通过诱导p21表达,控制细胞在G1期停滞从而抑制肿瘤细胞增殖[22]。目前MELK基因已成为抗癌药物研发中的热门靶点。

趋化因子受体8(chemokine receptor 8,CCR8)作为G蛋白偶联受体家族成员是CC类趋化因子CCL1的唯一受体。CCR8主要在淋巴组织中表达,近期研究认为肿瘤细胞可通过其表面的CCR8受体与CCL1结合促进淋巴转移[23],乳腺癌组织中的CCR8高表达与患者总体不良预后相 关[24]。CXCL9(monokine induced by IFN-γ)和CXCL10(IFN-γ-inducible protein 10)是 由 IFN-γ诱导产生的ELR-(Glu-Leu-Arg)CXC类趋化因子,在抑制肿瘤血管生成的同时通过上调淋巴细胞黏附分子诱导多种免疫细胞迁移至肿瘤组织发挥杀伤作用[25-26]。小鼠肿瘤免疫模型研究发现抗PD-L1治疗反应率高的肿瘤组织中CXCL9、CXCL10表达水平升高[27],提示对未来抗肿瘤免疫治疗的疗效预测具有潜在价值。

值得注意的是,本研究同时筛选出5个表达下调核心基因。其中CXCL2、CXCL3和CXCL5均为ELR+CXC类趋化因子,可作为血管生成因子从而诱导肿瘤组织内血管生成[28]。血小板碱性蛋白(pro-platelet basic protein,PPBP)参与调节有丝分裂、cAMP胞内聚集以及DNA合成等细胞生物学过程。CCL16/HCC4作为CC类趋化因子的成员,主要在巨噬细胞炎症归巢过程中发挥关键作用。目前关于这5个下调基因及其编码蛋白在肿瘤发生与发展机制中的相关性研究报道尚少,有待后续进一步探索。

综上所述,本研究基于生物信息学方法对年轻女性乳腺癌潜在核心基因进行了初步分析探索。由于目前医学癌症数据库中年轻女性乳腺癌相关数据较为有限,筛选出的核心基因仍需通过大量的基础实验及临床研究进一步证实。但本研究依然有助于增强对年轻女性乳腺癌相关分子机制的了解,同时为该疾病的临床诊断与治疗提供了一定的理论基础。

猜你喜欢
通路乳腺癌核心
我是如何拍摄天和核心舱的
军事文摘(2022年14期)2022-08-26 08:16:40
近观天和核心舱
军事文摘(2022年14期)2022-08-26 08:16:22
绝经了,是否就离乳腺癌越来越远呢?
中老年保健(2022年6期)2022-08-19 01:41:48
你好!我是“天和”核心舱
军事文摘(2022年12期)2022-07-13 03:12:18
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
通路快建林翰:对重模式应有再认识
创业家(2015年1期)2015-02-27 07:52:02