乳腺癌-冠心病共享生物标志物筛选

2021-04-07 12:13魏思昂丁志文冯江浩郝琴琴
科学技术与工程 2021年6期
关键词:泛素通路癌症

魏思昂, 丁志文, 冯江浩, 郝琴琴, 冯 焱*

(1.山西农业大学生命科学学院, 太谷 030801; 2.复旦大学中山医院, 心血管病研究所, 上海 200032)

乳腺癌是一种威胁女性生命的疾病,也是导致女性死亡的主要原因。在过去的20年里,与乳腺癌相关的研究已经引导我们在对乳腺癌的理解上取得了巨大的进步,从而获得更好的治疗方法。在所有恶性疾病中,乳腺癌被认为是绝经后妇女死亡的主要原因之一,占所有癌症死亡人数的23%。临床研究显示,癌症与心血管疾病存在密切关系,在患者死亡率中50%的癌症患者是由于心血管疾病致死。这是一个全球性的问题,但由于妇女对乳房的自我检查和临床检查的疏忽,诊断发现通常为晚期[1],乳腺癌患者幸存问题得到越来越多的关注。乳腺癌作为一种中位生存期相对较长的肿瘤,大量的长期带瘤生存者往往死于非肿瘤死亡风险,其中最常见的死因便是心血管疾病[2-3]。在乳腺癌各个时期中,心脏疾病是导致患者死亡的最主要的非癌症原因,主要包括心肌炎、冠心病、心梗、心力衰竭等。冠心病作为心血管疾病的其中一种,是乳腺癌患者最常见死亡的最终疾病。因此筛选乳腺癌-冠心病生物标志物对肿瘤心脏病的治疗和预防起着积极意义。

现基于基因表达数据库 (gene expression omnibus,GEO) 中筛选2个芯片数据集并进行分析乳腺癌患者冠心病相关差异表达基因 (differentially expressed genes, DEGs),利用生物信息学方法系统探讨潜在的功能和相互作用靶点,确定与乳腺癌中冠心病相关的分子及相关信号通路,检测乳腺癌患者主要差异表达基因的mRNA表达量和预后分析,以期探寻乳腺癌诱发的心血管发病机制中潜在的关键基因及其作用靶点。

1 材料与方法

1.1 资料获取

从GEO中查找并筛选得到浸润性乳腺癌和冠心病血液组织为研究对象,同时具有患者和正常对照组织样本的两个数据集:GSE73613 (浸润性乳腺癌)、GSE23561 (冠心病),患者和正常对照组织样本均来自人。为了鉴定健康与患病组织之间表达不同的基因,使用GEO2R工具鉴定出差异表达的基因,通过设置筛选条件为|log2FC|≥1.2,FC为差异倍数(fold change),P≤0.05。

1.2 样本的检测和交集差异基因的确定

采用SangerBox软件对每个数据集组绘制火山图,运用Draw Venn Diagram在线软件对上述2个数据集的DEGs作Venn图取乳腺癌心脏病标志物,2个数据集交集以上的DEGs用于后续分析。

1.3 GO富集和KEGG途径分析

利用DAVID在线分析工具对DEGs进行基因功能注释(gene ontology,GO)功能富集分析,以了解其分子功能 (molecular function,MF)、参与的生物学过程和途径 (biological process,BP) 及在细胞中组分和定位 (cellular component,CC),并进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,并对信号通路进行可视化处理。

1.4 PPI网络建设和hub gene模块分析

将获得的DEGs导入STRING 数据库以确定蛋白质-蛋白质相互作用信息 (protein-protein interaction information, PPI),应用Cytoscape 3.7.2软件进一步构建PPI网络并可视化。利用分子复合物检测 (MCODE) 插件在显著性mRNA水平表达的基因在PPI网络中选择重要的基因,P≤0.05均被认为有显著性差异。

1.5 hub基因表达和预后分析

使用GEPIA网站分析PPI网络中关键hub基因乳腺癌癌症和正常组织表达量 (P≤0.05为显著性差异);利用在线数据库Kaplan-Meier Plotter对进行hub基因采用接收者操作特征曲线 (receiver operating characteristic, ROC) 分析乳腺癌患者预后状况,随访周期为6个月。

2 结果

2.1 MH表达差异基因的鉴别

本研究共包括2个基因数据集:GSE73613、GSE23561,分别绘制数据集火山图,如图1(a)、图1(b)所示,红色为上调基因,绿色为下调基因。其中GSE73613芯片2例浸润性乳腺癌患者,2例健康人;GSE23561包含9例冠心病患者,6例健康人。差异表达基因是通过患者组织样本与正常标本间对比筛选出来 (P≤0.05, |log2FC)|≥1.2)。通过Veen图[图1(c)]选择得到基因286个。

图1 差异表达基因分析Fig.1 Analysis of differentially expressed genes

2.2 DEGs的GO富集分析

为了确定筛选出来的DEGs的功能和机制,将这些不同表达的差异基因数据上传到在线工具DAVID对DEGs进行KEGG途径分析,DEGs主要集中在泛素蛋白转移酶活性、糖蛋白结合、泛素蛋白连接酶结合方面发挥作用。参与的生物学过程主要涉及蛋白质结合的负调控、轴突延伸、干扰素β产生的正调控、细胞内信号转导、CD8阳性T细胞增殖的调控、膜组件、枝晶形态发生、MyD88依赖性Toll样受体信号通路的调控、细胞内转运的负调控、凋亡过程、成纤维细胞增殖的正调控等。差异性表达基因主要富集在突触后密度、质膜、核染色质、细胞外空间、生长锥、光感受器外段、Cul5环泛素连接酶复合物、Cul2环、泛素连接酶复合物、SAGA复合物、滑面内质网、质膜外侧、树突轴、中心粒部位。表1所示为部分GO富集分析结果。

表1 DEGs的GO富集部分结果Table 1 Partial results of GO enrichment of DEGs

2.3 KEGG通路富集分析

KEGG通路分析表明,DEGs 主要在缝隙连接、肾素分泌、5-羟色胺能突触、谷氨酸能突触、血管平滑肌收缩、血小板活化、癌细胞蛋白多糖、局灶黏附、雌激素信号通路、Rap1信号通路、内源性大麻素逆行信号通路、催产素信号通路、cGMP-PKG信号通路、炎症反应TRP通道、胆碱能突触、趋化因子信号通路、癌症信号通路、阿尔茨海默病、癌症中心碳代谢、钙信号通路、FOXO信号通路、唾液分泌、醛固酮合成与分泌、前列腺癌、Ras信号通路、昼夜节律的介导调节夹带、GnRH信号通路、黑色素生成、内分泌及其他因子调节的钙重吸收、MAPK信号通路、PI3K-Akt信号通路、HTLV-I感染等信号通路富集。基因个数分别为7(P=8.310 000 0)、 5(P=0.002 395 747)、 6(P=0.002 696 924)、 6(P=0.002 799 551)、 6(P=0.003 475 837)、 6(P=0.005 009 959)、 7(P=0.006 458 594)、 7(P=0.007 595 398)、 5(P=0.007 929 206)、 7(P=0.008 491 887)、 5(P=0.008 524 351)、 6(P=0.009 674 889)、 6(P=0.009 928 32)、 5(P=0.010 483 74)、 5(P=0.013 113 852)、 6(P=0.015 304 766)、 9(P=0.015 385 048)、 6(P=0.015 650 994)、 4(P=0.016 061 497)、 6(P=0.016 359 178)、 5(P=0.022 829 621)、 4(P=0.030 738 541)、 4(P=0.032 690 29)、 4(P=0.037 847 572)、 6(P=0.042 825 494)、 4(P=0.043 397 611)、 4(P=0.044 554 189)、 4(P=0.049 333 745)、 3(P=0.051 836 048)、 6(P=0.062 364 745)、 7(P=0.063 607 523)、 6(P=0.064 048 536),如图2所示。

图2 DEGs富集参与的信号通路Fig.2 Signal pathways involved in the enrichment of DEGs

2.4 PPI网络构建和关键DEGs选择

为了进一步研究不同表达的DEGs在心肌肥厚中的作用,从STRING数据库得到的286个基因使用Cytoscape软件构建PPI网络。为了更精准地分析这些基因的调控状态,使用Kaplan-Meier Plotter对这286个基因进一步筛选出来45个mRNA表达量显著性差异的基因。其中13个上调基因,32个下调基因,如图3所示。红色圆标注的基因为上调基因,包括NLN、MSR1、DNAJC12、OCIAD2、POSTN、SCCPDH、CCNB1、MAPT、TPM3、MYB、MYO6、ESR1、TNFSF13B;黄色圆标注的基因为下调基因,包括IRX4、SAMD4A、TIMP3、TFCPZL1、CMYA5、ACSL5、FAT4、C1S、NR4A3、CFH、FOXP2、PLA2R、DCN、SPRY1、CXCL3、TRIM29、FSTL1、MAP18、FBXO31、KALRN、SORBS2、CDO1、RUNX1T1、KIT、PDGFRA、PIK3R1、SPTBN1、DST、LAMA4、MAFF。

图3 蛋白质-蛋白质互作网络图Fig.3 Protein-protein interaction network

接着依据基因间相互作用的紧密程度发现了8个基因用于后续分析。4个上调基因分别为NLN、POSTN、MAPT、MYO6;4个下调基因分别为MAP1B、FBXO31、KIT、PIK3R1。

2.5 Hub预后分析和关键hub基因表达

利用GEPIA工具展示分析8个关键基因的mRNA基因表达量,结果如图4所示,在乳腺癌患者中NLN、POSTN、MAPT、MYO6显著性高表达,MAP1B、FBXO31、KIT、PIK3R1显著性低表达。红色盒子为癌症组织mRNA表达量,灰色盒子为正常人组织mRNA表达量,P<0.01。Kaplan-Meier Plotter对8个hub基因进行预后分析如图5所示,红色曲线为基因高表达,黑色曲线为基因低表达。

MAPT、MYO6、NLN、POSTN、FBXO31、KIT、MAP1B、PIK3R1在癌症患者和正常人组织差异表达情况, *为P<0.05图4 关键hub基因mRNA在乳腺癌组织的表达量分析Fig.4 Analysis of the expression of key hub genes mRNA in breast cancer

MAPT、MYO6、NLN、POSTN、FBXO31、KIT、MAP1B、PIK3R1表达差异下癌症患者生存曲线, HR为风险比,采用Logrank P模型检验图5 hub 基因在乳腺癌患者中的ROC分析Fig.5 ROC analysis of hub gene in breast cancer patients

3 讨论

癌症患者数量的增加和治疗时间的延长,使得心血管并发症的处理和治疗引起的心脏毒性成为一个重要的问题,如何有效治疗肿瘤心脏病也越来越受到重视[4]。癌症并发性心血管疾病患者数量的增加,特别是乳腺癌诱发的冠心病患者数量,促使研究肿瘤心脏病有效生物标记物显得尤为重要[5-7]。近年来,多项研究表明人类乳腺癌疾病存在心血管疾病相关的生物标志物并且在发生和发展中起着关键作用,但是大多数具体功能作用尚不清楚。本研究从 GEO 数据库中获取2个数据集,筛选出286个相关乳腺癌与冠心病共表达的DEGs,这些基因潜在的功能途径,DEGs主要在泛素蛋白转移酶活性、糖蛋白结合、泛素蛋白连接酶结合方面发挥作用。基于GEPIA数据库筛选mRNA差异显著表达基因45个,最后筛选出8个在乳腺癌中关键表达基因:NLN、POSTN、MAPT、MYO6、MAP1B、FBXO31、KIT、PIK3R1。以期为乳腺癌诱导的心血管疾病的研究和治疗提供潜在的治疗靶点。

功能富集分析表明,DEGs与泛素蛋白转移酶活性、糖蛋白结合、泛素蛋白连接酶结合方面密切相关。泛素转移酶和连接酶在靶蛋白的特异性识别以及泛素化系统活性的调控中起着最重要的作用。蛋白质泛素化是一种基本的翻译后修饰,调节几乎所有的细胞过程。泛素蛋白转移酶的异常与多种疾病有关,如癌症、帕金森、心肌炎等[5-7],而抑制心肌细胞泛素蛋白连接酶的降解,可改善活性氧诱导的心脏毒性[8]。糖基化修饰改变是癌症的标志之一,它导致肿瘤相关的甘聚糖或糖蛋白的产生。这些分子随后被分泌或膜脱落到血流中,从而成为肿瘤相关的标记物[9]。LOX-1是一种跨膜糖蛋白,在内皮细胞中,细胞黏附分子的表达增加,导致炎症细胞向内膜的附着和迁移增加,然后分化为巨噬细胞。血管收缩剂的增加、ROS的增加、内皮型一氧化氮 (NO) 的耗竭,导致内皮功能障碍的恶化。且抑制LOX-1已被证实能减轻炎症、氧化应激和动脉粥样硬化[10]。

通过紧密连接程度筛选得到了8个关键hub基因模块,NLN、POSTN、MAPT、MYO6、MAP1B、FBXO31、KIT、PIK3R1。NLN基因编码是金属肽酶M3蛋白家族的一个成员,研究表明其功能与脑肾素-血管紧张素系统及脑卒中的病理生理学有关[11-12]。POSTN是一种基质细胞蛋白,在各种正常成人和胎儿组织中均有表达。高水平的POSTN在心力衰竭,冠状动脉疾病和中风极为显著,因此可作为心血管疾病新的生物标志物[13-14]。MAPT基因编码微管相关蛋白τ,MAPT基因异常表达与多种疾病有关,如乳腺癌[15]、心肌肥厚[16]、脑血管疾病等[17]。MYO6是一种反向运动的肌动蛋白,参与了细胞内吞和肌动蛋白动力学调节等多种细胞过程。Wang等[18]证明敲除MYO6抑制乳腺癌细胞增殖,这与本研究结果一致。MAP1B属于微管相关蛋白家族的蛋白质。先前的研究证明MAP1B在神经系统的发育和功能中起着重要的作用,但是最近发现其与尿路上皮癌[19]和仔猪乳腺增生[20]也有关,因此在乳腺癌诱发的心血管中值得进一步研究。FBXO31在DNA损伤后G1期阻滞中起核心作用。特异性识别磷酸化细胞周期蛋白D1促进其泛素化和蛋白酶体降解,导致G1期阻滞,可以起到抑癌作用。上调miR-210逆转了FBXO 31对乳腺癌增殖的抑制作用[21]。KIT和PIK3R1作为在心血管和癌症疾病发挥作用的重要转录因子,在炎症、细胞分化、癌症、心血管疾病等均有影响[22-25]。并且最近研究表明PIK3R1驱动化生性乳腺癌伴随鳞状化的组织产生,为PIK3R1导致的乳腺癌可能存在其他病理性疾病提供了依据[26]。

4 结论

综上所述,通过一系列生物信息学分析,系统地探讨DEGs在乳腺癌-冠心病中发生或发展的作用,筛选和鉴定到参与乳腺癌发生或发展的8个冠心病相关hub 基因:NLN、POSTN、MAPT、MYO6、MAP1B、FBXO31、KIT、PIK3R1。这些DEGs可能参与乳腺癌诱导的冠心病的发生、发展过程。研究结果将有助于进一步研究肿瘤心脏病学的发病机制,开发新的治疗靶点和预后分子标记物。

猜你喜欢
泛素通路癌症
嗜肺军团菌效应蛋白质介导的新型泛素化过程
泛素链的体外制备、磷酸化修饰与标记方法
BCAA代谢异常与癌症的相关性研究进展
FBP1在癌症中的研究进展
体检发现的结节,离癌症有多远?
泛素化在心肌梗死后的心肌保护与促再生作用的研究进展
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
泛素化修饰在DNA 损伤修复中的功能研究进展