王淮 杨健康
【摘要】 目的 通过对皮肤黑色素瘤以及正常皮肤的m6A相关基因的表达和预后进行分析,探索皮肤黑色素瘤的发病机制。方法 从UCSC Xena上下载TCGA黑色素瘤病人和GTEx正常人皮肤组织的RNA表达数据,对文献报道的23个m6A相关基因进行差异表达分析;对表达有差异的基因使用R语言survival包进行生存分析,并得到与预后关系最密切的基因;采用GESA分析方法预测预后相关基因富集的基因集。结果 表达分析找到的差异基因共有21个,其中与预后关系最密切的基因只有3个,分别是IGF2BP1、METTL3和YTHDC2。在GSEA分析中,IGF2BP1、METTL3和YTHDC2主要富集在心脏肌肉收缩、核苷酸切除修复、RNA降解、泛素介导的蛋白质水解、基础转录因子、MTOR信号通路、非小细胞肺癌和胰腺癌等基因集。结论 m6A相关的基因中,IGF2BP1、METTL3和YTHDC2可能通过多种途径影响皮肤黑色素瘤的发生,未来可能可以作为该疾病的预后标志或潜在治疗靶点。
【关键词】 m6A基因;黑色素瘤;表达差异;生存分析;生物信息学分析
中图分类号:R394.3 文献标志码:A DOI:10.3969/j.issn.1003-1383.2020.12.002
【Abstract】 Objective To explore the pathogenesis of skin cutaneous melanoma by analyzing the expression and prognosis of m6A-related genes in cutaneous melanoma and normal skin.Methods RNA expression data of TCGA melanoma tissues and GTEx normal skin tissues were downloaded from UCSC Xena, and 23 m6A-related genes reported in literatures were analyzed for differential expression; survival analysis was carried out on genes with differential expression by using R language survival package, and genes most closely related to prognosis were obtained; GESA analysis method was used to predict the gene sets enriched in prognosis-related genes.Results A total of 21 differential genes were found by expression analysis, of which only 3 genes were most closely related to prognosis, namely IGF2BP1, METTL3 and YTHDC2. In GSEA analysis, IGF2BP1, METTL3 and YTHDC2 were mainly enriched in gene sets such as cardiac muscle contraction, nucleotide excision repair, RNA degradation, ubiquitin-mediated proteolysis, basic transcription factors, MTOR signaling pathways, non-small cell lung cancer and pancreatic cancer.Conclusion Among genes related to m6A, IGF2BP1, METTL3, and YTHDC2 may affect the occurrence of skin cutaneous melanoma through multiple pathways, and may be used as prognostic markers or potential therapeutic targets in the future.
【Key words】 m6A genes; cutaneous melanoma; expression difference; survival analysis; bioinformatics analysis
恶性黑色素瘤(malignant melanoma,MM)是较为常见的恶性肿瘤之一,起源于神经黑色素细胞,发病部位多见于皮肤、黏膜。其中皮肤黑色素瘤(skin cutaneous melanoma,SKCM)占全身肿瘤的1%,易发生淋巴结和血性转移,恶性程度高,病情发展快,预后差。因此早期诊断、早期治疗对本病患者起到至关重要的作用[1~2]。RNA甲基化修饰主要包括N6-甲基腺嘌呤(N6-methyladenosine,m6A)、N7-甲基鸟嘌呤(N7-methylguanosine,m7G)、5-甲基胞嘧啶(5-methylcytosine,m5C)、N1-甲基腺嘌呤( N1-methyladenosine,m1A)等,其中以m6A最为常见[3]。研究表明,m6A与急性髓细胞白血病(acute myeloid leukemia,AML)、原發性肝癌(hepatocellular carcinoma,HCC)、宫颈鳞状细胞癌(cervical squamous cell car-cinoma,CSCC)、乳腺癌(breast cancer)和前列腺癌(prostate cancer,PCa)等多种癌症密切相关[4]。m6A是指腺嘌呤(A)的第6位氮原子(N)发生甲基化修饰,这是一个动态可逆的过程,可调节RNA的剪接、加工、翻译以及降解等生理过程,从而影响癌症的发生发展[5]。本课题组对m6A相关基因进行表达差异分析得到与SKCM有关的m6A相关基因,绘制每个相关基因的生存曲线,探究相关基因对SKCM预后的影响,并利用基因富集分析(gene set enrichment analysis, GSEA)预测相关基因在SKCM发生发展过程中的作用,旨在探究m6A相关基因与皮肤黑色素瘤的关系,为SKCM的早期诊断以及寻找药物靶点提供理论基础。
1 资料与方法
1.1 数据来源
从UCSC Xena(https:/xenabrowsers.net/)下载得到RNA-seq的FPKM值表达矩阵,正常皮肤的数据来源于The Genotype-Tissue Expression(GTEx),黑色素瘤数据来源于癌症基因组图谱(the cancer genome atlas,TCGA)。上述表达矩阵来源于Toil流程[6]重新处理的RNA-seq原始数据,尽量减少了批次效应的影响。最终的合并数据集包括469例黑色素瘤样本和812例正常样本。
1.2 筛选差异表达基因
从已发表过的文章中收集到m6A相关的基因[7~9]共有23个,分别是:YTHDC1、IGF2BP1、IGF2BP2、IGF2BP3、YTHDF1、YTHDF3、YTHDC2、HNRNPA2B1、YTHDF2、HNRNPC、RBMX、METTL3、METTL14、WTAP、VIRMA、RBM15、RBM15B、FTO、ZC3H13、ALKBH5、PCIF1、CMTR1、CMTR2。从所有基因的表达矩阵中提取上述23个基因的表达数据。使用R语言limma包对数据集进行差异表达分析,以P<0.05為筛选条件。
1.3 基因表达与SKCM预后的关系
使用R语言survival包对SKCM病人的生存数据进行分析,分析差异表达基因与生存时间的关系,P<0.05说明基因与疾病生存率显著相关。
1.4 GSEA分析
根据基因在SKCM组织中的表达水平分为高表达组和低表达组,使用GSEA 3.0软件对IGF2BP1、METTL3和YTHDC2的表达数据进行分析,从而发掘京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)基因集与SKCM发生发展有关的机制。按照GSEA默认参数,置换检验1000次进行富集分析,将错误发现率(false discovery rates, FDR)<0.05的基因集作为显著富集基因集,最终得到可能受IGF2BP1、METTL3和YTHDC2表达影响的基因集。
2 结 果
2.1 差异基因筛选
正常皮肤和黑色素瘤的m6A相关基因的差异表达情况,如图1、图2所示。根据结果显示,23个m6A相关基因中FTO和METTL14的P值分别为0.686和0.938,不具有统计意义。因此最终得到m6A相关差异基因共21个。
2.2 基因表达与SKCM预后的关系
如图3所示,共3个基因与SKCM病人的生存时间相关,分别是IGF2BP1、METTL3和YTHDC2。根据结果,在生存年限相同的条件下,IGF2BP1基因低表达组的生存率高于高表达组;METTL3和YTHDC2基因高表达组的生存率高于低表达组。故可以初步将IGF2BP1、METTL3和YTHDC2作为评价SKCM预后的因素之一。
2.3 GSEA分析结果
结果见表1、图4。根据GSEA结果显示,与生存时间减少相关的IGF2BP1高表达组、METTL3低表达组以及YTHDC2低表达组主要富集在心脏肌肉收缩、核苷酸切除修复、RNA降解、泛素介导的蛋白质水解、基础转录因子、MTOR信号通路、非小细胞肺癌和胰腺癌等基因集。结果提示IGF2BP1、METTL3和YTHDC2可能通过影响核苷酸切除修复、RNA降解以及其他癌症过程,从而影响SKCM的发生发展。
3 讨 论
SKCM全球每年新发287 723例,死亡60 712例[10],预后极差。SKCM的发病原因还未明确,研究表明m6A对肿瘤的发生发展具有重要影响[11],因此通过生物信息学分析方法初步推测m6A在SKCM发病过程中的作用。
我们通过查阅文献,找到23个m6A相关基因,经过表达差异分析以及对基因表达与SKCM预后的影响分析,最终找到IGF2BP1、METTL3和YTHDC2这3个与SKCM发病和预后相关基因。
IGF2BP1是胰岛素样生长因子2 mRNA结合蛋白家族(insulin like growth factor 2 mRNA binding protein, IGF2BP)的重要成员之一,属于结合蛋白,可以选择性结合m6A甲基化修饰的mRNA。IGF2BP参与调控RNA的转运、翻译,细胞的增殖分化等重要生理过程[12]。有研究表明,IGF2BP1在多种肿瘤或肿瘤来源细胞中表达上调,在正常组织细胞中基本不表达[13]。我们的结果也显示正常皮肤组织中IGF2BP1表达低,而黑色素瘤中表达上调且表达上调组生存率也较低。根据GSEA富集结果发现,IGF2BP1与心肌收缩基因集密切相关,有可能通过此途径影响SKCM的发生发展。
甲基转移酶样蛋白3(methyltransferase-like 3,METTL3)属于甲基转移酶复合物,对RNA的m6A甲基化修饰形成起着至关重要的作用。有研究表明,METTL3通过MMP2影响肿瘤的侵袭迁移[14]。我们的结果显示METTL3在黑色素瘤中表达低于正常皮肤,低表达组生存率低。根据GSEA富集结果,发现METTL3与核苷酸切除修复、RNA降解、泛素介导的蛋白质水解等基因集关系密切,有可能通过影响这些基因集的功能从而在SKCM的发生发展中发挥作用。
YTH 结构域蛋白2(YTH domain-containing 2,YTHDC2)也属于结合蛋白,能够调控m6A位点识别,YTH蛋白家族的进化上保守的YTH结构域可以选择性识别m6A[15]。经过分析观察到YTHDC2在SKCM组织中低表达,低表达组生存率低。根据GSEA富集结果,发现YTHDC2与泛素介导的蛋白质水解、基础转录因子、MTOR信号通路等基因集关系密切,可能通过影响它们从而影响SKCM的发生发展。
本研究通过比较黑色素瘤与正常皮肤组织的基因表达数据得到m6A相关基因的表达差异情况,从中筛选出了表达有差异且与预后关系最密切的3个基因,接着对这3个基因进行了GSEA基因集富集分析。结果显示,IGF2BP1、METTL3和YTHDC2可能通過影响核苷酸切除修复、RNA降解、泛素介导的蛋白质水解、基础转录因子、MTOR信号通路等基因集的功能,从而参与SKCM的发生发展。这些基因为SKCM的诊断以及进一步研究SKCM的药物靶点提供了参考。
参 考 文 献
[1]韩娟娟,张新安,艾福录.m~(6)A RNA甲基化修饰异常在肿瘤中的作用[J/OL].中国生物化学与分子生物学报:1-16[2020-03-13].https://doi.org/10.13865/j.cnki.cjbmb.2019.11.1346.
[2]张玫茵,娄阁.N6-甲基腺嘌呤与癌症的研究进展[J].实用肿瘤学杂志,2019,33(4):357-360.
[3]地里呼玛尔·吐鲁洪,曾慧娟.m6A甲基化在肿瘤中的作用研究进展[J].东南国防医药,2019,21(4):402-407.
[4]王勇炫,王海伦,李晶.皮肤黑色素瘤临床与病理特征分析研究[J].中国医药科学,2018,8(13):225-227,240.
[5]唐智柳,石建伟,蔡美玉, 等.中国皮肤黑色素瘤发病及其影响因素分析[J].中国肿瘤,2014,23(10):829-833.
[6]VIVIAN J,RAO A A,NOTHAFT F A,et al.Toil enables reproducible,open source,big biomedical data analyses[J].Nat Biotechnol,2017,35(4):314-316.
[7]LI Y S,XIAO J,BAI J,et al.Molecular characterization and clinical relevance of m6A regulators across 33 cancer types[J].Mol Cancer,2019,18:137.
[8]ERDEM S,VALLE-GARCIA D,DHALL A,et al. PCIF1 Catalyzes m6Am mRNA Methylation to Regulate Gene Expression[J]. Mol Cell,2019,75(3):620-630.e9.
[9]TOCZYDLOWSKA-SOCHA D, ZIELINSKA M M, KURKOWSKA M, et al. Human RNA cap1 methyltransferase CMTr1 cooperates with RNA helicase DHX15 to modify RNAs with highly structured 5' termini[J]. Philos Trans R Soc Lond B Biol Sci, 2018,373(1762):20180161.
[10]宋毓平,张庆华,龚丹妮, 等.MUC16突变在皮肤恶性黑色素瘤患者预后中的作用分析[J].重庆医学,2019,48(19):3333-3336.
[11]李可心,黄常志. IGF2BP3在肿瘤中作用的研究进展[A].中国生物化学与分子生物学会2019年全国学术会议暨学会成立四十周年论文集[C].中国生物化学与分子生物学会,2019:91.
[12]彭彦茜,杜军,王红胜.m6A在肿瘤恶性生物学行为中的作用及靶向治疗策略[J].药学学报,2019,54(10):1771-1782.
[13]刘源,倪渐凤,李芳芳, 等.miRNA-196b靶向抑制IGF2BP1对肝癌HepG2细胞增殖和凋亡的影响及机制研究[J].癌症进展,2019,17(13):1557-1560.
[14]黄芳芳,周诺.METTL3在RNAm6A甲基化修饰的研究进展[J].生理科学进展,2019,50(6):458-463.
[15]徐岩岩.YTHDC2通过p38MAPK信号通路促进结直肠癌细胞的凋亡[D].天津:天津医科大学,2019.
(收稿日期:2020-08-11 修回日期:2020-11-11)
(编辑:梁明佩)