沈 瑞,李杰平,展会恩,彭剑娇,徐宏向,曾惠奇
急性髓系白血病(acute myeloid leukemia, AML)是成人最常见的急性白血病。近年来,尽管靶向治疗及干细胞移植等治疗手段极大改善了患者的预后,但是还有近一半的患者不能获得长期生存,其相关机制及治疗靶点仍有待进一步探索[1]。miRNA-155是一种功能广泛的小核糖核酸(ribonucleic acid,RNA),可参与机体的免疫应答、炎性反应、细胞分化等生物过程,并与肝癌、乳腺癌、淋巴癌等多种癌症的发生与进展密切相关[2]。有学者发现,miRNA-155在AML中亦呈高表达状态[3],但既往研究多着重于比较外周血中miRNA-155表达水平高低与临床指标的相关性,欠缺长期随访数据,潜在机制也尚未完全阐明。本研究拟借助公开的临床数据库—癌症基因组图谱(the cancer genome atlas, TCGA)和生物信息学手段分析miRNA-155表达水平对患者生存率的影响,以及miRNA-155调控AML的潜在分子机制,为AML的预防及治疗提供参考。
1.1 一般资料 从包含TCGA数据网站(http://www.linkedomics.org)下载AML数据集TCGA_LAMLmiRNASeq、TCGA_LAMLRNAseq和TCGA_LAML Clinical,筛选出同时包含miRNA-155表达水平测定和完整临床数据的病例共162例,按照miRNA-155表达水平由高到低排序,将排在前50%的81例设为高表达组,剩余81例设为低表达组,应用GraphPad Prism软件绘制两组患者生存曲线。
1.2 方法 利用Omisc软件,将上述患者的各RNA表达水平逐一与miRNA-155表达水平进行Pearson相关性检测,根据相关系数分别选取与miRNA-155正相关和负相关的前50个基因。将筛选出的100个相关基因导入String在线数据库(http://string-db.org/),进行生物学注释和分类,即完成基因本体(gene ontology, GO)富集分析(分为生物学过程、细胞组分和分子功能三个类型板块)和京都基因与基因组百科全书(the Kyoto encyclopedia of genes and genomes pathway, KEGG)通路富集分析,同时获得相关基因所编码的蛋白质之间的相互作用,从而找出处于网络核心的关键蛋白。
1.3 统计学处理 采用SPSS 17.0 软件进行数据处理,生存时间的比较使用Gehan-Breslow-Wilcoxon分析,相关基因筛选采用Pearson相关性分析。P<0. 05为差异有统计学意义。
2.1 两组年龄、性别及种族比较 高表达组与低表达组在年龄[(53.99±17.25)岁vs(53.73±15.25)岁]、性别构成(男性∶女性=42∶39vs37∶44)与种族构成(白人∶黑人∶亚裔=41∶15∶25vs44∶11∶26)方面比较,差异无统计学意义(P>0.05)。
2.2 miRNA-155表达水平差异对生存时间的影响 miRNA-155低表达组患者的中位生存时间长于miRNA-155高表达组,差异有统计学意义(P=0.045,图1)。
图1 miRNA-155对两组急性髓系白血病患者生存率比较
2.3 miRNA-155相关基因筛选结果 在检测的19,448个基因中,有2347个基因与miRNA-155存在相关性(P<0.05)。其中21号染色体开放阅读框71(chromosome 21 open reading frame 71, C21orf71)和芳基烃受体核转位样蛋白2(aryl hydrocarbon receptor nuclear translocator-like protein 2, ARNTL2)与miRNA-155表达水平的正相关系数最高(分别是r=0.634,P<0.05和r=0.526,P<0.05,图2A、B);溶质载体家族13成员5(solute carrier family 13 member 5, SLC13A5)和Ski样蛋白(ski-like protein, SKIL)与miRNA-155表达水平的负相关系数最高(分别是r=-0.50,P<0.05和r=-0.48,P<0.05,图2C、D)。
2.4 GO富集分析和KEGG通路富集分析 结果可见主要涉及的生物学过程包括DNA复制启动、DNA链延伸与DNA双链展开,主要涉及的分子功能为解旋酶活性、作用于DNA的催化活性和DNA复制起始的结合,主要涉及的细胞组分为微染色体维持复合体、三级颗粒和富含纤维蛋白-1的颗粒膜,主要涉及的信号通路为DNA复制、细胞周期调控和基础切除修复,见表1。
图2 与miRNA-155相关基因的表达水平
A、B. 和miRNA-155正相关且相关系数最高的2个基因;C、D. 和miRNA-155负相关且相关系数最高的2个基因
表1 完成基因本体富集分析和KEGG通路富集分析
2.5 蛋白相互作用网络 相关基因编码蛋白之间的相互作用网络见图3,其中微小染色体维持蛋白(microchromosome maintenance proteins,MCM)基因家族是处于网络核心的蛋白。
AML是血液系统常见的恶性肿瘤,近年来随着靶向治疗新药的应用及干细胞移植的开展,极大改善了患者的预后,但治疗复发性和难治性病例时,仍然缺少有效方法,大多数患者最终死于耐药和复发[4]。miRNA是一类内源性非编码RNA,成熟miRNA可与靶mRNA的3′U TR或5′U TR互补结合,并导致mRNA降解或抑制mRNA翻译,从而抑制基因表达[5]。越来越多的研究发现,miRNA的失调对肿瘤的形成和进展起着重要作用。其中miRNA-155在多种肿瘤的形成中扮演重要角色,例如在乳腺癌中,其过表达可使端粒重复序列结合蛋白1的表达受到抑制,导致端粒损伤,并影响细胞分裂[6];在甲状腺乳头状瘤中,其可通过激活Wnt/β-连环蛋白信号通路,促进肿瘤生长[7]。亦有学者发现,miRNA-155与AML患者预后不良有关[8],但缺少长期随访数据,且相关机制仍未完全阐明,miRNA-155能否作为一种提示AML远期预后的生物标志物仍有待于进一步探讨。
图3 相关基因编码蛋白相互作用网络
TCGA数据库是美国国家癌症研究所和国家人类基因组研究所在2005年发起的一个项目,在过去的十余年里,TCGA收录了加拿大和美国地区11 000多例肿瘤组织以及相匹配的正常组织,和约2.5 PB的高通量基因组测序结果,TCGA创建的基因组数据分析流程,可有效收集、选择和分析组织基因组改变,并结合收录患者的诊断和治疗信息,为改进癌症预防、早期检测和治疗提供了强大的研究基础[9]。本研究通过对TCGA数据库中162例AML患者的随访数据进行分析后发现,miRNA-155过表达会导致远期生存率降低,但具体机制尚不明确。为此本研究基于TCGA数据库中的基因检测结果,筛选出与miRNA-155表达密切相关的基因,并进行富集分析,以求挖掘出潜在机制。结果可见,C21orf71、ARNTL2、SLC13A5和SKIL与miRNA-155表达水平的相关性最为明显。其中C21orf71位于21号染色体,戴海萍[10]的研究发现,在AML患者中可存在11、21号染色体发生相互易位,这可导致其与伙伴基因一起转录新的融合蛋白,干扰造血细胞调控,促使AML病情的进展[11]。ARNTL2又名周期样因子,在细胞的昼夜节律调解中发挥重要作用,昼夜节律调节失常,可导致心血管疾病,癌症,代谢综合征和衰老等一系列疾病的发生[12]。SLC13A5是高亲和力的钠/柠檬酸协同转运蛋白,介导柠檬酸盐进入细胞,可以促进循环柠檬酸盐的利用,以产生能量和合成脂肪酸及胆固醇[13]。SKIL在响应细胞外信号的细胞分裂或分化中具有调节作用,有研究表明SKIL基因突变可引起胰腺肿瘤的形成[14]。这也提示miRNA-155可能通过上述靶基因在AML的进展中发挥作用。
GO富集分析结果与KEGG通路富集分析显示,miRNA-155的相关靶基因所编码的蛋白的功能多集中在细胞周期与DNA复制的全过程。蛋白网络分析可见,MCM蛋白家族处于网络的核心。MCM又称为DNA复制许可因子,MCM蛋白的早期分级可产生多种多聚体复合物,其具有不同的生物学意义,例如MCM467复合物显示具有体外解旋酶活性,其被MCM2亚基抑制。 MCM2-7六聚体在DNA复制起始和延伸中是必不可少的[15]。这也与miRNA-155靶基因的富集分析结果一致。
综上所述,本研究基于miRNA-155从数据库挖掘AML的潜在作用机制,发现 miRNA-155过表达与AML患者远期生存率降低有关,可能与其通过相关靶基因调节DNA的复制有关,这为 miRNA-155的临床价值提供了生物信息学证据支持。