王 丹 沙 岩 葛东伟
(徐州医科大学医学信息学院,徐州 221004)
胰腺癌是一种恶性程度很高、预后极差的消化道恶性肿瘤,且男性发病率普遍高于女性。近年来,胰腺癌发病率和死亡率不断上升,已成为威胁人类生命健康的主要原因。由胰腺癌引发的一系列转移性疾病是导致患者死亡的重要原因,因此探明胰腺癌转移的调控因子及分子机制至关重要。microRNA(miRNA)是一类长约22 nt的非编码单链 RNA,通过与目标miRNA互补配对可以降解mRNA或抑制转录后翻译进而诱导基因沉默,miRNA的异常缺失或过表达与多种自身免疫性疾病的发生和发展密切相关[1]。研究报道miR-34a 既可以作为诱癌基因参与恶性肿瘤的发生和发育,又可作为抑癌基因参与控制恶性肿瘤的形成[2]。研究表明,miR-34a在胰腺癌中作为重要的抑癌基因,在胰腺癌患者中存在异常表达[3,4],与肿瘤的转移密切相关,但其与胰腺癌发生相关的确切靶分子机制尚未清楚。本研究运用生物信息学的分析方法预测与胰腺癌相关的miR-34a的靶基因及其分子调控网络,分析可能存在的生物学功能,以期为研究胰腺癌发生、发展的作用和相关调控机制奠定基础。
1.1生物信息学网站和软件 使用UCSC基因组在线软件工具(http://genome.ucsc.edu/)分析has-miR-34a在人类基因组中的位置及保守性。通过miRecords数据库(http://mirecords.biolead.org)对miR-34a进行靶基因预测[5]。为了降低数据的假阳性,运用miRNA靶基因预测工具DIANA-microT、Microlnspector、miRANDA、MirTarget2、miTarget、NBmiR-Tar、PicTar、PITA、RNA22、RNAhybrid以及TargetS-can/TargertScanS按照默认参数对miR-34a进行靶基因预测。只有至少被5种不同算法预测的交集才作为miRecords预测的靶基因。GeneCards(http://www.genecards.org/)可查询到与胰腺癌相关的致病基因,并将其同miRecords获得的预测基因再次取交集,获得同胰腺癌相关的预测靶基因。运用Oncomine在线工具分析靶基因在胰腺癌患者中的差异表达。DAVID 6.8数据库(https://david.ncifcrf.gov/)可以实现对预测的靶基因集合进行GO分析和基于信号传导通路的富集分析,通过Fisher Exect Test计算P值,筛选有统计学意义的生物学功能信号传导通路(P<0.05)。
1.2统计学处理 采用SPSS16.0软件对miR-34a RT-PCR结果进行统计学处理,独立样本采用t检验进行组间比较,P<0.05表明差异具有统计学意义。
2.1miR-34a在人类基因组中的位置及保守性分析 利用UCSC基因组在线工具获取miR-34a在人类基因组中位置(图1),miR-34a位于人类1p36.22染色体上 chr1∶9,151,668-9,151,777 位置,长度共110 bp,其核苷酸序列在人、猕猴、小鼠、狗、大象、鸡、西方爪蟾、斑马鱼八个物种中呈高度保守,表明其发生突变的概率低。
2.2筛选与胰腺癌发病相关的miR-34a靶基因 使用miRecords数据库对人miR-34a进行靶基因预测,得到5种算法预测的潜在交集靶基因有229个,同时检测得到确切的实验验证靶基因20个[5,6],分别为:AXIN2、AXL、BCL2、CCND1、CD44、CDK6、DLL1、E2F3、EPHA5、JAG1、MAP2K1、MET、MYB、MYC、 MYCN、NOTCH1、NOTCH2、SIRT1、VEGFA、WNT1,其中同预测的靶基因相同的有:AXL、BCL2、CCND1、CDK6、DLL1、E2F3、JAG1、MAP2K1、MET、NOTCH1、NOTCH2、SIRT1、VEGFA。将上述数据库中的两类靶基因取并集,并作为最终的数据库预测靶基因。同时,通过GeneCards在线数据库查询到与胰腺癌相关的致病基因共4 854个。最后将上述两个数据库获得的基因进行对比分析并取交集,筛选得到与胰腺癌发病相关的miR-34a潜在靶基因73个,如:BCL2、MYC、Met、CDK6、SIRT1等,本研究将针对这73个靶基因进行深入分析。
图1 miR-34a在人类基因组中位置和保守性分析Fig.1 Location and conservation analysis of miR-34a in human genome
2.3miR-34a靶基因在胰腺癌患者中的差异表达 运用Oncomine在线软件分析所获得靶基因在胰腺癌患者中的表达水平。以Met基因为例(图2),其差异结果具有统计学意义(P<0.01)。从图中可以看出Met基因在胰腺癌患者中表达水平与健康人群相比显著升高。
2.4GO功能富集分析 将miR-34a潜在调控靶基因与Genecards数据库交集得到的73个靶基因使用DAVID进一步进行生物学功能分析,将获得数据进一步筛选(P<0.05)得到GO数据分析数据结果,见表1。分子功能项结果显示,miR-34a靶基因存在于细胞过程调节、生物过程调节、生物过程负调控、器官发育、多细胞有机体发育、系统开发、解剖结构发育、神经发生、对外界刺激的反应、细胞代谢调节、转录调节与DNA依赖、细胞增殖正调控、细胞表面受体连接的信号转导、基因表达调控、基因细胞分化、胚胎发育等多个生物学过程中。
2.5KEGG信号转导通路富集分析 采用DAVID在线工具对胰腺癌的预测靶基因进行信号转导通路分析,并筛选得到19个靶基因富集通路,见表2。分别为肿瘤通路、结肠直肠癌通路、胶质瘤通路、黑色素瘤通路、膀胱癌通路、Notch信号通路、前列腺癌通路、子宫内膜癌通路、非小细胞肺癌通路、Wnt信号通路、甲状腺癌通路、胰腺癌通路、慢性髓性白血病通路、SNALL细胞肺癌通路、黏着斑通路、急性髓系白血病通路、背腹轴前移通路、细胞周期通路、黑色素生成通路,见表2。选取胰腺癌通路途径中靶基因绘制分布图进行举例说明,见图3。
图3 miR-34a靶基因在胰腺癌通路中的分布Fig.3 Distribution of predicted target genes of miR-34a in pancreatic cancer pathwayNote: ★.miR-34a target genes.
表1 miR-34a预测靶基因的GO富集分析Tab.1 Gene Ontology enrichment analysis of predicted target genes of miR-34a
表2 miR-34a预测靶基因KEGG信号通路转导分析Tab.2 Results of KEGG pathway of target genes regulated by miR-34a
近年来,miRNA在癌症中的作用机制已经成为研究热点,基因芯片有助于探究miRNA在多种癌症中的表达模式[7]。多项研究表明,miRNA参与细胞生长、增殖、分化和凋亡等多个生理过程[8,9],在癌症发生和发展中有重要作用,甚至能够预测肿瘤分类[10]。
Calin等[11]发现超过 50%的miRNA 位于肿瘤相关基因区域或脆性位点,这表明 miRNA在肿瘤的发生发展过程中发挥重要的调控作用。本研究对miR-34a在多个物种间成熟序列进行比对分析,发现物种间序列呈高度保守性,表示该基因在不同物种中可能发挥重要的调控作用。此外,通过Oncomine工具分析胰腺癌患者和健康人群miR-34a的靶基因Met的表达水平,发现其靶基因Met显著异常表达(P<0.01),提示其在胰腺癌的发生发展过程中可能扮演重要角色。
运用生物信息学软件预测miRNA靶基因,已经成为生物学研究的一种重要手段。现已开发出多种miRNA靶基因预测软件,但不同软件的算法不同,优缺点也有所侧重。本研究使用miRecords在线分析软件进行靶基因的预测,由于该软件结合了多个靶基因预测软件的结果,大大排除了假阳性的影响,准确性增高。近年来将Genecards数据库查询到的疾病相关因子的调控网络与生物信息学软件所获基因进行联合,为后续实验验证提供大量非常有价值的线索[12]。本研究将Genecards数据库中与胰腺癌相关的基因同miRecords分析出的潜在靶基因交集,共获得73个基因,包括BCL2、CDK6、SIRT1等。Jamieson等[13]研究发现,miR-34a在胰腺癌中具有抑癌基因的作用,它可以通过调控靶基因BCL2的表达进而调节细胞增殖、迁移及侵袭,诱导细胞凋亡。Nalls等[14]发现在胰腺癌细胞系中,应用甲基化抑制剂后可以使miR-34a 恢复表达并抑制下游靶基因BCL2、CDK6、SIRT1等表达,以及调控胰腺癌细胞的增殖、侵袭与凋亡。这也表明miR-34a及其靶基因对胰腺癌的临床诊断和治疗具有重要的指导意义。
GO富集分析表明靶基因存在多种生物学功能。多种肿瘤的研究表明,miR-34a异常表达时会抑制CDK4和CDK6基因的表达,从而促进细胞周期过程[15]。miR-34a可以靶向调控BCL2,诱导细胞凋亡[16]。KEGG信号传导通路研究发现,miR-34a靶基因富集于Wnt、Notch等多个信号通路,同时与结肠癌、胶质瘤、黑色素瘤、膀胱癌、非小细胞肺癌等多种肿瘤信号通路密切相关。其中一些信号传导通路已经被证实。上皮间质转化(Epithelial mesenchy-mal transition,EMT)在肿瘤发生过程中具有促进作用,miR-34a直接靶向抑制EMT诱导转录因子SNAIL,进而抑制EMT途径[17,18]。Siemens等[19]研究表明,c-kit不仅是miR-34a的靶基因,而且对肿瘤干细胞具有负调控作用。
综上所述,利用生物信息学在线分析软件所获得的信息能够对miRNA与疾病发生相关的研究发挥很好的前瞻性作用。本研究对miR-34a 进行序列分析、靶基因预测、GO富集分析和KEGG通路富集分析,结果表明在胰腺癌发病过程中miR-34a可能通过调控多个与胰腺癌发病相关的靶基因,并可能参与多条信号通路的调节,从而在胰腺癌中发挥抑癌基因的作用。本研究揭示miR-34a与靶基因信号通路可以作为胰腺癌发病机制中的重要生物学靶标,为miR-34a在胰腺癌发病中所涉及的靶基因调控网络研究提供理论依据,并为新药物靶点的开发和应用指明方向。