miRNA的研究进展及其展望

2011-06-14 02:14姜雪鸥钟金城
中国草食动物科学 2011年4期
关键词:信息学分子生物

姜雪鸥,钟金城

(动物遗传育种学国家民委-教育部重点实验室,西南民族大学,四川成都610041)

小分子DNA(miRNA)是一类存在于动植物体内、大小为21~25 nt的内源性非编码单链小分子RNA,对生物体转录后的基因表达调控起关键作用[1]。1993年,首次在秀丽隐杆线虫中发现miRNA let-4;7年后,在果蝇中发现第2个miRNA let-7。在进化中的保守性分析使科学家惊异地发现miRNA let-7的形成至少需要有Drosha/DGCR8(Pasha)、Dicer等2种RNA酶(RNaseⅢ)的参与。Drosha/DGCR8定位于细胞核内,它能剪切miRNA前体转录物(pri-miRNA),从而释放出具有发夹结构、大小为70 nt左右的pre-miRNA,后者在转运受体Exportin-5(Exp5)的作用下被转运至细胞质,然后被胞质中的另一种RNaseⅢ蛋白Dicer剪切,最终被加工成成熟的miRNA[2]。动物的miRNA位于前体mRNA的内含子中,这种安排将使mRNA基因和内含子中miRNA共同转录。近年来,发现和鉴定的miRNAs越来越多,但植物miRNAs仅占很小一部分,且主要集中于拟南芥和水稻等少数模式植物中,植物miRNA的靶基因大多编码转录因子,与植物的生长、发育密切相关;而在动物和人中发现大量miRNA,已证实在动物的生长、发育和疾病发生等过程中起重要作用。

1 miRNA的生物功能

1.1 真核生物

近几年来,人们对miRNA的研究方兴未艾,进展十分迅速。有一些研究报道指出,miRNA在调节植物对环境胁迫如干旱、盐害和养分的胁迫反应等方面起着重要的作用[3]。成熟的miRNA先与一种称为RNA诱导沉默复合体(RNA-induced silencing complex,RISC)的复合物结合,再特异性地与目标mRNA结合,引起靶mRNA的降解。由于植物miRNA与其靶mRNA具有很高的碱基互补性,因而植物miRNA的作用方式可能更像小分子RNA干涉(small interfering RNA,siRNA),即RNA干涉对靶基因进行降解,miRNA所调节的靶基因控制着植物的根、叶、花等形态发生,细胞分化,输导组织形成等植物生长发育的各个方面,大多数miRNA通过调节转录因子影响细胞分化和器官发生[4]。

与植物相反,在动物细胞中大多数miRNA与其靶mRNA并不完全互补,miRNA则通过与对应mRNA的3′端非翻译区(3′UTR)结合阻止转录后的翻译,从而起到调节基因表达的作用。对动物的研究,从线虫时序发育中lin-4、let-7的功能被揭示以来,miRNA功能研究不断得益于miRNA基因功能丧失的突变体。bantam基因突变果蝇由于细胞数量减少(而不是细胞体积减小)而造成比野生型的个体小,相反,bantam过量表达则会导致果蝇翅膀和眼组织过度生长[5]。此后,Brennecke[6]等证实bantam miRNA通过控制前凋亡基因hid来促进细胞增殖和抑制凋亡。mir-14的缺陷加速了由细胞死亡激活剂Reaper诱导的细胞死亡,并导致了应急反应和脂肪代谢缺陷[7],发现mir-14与细胞凋亡和脂肪代谢有关。而迄今为止,已经预测出上千个哺乳动物miRNA的靶基因,它们对参与调控基因有着很强的嗜性,例如F$′G参与翻译抑制的蛋白、miRNA的组成成分和编码的转录因子的基因等,但也有许多编码结构蛋白和酶的基因,暗示miRNA在多种生理过程中具有调控作用。

在人类miRNA的研究中,Calin等[8]发现约有50%的miRNAs基因位于与肿瘤相关的染色体区域内,如染色体发生杂合性缺失的区域、发生重排和扩增及断裂点的区域等,提示miRNA基因的表达可能与肿瘤发生相关。此外,已有研究表明,miRNA对细胞的增殖、分化、凋亡和癌症发生有重要的调控作用[9],其在正常组织和肿瘤组织中的表达有着显著差异,有些miRNA会在肿瘤组织中有低表达,有些则在肿瘤组织中有高表达[10],这说明miRNA在肿瘤发生过程中起了至关重要的作用。Calin等[11]研究发现患有一种成年型B细胞慢性淋巴型白血病(CLL)的病人常有mir-15a、mir-16基因簇的缺失或表达下调,65%的CLL病人、50%的外套细胞淋巴瘤病人、16%~40%的骨髓瘤病人、60%的前列腺癌病人中有13 q14位点的缺失,显示miRNA可能起到抑癌基因作用。进一步研究发现mir-15a和mir-16可通过抑制BCL-2基因的表达水平而阻止癌症的发生。Lu等[12]研究发现,较少的miRNAs(约200个)表达谱就可以对人类癌症进行诊断和分类,与mRNA表达谱(5%)相比,其准确度高达70%。近来发现的一簇miRNA,mir-17-92多顺反子,定位于人B细胞瘤中DNA扩增区域,对其研究结果表明,mir-17-92簇可能为潜在的致癌基因。Takamizawa[13]等发现,肺癌患者中 let-7miRNA 表达水平降低,且let-7水平降低的患者在手术切除后存活时间更短;此外,在体外高表达let-7的肺腺癌细胞系A549可抑制肺癌细胞的生长。Johnson[14]等研究表明,let-7 miRNA在线虫和人瘤细胞系中负调控RasGTP酶癌基因家族,暗示let-7可能是肿瘤抑制基因。Chan[15]等发现mir-21在恶性脑瘤和神经胶质细胞瘤中显著高表达,并且mir-21可能通过阻止关键凋亡相关基因的表达而促进恶性表型。

1.2 原核生物

miRNA除了在多细胞生物中发挥重要的调节作用外,还广泛存在于单细胞生物中。单细胞生物中的miRNA,都可在体内和体外对靶标mRNA进行切割,这与植物中发现的miRNA一致,但与多细胞生物中的miRNA具有显著差异,这提示miRNA通路形成于这两条进化支系分离之前,而且单细胞生物中的miRNA是独立进化而来的[16]。近年来的研究表明,一些病毒也编码大量的miRNAs,它们在病毒的复制和感染过程中发挥着至关重要的作用[17]。

2 miRNA的预测与鉴定

自从第一个miRNA发现以来,已经出现了多种鉴定、预测、分析miRNA的方法,这些方法各有优缺点,主要有以下几种方法。

2.1 cDNA文库法

该方法是首先从细胞组织中提取总RNA,用聚丙烯酰胺凝胶进行电泳,回收大小为20~25个核苷酸的RNA分子,利用T4连接酶,直接将人工合成的3′和5′接头连接到RNA上,经PCR反转录扩增这些序列,建立miRNAs的cDNA文库,进行克隆、测序,然后用生物信息学软件定位其在基因组中的位置,并验证是否具有发夹结构的前体和该发夹结构在其它物种中的保守性,最后将具有发夹结构的小分子RNA进行Northern杂交等来检测其表达情况,将符合miRNA标准的小分子RNA鉴定为新的 miRNA[18]。

2.2 生物信息学分析

表1 第一代miRNA靶基因预测软件

表2 第二代miRNA靶基因预测软件

动植物中的miRNA可以用直接克隆的方法加以鉴定。一些实验室已经建立了不同组织、不同发育时期或不同生长条件下的miRNA基因文库[21]。但该方法对低丰度miRNAs的鉴定却相当困难,且不可避免大量的重复测序[22]。由于大部分成熟的miRNAs序列是高度保守的,所以可以通过表达序列标签(EST)和基因组序列(GSS)的生物信息学比对,来搜索或预测在其他生物中的未知miRNAs,再根据miRNAs与靶基因mRNAs完全或部分互补的特性预测其靶基因[23]。实验证明,生物信息学方法是预测和发现新的miRNA的一个有效方法,它是以基因组序列和计算机程序鉴定为基础的方法[24]。目前,通过各种计算机软件以及其他计算工具已经成功地预测和鉴定了动植物中的大多数miRNA[25]。近年来,许多实验室开发出了应用于预测miRNA及其靶基因的计算机软件(表 1,表 2)[26],这些软件各有优缺点,主要依据miRNA靶位点的保守性、miRNA与其靶位点的互补性、miRNA-mRNA双链之间的热稳定性及附近序列的二级结构等信息编写其程序。其中TargetScan提出了“种子区”的概念,增加了预测的精确度;miRanda是将miRNA-mRNA之间的序列匹配,保守性及热稳定性作为计算参数,有比较好的检出率,但是假阳性率也较高;DIANA-microT则主要考虑miRNA调控单个靶基因的情况,同时考虑中央突起以及miRNA在3′端与mRNA的结合;RNAhybrid的研究重点在RNA二级结构预测方面,能够更快速准确地计算miRNA-mRNA双链的自由能,降低了假阳性率;部分学者的研究结果显示,PicTar和TargetScan这两种软件的预测方法、预测的靶位点在整体上是相似的,而与其他多数软件的预测结果则相去甚远。但RNA22与其他算法不同,不考虑物种间的保守性,检出率较高。通过比较分析这些miRNA和靶基因预测软件,大致可将其分为第一代和第二代两大类预测软件。第一代miRNA及其靶基因预测软件主要侧重以下3点:①靶基因非翻译区的跨物种保守性;②靶基因与种子序列的互补性;③miRNA靶基因二聚体热力学稳定性。而第二代预测软件是在第一代预测软件的基础上大多从“突破物种间保守”来设计的,如microTar、miTarget等引入了机器学习方法来提取特征参数,尝试从统计学的角度更好地反应miRNA与靶基因相互作用的真实过程,以弥补保守性这个限制而丢失了的靶基因,取得了一定程度的成功。目前,很难评价哪种方法是最好的。尽管各种方法的基本原理都是相关的,但由于动物miRNA的靶位点很小,而且miRNA与靶位点是不完全互补,因此计算方法中极小的差别就能产生相差很远的预测结果。并且对于计算位点保守性的得分标准,3′UTR的邻位序列的定义和分析以及对3′UTR的长度和其核苷酸组成考虑等,不同方法间都有显著的差异,这也会造成结果的差异。

3 miRNA研究中存在的问题及展望

目前已鉴定的miRNA无论是在植物,还是动物中,其数目都非常的有限。因此,还有许多其他的miRNA有待于发现并阐明其功能。例如,现已有研究人员对于牛、羊、猪、家犬、大猩猩等哺乳动物的miRNA,在NCBI数据库中注册了其分子信息,可对这些哺乳动物进行深入的研究,这些miRNA在其各个时期都可能起着重要的作用,也可对其他物种进行研究,这为遗传学提供了新的研究方向与思想;而针对miRNA在一些疑难疾病,特别是肿瘤和癌症的发病机理中,随着研究的不断深入,这类小分子在生命活动中具有广泛的调节功能,同时有助于阐明药物反应的个体机制,也为药物设计与针对性治疗提供了潜在目标。

目前,一些实验室已经建立了不同组织、不同发育时期或不同生长条件下的miRNA基因文库,发现了许多miRNA。但在其功能的分析、最终的表型与表达等方面的研究,还是较少的,一方面是因为研究miRNA的成本太高,所需时间较长;另一方面是还没有真正地找到一种符合多数miRNA的研究方案。如何建立一种高效、准确地搜寻miRNA的方法是当前的研究重点。生物体中已知miRNA通常用的是直接克隆、芯片技术等生物学实验方法加以鉴定、验证的。其中直接克隆法针对鉴定那些高丰度的miRNAs有显著的效果,而对于丰度低、具有组织和阶段表达特异性的miRNA,以及由于自身的物理因素(如转录后修饰等)[19]而很难通过克隆的方法得到的miRNA,都很难用克隆方法进行鉴定,而且不可避免大量的重复测序,所以通过建cDNA文库的方法寻找miRNA具有明显的局限性。此外,一些内源性的miRNA以及mRNA和其他非编码RNA的降解产物对克隆也具有一定的干扰作用[20]。而芯片技术的应用是通过杂交,发现大量的miRNA分子,从而可以对这些被发现的miRNA分子进行下一步的分析,但是这种方法的缺点是无法直接得到miRNA靶基因、基因位置和前体序列等信息[27],这会影响对miRNA分子研究的后续工作。大部分成熟miRNAs序列在生物中是高度保守的。近年来,通过生物信息学方法来进行分析和预测,除了在对比过程中就能了解前体信息外,还能了解到其靶基因信息,而所得到的miRNA候选基因序列,大多都与已知的miRNAs序列高度相似,这说明根据miRNA的保守性和物种之间基因组的同源性,用生物信息学理论和方法筛选、寻找新的miRNA候选序列的方法能够在较短时间里寻找出一定量的新miRNA分子,速度快、通量大,是一条在生物体内寻找到更多miRNA分子的新思路和有效途径。但是生物信息学方法也有不足之处,虽经多年来的发展,同源序列搜索法已经取得了很大成功,然而要搜索与已知miRNAs/per-miRNAs在序列上和结构上同源的miRNAs/per-miRNAs,需有已知的miRNAs/per-miRNAs为参照,对于不与已知miRNAs/per-miRNAs同源的miRNAs/permiRNAs则行不通。

综上所述,无论是单纯的生物实验方法还是生物信息学方法,对于miRNA的研究都有优缺点,生物信息学分析得到的结果还需进一步的生物学实验验证,如果能够充分地把计算机、生物信息学等预测方法和生物学实验方法相互补充和有机结合,不但能够减少miRNA靶基因寻找的盲目性,节约实验成本,而且可以使人们能够更有针对性地研究感兴趣的miRNA,更加准确方便地阐明其在生命活动中的功能与意义。

目前,已对牛、羊、猪、家犬、人、大猩猩等哺乳动物的miRNA进行了较多的研究,在NCBI数据库中注册了其分子信息。通过对牛和羊已经注册的miRNA序列进行分析得到的一些筛选标准为:①新预测miRNA的前体能折叠成发夹二级结构;②新预测的miRNA与成熟的miRNA只能存在0~3个碱基差异;③在miRNA中不能存在环状结构;④miRNA中的A+U含量在30%~70%之间;⑤miRNA与其互补序列的差异不能多于6个;⑥发夹结构必须有较小的自由能。符合以上标准的序列可为以后预测到牛、羊等动物基因组中新的miRNA序列。

但在动植物中目前已鉴定出的miRNA,其数目非常有限。还有许多miRNA有待于发现并阐明其功能,这可能是今后遗传学、医学研究的一个新方向和热点。

[1]Bartel D P.MicroRNAs:Genomics,biogenesis,mechanism,and function[J].Cell,2004,116(2):281-297.

[2]Dugas D V,Bartel B.MicroRNA regulation of gene expression in plants[J].Current Opinion in Plant Biology,2004,7(5):512-520.

[3]Jung J H,Seo P J,Park C M.MicroRNA biogenesis and function in higher plants[J].Plant Biotechnology Reports,2009,3(2):111-126.

[4]Jones-Rhoades M W,Bartel D P,Bartel B.MicroRNAs and their regulatory roles in plants[J].Annual Review of Plant Biology,2006,57:19-53.

[5]Hipfner D R,Weigmann K,Cohen S M.The Bantam gene regulates Drosophila growth[J].Genetics,2002,161:15-27.

[6]Brennecke J,Hipfner D R,Stark A,et al.Bantam encodes a developmentaly regulated microRNA that controls cell proliferation and regulates the proapoptotic gene hid in Drosophila[J].Cell,2003,113(1):25-36.

[7]Xu P,Vernooy S Y,Guo M,et al.The Drosophila microRNA mir-14 suppresses cell death and is required for normal fat metabolism[J].Current Biology,2003,13(9):790-795.

[8]Calin G A,Sevignani C,Dumitru C D,et al.Human microRNA genesare frequently located at fragile sites and genomic regions involved in cancers[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(9):2999-3004.

[9]Hwang H W,Mendell J T.MicroRNAs in cell proliferation,cell death,and tumorigenesis[J].British Journal of Cancer,2006,94(6):776-780.

[10]王杰,李杰,鲁风民.MicroRNA在肿瘤方面的研究进展[J].国际遗传学杂志,2007,30(4):293-297.

[11]Calin G A,Dumitru C D,Shimizu M,et al.Frequent deletions and down regulation of micro-RNA genes miR15 and miR16 at 13q14 in chroniclymphocyticleukemia[J].ProceedingsoftheNationalAcademyof Sciences of the United States of America,2002,99(24):15524-15529.

[12]He L,Thomson J M,Hemann M T,et al.A microRNA polycistron as a potential human oncogene[J].Nature,2005,435(7043):828-833.

[13]Takamizawa J,Konishi H,Yanagisawa K,et al.Reduced expression of the let-7 microRNAs in human lung cancers in association with shortened postoperative survival[J].Cancer Research,2004,64(11):3753-3756.

[14]Johnson S M,Grosshans H,Shingara J,et al.RAS is regulated by the let-7 microRNA family[J].Cell,2005,120(5):635-647.

[15]Chan J A,Krichevsky A M,Kosik K S.MicroRNA-21 is an antiapoptotic factor in human glioblastoma cells[J].Cancer Research,2005,65(14):6029-6033.

[17]Zhao T,Li G,Mi S,et al.A complex system of small RNAs in the unicellular green alga Chlamydomonas reinhardtii[J].Genes&Development,2007,21(10):1190-1203.

[18]赵朴,郑玉姝,刘兴友.病毒编码的miRNAs研究进展[J].中国生物杂志,2007,27(8):92-95.

[19]李成梅,郑继刚,杜桂森.miRNA:一种新的基因表达调节子[J].遗传,2004,26(1):133-136.

[20]Yang Z,Ebright Y W,Yu B,et al.HEN1 recognizes 21~24 nt small RNA duplexes and deposits methyl group onto the 2′OH of the 3′terminal nucleotide[J].Nucleic Acids Research,2006,34(2):667-675.

[21]Wang J F,Zhou H,Chen Y Q,et al.Identification of 20 microRNAs from Oryza sativa[J].Nucleic Acids Research,2004,32(5):1688-1695.

[22]Arazi T,Talmor-Neiman M,Stav R,et al.Cloning and characterization of micro-RNAs from moss[J].the Plant Journal,2005,43(6):837-848.

[23]Zhang B H,Pan X P,Cannon C,et al.Conservation and divergence of plant microRNA genes[J].the Plant Journal,2006,46(2):243-259.

[24]Li W,Ruan K.MicroRNA detection by microarray[J].Analytical and Bioanalytical Chemistry,2009,394(4):1117-1124.

[25]Xie F L,Huang S Q,Guo K,et al.Computational identification of novel microRNAs and targets in Brassica napus[J].Febs Letters,2007,581(7):1464-1474.

[26]Qiu C X,Xie F L,Zhu Y Y,et al.Computational identification of microRNAs and their targets in Gossypium hirsutum expressed sequence tags[J].Gene,2007,395(1):49-61.

[27]夏伟,曹国军,邵宁生.MicroRNA靶基因的寻找及鉴定方法研究进展[J].中国科学,2009,39(1):121-128.

[28]赵东宇,王岩,罗迪.生物信息学中的MicroRNA预测研究[J].吉林大学学报,2008,26(3):276-280.

猜你喜欢
信息学分子生物
生物多样性
生物多样性
上上生物
鸡NRF1基因启动子区生物信息学分析
分子的扩散
第12话 完美生物
初论博物馆信息学的形成
“精日”分子到底是什么?
米和米中的危险分子
中欧医学信息学教学对比研究