降解组测序技术及其研究进展

2017-02-18 09:28李法君
生物学教学 2017年4期
关键词:文库剪切位点

李法君

(山东省潍坊科技学院 262700)

微RNA(microRNA,miRNA) 是一类长度为19~25个核苷酸(nt)(一般为22个)的内源性非编码小分子单链RNA,具有高度保守性、时序性和组织特异性。通常,miRNA能与靶基因的mRNA序列部分或完全配对,在转录后水平上抑制mRNA翻译或诱导mRNA剪切降解。作为21世纪生命科学领域的重大发现之一,miRNA参与了动植物体内许多生化过程。迄今,人们已能通过转录组测序技术从生物体中获取大量的miRNA信息。然而,达成人类对miRNA生物学功能的利用还有赖于对其靶基因调控的实现。因此,如何确定miRNA的靶基因已经成为当前亟待解决的课题。传统miRNA靶基因的确定一般是通过生物信息学进行预测[1],但是该方法无法区分预测靶基因的真伪,所测得的结果必须经实验去伪存真,这就极大地影响了靶基因的探索效率[2];在一些特殊情况下,miRNA与靶基因间存在较高错配,该预测方法可能会丢失许多真实的靶基因。因此,生物信息学预测并不能全面、快速、真实地鉴定miRNA的靶基因。动物体中miRNA多通过与靶基因的3′-端的非翻译区结合来抑制翻译的进行。与之不同,植物体中的miRNA则是通过剪切的方式将目标mRNA降解。因此,降解组测序(degradome sequencing)技术就成为确定植物miRNA靶基因的有力工具。

1 降解组测序技术

降解组测序技术又称为大规模平行末端分析(parallel analysis of RNA ends,PARE),是一种新的鉴定miRNA靶基因的实验方法。它综合了高通量测序技术与生物信息学分析两者的优势,对植物体中由 miRNA 介导而产生的mRNA降解片段进行深度测序分析,从而高效、准确地筛选出与之相对应的靶基因。降解组测序技术包括两个主要环节,即降解组文库的构建与测序以及数据分析。基本原理[2,3]如下:植物体内绝大多数的miRNA通过剪切作用来调控靶基因的表达,剪切位点通常发生在miRNA与mRNA互补的第10或第11位核苷酸上。靶基因经过剪切后被分为两个部分,即5′-端剪切片段和3′-端剪切片段,其中3′-端剪切片段包括自由的5′-端单磷酸和3′-端poly(A)尾巴。RNA连接酶利用5′-端单磷酸将3′-端剪切片段与特定的5′-端接头序列连接,形成一新的单链RNA序列。利用oligo(dt)引物将该新的单链RNA序列反转录成cDNA序列,用PCR技术将其扩增,并利用限制性内切酶Mme I对上述PCR产物进行酶切,从而得到长度为20~21 nt的片段。将这些片段与3′-端双链DNA接头连接并继续进行PCR扩增,最终得到一个包含miRNA的靶基因3′-端剪切片段的文库(降解组文库)。随后对该文库进行高通量测序,并从测得的序列中去除接头序列,便可获得目的序列。利用CleaveLand、starBase、SeqTar、SoMART 和PAREsnip等分析软件对所测序列进行深入比对,可以直观地发现在mRNA序列的某个位点会出现一个波峰,而此处正是候选的miRNA剪切位点。其后在波峰的上、下游各选取15 nt的核苷酸序列,这样就得到一个大约30 nt的序列。将该序列反向互补并与测序物种的miRNA数据库比对,符合要求的匹配即为潜在miRNA的靶基因。

2 降解组测序技术研究进展

2.1 miRNA生成机制的调控 研究表明,初级miRNA(pri-miRNA)经过剪切便成为成熟的miRNA。在此过程中,有些pri-miRNA可被自身成熟的miRNA剪切加工,且大多数切割位点并不发生在10~11nt处,其中的分子机制还不完全明确。Meng等[4]通过对水稻的降解组数据研究发现,miR-161和miR-445d可以对自身的前体序列进行切割。原因可能在于,miRNA和前体序列之间通过这种反馈机制来调控miRNA的表达,从而与靶基因的表达相一致,进而调控靶基因的表达。虽然miRNA在生物体内的生成机制已有大量的研究报道,但尚有许多具体的环节不清楚。降解组测序技术将有助于从一个新的视角诠释miRNA的生物学生成机制。

2.2 miRNA靶基因的确定 2008年,German等[5]最先在拟南芥中运用降解组测序技术确定了miRNA的靶基因。在100个已经在拟南芥中证实的miRNA靶基因中,分别在野生型(WT)和xrn4突变型拟南芥花组织的降解组中检测到了94个和98个靶基因,初步证实了降解组测序在筛选miRNA基因方面的高效性;而在124个尚未确定的靶基因中,在WT和xrn4降解组中分别发现了31个和42个。为了确定上述基因是否真的是miRNA的靶基因,进而从中选取13个未确定基因用传统的RACE方法进行验证,结果显示其中的12个是miRNA的靶基因。Liu等[6]在不同发育时期的玉米穗中,通过降解组测序技术发现102个miRNA存在141个靶基因。上述结果表明,相比以前的生物信息学预测,降解组测序技术能高效准确地鉴定miRNA的靶基因。

2.3 miRNA家族靶基因具体位点的确定 miRNA功能具有高度的保守性,同一个miRNA家族的不同miRNA个体可能会作用于相同的靶基因,但具体的作用位点可能不尽相同。MADS-box 基因是一类在植物中广泛存在的同源异型基因,参与调控花和果实发育及成熟的多个过程。作为重要的转录因子,MADS-box 基因的表达受miR-444家族的调控。miR-444家族包括miR-444-b.1、miR-444-b.2和miR-444-c.2等多个亚型。Li等[7]在水稻中通过降解组测序技术表明,虽然不同miR-444亚型切割的基因相同,但是其切割后产生的序列片段数目却不同,原因在于不同亚型的切割位点不同。由miR-444-b.2/c.2介导的对Os02g36924靶基因(MADS-box基因的亚型之一)C1位点的切割所产生的序列片段数量最多,而miR-444-b.1在该基因C2位点上的切割丰度却远低于C1位点。这一结果清楚地表明:降解组测序在确定miRNA家族靶基因具体切割位点方面具有独特的技术优势。

2.4 抗逆性研究 近来,降解组测序技术也被用在植物的抗逆性研究中。Wang等[8]通过构建谷子干旱胁迫的miRNA转录组文库,发现了81个保守的和72个新发现的miRNA序列。进一步的降解组测序分析表明,它们所对应的靶基因分别为56和26个,为研究谷子在干旱胁迫下的基因调控网络奠定了基础。Chen等[9]在低氮胁迫的杨树中发现60个miRNAs(39个保守的,13个非保守的和8个新发现的)分别调控64个靶基因的表达,为研究杨树的低氮胁迫提供了基本的miRNA数据。此外,科研人员还运用降解组测序研究了大麦的干旱胁迫、小麦的寒冷胁迫、玉米的低氮胁迫和胡杨的盐碱胁迫等相关抗逆性过程。

2.5 生长发育研究 miRNA在生物体的生长发育过程中发挥着重要的调控作用。Song等[10]通过构建大豆种子不同发育时期miRNA转录组文库和降解组文库发现,207个注释的和26个新发现的miRNA的靶基因分别为145个和25个。其中新发现的miRNA Soy-25的靶基因为沉默抑制因子3基因,揭示大豆种子发育过程中的miRNA生物合成受反馈调控。由此可见,降解组测序为阐明大豆的种子发育机制提供了有力的技术支持。现在降解组测序已经广泛应用于植物生长发育过程的研究,如草莓的果实衰老、龙眼的胚胎发育、棉花的体胚发育、葡萄的开花结果和西红柿的果实成熟等。

3 展望

随着转录组测序技术的发展,植物体内不同组织和不同发育时期的mRNA序列相继得以明确。因此,基因组学中有关基因功能的研究势必将从单个基因功能的确定过渡到调控机制的研究。作为真核生物中普遍存在的转录后调控机制,miRNA主要通过调控靶基因的表达来实施自己的生物学功能。因此,靶基因的鉴定就显得格外重要。作为一项新兴的技术,降解组测序技术为准确鉴定miRNA的靶基因提供了一个有效的技术平台,已经在植物中得以应用,并取得了众多的科研成果。有趣的是,近来降解组测序技术也被应用于动物体miRNA靶基因的确定。Park等[11]在模式动物线虫中运用此技术证实,miR-249的靶基因为ZK637.6的转录本。Yang等[12]在日本囊对虾中运用降解组测序技术发现,miR-1和let-7的靶基因分别为核酸内切逆转录酶基因和跨膜蛋白14C-like基因。由此可见,降解组测序对于动物体miRNA靶基因的确定也具有一定的意义。相信随着不同物种miRNA序列的逐渐丰富,降解组测序将会发挥更大的作用,两者的有机结合将有助于解析生物体的转录后调控机制,进而为研究基因的调控网络奠定理论基础。

猜你喜欢
文库剪切位点
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
专家文库
东天山中段晚古生代剪切带叠加特征及构造控矿作用
优秀传统文化启蒙文库
TC4钛合金扩散焊接头剪切疲劳性能研究
关于推荐《当代诗坛百家文库》入选诗家的启事
二项式通项公式在遗传学计算中的运用*
一种改进的多聚腺苷酸化位点提取方法
专家文库