朱克明 杨艳华
摘要:转座子是存在于染色体DNA上可自主复制和位移的基本单位。简单介绍了转座子的种类、结构和特性, 综述了MITEs转座子的研究进展及其应用。
关键词:植物;MITEs转座子;种类;结构;特性
中图分类号:Q784 文献标识码:A 文章编号:0439-8114(2015)22-5497-04
Abstract: The transposon, existing in the chromosome DNA, is the basic unit of self-duplication and displacement. In this review, the category, the structure, and the characteristic of the transposon were introduced, and the research progress and application of plant MITEs transposon were summarized.
Key words:plant; MITEs(miniature inverted-repeat transposable elements); category; structure; characteristic
1951年美国的McClintock在玉米中首先发现了DNA转座子(DNA-transposon),以后陆续在矮牵牛、金鱼草、甜豌豆等其他高等植物和动物中也证实了转座子的存在。另外,在一些多细胞绿藻中也发现了转座子的存在。研究证实,在高等真核生物中转座子构成了其基因组的重要组成部分,例如人类基因组的45%,玉米基因组的60%都是由转座子构成的[1,2]。虽然转座子在水稻和拟南芥的基因组中所占的比例较低,但仍然大量存在,例如水稻基因组的29%是由转座子构成的[3]。尽管转座子的研究已经有50多年的历史,但是转座子在基因组进化中的作用尚不清楚。随着分子生物学和分子遗传学的不断发展,人们能够从分子水平上研究转座子的结构与功能,对转座子本质的认识不断深化,也使转座子的应用前景更加广阔。近年来,转座子的应用研究日益受到人们的重视,许多研究表明,转座子在许多植物的基因和基因组进化中起着重要作用[4-12]。
1 转座子的种类和特性
转座子根据其转座方式的不同可以分为两类:类型Ⅰ转座子(Class I),又称作反转录转座子(Retrotransposon),其转座过程以RNA为中间媒介,将原有的元件复制并粘贴到新的位点,这类转座子在基因组中一般呈多拷贝分布;类型Ⅱ转座子(Class II),也称作DNA转座子(DNAtransposon),是以DNA为媒介,将元件从初始位置剪切出来,单链的或双链的,然后粘贴到新的位点,其拷贝数一般较少[13]。
1.1 反转录转座子
反转录转座子其转座过程是转座因子DNA先被转录成RNA,再借助反转录酶(RNaseH)反转录成DNA,之后插入到新的染色体位点,从而引起基因的突变或重排。因为反转录转座子是通过复制的方式实现转座,每转座一次,其拷贝数就增加一份,因而极大地增加了植物基因组的大小,是构成植物基因组的主要成分。Sanmiguel等[14]依据对玉米核基因组基因间填充成分研究的结果推断,高等植物基因组大小的差别主要是由基因间填充的反转录转座子拷贝数的多少造成的。反转录转座子主要包括长末端重复(Long terminal repeat, LTR)反转录转座子和非长末端重复(Non-long terminal repeat,Non-LTR)反转录转座子。LTR根据其编码序列的结构可以进一步分为Copia和Gypsy,Non-LTR包括LINEs(Long interspersed elements)和SINEs(Short interspersed elements)两类[8,9]。
1.2 DNA转座子
DNA转座子是以DNA-DNA方式转座的转座子,可通过DNA复制或直接切除两种方式获得可移动片段,重新插入基因组DNA中,导致基因的突变或重排,但一般不改变基因组的大小。DNA转座子根据转座的自主性又分为自主转座子和非自主转座子,前者本身能够编码转座酶而进行转座,后者则要在自主转座子存在时才能够实现转座。玉米的Ac/Ds体系就是典型的一例。Ac(Activator)属于自主转座子,Ds(Dissociation)属于非自主转座子,只有在Ac存在时,Ds才能转座。从结构上看,MITEs (Miniature inverted-repeat transposable elements)属于典型的非自主性DNA转座子。
2 MITEs转座子的研究概况
2.1 MITEs转座子的发现
在分析玉米wx-B2突变的插入时,发现一个短的转座子(128bp)在基因组中大量存在[15]。这些转座子有14 bp的TIRs以及两侧有3 bp的TSDs。然而,这些转座子的序列与已知任何的TE,甚至在TIR区域都没有相似性。引人注目的是,不同于任何其他含有TIRs的TEs,这些转座子在玉米基因组中具有较高的拷贝数[15]。这个转座子家族被命名为Tourist。两年后,通过计算分析草本基因组时,发现命名为Stowaway的另一类型转座子的几个家族[16]。Stowaway转座子的TSDs是一个不可变并含有二核苷酸“TA”,与单子叶植物及双子叶植物的基因相关联。随后在真菌、人类、蚊子、甲虫、硬骨鱼等多种生物中也陆续证实了MITEs的存在。截至2001年,已确定的MITEs可进一步被分为七类:Tourist、Stowaway、Gaijin、Castaway、Ditto、Wanderer和Explorer。最近, 在苹果中发现了一类新的MITEs转座子Spring[17]。
2.2 MITEs转座子的特征
从结构上看,MITEs属于典型的非自主性DNA转座子。它们一般较短(100~700 bp),含有类似于DNA转座子的末端倒转重复(Terminal inverted repeats,TIRs,10-30 bp)和插入位点复制区(Target site duplications,TSDs,2-3bp)。其中大部分MITEs长度在400 bp左右,同时其侧翼具有相似的反向重复,例如:
5′GGCCAGTCACAATGG..~400 nt..CCATTGTGACTGGCC 3′
3′CCGGTCAGTGTTACC..~400 nt..GGTAACACTGACCGG 5′
2.3 MITEs转座子的鉴定
20世纪90年代中期,随着大量基因组序列的公布,MITE家族的数量也迅速增长[18]。需要有专门的软件,以便在一个较大的基因组中来确定转座子MITEs的结构特征。FINDMITE软件使用的是平均大小为829 bp的序列,并成功地在蚊子基因组中找到了MITE家族[19-21]。该软件要求用户预先定义TSD序列或长度、TIR的长度以及TIRs之间的最小距离。不符合预先设定的参数、TIRs序列有大量变异或失去TSDs的转座子很可能会漏掉[22]。MUST软件(MITE Uncovering SysTem)是基于字符串匹配,在500 bp长度的片段中搜素TIR结构[23]。然后,验证是否该区域两侧有成对的TSD。当检索完所有候选转座子,MUST根据TIRs之间的序列相似性将转座子分为不同家族。FINDMITE软件,由于基因组中TE结构比较复杂,它可能会产生大量的假阳性和假阴性[24]。MITE-Hunter软件利用多重序列比对来筛选序列,另外符合MITE特定标准,但有相似的侧翼序列。MITE-Hunter软件将候选序列归为不同家族,并建立共识序列。在水稻基因组中,MITE-Hunter软件的假阳性率为4.4%~8.3%,FINDMITE软件的假阳性为85%,MUST软件的假阳性率为86%[24]。为了减少MITEs高拷贝数而引起的计算冗余,开发了MITE Digger软件,该软件可以全基因组鉴定MITE家族。运用该软件处理水稻基因组的时间减少到15 h左右,而且假阳性率(1.8%)和假阴性率(0.9%)比较低[25]。
3 MITEs在实际研究中的应用
转座子插入是基因组中频繁发生的事件。据估计,水稻两个亚种在分化后基因组分别增大2%和6%就是由于LTR转座子插入造成的[26]。在水稻基因组中,转座子约占26%,Class I和Class II分别为15%和11%[27]。从拷贝数上看,Class II要多于Class I,其主要原因在于水稻基因组中含有约100 000份拷贝的MITEs,占据了水稻转座子的71.6%及将近20%的核苷酸序列长度,是水稻基因组中含量最多的转座因子[28,29]。对水稻4号染色体的分析表明,MITEs约占重复DNA总量的50%[30]。由于MITEs较小而不能编码任何蛋白质,尚不确定它们是如何复制及如何移动到一个新的位置,或许较大的转座子能够编码转座所必需的酶及识别相似的反向重复。在水稻中某些品系的突变就是MITEs在基因中的插入引起的。对于系统发育研究而言,MITEs是比较好的分子标记,首先它们一般长度较短(100~700 bp),并且作为一种可移动因子极少受到选择作用,进化速率更快、信息量更大,适合于低分类等级的研究;其次,MITEs分布极其广泛,是水稻基因组中最多的转座因子,便于找到适合研究的片段;此外,从分布区域上看,MITEs主要分布于染色体臂的常染色质区,如基因富集区[5, 30],便于用EPIC-PCR策略去筛选一些位于内含子中的MITEs用于分析。总之,对于稻属内较低分类等级物种的系统发育和群体遗传学研究而言,MITEs是较为理想的一种分子标记。
同时MITEs也是植物基因组的一个重要组成部分,如MITEs中的“Stowaway”家族占水稻基因组的2%[29]。由于MITEs存在极高的拷贝数和插入位点多态性,因而被认为是水稻中等位基因多态性的主要来源[31]。MITEs在影响基因表达方面具有重要作用[4,15,32]。由于MITEs多分布于基因富集区域,如5′-侧翼区、3′-侧翼区和内含子区段,这种现象在禾本科植物中表现尤为明显[32-34]。MITEs插入可能会改变基因的起始或终止序列,甚至转录起始或编码序列[4,22,35,36]。如水稻的一个抗病基因家族Xa21包含多个转座子(例如MITEs和LTR反转录转座子),它们插入到不同的基因中,由此产生高度变异使得该家族的一些成员又进化出新的抗病性[37]。
一系列研究表明,MITEs插入基因组某个特定位置能为系统发育重建提供重要信息,只要它们具有同源性[38,39]。由于MITEs插入后再发生切除的频率相当低[4,40],只要MITEs不从基因组中切除,则会成为该基因组的一个标记(Marker),因而MITEs的存在与否对推断物种之间的系统发育关系非常有用[4,40],可以用来探讨一些物种的进化历史[41,42]。
近年来,随着亚洲栽培稻两个亚种基因组测序工作的完成,部分研究从基因组角度探讨了两个亚种的起源及分化时间[26,43-45]。Ma等[26]以非洲栽培稻Oryza glaberrima的序列为参照,分析了O.sativa ssp. indica和O.sativa ssp. japonica基因组的同源序列,发现这两个亚种从它们的祖先种分化出来后,基因组分别增大了2%和6%。他们利用随机选择的24个基因的核苷酸序列,估测亚洲栽培稻两个亚种的分化时间约为0.44 MYA左右,非洲栽培稻和亚洲栽培稻的分化时间约为0.64 MYA。Zhu等[45]测定了4个单拷贝核基因(Adhl及3个未注释基因)的内含子序列,构建了稻属A基因组8个物种的系统发育关系。用分子钟方法估测亚洲栽培稻和非洲栽培稻,以及亚洲栽培稻的两个亚种的分化时间分别为0.7 MYA和0.4 MYA左右。
研究表明,转座子在哺乳动物的基因调节、产生新的外显子及新的基因方面具有积极作用[46-48]。也有研究表明,转座子对基因变异及产生新的功能亦具有积极的作用[7,11,49-54]。另外,大约4%的人类蛋白质编码基因含有转座子,这表明转座子对基因进化具有重要影响。因此,阐明转座子在生物物种中的生物重要性值得进一步的研究和探讨。
参考文献:
[1] BI?魪MONT C, VIEIRA C. Genetics: Junk DNA as an evolutionary force[J]. Nature, 2006, 443(7111): 521-524.
[2] LOCKTON S, GAUT B S. The contribution of transposable elements to expressed coding sequence in Arabidopsis thaliana[J]. Journal of Molecular Evolution, 2009, 68(1):80-89.
[3] MESSING J, BHARTI A K, KARLOWSKI W M, et al. Sequence composition and genome organization of maize[J]. Proc Natl Acad Sci, 2004, 101(40):14349-14354.
[4] WESSLER S R, BUREAU T E, WHITE S E. LTR-retrotransposons and MITES: Important players in the evolution of plant genomes[J].Current Opinion in Genetics & Development,1995, 5(6): 814-821.
[5] ZHANG Q, ARBUCKLE J, WESSLER S R. Recent, extensive, and preferential insertion of members of the miniature inverted-repeat transposable element family Heartbreaker into genic regions of maize[J]. Proc Natl Acad Sci, 2000, 97(3):1160-1165.
[6] CASACUBERTA J M, SANTIAGO N. Plant LTR-retrotransposons and MITEs: Control of transposition and impact on the evolution of plants genes and genomes[J]. Gene, 2003, 311: 1-11.
[7] SAKAI H, TANAKA T, ITOH T. Birth and death of genes promoted by transposable elements in Oryza sativa[J]. Gene, 2007, 392(1-2): 59-63.
[8] WICKER T, SABOT F, HUA-VAN A, et al. A unified classification system for eukaryotic transposable elements[J]. Nature Reviews Genetics, 2007, 8(12):973-982.
[9] PARISOD C,ALIX K,JUST J,et al.Impact of transposable elements on the organization and function of allopolyploid genomes[J].New Phytologist,2010,186(1):37-45.
[10] LISCH D.How important are transposons for plant evolution?[J].Nature Reviews Genetics,2013,14(1):49-61.
[11] FATTASH I,ROOKE R,WONG A,et al. Miniature inverted-repeat transposable elements: discovery, distribution, and activity[J].Genome,2013,56(9):475-486.
[12] CHEN J,HU Q,ZHANG Y,et al. P-MITE:A database for plant miniatureinverted-repeat transposable elements[J].Nucleic Acids Research, 2014, 42:D1176-D1181.
[13] FINNEGAN D J. Transposable elements[A]. LINDSLEY D L, ZIMM G G. The genome of Drosophila melanogaster[M]. New York: Academic Press, 1992.
[14] SANMIGUEL P,TIKHONOV A,JIN Y K,et al. Nested retrotransposons in the intergenic regions of the maize genome[J]. Science,1996,274(5288):765-768.
[15] BUREAU T E, WESSLER S R. Tourist: A large family of small inverted repeat elements frequently associated with maize genes[J]. Plant Cell, 1992, 4(10): 1283-1294.
[16] BUREAU T E, WESSLER S R. Mobile inverted-repeat elements of the Tourist family are associated with the genes of many cereal grasses[J]. Proc Natl Acad Sci, 1994, 91(4): 1411-1415.
[17] HAN Y, KORBAN S S. Spring: A novel family of miniature inverted-repeat transposable elements is associated with genes in apple[J]. Genomics, 2007,90(2): 195-200.
[18] FESCHOTTE C, ZHANG X, WESSLER S R. Miniature inverted-repeat transposable elements(MITEs) and their relationship with established DNA transposons[A]. CRAIG N, CRAIGIE R, GELLERT M, et al. Mobile DNA II[M]. Washington DC: American Society of Microbiology Press, 2002.
[19] TU Z. Eight novel families of miniature inverted repeat transposable elements in the African malaria mosquito,Anopheles gambiae[J]. Proc Natl Acad Sci,2001,98(4):1699-1704.
[20] NENE V,WORTMAN J R,LAWSON D,et al. Genome sequence of Aedes aegypti, a major arbovirus vector[J].Science,2007,316(5832): 1718-1723.
[21] AMUNDSEN K,ROTTER D,LI H M,et al. Miniature inverted-repeat transposable element identification and genetic marker development in Agrostis[J].Crop Science,2011,51:854-861.
[22] SANTIAGO N,HERRAIZ C,GONI J R,et al. Genome-wide analysis of the emigrant family of MITEs of Arabidopsis thaliana[J].Molecular Biology and Evolution,2002,19(12): 2285-2293.
[23] CHEN Y, ZHOU F, LI G, et al. MUST: A system for identification of miniature inverted-repeat transposable elements and applications to Anabaena variabilis and Haloquadratum walsbyi[J]. Gene, 2009, 436(1-2): 1-7.
[24] HAN Y, WESSLER S R. MITE-Hunter: A program for discovering miniature inverted-repeat transposable elements from genomic sequences[J]. NucleicAcids Res, 2010, 38(22): e199.
[25] YANG G. MITE Digger, an efficient and accurate algorithm for genome wide discovery of miniature inverted repeat transposable elements[J]. BMC Bioinformatics, 2013, 14:186.
[26] MA J, BENNETZEN J L. Rapid recent growth and divergence of rice nuclear genomes[J]. Proc Natl Acad Sci, 2004, 101(34): 12404-12410.
[27] JIANG N, BAO Z, ZHANG X, et al. An active DNA transposon family in rice[J]. Nature, 2003,421(6919):163-167.
[28] TURCOTTE K, SRINIVASAN S, BUREAU T. Survey of transposable elements from rice genomic sequences[J]. Plant Journal, 2001, 25(2): 169-179.
[29] MAO L, WOOD T C, YU Y, et al. Rice transposable elements: A survey of 73,000 sequence-tagged connectors[J]. Genome Research, 2000, 10(7): 982-940.
[30] FENG Q, ZHANG Y, HAO P, et al. Sequence and analysis of rice chromosome 4[J]. Nature, 2002, 420(6913): 316-320.
[31] WESSLER S R. Plant transposable elements, A hard act to follow[J]. Plant Physiology, 2001, 125: 149-151.
[32] HU J, REDDY V S, WESSLER S R. The rice R gene family: two distinct subfamilies containing several miniature inverted-repeat transposable elements[J]. Plant Molecular Biology, 2000, 42(5): 667-678.
[33] BUREAU T E, RONALD P C, WESSLER S R. A computer based systematic survey reveals the predominance of small inverted-repeat elements in wild-type rice genes[J]. Proc Natl Acad Sci, 1996, 93(16): 8524-8529.
[34] TARCHINI R, BIDDLE P, WINELAND R, et al. The complete sequence of 340 kb of DNA around the rice Adh1-Adh2 region reveals interrupted colinearity with maize chromosome 4[J]. Plant Cell, 2000, 12(3):381-391.
[35] YANG G,DONG J,CHANDRASEKHARAN MB,et al. Kiddo,a new transposable element family closely associated with ricegenes[J]. Molecular Genetics and Genomics,2001,266(3): 417-424.
[36] AMRANI A E, MARIE L, A?魵NOUCHE A, et al. Genome-wide distribution and potential regulatory functions of AtATE, a novel family of miniature inverted-repeat transposable elements in Arabidopsis thaliana[J]. Molecular Genetics and Genomics, 2002, 267(4): 459-471.
[37] RICHTER T E,RONALD P C.The evolution of disease resistance genes[J].Plant Molecular Biology,2000,42(1):195-204.
[38] IWAMOTO M,NAGASHIMA H,NAGAMINE T,et al.A Tourist element in the 5′-flanking region of the catalase gene CatA reveals evolutionary relationships among Oryza species with various genome types[J].Molecular Genetics and Genomics, 1999,262(3):493-500.
[39] PETERSON G,SEBERG O. Molecular evolution and phylogenetic application of DMCI[J]. Molecular Phylogenetics and Evolution, 2002, 22(1): 43-50.
[40] KANAZAWA A, AKIMOTO M, MORISHIMA H, et al. Inter-and intra-specific distribution of Stowaway transposable elements in AA-genome species in rice[J]. Theoretical and Applied Genetics, 2000, 101(3): 327-335.
[41] BATZER M A,DEININGER P L.Alu repeats and human genomic diversity[J].Nature Reviews Genetics,2002,3(5):370-379.
[42] KAZAZIAN H H. Mobile elements: Drivers of genome evolution[J]. Science, 2004, 303(5664): 1626-1632.
[43] TANG J B, XIA H A,CAO M,et al. A comparison of rice chloroplast genomes[J]. Plant Physiology,2004,135(1):412-420.
[44] VITTE C, ISHII T, LAMY F, et al. Genomic paleontology provides evidence for two distinct origins of Asian rice (Oryza sativa L.)[J]. Molecular Genetics and Genomics, 2004, 272(5): 504-511.
[45] ZHU Q H, GE S. Phylogenetic relationships among A-genome species of the genus Oryza revealed by intron sequences of four nuclear genes[J]. New Phytologist, 2005, 167(1): 249-265.
[46] MAKALOWSKI W. Genomic scrap yard: How genomes utilize all that junk[J]. Gene, 2000, 259(1-2): 61-67.
[47] BRANDT J, SCHRAUTH S, VEITH A M, et al. Transposable elements as a source of genetic innovation: Expression and evolution of a family of retrotransposon-derived neogenes in mammals[J]. Gene, 2005, 345(1): 101-111.
[48] BRANDT J, VEITH A M, VOLFF J N. A family of neofunctionalized Ty3/gypsy retrotransposon genes in mammalian genomes[J]. Cytogenetic and Genome Research,2005,110(1-4): 307-317.
[49] BRITTEN R. Transposable elements have contributed to thousands of human proteins[J]. Proc Natl Acad Sci, 2006, 103(6): 1798-1803.
[50] BUREAU T E, WESSLER S R. Stowaway: A new family of inverted repeat elements associated with the genes of both monocotyledonous and dicotyledonous plants[J]. Plant Cell, 1994, 6(6): 907-916.
[51] IWAMOTO M, NAGASHIMA H, NAGAMINE T, et al. P-SINEl-like intron of the CatA catalase homologs and phylogenetic relationships among AA-genome Oryza and related species[J]. Theoretical and Applied Genetics, 1999, 98(6): 853-861.
[52] MCCLINTOCK B. Chromosome organization and gene expression[J]. Cold Spring Harbor Symposia on Quantitative Biology, 1951, 16(3): 13-47.
[53] MUOTRI A R, MARCHETTO M C, COUFAL N G, et al. The necessary junk: New functions for transposable elements[J]. Human Molecular Genetics, 2007, 16(R2):159-167.
[54] WU M, LI L, SUN Z. Transposable element fragments in protein-coding regions and their contributions to human functional proteins[J]. Gene, 2007,401(1-2): 165-171.
(责任编辑 潘 峰)