许陶瑜,王长彪,韩 斌,赵兴华,刘 江,任永康,牛瑜琦,唐朝晖
(1.山西大学生物工程学院,山西太原030006;2.山西省农业科学院经济作物研究所,山西汾阳032200;3.山西省农业科学院生物技术研究中心,山西太原030031;4.山西省农业科学院,山西太原030031)
小麦祖先种乌拉尔图小麦、粗山羊草是异源六倍体小麦基因组A 和D 的供体,是构成小麦基因的基础。水稻(Oryza sativa)是较早进行基因测序的物种,它具有较小的基因组、高效率的遗传转化、高密度的遗传图谱和物理图谱等优势,使它成为了禾本科植物研究的模式作物。利用水稻作为参考基因组与小麦祖先种进行全基因组比较分析,可以更深入地了解小麦祖先种的遗传基础、分子结构、进化关系,为小麦育种奠定基础。
随着基因组测序技术的发展[1-2],自SANGER 发明双脱氧测序进行核苷酸序列测定以来,越来越多的物种基因完成了全基因组测序。随着对水稻[3]、小麦[4-5]及小麦祖先种乌拉尔图[6-7]及粗山羊草[8]基因组测序工作的完成,使得水稻和小麦祖先种基因组比对分析成为可能。基因组比对分析是在基因组测序基础上,通过对核苷酸序列、氨基酸序列进行全基因组比对,从全基因组水平认识基因组之间的异同[9-10]。比较基因组研究通常有2 种方式,一种是通过比较解释差异,另一种是通过比较揭示共性。
培育高产[11]、抗病、抗虫、抗逆[12]、高水肥利用效率的的优质小麦、水稻品种一直是育种家的目标。过去田间育种,主要通过田间表型观察、性状分析来进行选择育种,往往需要多代,选育周期长,过程复杂,工作量大。随着基因组测序的完成,育种家将基因组和表型观察联系起来,可以通过基因鉴定来发掘不易鉴定的表型,将基因分析和遗传分析联系起来,大大地缩短了育种年限,节约了成本,提高了育种效率。通过小麦祖先种与水稻基因组比对分析,可以挖掘祖先种优异抗性基因辅助小麦分子育种。
为深入研究小麦祖先种与水稻的遗传基础、分子结构、进化关系,了解3 个物种同源核苷酸序列和基因序列的排列与分布[13],本试验构建了3 个物种的核苷酸序列和基因序列库,利用Blast 方法筛选同源核苷酸序列和同源基因序列,然后用circos,synmap 4.2 分别对同源核苷酸和同源基因序列作图,旨在揭示3 个物种间分子水平的共线性关系[14-15]及进化关系[16-18]。
乌拉尔图小麦序列从https://www.ncbi.nlm.nih.gov/nuccore/MKGO00000000.1 下载,数据更新公布的时间为2018 年5 月。
粗山羊草序列从https://www.ncbi.nlm.nih.gov/n uccore/MCGU00000000.1 下载。数据更新公布的时间为2017 年11 月。
水稻基因组全基因组序列从https://www.ncbi.nlm.nih.gov/genome/10 下载,数据更新时间为2018 年12 月。
1.2.1 核苷酸序列全局比对 将乌拉尔图小麦、粗山羊草作为目标基因组,水稻作为参考基因组,对核苷酸序列进行Blast N(e-value 为1e-20)比对,对结果筛选分析;使用circos 对同源核苷酸序列进行关联作图。
1.2.2 核苷酸序列局部比对 选取水稻1 号染色体和乌拉尔图小麦3 号染色体的同源核苷酸序列,使用软件mauve 对同源核苷酸序列做线性比对。
1.2.3 基因比对 构建3 个物种编码蛋白质的基因数据库,对它们的氨基酸序列进行Blast X(e-value为1e-10)比对,使用symap 4.2 对数据结果作图。
结果表明,乌拉尔图小麦中有6 786 546 条与水稻同源核苷酸序列,粗山羊草中有748 050 条与水稻同源核苷酸序列,小麦祖先种中存在大量水稻同源序列。筛选长度为4 kb 以上的同源核苷酸序列使用circos 软件作图(图1),乌拉尔图小麦筛选到2 007 条大片段(4 kb 以上)与水稻同源序列,而粗山羊草中筛选到6 252 条大片段序列。这说明粗山羊草在DNA 进化中更保守,与水稻的亲缘关系近。在序列比对中,本研究发现,乌拉尔图小麦、粗山羊草中的某条核苷酸序列可能在水稻的多条染色体中找到同源序列,水稻中的某条同源核苷酸序列也会匹配到乌拉尔图小麦或粗山羊草的多条染色体上,这表明3 个物种均存在核苷酸序列的复制现象。
试验选取水稻1 号染色体和乌拉尔图小麦3 号染色体的Blast 结果,使用mauve 软件对同源核苷酸序列作线性比较。结果表明,水稻1 号染色体和乌拉尔图小麦3 号染色体存在大量同源核苷酸序列。图中使用相同颜色表示了相同的同源核苷酸序列区块,水稻和乌拉尔图标识同源序列的颜色区块一致性排列,这表明它们之间存在同源核苷酸序列宏观的同线性和共线性(图2)。
结果还表明,同源核苷酸序列主要分布在水稻正义链上,而乌拉尔图小麦中同源序列正义链、反义链均有分布。在1 号染色体上的水稻某一同源核苷酸序列和乌拉尔图小麦3 号染色体的多个不同位置的核苷酸序列存在同源关系。
氨基酸序列比对中,本研究用乌拉尔图小麦、粗山羊草的每一条染色体和水稻全基因组进行比较,发现每一条染色体都有80%以上的同源基因匹配到水稻全基因组中。乌拉尔图小麦中5 号染色体与水稻的基因匹配率最高,为84%。粗山羊草中2 号染色体与水稻的匹配率最高,为88%。在共线性的区块中发现,约50%的基因共线性区块存在倒位现象,这表明在乌拉尔图小麦、粗山羊草和水稻的比较中,染色体的倒位现象是普遍存在的。
从基因比较的共线性排列中可以得出,乌拉尔图小麦1 号染色体和水稻1,5,10 号染色体存在大片段共线性排列,由水稻5,10 号染色体融合形成。乌拉尔图小麦2 号染色体和水稻4,7 号染色体有大片段共线性排列。乌拉尔图小麦3 号染色体和水稻1 号染色体有大片段共线性排列,由1 号染色体进化而来。乌拉尔图小麦4 号染色体来源于水稻3,11 号染色体。乌拉尔图小麦5 号染色体来源于水稻3,9,12 号染色体。乌拉尔图小麦6 号染色体来源于水稻2 号染色体。乌拉尔图小麦7 号染色体由水稻6,8 号染色体融合形成。基因比较中还发现,乌拉尔图小麦4,5 号染色体均和水稻3 号染色体的某一片段存在共线性,而且在乌拉尔图小麦4 号染色体中发生了倒位(图3)。在粗山羊草和水稻的基因组比较中也发现了类似的基因共线性排列(图3,4)。乌拉尔图小麦、粗山羊草的3 号与6 号染色体基因分别与水稻的1,2 号同源整体,这表明在进化中,这2 条染色体相对保守,没有发生染色体大片段的移位和融合。
从图3,4 可以看出,乌拉尔图小麦和粗山羊草的差别为:和水稻共线性的基因在它们中不是相同排列的。例如,乌拉尔图小麦7 号染色体和水稻8 号染色体只在短臂上有基因共线性,而在粗山羊草7 号染色体的短臂、长臂均与水稻8 号染色体有基因的共线性。这表明乌拉尔图小麦和粗山羊草在分化过程中,DNA 分子也发生了选择性进化。一些DNA 分子由于插入、缺失、转座子插入等原因而发生了基因的丢失。而一些同源基因的DNA 分子在进化过程中由于变异的积累,形成了具有新功能基因的DNA 序列。
水稻和小麦都是禾本科单子叶植物。对小麦祖先种及水稻的基因组比较分析,有助于理解高等植物的进化与发育关系。本试验表明,乌拉尔图小麦、粗山羊草和水稻无论是核苷酸序列水平还是基因水平都存在高度的、整体水平的共线性,同时它们的染色体中存在着大量的倒位和复制现象。
本试验通过对小麦祖先种和水稻全基因组比较[19],全面地在核苷酸序列水平和基因水平对小麦祖先种和水稻进行了DNA 水平和基因水平的关联分析,阐述了小麦祖先种染色体的进化过程,为进一步研究小麦遗传多样性、基因组分子进化、借鉴水稻基因组研究对小麦基因组进行注释[20]奠定了基础。