傅向东 刘 倩 李振声 张爱民 凌宏清 童依平 刘志勇
中国科学院遗传与发育生物学研究所 北京 100101
作为世界总产量排名第二的粮食作物,小麦在世界各地被广泛种植,养活了全球近 40% 的人口。预计到 2050 年世界人口将增长至 96 亿,为了满足这一未来需求,小麦生产力需要每年增加 1.6%,这必须通过对作物及其性状的改良来实现。由于普通小麦是异源六倍体,基因组庞大且复杂(是水稻基因组的 40 倍、人类基因组的 5.5 倍),其功能基因组学研究远远落后于水稻和玉米,复杂的遗传背景一直以来也是制约重要农艺性状的基因克隆和分子设计育种技术发展的瓶颈。2005 年,美、法等国科学家发起并成立了国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium,IWGSC),组织全世界 20 多个小麦主要生产国的科学家协作开展小麦基因组测序。
我国作为世界最大的小麦生产国和消费国,小麦生产对保障国家粮食安全和农业可持续发展具有重大现实和战略意义,因此小麦的增产和品质改良变得尤为重要。然而,产量和品质等重要农艺性状都是受多基因和环境互作影响的复杂数量性状,单纯依靠现有常规育种技术已经难以满足我国粮食安全和人民日益增长的美好生活需要。因此,加快对小麦基因组和分子遗传育种的研究势在必行。
中国科学院战略性先导科技专项(A类)“分子模块设计育种创新体系”(以下简称“分子设计育种先导专项”),提出并建立了从“分子模块”到“品种设计”的现代生物技术育种创新体系,从而快速实现全基因组水平多模块优化组装并培育新一代超级品种[1],同时也对我国小麦遗传学研究和分子改良育种提供了新的发展契机。文章将对专项实施期内小麦相关研究成果和未来研究方向的展望进行梳理。
普通小麦是一个 AABBDD 的异源六倍体,其形成涉及 3 个原始祖先物种和 2 次天然杂交。大概 50 万年前,祖先种乌拉尔图小麦(Triticum urartu)和近缘种山羊草杂交加倍后形成异源四倍体 AABB。大概 8 000—10 000 年前,这个异源四倍体又与野生粗山羊草杂交加倍后才产生了 AABBDD 的异源六倍体,这导致普通小麦的基因组庞大而复杂。由于水稻和玉米相对简单的基因组较早被破译,已经使得二者的分子设计育种理论和技术日趋完善。鉴于此,高质量小麦参考基因组序列图谱是小麦分子设计育种研究取得突破性成果的关键。
我国在麦类作物基因组研究方面作出了很多突出贡献,包括 AA 基因组和 DD 基因组的精细图谱绘制,以及参与了“中国春”AABBDD 六倍体小麦精细图谱的部分绘制工作。其中,A 基因组是小麦进化的基础性基因组,在多倍体小麦进化过程中起着核心作用。中国科学院遗传与发育生物学研究所(以下简称“遗传发育所”)小麦研究团队利用二代测序技术对乌拉尔图小麦进行了全基因组测序,于 2013 年完成了小麦 A 基因组草图的绘制。注释出了 34 879 蛋白编码基因,预测出了 1.6 万多个简单重复序列(simple sequence repeat,SSRs)、73.9 万多个插入位点的多态(insertion sitebased polymorphism,ISBPs)和 340 多万个单核苷酸多态(single nucleotide polymorphism,SNP)分子标记,相关研究结果发表在 Nature 杂志上[2]。之后,团队成员构建了二倍体乌拉尔图小麦 A 基因组的 BAC 文库和物理图谱,通过 BAC-by-BAC 测序,并结合三代 PacBio 测序和最新基因组物理图谱构建等技术(10×Genomics,BioNano),完成了小麦 A 基因组的精细图谱绘制。基因组大小为 4.94 Gb,组装的 Contig(无N)序列总长为 4.79 Gb(为基因组的 97%),Contig N50 为 344 kb;Scaffold(含 N)序列总长为 4.86 Gb(为基因组的 98.4%),Scaffold N50 为 3.67 Mb。注释出了 4 1507 个蛋白编码基因,81.42% 的基因组序列为重复序列。通过比较基因组学研究,鉴定出了小麦 A 基因组在进化过程中发生结构变异,并演绎出了小麦 A 基因组 7 条染色体的进化模型,为小麦进化分析和基因克隆提供了一个高质量的参考基因组。相关研究结果发表在 2018 年 Nature杂志上[3]。
此外,美国的研究团队利用经典的 BAC-by-BAC 测序结合 Bionano 和三代测序技术,中国农业科学院贾继增团队采用二代结合三代测序技术和 NRgene 组装技术,分别绘制完成小麦 D 基因组供体粗山羊草(Aegilopst auschii)的参考基因组精细图谱,研究结果分别发表在 2017 年的 Nature 和 Nature Plant 杂志上[4,5]。与此同时,小麦四倍体祖先种野生二粒小麦(Triticum dicoccoides)的 AABB 基因组序列解析结果发表在 Science 杂志上[6]。尤其重要的是,国际水稻测序联盟采用流式细胞仪分离技术将普通小麦“中国春”(Chinese Spring,CS)的染色体进行分离,利用二代测序和 NRgene 组装技术分染色体解析注释了 CS 的参考基因组序列并公开释放(RefSeq-v1.0)[7]。这应该是目前小麦染色体级别组装最好的版本。
截至 2018 年 8 月,六倍体小麦及其亲缘种 AA、DD、AABB 和 AABBDD 的精细基因组序列图谱均已绘制完成,这为小麦的功能基因组学、比较基因组学和进化基因组学研究奠定了基础;尤其在全基因组水平上认识小麦的起源、驯化、人工选择以及重要农艺性状形成的遗传和表观遗传调控机制,挖掘优异等位基因并利用于育种,对保障我国粮食安全和农业可持续发展意义重大。
“分子模块耦合育种”理论的提出是分子设计育种先导专项的理论创新,经过多年的攻坚努力,目前该理论在小麦育种领域已经得到实践验证,成绩斐然。西南地区是我国小麦主产区之一,也是小麦条锈病的主要发源地。培育抗条锈病小麦新品种是对于从源头上防治我国小麦病害尤为重要。在“多模块耦合育种”理论的指导下,中国科学院成都生物研究所小麦研究团队通过耦合抗条锈病分子模块 Yr7 和 Yr17、无芒性状分子模块 Xgwm291 和矮秆分子模块 Rht-D1b 育成了抗倒、抗病、优质、无芒、适宜机械化收割的小麦新品种“川育 25”。通过耦合大粒分子模块 QTkw.saas-5B 和抗条锈病分子模块 YrCH42 育成的高产抗病品种中“科麦 138”,是四川省近 10 年来唯一一个在区试和生产试验中产量提高均超过 10% 的突破性新品种,被列为 2016 年四川省主导小麦品种。通过导入糯性分子模块(Wx-A1b、Wx-B1b 和 Wx-D1b)和低 PPO 分子模块Ppo2A1b/Ppo2D 1a 育成的全糯专用优质小麦品种“中科糯麦1号”,实现了优质、高产、抗病等多个优良性状的有机结合,在食品加工与酿酒领域具有广阔的应用前景。截至 2018 年,这 3 个模块新品种累计推广面积已达 158 万亩,对我国西南地区小麦新品种升级换代起到了引领作用。
我国环渤海地区拥有 4 000 多万亩中低产田和 1 000 多万亩盐碱荒地,长期遭受旱、涝、碱灾害。培育抗旱、抗盐碱的小麦新品种对于当地农业的增产和增收尤为重要。2017 年遗传发育所培育的“小偃 60”通过了河北省农作物品种委员会审定(冀审麦 2016030 号)。沧州的运东地区(运河以东地区)是土壤盐碱程度较为严重地区,截至 2018 年,“小偃 60”在该地区的累积示范推广面积已达 21 000 亩。通过构建“中麦 175”与“小偃 60”的重组自交系群体,利用小麦 55K SNP 芯片构建遗传连锁图谱,并结合苗期和大田成株期耐盐相关表型的调查数据,目前已经定位到耐盐相关的数量性状基因座(quantitative trait locus,QTL)数十个。通过转录组学分析发现,“小偃 60 ”可能通过调节光合作用和茉莉酸信号通路增强自身的耐盐、耐旱性。
现有测序数据已经表明,六倍体小麦与二倍体、四倍体小麦基因组非常相似,说明多倍体形成之后的基因损失是有限的。不过小麦基因组的一个特点是含有大量的重复序列,而且这些序列高度相似又不完全相同。因此,精确定位和分离小麦基因及转录本的难度还是挺大的。目前,长片段三代测序技术日益普遍,这无疑为小麦基因组和转录组的测序提供了便利。期望后续测序技术的变革和分析方法的改进可以进一步补充完善现有普通小麦基因组精细图谱,或是完成更多小麦品种的基因组组装和注释。
在小麦参考基因组序列图谱绘制方面,我国科学家已经走在了前列,并为我国小麦功能基因组学研究搭建了良好的平台。此外,伴随测序成本的不断降低,预期未来几年内小麦全基因组重测序和关联分析研究会成为重要的发展方向。譬如,利用小麦近缘种、农家种、主栽品种及其远缘杂交所构建的易位系、附加系、代换系,以及饱和突变体库等材料进行全基因组重测序,重点开展小麦及其亲缘种复杂性状的基因组学、表观基因组学、比较基因组学和进化基因组研究,在全基因组水平上揭示小麦起源与驯化的历史,以及多倍体、二倍化的遗传与表观遗传学机制,解析小麦重要农艺性状形成的遗传调控网络,挖掘并利用优异等位基因。此外,野生种质资源研究已经从野生资源的收集、保存转向深入研究和利用,通过遗传群体构建或是多种质资源的深度重测序,充分利用和挖掘野生遗传资源将有利于改良现有作物品种。
我国现有小麦种质资源丰富,构建的遗传群体数目庞大,用于表型鉴定花费的人力物力不计其数。如何快速准确地获得小麦单株或品系的表型数据,一直是育种家和研究者面临的困境。表型分析平台就是新兴的、可以进行种质资源表型研究和精准鉴定的大型科学装置或设施。遗传发育所的攻关团队针对作物株型和穗型等三维构象,利用高分辨激光/软射线成像系统、高精度图像解析与重建等方法和技术,搭建了水稻、小麦等品系株型和穗型的表型分析平台。此外,无人机搭载高清摄像机或红外仪等,通过遥感技术实现对大范围田间作物的表型采集工作,已在陆续开展。这些新技术、新方法的推广应用将进一步推动种质资源的利用和品种的选育过程。
当前,功能基因组学已成为目前生命科学的竞争热点与重点发展方向。随着人类基因组、模式动植物基因组等测序工作的相继完成,生命科学已从整体上进入以功能基因组学研究为核心的后测序时代,世界各国对各种后测序基因组计划高度重视。例如,欧美等发达国家和地区先后启动了多个物种的 ENCODE 计划和四维细胞核组学项目。但是,我国在复杂多倍体基因组及其功能基因组学领域还处于跟踪与追赶阶段。多倍体小麦参考基因组的问世,为我们提供了很好的契机。如何借鉴模式植物拟南芥和水稻功能基因组研究的成功经验,结合小麦基因组的自身特点,开发一套适合小麦突变体的快速图位克隆技术,应该是小麦研究人员共同面临的一个课题。
Mut-Map 是利用野生型和突变体构建的分离群体进行测序并快速定位功能基因的成熟技术。鉴于小麦巨大基因组和昂贵的测序成本,科研人员可以同时借助转录组测序、捕获测序、RNA-Seq 和重测序等多重手段帮助实现小麦功能基因的快速定位。BSR-Seq 技术就是融合集群分离分析(bulked segregant analysis,BSA)和 RNA-seq 分析,可以实现小麦基因快速定位的一种方法[8]。
基因编辑技术是利用人工核酸酶对基因组进行靶向修饰的遗传工程技术,是当今生命科学领域的研究热点。遗传发育所高彩霞团队一直致力于作物基因组编辑方法的研究和应用。2014 年,该团队首先利用 TALEN 技术敲除小麦 MLO 基因实现对白粉病的广谱抗性[9]。CRISPR/Cas9 基因编辑系统由于设计简便及高效的特点,已经成为目前应用最为广泛的基因编辑技术。之后,该团队又率先在小麦、水稻和玉米三大重要农作物成功实现了单碱基编辑技术并运用到性状改良上[10]。此外,通过将 CRISPR/Cas9 蛋白和 gRNA 在体外组装成核糖核蛋白复合体(RNP),再利用基因枪法进行转化和定点编辑,该团队已在小麦中成功建立了全程无外源 DNA 的基因组编辑体系[11]。这种 DNA-free 的基因编辑技术具有精准、特异、简单易行、成本低廉的优势,并且有助于最大程度的减少监管,建立起精准、生物安全的新一代育种技术体系,加快作物基因组编辑育种产业化进程。
长期以来,局限于小麦功能基因的数量和注释信息太少,分子辅助育种技术一直无法推广;伴随基因组测序和基因克隆技术的发展,相信会有越来越多的小麦功能基因被克隆和应用到分子育种实践中。近年来,小麦 SNP 芯片的开发和应用更为普及,多个国内单位和公司合作开发的新芯片相继推出。这些 SNP 检测技术将为小麦全基因组关联分析、重要基因/QTL 连锁定位以及育种亲本及后代材料的分子检测提供重要的技术支撑。已有文章报道,利用 Illumina Infinium iSelect 90K SNP 芯片技术结合 BSA 集群分离分析法可以实现对大规模的小麦新品系或品种中抗白粉病基因的定位[12]。
此外,育种芯片的开发和应用极大提高了高通量筛选鉴定后代群体的效率。小麦传统常规育种一般依靠品种间杂交,因此导致遗传多样性的丧失。植物细胞与染色体工程国家重点实验室在李振声院士的带领下,长期致力于小麦远缘杂交和染色体工程育种研究,成功将偃麦草的染色体组、染色体、染色体片段导入小麦,育成小偃麦八倍体、异附加系、异代换系和易位系等杂种新类型,以及“小偃 6 号”等高产、优质、广谱抗病小麦品种。但是,小麦远缘杂交育种研究一直以来还局限于在细胞遗传学水平上。借助于基因组测序技术和育种芯片的开发,相信会更快地推动小麦远缘杂交品种的选育进程。