全基因组关联分析在作物育种研究中的应用

2019-08-17 06:47曹英杰杨剑飞
核农学报 2019年8期
关键词:农艺基因组关联

曹英杰 杨剑飞 王 宇

(东北林业大学生命科学学院,黑龙江哈尔滨 150040)

作物的驯化及育种过程对作物的遗传多样性具有重要的影响,了解作物表型变异的遗传基础能够帮助人们有效地利用现有的遗传多样性资源提高育种效率以及促进作物产量和品质的改良[1]。但重要的农艺性状如作物产量、作物品质以及植物抗病性、抗逆性是由多个基因共同控制决定的连续性状,其表型变异受多种环境条件和内源遗传物质的影响,与单基因控制的性状相比,其遗传基础更复杂。

大量研究表明,分子标记是研究作物重要农艺性状,挖掘相关基因的重要手段之一,如Michelmore等[2]基于孟德尔遗传定律提出了群体分离分析法(bulked segregant analysis,BSA),并表明此方法可明显提高性状关联分子标记的开发效率,加快作物基因组学的研究进程;Zheng 等[3]提出了一整套应用分子标记辅助选择育种(maker-assisted selection,MAS)的程序,主要通过限制性片段长度多态性(restriction fragment length polymorphism,RFLP)、简单重复序列(simple sequence repeat,SSR)、序列特异性扩增区(sequence characterized amplified region,SCAR)、序列标志位点(sequence tagged sites,STS)等分子标记,进行作物的遗传辅助育种。此外,随着第二代测序技术(next general sequencing,NGS)的迅猛发展,进一步为数量性状研究以及基因功能挖掘提供了更有利的技术支撑,其中以序列为基础的单核苷酸多态性标记(single nucleotide polymorphism,SNP)直接用于分子育种的遗传连锁图构建,极大地提高了遗传图谱的分辨率及精确度[4-5]。有研究者利用高密度的遗传图谱和适用于特定性状的分离群体在多个作物中定位出控制作物产量、品质、生物和非生物抗性等重要农艺性状的基因和主效数量性状位点(quantitative. trait loci,QIL)[5-8]。但由于进行QTL 研究的分离群体涉及的材料种类有限,导致针对某性状的研究主要集中在亲本间存在多样性等位基因的位点,且构建群体时亲本间有限的杂交和自交次数,导致遗传图谱的分辨率较低,仅利用亲本配子的重组信息定位的QTL 区间较大[9-10]。全基因组关联分析(genome-wide association study,GWAS)是应用基因组中数以百万计的SNP 为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,并通过比较发现影响复杂性状的基因变异的新技术。其可作为研究目的性状的基础试验,为性状分析提供遗传结构,筛选出用于QTL 分析的最佳亲本组合,找到候选的目的位点,因此,GWAS 通常与QTL 相互作补充,以降低分析误差。目前利用GWAS已经鉴定出大量与疾病性状相关的遗传位点[11-12];与人基因组的GWAS 研究不同,作物的许多性状能够通过控制杂交个体进行可重复的定向变异,并利用产生的特异作图群体对特异性状或QTL 进行关联分析。本文综述了目前GWAS 在粮食作物研究中取得的最新进展,以期为利用GWAS 发掘作物复杂数量性状基因,揭示重要农艺性状形成的分子基础,为粮食作物的品种改良提供依据。

1 GWAS 的研究策略及影响因素

目前GWAS 设计类型主要采用两阶段或多阶段方法,其操作过程为首先选择高通量的SNP 芯片或利用高通量测序手段获得待测样品的SNPs、SSRs 等分子标记信息,在群体结构分析的基础上进行关联分析,筛选出显著的SNP 位点;然后利用特定作图群体进行大样本的基因分型,最后结合多组学分析确定候选基因[13-14](图1)。

图1 定位不同品种水稻籽粒大小候选基因典型的GWAS 研究流程示意图Fig.1 Schematic of an exemplary GWAS workflow to map causal genes for natural variation of rice grain size

1.1 群体结构划分对GWAS 的影响

前人用于GWAS 研究的植株材料来自世界各地,包括栽培和野生在内的多个品种。这些品种经过长时间的环境选择效应、遗传漂变、迁移及人工驯化效应,基因组中可能会产生不同的遗传模式,形成多个具有遗传差异的亚群。这些亚群间的基因交流频率较低,导致群体间等位基因频率不同,混合分析时会增加染色体间的连锁不平衡性,导致关联分析产生大量的假阳性[15]。若不考虑群体结构对特征性状的影响,由GWAS 分析获得的多态性可能是由群体结构导致的无功能多态性位点或仅在亚群内有功能的位点[16]。因此,关联分析时必须对群体结构进行分析和校正,如有研究者提出利用贝叶斯聚类分析方法,对获得各个体中的基因型信息进行聚类,根据聚类结果划分群体结构,在亚群内进行关联分析[16]。目前,控制群体结构的统计学方法主要有基因组对照法(genomic control)、结构关联法(structured association,SA)、主成分分析法(principal components analysis,PCA)、非计量多维标度法(non-metric multidimensional scaling,NMDS)、基于群体结构(Q)+亲缘关系(K)的混合模型法(unified mixed-model approach,Q+K model)等[16-19],且通常采用STRUCTURE、INSTRUCTURE 等软件进行分析。如为了校正群体间亲缘关系的影响,Yu 等[19]将混合线性模型引入GWAS 研究,有效地控制了群体结构的影响,提高了分析效率和准确性。

1.2 连锁不平衡对GWAS 的影响

连锁不平衡(linkage disequilibrium,LD)是指群体内不同位点上等位基因间的非随机关联。在随机交配的群体中,连锁不平衡性参数会随着传代次数升高而显著降低,直到最终变成平衡状态;其中,LD 值较低的染色体区段,可以获得更多与靶基因(QTL 位点)有效关联的分子标记,提高关联分析的精确性[15]。受遗传背景、杂交类型、群体融合等因素的影响,不同物种间的基因组中LD 具有显著差异,如拟南芥、水稻、高粱、大豆等自交品种,其基因组纯合度高,产生有效重组的频率较低,导致LD 值偏高;而甘蓝、油菜、玉米等杂交品种,染色体内有效变异较多,其LD 值随着重组事件增加迅速降低[20]。LD 值具有群体依赖性,即同一物种不同群体间的LD 值也可能具有差异性。驯化品种在形成过程中经过人工选择,导致特定性状被保留,与野生品种相比遗传多样性较低,LD 值较高,如玉米骨干自交系的LD 值为100 kb,地方品种间的LD 值为1~5 kb,而野生型玉米小于1 kb[21-23]。因此,构建关联群体时,选择地理差异大的品种作为关联分析材料,能够有效降低基因组上的连锁不平衡性,获得较多的表型变异和遗传变异,但也可能会增加群体结构分析的难度[24]。

1.3 群体大小对GWAS 的影响

足够的群体数量能够提高关联分析的效力进而检测到低频度的遗传变异,这种关联分析受到样品量、遗传效应量和等位基因频率的影响,其中样品量是决定统计分析效力的主要控制因子。大部分农艺性状是由大量的微效位点调控的,因此增加群体数量能够提高关联分析的效率,有利于鉴定出微效的基因位点,如Long 等[25]研究表明,与增加检测的SNP 数量相比,增加群体数量更能提高关联分析的作图能力;Seng 等[26]研究认为样本量较大时,应当考虑SNP 在两阶段设计中的重复性以控制假阳性率;美国康奈尔大学的Buckler 实验室利用25 份具有广泛遗传变异的自交系分别杂交、自交,获得了5 000 个重组自交系材料,该群体集合了连锁和关联群体的优势,在解析开花期、抗病性、植物形态等复杂的数量性状中具有重要作用[4,27-28]。在构建RIL 群体时,多亲本的种间杂交能显著提高遗传图谱的分辨率,同时多个亲本会引入更多的遗传多样性,有利于同时对多个相关性状进行研究。目前,已在多种作物中成功构建出优良种质的作图大群体,这些群体由多种表型变异的亲本通过人工杂交育种的方式构建,如水稻的RIL 群体、玉米的巢式关联群体(nested association mapping,NAM)、小麦的多亲本高级世代互交系(multi-parent advanced generation inter-cross,MAGIC)、大麦HEB-25 巢式关联群体等,促进了多种重要农艺性状基因的挖掘[29-31]。

2 GWAS 在粮食作物育种中的应用

随着高通量测序技术的发展,一些主要作物如水稻[32]、大麦[33]、谷子[34]、玉米、高粱[35]、土豆[36]、西红柿[37]、白菜[38]等参考基因组均已公布。这些物种中基因组范围的变异数据被用于遗传作图和作物演化的研究,为作物品种改良和培育奠定了重要的理论基础(表1)。

2.1 水稻

水稻(Oryza sativa L.)分布范围广,是目前自然群体数量最多的粮食作物,各栽培地区生长的优良水稻品种包含了丰富的遗传变异信息,是研究重要农艺性状基因的首选材料。通过对水稻代谢组的GWAS 研究,能够从代谢水平上找到影响表型变异的特征代谢物。结合基因组水平上与表型变异连锁的SNP 位点,能为复杂农艺性状中微效QTL 的定位和基因的挖掘提供一定的理论依据[39]。如Huang 等[40-41]首次将大样本、低丰度的基因组测序数据利用缺失数据修复算法与基因分型手段相结合,构建了水稻高密度基因组单体型图谱,且进一步对包括谷粒宽度、千粒重、分蘖数目、淀粉含量及抽穗期等14 个农艺性状进行GWAS分析,鉴定出多个控制花期和粮食产量性状相关的新位点。Yonemaru 等[42]在14 个高产水稻品种的GWAS分析中筛选到1 152 个与高产性状关联的SNP,并发现8 个与产量性状相关的基因渗入区域,证明控制产量性状基因的遗传结构在人工驯化过程中发生了变化。Duan 等[43]利用102 份种子大小具有显著差异的籼稻品种进行GWAS 分析,发现LOC_Os05g09520(GSE5)的表达水平与种子大小显著相关,进一步分析发现GSE5 的启动子区950 bp 的删除会显著降低GSE5 的表达从而导致种子变宽。赵宏亮等[44]利用6 704 个SNP 标记对261 份籼稻核心种质资源的千粒重、单株产量等9 个源库相关性状进行GWAS 分析,共检测到68 个与产量性状关联的QTL,其中以QTgw5b 的贡献率最大,为6.91%。Volante 等[45]对缺水和多水条件下的粳稻品种进行GWAS 分析鉴定,得到3 个与产量相关的位点,其中,Os05g0187500 和Os04g0615000 分别编码与谷粒重量相关的GW5 和Nal1 基因,Os04g0663600 编码与腋芽形成相关的WOX1 基因,通过调控水稻的分蘖数进而影响水稻产量。表明在缺水条件下,水稻会产生更多的分支和更小的谷粒以抵御干旱。在作物研究过程中,某些性状(如干旱抗性)受多个微效基因调控,利用GWAS 进行候选基因的定位非常困难,研究者往往利用与抗性相关的衍生表型或特征代谢产物相结合的手段进行关联分析并成功定位到多个参与调控胁迫响应的目的基因[46-48]。在水稻中,利用代谢组GWAS 与基因组GWAS 结合分析的方法,有助于推动复杂性状的研究,如Matsuda 等[49]利用代谢组数据对175 份水稻品种进行GWAS 分析,从143 个SNP 和89 个代谢物中成功鉴定出323 个关联数据。Chen 等[50]利用529 份水稻对84 个代谢物进行综合分析,鉴定出上百个能够影响次级代谢产物含量的变异位点,发掘出36 个调控代谢物水平的候选基因,注释了5 个与代谢性状相关的候选基因。Chen 等[51]利用基因组、代谢组和表型组关联分析相结合的方法,鉴定出多个在水稻籽粒中显著关联的特征代谢物和SNP 位点,包括调控水稻籽粒颜色、大小相关性状的特征代谢物,获得17 个候选基因。

2.2 玉米

作为短日照开花作物,玉米(Zea mays L.)的种植范围已经扩散到温带的长日照地区。玉米的早花性状是其驯化过程中产生的主要适应性性状。近年来,随着高通量测序技术的发展和玉米参考基因组信息的完善,GWAS 极大地推进了玉米功能基因组学的遗传研究,获得了一系列与产量、发育、抗性相关的候选基因或候选位点。如Li 等[52]运用玉米巢式关联群体同时对玉米的早花性状进行GWAS 分析,在距离关联SNPs 1 Mb 范围内获得220 个候选基因,其中66%与拟南芥中的开花基因同源,这些SNPs 位点集中分布在候选基因内部和距离候选基因5 kb 附近的区域,能够显著影响玉米的早花性状。Yang 等[53]研究表明,ZmCCT基因是感知光周期的重要因子,其表达水平能够显著影响玉米的开花时间;在早花品种中,其5′UTR 区域的CACTA 型转座元件插入导致启动子区甲基化水平升高;ZmCCT 基因的表达水平降低能抑制玉米对光周期的敏感性,促进早花表型的发生,使早花品种能适应高纬度地区的长日照环境。复杂的数量性状通常受多个基因或QTL 位点控制,获得的QTLs 数目越多说明大部分位点对表型变异的贡献率越低,如Buckler等[54]和Tian 等[55]利用GWAS 获得超过40 个与开花时间和叶子形态相关的QTL 位点,但90%的位点仅能够解释低于2.5%的表型变异;此外,单个QTL 位点也可能参与影响多个数量性状的形成。如Li 等[52]以US-NAM 群体对玉米的开花期、抽丝期、雌雄穗间隔期等相关性状进行GWAS 分析,对获得的71 个QTLs 进行分类发现,其中57.7%的QTLs 位点与2 种以上性状显著相关,能够同时影响3 种性状的QTLs 位点占总QTLs 数目的28.2%;Thomsberry 等[56]通过关联分析发现Dwarf8 基因在不同品种中存在多态性,这些多态性不仅影响玉米株高,还与玉米开花期变异显著相关,其中Dwarf8 基因中702 位点的缺失与1 664 位点的T基因型紧密连锁,是显著影响玉米早花性状的功能性位点。Yang 等[57]利用513 个近交系材料,鉴定出678个与株高、籽粒形态、开花时间等17 种农艺性状相关联的SNP 位点,其中54.3%(368 个)的SNPs 至少与2种以上性状关联。用于GWAS 研究的大群体由于存在复杂的群体结构,导致关联分析得到的QTLs 位点范围区间较大,不利于候选基因的鉴定和挖掘。研究者通常还会构建双亲本群体共同进行QTLs 定位,缩短候选基因范围,以对GWAS 获得的QTLs 进行精细定位。如Zhao 等[58]首先利用43 437 个SNP 对269份玉米的叶片中镉(Cd)含量进行GWAS 分析,鉴定出SNP(SYN25051)解释了27.1%的表型变异,进一步通过对双亲本群体的QTL 定位,验证了由GWAS 鉴定的主效QTL 基因座qLCd2,可解释39.8%的镉在叶片中积累的表型。Ju 等[59]通过GWAS 和RIL 群体中的QTL 作图相结合的方法研究玉米对镰刀菌(Fusarium verticillioides)孢子的抵抗力,鉴定出与FSR 抗性相关的8 个数量性状基因座(QTLs),其中3 个候选基因GRMZM2G0081223、AC213 654.3 _ FG004 和GRMZM2G099255,在连锁作图和GWAS 中均能被检测到。然 而 进 一 步 研 究 发 现, 仅 含 有GRMZM2G0081223 的近等基因系(near-isogeniclines,NILs)具有显著的FSR 抗性。在玉米功能基因组学的研究中,多亲本重组自交系是研究微效QTLs 或低频QTLs 的优质群体材料,然而其GWAS 作图的分辨率受到亲本数量的影响,其中增加重组自交系的亲本数量能够提高作图分辨率,但会消耗大量人力和物力;而传统自然群体虽然重组频率和等位基因多样性高,但群体结构更复杂,需要有效的统计手段或算法对其进行校正。

2.3 谷子

谷子(Setaria italic L.)具有较强的抗旱性和耐贫瘠性,在旱作农业中起着重要作用,是中国北方的主要粮食作物之一[60]。高质量谷子基因组测序的完成使得研究者们能够在大规模的谷子种质中快速检测基因组范围内的变异,促进了谷子种质中等位基因多样性的研究[34,61]。Jia 等[62]对916 份谷子材料进行全基因组低倍重测序及序列分析,并运用其中845 787 个高质量SNPs 构建出一张精细的谷子单倍型图谱;针对谷子的株型、产量、花期、抗病性、颜色等47 种农艺性状,采用GWAS 分析筛选出512 个相关的遗传位点,其中,59 个位点至少控制2 种性状,而一些前期被证明在抽穗期对环境温度和光周期高度敏感的位点仅在部分地区有很强的关联性,其他环境中关联性较低,表明很多数量性状与所处的环境密切相关[27,41,62]。大量研究表明谷子的地方品种与现代育种品种中的产量相关性状表型差异明显,表现为现代育种品种中的圆锥花序重量显著高于地方品种。如Jia 等[62]通过全基因组筛选,鉴定出36个可能在现代遗传改良育种过程中受到选择的基因组位点,其中16 个被定位在关联位点周围,包括与分蘖数、单株总圆锥花序数和外壳颜色相关联的位点;而在谷子第5 号染色体上的qSH1 位点周围显示出很强的选择痕迹[63],这些位点为研究相关基因是否在驯化过程中被人为选择提供了线索。

2.4 高粱

高粱(Sorghum bicolor L.)作为研究圆锥花序类基因组的模式谷物,具有高水分利用效率、高生物量等特点,促进高粱的遗传分析与分子育种对保证粮食安全具有重要作用。如Bouchet 等[64]运用DarT 标记通过MLST(maximum length subtree)算法对高粱的群体结构和连锁不平衡程度进行遗传研究,定位了一系列与植物抗病性、DNA 损伤、光周期调控相关的位点。Morris 等[65]对生长在不同环境下的971 份高粱品种的农艺性状如植株高度、成熟时间及花序特性进行GWAS 研究,筛选到已知的与植株成熟和淀粉代谢相关的位点Shattering1、brittle endosperm 2 和opaque2,这些位点在不同的地方品种中存在选择性特性,进一步对携带矮小和长分支花序等位基因的多个单倍型高粱的GWAS 图谱进行分析,找到部分控制植株高度和花序特性的位点及基因。籽粒大小是影响作物产量的重要性状,也是作物驯化过程中的重要指标。研究表明不同高粱品种的籽粒大小存在明显差异,已有研究者利用传统的QTL 定位手段成功将控制谷粒大小的13个QTL 位点定位在基因组上11 个非重叠区域内,但这些区域往往区间较大、分辨率低,很难获得真正的候选基因[66]。Zhang 等[66]利用GWAS 针对谷粒数、谷粒长度、宽度等性状进行分析,发现4 个与谷粒大小关联性强的热点区域,显著缩短了QTLs 定位的候选区域并找到4 个候选基因(Sb04g015420、Sb06g033060、Sb07g023950、Sb10g018720),其中在基因Sb10g018720和Sb06g033060 上存在非同义突变的SNPs 位点,显著影响谷粒大小和重量。Zhao 等[67]利用GWAS 对49个与谷粒和生物量相关的农艺性状进行分析,获得101 个SNPs 至少与1 种性状显著相关,并发现参与赤霉素(gibberellim,GA)途径的候选基因GA2ox5 和KS3影响种子数量和植株高度,证明GA 参与植物形态建成,影响与产量相关的农艺性状。Zhang 等[66]对不同谷粒作物类群的比较研究表明,在高粱、水稻和玉米的基因组中,含有大规模的同源且功能保守的片段调控谷粒的大小,这种跨类群的同源片段大多功能相近,且能促进产生相似的表型变异。Kong 等[68]运用QTL 定位将9 种分蘖相关性状的QTLs 位点定位在10 条染色体上,进一步运用GWAS 与共线性比较分析结合的方法,发现8 个与水稻分蘖相关的同源基因分布在鉴定出的QTLs 区域内,有效地缩短了QTLs 的区间范围。GWAS 结合QTL 与共线性分析的研究策略,提高了遗传图谱的分辨率,加快了高粱农艺性状相关基因的鉴定和遗传育种进程。

2.5 大麦

大麦(Hordeum vulgare L.)常通过近亲交配产生后代,受到非随机交配及选择过程的影响,导致其群体结构非常复杂。如Wang 等[69]利用主成分分析法对615 个大麦品系进行群体结构分析,结果表明在PC2中大麦含有3 个亚群,其中大部分春麦和冬麦品种被聚类到2 个亚群,而未知生长习性的亚群内也包含超过30 种大麦品种,此外在PC3 中发现春麦和冬麦品种间也存在不同的亚群,证明大麦中群体结构K 值介于2~6 之间。Pasam 等[70]利用1 536 个SNP 对224个春麦品种进行GWAS 研究,定位到了与穗型、株高、抽穗期等性状紧密关联的标记及QTL;这些标记的位置和之前定位到与开花时间连锁的QTL 基因组区域基本一致,其中包含如HvFT3、PpdH1、HvFT4、eps2、HvGI、HvCO3、HvFT1、HvCO1 等开花途径中的基因;而千粒重、淀粉含量和蛋白质含量相关的标记的分布与Vrs3、Vrs1、Vrs4、waxy 和Int-c 的基因组区域一致。Maurer 等[71-72]模拟玉米巢式关联群体法,以春麦Barke 品系与25 个野生麦品种构建了大麦HEB-25 的巢式关联群体,并用于大麦发育过程(发芽、开花、成熟等)中的相关性状、株高和千粒重的GWAS 分析中,共找到89 个关联的QTL 位点,其中QTL-1H-10 附近的HvEFL3 位点的变化能够加速植株的发育,使每个发育时期与春麦Barke 品种相比缩短2 ~3 d;Denso/sdw1 位点控制植株的半矮化性状,同时该位点变异也表现出延长大麦发育时期的性状,HvGA20ox2 基因可能是其中关键的候选基因。Saade 等[73]对大麦巢式群体HEB-25 在盐胁迫下产量性状进行分析发现,在盐胁迫下大麦表现出开花时间提前、植株矮化和产量下降的性状。通过GWAS 鉴定到2 个与开花相关的基因,即HvELF3 和HvCEN,其中在盐胁迫下HvELF3 的表达量与植株高度和千粒重显著相关;而HvCEN 除控制植株矮化,还能显著增加产量;此外,还发现位于α-葡糖苷酶基因(AK375658)上的SNP 标记BOPA2_12_30822 在HEB1 群体中能够解释19.8%的产量变异性状,能显著提高盐胁迫下的大麦产量。NAM 群体的构建极大地丰富了大麦群体的种质资源,为大麦的GWAS 研究提供了材料基础,有利于大麦重要农艺性状改良和候选基因的挖掘。

表1 全基因组关联分析在作物育种研究中的应用Table 1 The application of GWAS in crop breeding

2.6 小麦

普通小麦(Triticum aestivum L.)是多倍体作物,基因组复杂且尚未完全解析。目前小麦的GWAS 研究主要集中在利用高通量测序技术获得的大量SNP 标记进行群体结构分析及相关性状的基因定位。如Turuspekov 等[74]利用3 245 个SNP 标记将194 个春麦品种分为3 个亚群,其中这些SNP 在小麦A 基因组(41.3%)和B 基因组(44.6%)中的分布显著高于D基因组(14.1%),导致D 基因组的LD 值(26.8 cM)最高。Qaseem 等[75]同样发现小麦D 基因组上的SNP 位点低于A 基因组和B 基因组,其中4D 染色体上的连锁不平衡值最大(r2=0.64)。这可能是由于D 基因组的进化时间较A 基因组和B 基因组晚,导致D 基因组更加保守;进一步对12 种与产量相关的农艺性状进行GWAS 分析发现,共获得114 个关联的SNP 位点,其中21 个位点与单株穗数相关,4 个位点与单穗粒数相关,7 个位点与千粒重相关,2 个位点(AX-94532960和AX-94539237)与花序长度相关。Wang 等[76]对105 个小麦品种进行产量及相关性状的GWAS 分析,共找到24 个与9 种产量相关性状连锁的标记,其中与千粒重、籽粒形态和植株高度相关的4 个位点在不同环境中均能被检测到,说明这些位点或性状在进化过程中较保守,受环境影响较小;而有效穗数、籽粒总产量、叶面积等性状受环境影响较大。此外,控制不同性状的部分标记会定位在染色体上的同一区域或邻近区域,如位于7B 上控制株高的Wsnp_Ex_c11003_17857272 (77.13 cM)与千粒重相关标记Ex_c12057_797 (77.13 cM)位置相同;位于4B 染色体上的Rht-D1 基因(31.5 cM)与AX-94592612 (39.0 cM)紧密连锁,控制株高和单株穗数;定位在2D 染色体上控制柄长和穗长/株高的SNP 标记(20.6 cM 和28.1 cM)与Rht8(23.0 cM)基因位置相近。由此,不同的产量相关性状之间存在复杂的联系,可能是基于基因或位点的多效性,共同构成调控小麦总产量的复杂网络。

3 展望

近年来,应用QTL 和关联分析发掘粮食作物数量性状基因已成为作物基因组学研究的热点之一。随着测序技术和统计算法的迅猛发展,GWAS 现已成为检测作物复杂性状自然变异的重要工具,其不仅能够提高传统的双亲分离群体作图的分辨率,同时还能对多个农艺性状进行关联作图,极大地提高了育种的效率[82]。但是基因之间、基因与环境间互作的统计算法有限,导致GWAS 结果较难解释大部分复杂性状的遗传学特征;此外,群体结构的划分和海量的数据处理,也是关联分析亟待解决的难题。

目前,RNA 测序和甲基化测序技术的迅猛发展使需要大量SNP 数据的转录组QTL 和甲基化QTL 作图成为可能,而代谢组的发展有利于解决复杂性状表型的鉴定,能进一步促进GWAS 研究[83]。在今后的研究中,研究者不仅可以利用GWAS 对粮食作物基因组的序列进行关联分析,还能鉴定作物的代谢组、转录组及全基因组甲基化的QTLs,从代谢和表达水平上对作物的分子遗传机制进行深入研究,加速粮食作物的品种改良。

猜你喜欢
农艺基因组关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
牛参考基因组中发现被忽视基因
农机需要农艺“标准”,农艺需要农机“灵活”——2021国际农机展不容错过的果蔬茶机械化论坛
水稻主要农艺性状与产量的相关性分析
“一带一路”递进,关联民生更紧
奇趣搭配
智趣
14份蒌蒿种质资源主要农艺性状及营养成分评价
90团举办初级农艺工培训班
基因组DNA甲基化及组蛋白甲基化