潘文婧 王金星 王 乔 孙亚男 高陆思 曲梦楠 张维耀付春旭 姜世波 姜成喜 付亚书 景玉良
(1 黑龙江省农业科学院绥化分院,绥化 152000;2 黑龙江省农业科学院经济作物研究所,哈尔滨 153000)
大豆起源于中国,已经有几千年的历史,是重要的经济作物,是可食用蛋白质和油脂的主要来源之一[1-3]。随着经济社会的不断发展,人类对饮食的要求发生变化,对一些与大豆产业相关的消费需求迅速增加[4]。但是目前国产大豆无法满足人们的需求,在一定程度上还要依赖于进口,因此要大力发展国内的大豆产业,在耕地面积不足的情况下,提高大豆单株产量和籽粒品质是最有效的发展途径。
作物的质量性状是指能明显区分的性状,主要受少数几对基因所控制,无法用计量单位计量,如大豆的花色、叶形、绒毛色等。数量性状是指可以用计量单位计量,由多对基因控制,呈现连续性变异的性状[5],大部分品质性状以及产量性状都属于数量性状[6],如大豆的蛋白质、油分等都是重要的品质性状,以及大豆产量的主要构成因素——单位面积株数、单株荚数、每荚粒数和百粒重等。大豆育种的主要目标则为改良大豆品质,增加大豆单位面积产量。传统的育种方式,存在周期长、难度大、耗费大量的人力物力等问题,不能够满足现代社会的要求,因此合理利用多种育种手段进行品种改良,不断寻找更加快捷的方式,提高大豆产量和品质,是育种技术未来前进的方向[7]。
在分子遗传学不断的发展下,分子标记辅助选择育种为加快育种进程提供了新的思路。分子标记辅助选择育种是指在育种选择时通过对与功能基因相连锁的分子标记对目标性状进行间接选择。目前已经在小麦[8]、水稻[9]等作物中应用。利用分子标记辅助选择的前提是利用遗传群体进行QTL 定位,挖掘与性状相关联的关键位点,是挖掘数量性状功能基因和进行标记辅助选择育种的有效手段。自1988 年Paterson 等人首次将分子标记应用于番茄数量性状位点的研究中以来,基于分子标记的QTL研究已经应用于许多作物的数量性状中,例如,玉米的百粒重[10]、小麦的株高[11]、大豆的主茎节数[12]、大豆蛋白质含量[13]等。
1.1 QTL 定位方法QTL(Quantitative trait locus)即数量性状基因座,指控制数量性状的基因所在的位置。目前QTL 定位的方法主要有两种。第1 种为连锁分析,利用与目标性状功能基因相连锁的分子标记对QTL 进行定位。第2 种为关联分析,使用连锁不平衡原理,探究分子标记与表型变异的相关性,从而来定位QTL[14]。
单标记分析法是利用方差分析、卡方分析、回归分析等方法来检测单个分子标记与研究性状之间是否连锁的定位方法。具有操作简单,适宜性广,不用特意构建遗传图谱等优点,但不能得到QTL 的有效位置,并且连锁关系也无法计算,存在一定的局限性。
1989 年区间作图法(IM,Interval mapping)被提出[15],该方法对QTL 区间定位采用的是最小二乘法和极大似然估计等方法。IM 对群体的要求不高,当只存在一个QTL 时,定位结果准确,虽然如此但也存在一定的弊端,当多个QTL 距离很近时,QTL 会相互干扰,影响精度。
Zeng[16]针对区间作图存在的一些弊端进行了修改,提出了复合区间作图法(CIM,Composite interval mapping)。CIM 在检测区间标记时,会将区间以外的分子标记作为余因子进行拟合,控制了遗传背景对于定位准确度的影响,对QTL 的有无是通过计算LOD 值来检测的。与IM 相比,CIM 能够直观地显示QTL 所在位置及显著性,但无法计算QTL 之间以及QTL 与环境之间的互作。2007 年Li 等[17]提出完备区间作图法(ICIM,Inclusive composite interval mapping),ICIM 可以计算QTL 之间的上位性效应。
1.2 QTL 作图群体作物群体是进行QTL 定位的基础,决定了QTL 定位的精确性,其中初级定位群体是最早应用的遗传群体,在早期的QTL 定位以及现在初步定位中有广泛的应用。但其遗传背景复杂、群体不稳定,遗传率较低的QTL 难以检测,得到的区间大,在多年多点的环境中试验不具有重演性[18]。随着不断深入的研究,其精度和准确性均不能满足研究的要求,因此在其基础上,通过杂交、回交等方式,构建目标片段更精确地分离群体称为精细定位群体。
现阶段的主要作图群体都为精细定位群体,可分为初级定位群体衍生系和代换系群体。虽然二者构建方法不同,但都是群体个体间遗传背景相似,降低或消除了背景干扰,精度高,构建时间相对更长,如近等基因系群体(NILs,Near isogenic lines),是通过多代的连续回交(轮回亲本对非轮回亲本),得到一套除了目的基因外,其他基因组背景片段完全相同,无干扰背景的群体;残留异质系(RHLs,Residual heterogeneous lines)也是典型的精细定位群体,RHL在初定位结果的基础上,可以缩小目标片段,得到更为精确的定位结果,但是仍然存在构建时间长、操作难度大等缺点;导入系群体(ILs,Introgression lines)对加性效应及上位性效应的检测准确度高、前景好,但是不能计算显性效应,构建时间长、难度大。
目前,已经有大量关于QTL 作图群体构建的研究。2017 年Xin 等[19]为了获得适合黑龙江省栽培的优良性状大豆品种,以绥农14 为轮回亲本、野生大豆ZYD00006 为供体亲本进行杂交后不断回交,构建了含有194 个株系的导入系群体。2019 年李杨等[20]以郑58 和昌7-2 为材料,分别与PH6WC和PH4CV 进行杂交、回交以及多代自交,构建了含有先玉335 背景的近等基因系混合群体。2019 年Wang 等[21]利用171 个株系的RIL 群体进行定位,得到3 个花期相关的QTL,并构建RHL 群体进行精细定位,定位结果挖掘到2 个与大豆开花机制相关基因。2020 年苏代群[22]利用由两个杂交组合衍生的两个重组自交系群体为材料,在3 个不同地点分别种植正常施用氮肥和不施用氮肥的材料,对大豆产量、品质等性状进行加性和上位性QTL 定位,并针对各性状进行氮肥响应的QTL 定位。2020 年Wang 等[23]利用重组自交系对大豆叶绿素含量进行了QTL 定位,定位结果得到78 个相关QTL。2021年卢峰[24]利用玉米自交系LDC-1 为供体亲本、YS501 为受体亲本,根据分子标记辅助选择,构建出CSSLs,并且鉴定出在2 个环境下与玉米穗上叶夹角相关的QTL。
2.1 大豆百粒重QTL 研究进展百粒重是大豆产量的重要构成因素,还在一定程度上影响大豆的外观品质以及商品性,因此一直以来针对百粒重培育新品种是育种者研究的重要目标之一。百粒重是受多基因控制的数量性状,易受环境影响。在分子标记技术的不断发展下,对百粒重基因座的检测,发展分子辅助育种对于培育高产大豆有重要意义。目前已经有许多国内外的科研人员进行了大量的大豆百粒重QTL 定位,通过对QTL 定位分析,定位百粒重相关 QTL,挖掘带有优异等位变异的资源,对于聚合多个优异等位变异有重要意义。
2014 年Kato 等[25]以来自日本和美国的品种作为亲本配制了2 个杂交组合,在3 种环境下共检测到15 个百粒重QTL,其中位于Gm17 上的qSw17-1在多环境下被检测到。2015 年Zhou 等[26]利用302 份资源为材料,其中包括野生资源、地方品种以及育成品种,利用GWAS 进行分析,结果表明位于Gm17 上的百粒重QTL 位点与前人报道的相符。2016 年Wang 等[27]分别利用栽培品种和野生资源为亲本配制的杂交组合,得到了17 对上位性互作的QTL 以及 15 个加性效应QTL。2019 年滕卫丽等[28]利用以东农46 和L-100 杂交构建的RIL 群体,利用ICIM 法对加性QTL 和QTL 间上位性互作进行检测,共检测出11 个百粒重相关QTL 位点,分布于8 条不同染色体上,贡献率为6.48%~15.43%。2020 年Wu 等[29]对大豆百粒重进行QTL 定位,在9 个连锁群上共检测到12 个QTL,遗传贡献率在8.11%~17.21%之间。2020 年潘丽媛等[30]以科丰1 号以及南农1138-2 为亲本,构建了一个重组自交系群体,包含427 个家系。采用CIM、MLMGWAS、RTM-GWAS 3 种不同定位方法对大豆百粒重进行QTL 定位,共定位到77 个与大豆百粒重相关的QTL。2021 年刘家伶[31]以吉农45 以及绥农76 为亲本,杂交获得F2群体及其衍生的F3群体为试验材料,分别采用CIM、ICIM 和IM 进行QTL 定位,共检测到4 个与百粒重相关的QTL,贡献率为8.49%~9.01%,其中2020_q HSW15-1在3 种方法下均被定位到。2022 年葛天丽等[32]以中黄13 和中品03-5373 为亲本构建的RIL 群体为材料,利用高密度Bin 图谱以及百粒重表型数据,检测到分别位于Gm12 和Gm18 上的2 个稳定的百粒重QTL。2022 年Qi 等[33]以soymap2 为参考,构建了大豆百粒重QTL 综合图谱,将百粒重QTL 投影到图谱中,共收集65 个百粒重QTL。
目前在Soybase 网站(https://www.soybase.org/)收录了304 个基于双亲群体定位的百粒重QTL,作图群体主要为RIL 群体。部分QTL 信息如表1 所示。
表1 百粒重性状QTL 定位信息
2.2 大豆蛋白QTL 研究进展大豆蛋白质富含8种人体必需氨基酸,是优质的植物蛋白,改良大豆籽粒蛋白质含量是大豆育种的重要目标之一。大豆籽粒蛋白质含量在品种间存在显著差异并且易受外界环境条件影响,是典型的由多基因协同控制的复杂数量性状。通过QTL 定位,可以初步确定与大豆籽粒蛋白质含量相关的染色体大致区间,对该区间进行精细群体构建,缩小该区间是目前QTL 精细定位的重要途径。
在不同遗传背景的群体下检测到的蛋白质含量QTL 数量存在一定差异。QTL 定位与环境因素、群体类型、遗传背景和性状类型有着重要关系。使用不同的定位方法对同一个群体的QTL 进行分析,得到的大豆蛋白质含量QTL 结果可能也不同。1992 年Diers 等[34]发表了关于大豆蛋白含量 QTL定位的第1 篇文章,在此文章发表之后大豆蛋白含量QTL 定位成为国内外研究的重点。
2014 年侯萌等[35]利用CIM 和MIM 2 种算法在2 年3 点共6 个环境下定位出9 个蛋白质QTL,分布于6 个连锁群上。2015 年张金巍等[36]以黄淮海主栽品种中黄13 为轮回亲本、东山69 为供体亲本,构建了BC2F2回交导入系群体,利用2 种方法在4 个群体中定位到42 个与蛋白质含量相关的QTL。2017 年Smallwood 等[37]使用一套RIL 群体,结合3 年的表型数据,利用633 个SNP 位点进行基因分型,共定位得到位于4 个染色体上的7 个重要的蛋白质含量QTL 位点。2018 年滕康开等[38]以蒙8108 和南农1138-2 为亲本杂交构建重组自交系群体NJMN,并对其在5 个环境下进行试验得到表型数据,使用包含2062 个SLAF 标记的遗传图谱进行QTL 定位,分别在Gm6、Gm7、Gm11、Gm17 上定位到4 个加性QTL。2019 年Zhang 等[39]使用全基因组关联分析的方法,将调控蛋白质含量的QTL定位到Gm15 和Gm20 染色体上。2019 年Prenger等[40]通过全基因组关联分析的方法,并构建NIL 群体,在Gm20 上发现调控大豆蛋白含量的重要QTL位点。2019 年张琦等[1]以栽培大豆绥农14 为轮回亲本,使用野生型大豆ZYD00006 为供体,构建了CSSL 群体,在2 年间共检测到21 个与大豆蛋白质含量相关的QTL。2020 年任丙新等[41]以中黄13作为轮回亲本、东山69 作为供体亲本构建了包含142 个家系的高代回交导入系群体BC2F7,利用完备区间作图法对QTL 进行定位,2 年共定位到5 个与蛋白质相关的QTL。2020 年田雨等[42]分别利用东农L13、黑河36 以及东农L13、合农60 为亲本构建的2 个RIL 群体(RIL3613、RIL6013),在3 个环境下对大豆蛋白含量表型数据进行分析,采用ICIM 对3 个环境下蛋白质含量进行QTL 定位,共检测到分布于7 个连锁群的8 个QTL。2021 年武阳春等[43]以低蛋白品种中黄35 以及高蛋白大豆十胜长叶为亲本构建了RIL 群体,利用完备区间作图法对群体F2:15和F2:16进行分析,最终在Gm19 上定位到1 个与蛋白质含量相关QTL(qPRO-19-1)。
截止到目前,在Soybase 网站(https://www.soybase.org/)中共收录了248 个基于双亲群体定位的籽粒蛋白质QTL,部分QTL 信息如表2 所示。这些研究利用不同的分析方法,构建不同类型的遗传群体,使用多年、多点的表型数据,最终定位到大豆蛋白质含量相关的QTL 位点。随着分子标记的不断开发,遗传图谱越来越精密,越来越多有关大豆蛋白质性状相关的重要QTL 位点被挖掘。
表2 蛋白质含量QTL 定位信息
随着分子数量遗传学的不断发展,复杂的数量性状QTL 研究取得了很大的进步,QTL 定位技术以及一些其他技术体系的建立使对数量性状进行改良成为了可能。在QTL 分析中依然存在许多限制以及干扰因素,例如,利用比较常见的初级作图群体进行定位得到的精确度以及准确度都不高;易受环境因素的干扰,导致定位结果准确度低;遗传图谱饱和对QTL 也存在一定影响。想要克服这些不利因素,要选择目标性状差异较大的亲本组合进行定位,控制环境条件,利用永久性分离群体进行多年多点的检测,对QTL 作图方法和分析方法进行不断地完善,构建高密度的大豆遗传连锁图,增加遗传图谱的饱和度。获得可靠的数据有利于对QTL 后续研究的实施。
几十年来,已经有大量对于大豆蛋白质含量以及百粒重QTL 的研究,但是仍然存在一些方面需要进行深入探索以得到更加准确的QTL。连锁分析可以初步定位到目标性状基因的位置,关联分析可以进行精细定位以及验证基因功能,其二者在对于数量性状的研究上存在重要作用,将其二者进行结合可能会为深入解析数量性状遗传特点提供更多思路。在不断的研究探索中得到更加稳定的QTL 位点,进而对得到的QTL 进行分析、验证、基因挖掘,最终应用到遗传改良中去。