吴小燕 ,周仙莉 ,张红岩 ,彭小星 ,范惠玲 ,滕长才 ,刘玉皎 ,3*
(1.青海大学农牧学院,西宁 810016;2.青海省农林科学院,西宁 810016;3.青海大学省部共建三江源生态与高原农牧业国家重点实验室,西宁 810016)
蚕豆(Vicia fabaL.),又称罗汉豆、佛豆和胡豆等,属豆科巢菜属,一年生或越年生草本植物,是人类最早栽培种植的豆科类作物之一。蚕豆富含丰富的蛋白质、矿物质和维生素等,在食品、饲料以及绿肥等方面广泛应用[1]。蚕豆还具有较高的药用价值,它的茎、叶、花和荚壳等都可入药,其根部的固氮能力可改善土壤结构与土壤营养状况[2]。目前,国内外蚕豆育种主要集中在产量、品质与抗性育种等方面[3]。机械化生产是现代农业发展的总体趋势,也是制约蚕豆生产的因素之一。近年来,由于蚕豆难以适应机械化,生产效率低,生产成本不断增加,导致其种植面积减少[4]。始荚节位与始荚高度是蚕豆重要的农艺性状,是实现蚕豆规模化机械生产的关键性状,因此,选育始荚节位与高度适宜且结荚比较集中、适合机械收获的蚕豆品种,是解决近年来制约蚕豆产业发展的机械化收获问题的有效方式。蚕豆基因组巨大,约为13 Gb,其基因组学与遗传学研究进展相比于其他豆类较为缓慢[5],基因组学研究仅局限于分子标记及QTLs层面。目前,关于始荚高度性状基因定位的研究主要是在大豆上[6-10],还未见关于蚕豆的相关报道。本研究以青蚕19号/青海13号构建的F2群体为材料,对蚕豆的始荚节位、始荚高度性状的遗传进行分析,明确其遗传规律,定位与蚕豆始荚节位、始荚高度性状相关的QTLs,为应用分子标记辅助选择育种技术定向选育适宜始荚高度与始荚节位的优良品种选育提供依据。
青蚕19号,始荚节位、始荚高度高,晚熟;青海13号,始荚节位、始荚高度低,早熟;以上材料均由青海大学农林科学院作物栽培研究所蚕豆课题组提供,种植于青海省农林科学院试验地(36°43′N,101°45′E)。
1.2.1 群体构建及性状调查
以始荚节位、始荚高度较高的青蚕19号为母本,以始荚节位、始荚高度低的青海13号为父本,于2019年6—7月组配杂交组合,于8月份收获杂交种;2020年4月种植F1群体,于8月份收获F1单株;2021年4月种植F2群体。田间管理按常规方法进行。待成熟时,分别测定F2群体中各单株的始荚节位、始荚高度等性状,利用SPSS统计软件对F2群体的表型数据进行统计分析,采用植物数量性状“主基因+多基因”混合遗传模型[11]对亲本和F2群体单株始荚节位与始荚高度进行遗传分析。
1.2.2 引物筛选
DNA提取:在幼苗期取亲本及F2群体的幼嫩叶片,采用改良CTAB法[12]提取DNA。利用IMPLEN GMBH的超微量核酸蛋白测定仪与1%琼脂糖凝胶电泳对提取的蚕豆基因组DNA进行质量检测。
PCR扩增及产物的检测:配置PCR反应体系,依次加入4 μL 2× San Taq PCR mix预混液体系、上下游SSR引物各0.5 μL、1.5 μL DNA模板及3.5 μL ddH2O,共10 μL。PCR仪扩增程序:94 ℃预变性5 min;94℃变性30 s,50℃~60℃退火45 s,72℃延伸45 s,35个循环;72℃延伸10 min,4℃保存。PCR产物使用8%非变性聚丙烯酰胺凝胶电泳检测,缓冲液为1×TBE,220 V恒压电泳1.2 h左右,电泳结束后进行银染和显影,然后统计在亲本材料间表现多态性的SSR引物。
1.2.3 基因分型
利用筛选出来的具有多态性的SSR引物,对F2群体进行基因分型,与青蚕19号带型一致的带型记为1,与青海13号带型一致记为2,杂合带型记为0,缺失带型记为3。
1.2.4 图谱构建
采用QTL Icimapping v.4.2软件的构建遗传连锁图谱,对SSR标记进行分组排列,计算标记间的连锁距离。
1.2.5 基因初步定位
根据F2单株始荚节位与始荚高度性状表型数据,应用QTL Icimapping v.4.2软件的复合区间作图法对表型数据和分子标记数据进行连锁分析,扫描步长为1.00 cM,逐步回归分析中标记进入的最大P值(PIN)为0.001,LOD阈值为2.2,初步定位始荚节位与始荚高度性状相关QTLs。
F2群体中始荚节位与始荚高度两个性状呈现连续性分布(图2),符合数量性状的特征。F2群体始荚节位与始荚高度性状的分离情况(表1)表明,始荚节位性状的偏度值与峰度值的绝对值都小于3,说明该性状由主效基因控制,始荚高度性状的偏度值的绝对值小于3,但峰度值的绝对值大于3,说明该性状受主基因控制的同时可能还受多个微效基因控制。始荚节位与始荚高度的变异系数都大于15%,说明这两个性状的变异丰富,始荚节位的变异系数33.4%,小于始荚高度的变异系数49.2%,表明后者比前者在形态变异上更丰富,更突出。这两个性状的变异系数都小于1,说明存在超亲分离现象。通过相关性分析,结果表明始荚节位与始荚高度性状之间呈现极显著的正相关关系,且相关系数高达0.594(表2)。
图2 始荚节位与始荚高度频率分布直方图Figure 2 Frequency distribution histogram of initial pod node position and initial pod height
表1 F2群体分离情况Table 1 Segregation of F2population
表2 始荚节位与始荚高度性状的相关性分析Table 2 Correlation analysis between the position of the first pod node and the height of the first pod
采用植物数量性状“主基因+多基因”混合遗传模型对亲本和F2群体单株始荚节位与始荚高度进行分析,根据AIC值最小法则选择AIC值最小的一组作为备选模型(表3),对备选模型进行一组适合性检验(表4),选择AIC值最小且统计量达到显著水平个数较少的模型作为最优模型,备选模型的统计量达到显著水平的个数均为0,根据AIC准则进行筛选,即蚕豆始荚高度性状符合2对加性-显性主基因模型(2MG-AD)遗传模型,蚕豆始荚节位性状符合2对加性-显性-上位性主基因模型(2MG-ADI)遗传模型。根据选择的最优遗传模型估计最优遗传模型的一阶、二阶遗传参数,并求得了相关二阶遗传参数(表5、6),结果表明始荚节位性状由2对主基因控制,主基因的遗传率为44.6%,该性状受环境因素的影响较大;2对主基因的加性效应值da(d)、db分别为1.134 9、1.060 5,具有正向遗传效应,显性效应值 ha(h)、hb 分别为-1.649 9、-0.921 5,均表现为负向遗传效应。加性×加性互作效应值i为1.051 4,表现为正向效应,加性×显性互作jab和显性×加性互作jba的效应值分别为-0.920 3和-0.464 1,表现为较低的负向遗传效应;显性与显性互作效应值l为1.481 6,表现为正向效应。始荚高度性状由2对主基因控制,主基因的遗传率较高,达到了83%。2对主基因的加性效应值da(d)、db分别为11.231、8.705 9,具有较高的正向遗传效应,其显性效应值ha(h)、hb分别为-15.806 6、-4.962 3,均表现为负向遗传效应,尤其前者的负向遗传效应更为突出。
表3 F2群体始荚节位与始荚高度性状的遗传模型Table 3 Genetic model of the characters of initial pod node position and initial pod height in F2population
表4 F2群体始荚节位与高度性状的适合性检验Table 4 Fitness test of initial pod position and height traits in F2population
表5 F2群体始荚节位性状遗传参数估计值Table 5 Estimation of genetic parameters of the first pod node traits in F2population
表6 F2群体始荚高度性状遗传参数估计值Table 6 Estimation of genetic parameters for the traits of initial pod height in F2population
2.3.1 多态性引物筛选
利用1 596对蚕豆SSR引物在亲本青蚕19号和青海13号之间进行多态性引物的筛选,共筛选出202个在亲本间具有多态性的标记,多态性比率为12.7%。
2.3.2 基因分型与偏分离分析
利用202对多态性引物对(青蚕19号×青海13号)F2群体进行基因分型,其中132个标记的带型清晰且易识别,用于构建遗传图谱。利用QTL Ici⁃mapping v.4.2软件对每个SSR标记位点在作图群体中的分布情况进行测验,在P<0.05的显著水平上,判断某标记位点是否存在偏分离现象。结果表明132个标记中,53个标记表现出明显的偏分离现象,占标记数量的40.15%,后期构建遗传图谱时将这些偏分离标记剔除。
2.3.3 遗传图谱的构建
利用QTL Icimapping v.4.2软件对79个多态性标记的基因分型数据进行连锁分析,构建遗传连锁图谱。当LOD值为2.2时,图谱共包含6个连锁群,图谱总长度为1 804.59 cM,标记间平均距离为22.84 cM,各连锁群长度介于26.34~1 389.89 cM之间,SSR标记在各个连锁群上分布不均匀,连锁群的标记数量介于2~54个,其中LG1覆盖长度最长,标记数量最多为54个,LG6覆盖长度最短,含标记数量最少为2个,LG4标记间平均距离最小为7.47 cM,LG5标记间平均距离最大为28.12 cM。
2.3.4 始荚节位与始荚高度性状基因的初步定位
利用QTL Icimapping v.4.2软件对分子标记与始荚节位和始荚高度表型数据进行完备区间作图法(inclusive composite interval mapping,ICIM)作图,以LOD≥2.5为判定QTL是否显著的标准,定位到了5个与始荚节位相关的QTLs(图3),分别为qPs-2-1、qPs-2-2、qPs-2-3、qPs-2-4和 qPs-2-5,分别位于LG2上的482.00 cM、1018.00 cM、1183.00 cM、1 243.00 cM和1 354.00 cM处,LOD值分别为6.512 6、3.070 4、6.618 4、2.907 6和 2.618 0,加性效应分别为 0.512 6、1.173 7、1.270 4、0.408 9和-0.451 8,分别解释了1.2213%、5.8434%、5.1660%、0.614 6%和0.663 0%的表型变异。定位到8个与始荚高度相关QTL(图2),分别命名为qPh-2-1、qPh-2-2、qPh-2-3、qPh-2-4 qPh-2-5、qPh-2-6、qPh-3-1和qPh-3-2,他们分别位于LG2上的262.00 cM、484.00 cM、505.00 cM、697.00 cM、1 181.00 cM以及1 238.00 cM处和LG3上的48.00 cM以及187.00 cM处,LOD值分别为9.607 5、4.263 1、4.331 1、2.831 3、10.772 5、6.235 8、5.246 9和3.046 4,加性效应分别为9.506 7、2.386 1、3.817 5、2.347 5、9.144 9、4.030 3、9.183 1和 7.944 1,分别解释了4.759 4%、0.548 2%、1.125 9%、0.386 8%、4.613 5%、0.781 5%、4.425 2%和3.225 9%的表型变异。
图3 遗传连锁图谱Figure 3 Genetic linkage map
蚕豆作为我国种植面积最广的食用豆品种,它可以调整种植结构,增加农民的收入,但是在生产过程中所需劳动强度大,生产成本高,效率低,影响了自身优势作用的发挥[13]。始荚高度是蚕豆实现机械化生产的重要性状,明确该性状的遗传规律,定位相关的QTLs,为适宜始荚高度与始荚节位的优良品种选育及分子辅助选择育种提供依据。研究结果表明始荚节位与始荚高度都是数量性状,并且这两个性状都由2对主基因所控制,始荚节位主基因的遗传力为44.6%,该性状表型的变异容易受环境因子的影响;始荚高度主基因的遗传力为83%,说明该表型变异是由遗传因子决定的,这与大豆始荚高度遗传研究所得到的结论相一致[7,14-15]。当遗传力较大时,在早代进行选择比较适宜,遗传力较低时在晚代进行选择[16],因此若要在后代群体中进行选择,需在早代选择。根据相关性分析可知,始荚节位与始荚高度之间呈现极显著正相关,相关系数达0.594,这说明两个性状之间存在紧密联系。
构建高密度的遗传图谱是蚕豆基因组研究的基础和主要手段,在基因定位、克隆和关联分析等方面发挥了重要的作用[17];在构建遗传图谱时,得到的连锁群数目应与所研究对象染色体对数目是一一对应的[18];如已有研究证实水稻的12对染色体与其连锁群之间是完全对应的[19];大豆有20对染色体,构建的连锁图谱中含20个连锁群[20];玉米含有10对染色体,其连锁群个数也为10[21];还有马铃薯[22]、番茄[23]、绿豆[24]、菜豆[25]以及冬瓜[26]等它们的遗传连锁群个数均与单倍染色体个数相等。本试验所构建的遗传图谱包含6个连锁群,与蚕豆的单倍染色体数目相等。与前人在研究中构建的蚕豆遗传图谱相比[27],该遗传图谱密度较小,连锁群上所分布的标记不均匀,大多数标记都分布在LG02上,LG01和LG06上分别仅有3个和2个标记,主要是因为蚕豆基因组大而构建图谱所用的标记少,覆盖率小导致的,后期需继续筛选引物标记来加密已构建遗传图谱。在构建遗传图谱时存在一些偏分离标记,偏分离的概率达到了40.15%。前人[28-29]在研究中表明,构建遗传图谱时偏分离是一种普遍现象,引起偏分离的原因有很多,如染色体丢失、重排、环境因素以及试验过程中的误差等,本试验中偏分离存在的原因有待进一步研究。本试验共定位到了5个与始荚节位相关的QTLs和8个与始荚高度相关的QTLs,两个性状各QTL位点贡献率在0.61%~5.84%、0.39%~4.76%之间,小于10%,贡献率较低。影响贡献率的因素为遗传方差和表型方差,本试验在进行QTL作图时,对每个SSR标记位点在作图群体中的分布情况进行检测,在P>0.05的显著水平上,去除奇异分离的标记后进行QTL作图,因此,遗传因素对贡献率的影响可以忽略。表型方差是导致低贡献率的原因,本试验未设多年多点,作图群体为F2群体,变异系数大,表型变异丰富,此外调查表型性状时还存在人为误差,基因和环境互作也对贡献率有一定的影响。在后期试验中,应选用次级作图群体或设多年多点试验,减小试验中的随机误差,提高所定位的QTL的质量。有研究表明,在QTL作图结果中,遗传效应大、PVE低属于正常现象[30]。检测到QTLs的准确性还需进一步验证,可采用连锁分析和关联分析相结合的方法来提高QTL定位结果的准确性。
蚕豆的始荚节位与始荚高度均是数量性状,两者之间呈极显著正相关关系,这两个性状均由2对主基因控制,无多基因;始荚节位性状遗传力较小,容易受环境因素影响,始荚高度性状遗传力较大,表型变异主要由遗传因子决定,受环境影响较小。经过SSR标记连锁分析,定位到了5个始荚节位相关的QTLs和8个始荚高度相关的QTLs,贡献率分别在0.61%~5.84%、0.39%~4.76%之间。这一研究结合分子标记辅助选择育种技术为定向选育适宜始荚高度与始荚节位的优良品种选育提供依据。