曲玉杰,孙君灵,耿晓丽,王骁,Zareen Sarfraz,贾银华,潘兆娥,何守朴,龚文芳,王立如,庞保印,杜雄明
(中国农业科学院棉花研究所/棉花生物学国家重点实验室,河南安阳 455000)
【研究意义】棉花是世界上最重要的经济作物之一,其棉纤维是重要的天然纺织原料,陆地棉(Gossypium hirsutumL.)是应用最广泛的棉种,其种植面积可达全球棉花种植面积的95%[1-3]。杂种优势利用是改良作物产量和品质的重要途径[4],在水稻[5]、玉米[6]、油菜[7]等作物育种中得到广泛应用。杂种优势利用在棉花育种中也具有十分重要的地位,杂交棉已在中国、印度和巴基斯坦等国家得到广泛应用[8-9]。陆地棉为异源四倍体作物,其杂种优势相比于二倍体的玉米和水稻较弱。有研究指出品种间杂交其产量性状具有一定的超亲优势,纤维品质性状具有中亲优势[10-11]。杂交种选育的目的是获得综合性状表现较好的强优势杂种后代,其关键所在是亲本选配。研究陆地棉亲本间遗传距离与杂种优势的关系对合理选配亲本和配制强优势杂交组合具有重要意义,可为杂种优势的准确预测和育种效率的提高提供一定的理论指导。【前人研究进展】在杂交育种亲本选配时,一般要求亲本间具有一定的遗传差异。遗传距离是对物种之间、种群之间遗传差异的度量[12]。徐静裴等[13]认为遗传距离(数量性状)可以用于预测杂种优势。MOLL等[14]最早利用玉米研究遗传差异与杂种优势的关系,发现二者呈曲线关系。GHADERI等[15]、ALI等[16]和TEKLEWOLD等[17]认为大豆、油菜和埃塞俄比亚芥数量性状遗传距离与杂种优势呈正相关。在研究陆地棉数量性状遗传距离与杂种优势关系中,王学德等[18]认为亲本遗传距离与产量杂种优势有显著或极显著的抛物线回归关系。赵玉昌等[19]认为遗传距离与断裂比强度、马克隆值的中亲优势和超亲优势存在显著或极显著的相关性,与单铃重的超亲优势和衣分的中亲优势存在显著的相关性。郝德荣等[20]认为遗传距离与杂种优势的关系较为复杂,并非遗传距离越大杂种优势越明显。陈强等[21]认为遗传距离与产量和纤维品质性状杂种优势的相关性均不显著,与纤维品质性状的相关性均高于产量性状的相关性。显然,前人对陆地棉数量性状遗传距离与杂种优势的关系研究尚未得到一致性的结果。【本研究切入点】前人研究陆地棉亲本间数量性状遗传距离与杂种优势关系所用的材料数目仅有几个到十几个,对应组合数目也仅有十几到几十个,很难充分体现陆地棉及陆地棉杂交后代的特点,相关性结果也不一定适用于所有陆地棉组合。赵仁渠等[22]研究发现小麦遗传距离与杂种优势的相关性随样本量的增加而由不相关到相关,认为较大的样本容量才能真实反映遗传距离与杂种优势的关系。陆地棉核心种质可以代表陆地棉的遗传多样性[23-24],用其来配制大规模的杂交组合,研究亲本间遗传距离及其杂种优势的关系,能得到更准确的结果,有利于陆地棉杂种优势预测。【拟解决的关键问题】本研究利用305份陆地棉核心种质材料为亲本,通过L×T杂交设计[25],配制1 500个组合,分析10个产量和纤维品质性状的杂种优势及其与亲本间遗传距离的相关性,探究利用大规模杂交组合亲本间数量性状遗传距离预测陆地棉杂种优势的效果,以提高杂种优势预测的精确度,减少杂交育种的盲目性,提高育种效率。
选取305份陆地棉核心种质作为亲本,它们分别来自中国、美国、澳大利亚、俄罗斯等15个国家,其中,中国材料257份,占84.26%,美国材料25份,占8.20%,其他国家材料23份,占7.54%。中国材料来自23个省(市),按棉区划分,黄河流域棉区175份,占亲本材料(下同)的 57.38%;长江流域棉区54份,占17.70%;西北内陆棉区17份,占5.57%;北部特早熟棉区9份,占2.95%;华南棉区2份,占0.66%。5份测试种(父本材料MA—ME):中7886、中1421、A971Bt、4133Bt和SGK9708均来自黄河流域棉区,为丰产型、综合性状优良的材料。所有种质均由国家棉花种质资源中期库提供,其详细信息见电子附表1。
305份陆地棉亲本,前期采用双行种植,每行约种30株,进行3年自交,使其性状稳定,并利用L×T杂交设计配制1 500个组合,收获F1种子。其中,L×T杂交设计是所有类型作物育种中评价优良亲本和有利杂交组合最简单有效的方法[25]。2012—2013年,将1 500份F1按父本不同分成5组(A—E),每组及305个亲本、4个对照(鲁棉研 28、7886、瑞杂 816和鄂杂棉10号)采用两年多点的种植方式,种植于中国南北方13个不同的生态环境,且5组同一年份的南北方地点均在同一棉区(长江流域棉区或黄河流域棉区),利用4个对照共同校正同一年份相同棉区不同地点间的误差。试验采用随机区组设计,行距1 m,行长8 m,3次重复,每小区约30株,试验地肥力中等,田间管理方式按当地大田生产常规操作进行,由中国农业科学院棉花研究所和11家合作单位共同完成。
棉花打顶后一周,每小区随机选取10株调查株高(plant height,PH,单位:cm),计算小区平均数。成熟后,每小区随机选取 10株调查单株铃数(boll number per plant,BN,单位:个),计算小区平均数。每个小区收取30铃,统计皮棉和籽棉重,计算单玲重(boll weight,BW,单位:g)和衣分(lint percentage,LP,单位:%)。称取30铃皮棉15 g以上用于纤维长度(fiber length,FL,单位:mm)、断裂比强度(fiber strength,FS,单位:cN/tex)、整齐度指数(fiber length uniformity,FU,单位:%)、伸长率(fiber elongation,FE,单位:%)、纺纱均匀性指数(spinning consistency index,SCI,单位:%)和马克隆值(Micronaire,MIC,单位:μg/inch)的测定,品质测定由农业农村部棉花品质监督检验测试中心完成。利用Excel计算每个环境各组合F1的中亲优势(mid-parent heterosis,MPH)和超亲优势(heterobeltiosis,HB)。计算公式如下:
式中,F1为某杂种一代表型均值,HP为高值亲本表型均值。
为了减少环境误差对结果的影响,利用Excel计算 F1各性状 4个环境的中亲优势和超亲优势的平均数,统计其杂种优势表现,并利用Graphpad prism 7.0对F1和亲本的10个性状进行差异显著性分析。利用305份亲本10个农艺性状所有环境的平均数,运用R语言进行亲本间数量性状遗传距离计算和群体结构分析,遗传距离采用欧式距离(D2)[12],为了使聚类树比例看起来更协调,利用遗传距离的平方根(即最小方差聚类,Ward,距离为 D)进行聚类,此种方法不影响聚类树的拓扑结构[26]。利用R语言进行数量性状遗传距离与杂种优势的相关性分析,采用4种分析方案(表1)。其中,Cor1:利用1 500个组合共同计算遗传距离与杂种优势的相关性;Cor2:将1 500个组合按分群结果分5个亚群(Ⅰ—Ⅴ),分别计算遗传距离与杂种优势的相关性;Cor3:按不同父本分5个组(A—E),分别计算遗传距离与杂种优势的相关性;Cor4:按不同父本分 5组,再按分群结果分5个亚群(即5×5),分别计算遗传距离与杂种优势的相关性。
表1 数量性状遗传距离与杂种优势的相关性分析方案Table 1 Correlation analysis schemes between genetic distance of quantitative traits with heterosis
F1和亲本 10个数量性状的差异显著性分析结果(图 1)表明,纤维长度、伸长率、整齐度指数、单玲重和株高的F1表现显著高于双亲,整体表现出一定的超亲优势;马克隆值、衣分和单株铃数的F1表现显著高于母本,父本也显著高于母本,F1与父本间差异不显著,整体表现为中亲优势或趋于高亲(父本)的优势;断裂比强度和纺纱均匀性指数的F1表现显著高于父本,与母本差异不显著,整体表现为中亲优势或趋向于高亲(母本)的优势。从整体来看,F1与亲本(双亲或其中一个亲本)的10个数量性状均存在显著差异,表现出一定的中亲和超亲优势。
图1 F1与亲本10个性状的差异显著性分析Fig. 1 Significant difference analysis of 10 traits between F1 hybrids and parents
通过对1 500个组合杂种优势分析,结果(表2)显示,10个性状在5组中除C、D和E组的马克隆值之外,其他性状50%以上的F1具有明显的中亲优势。其中,5组中80%以上F1均表现正向中亲优势的性状为单铃重和纤维长度,其中亲优势最大分别为34.01%和9.83%,对应超亲优势分别为24.25%和5.80%。有4组中80%以上F1均表现正向中亲优势的性状为株高和衣分,其中亲优势最大分别为 24.29%和 13.33%,对应超亲优势分别为19.98%和7.80%。为了观察每组的杂种优势的整体表现,对每组10个性状的中亲优势和超亲优势取平均值,其中,平均中亲优势A>E>B>C>D,最大为6.21%,平均超亲优势A>B>E>C>D,最大为1.13%。5组10个性状中亲优势总平均的变幅为1.70%—7.40%,平均为4.36%,超亲优势总平均的变幅为-4.17%—1.87%,平均为-0.64%。所以,10个产量和纤维品质性状中,大部分性状表现正向中亲优势,少数性状表现正向超亲优势,杂种优势表现最明显的为单铃重,其次为单株铃数和株高,表现最好的组为A组,其次为B、E组,C、D组最差。
表2 陆地棉10个数量性状杂种优势Table 2 Heterosis of 10 quantitative traits in upland cotton
续表2 Continued table 2
马克隆值是衡量纤维细度和成熟度的综合指标,纤维越粗成熟度越高,但是适合机纺的棉纤维需要尽可能的细和成熟,所以并不是马克隆值越大越好。对亲本和F1的马克隆值进行统计分析,其在95%的置信区间内均服从正态分布,亲本马克隆值(单位:μg/inch)介于2.54—6.64,平均值为4.82;F1马克隆值介于 3.24—6.47,平均值为 5.01。根据中华人民共和国国家标准——棉花细绒棉[27],马克隆值在A级和B级(3.5—4.9)的亲本占62.86%,F1占36.89%。进一步对表2中马克隆值的中亲优势和超亲优势的均值均为负的D、E组两组进行分析,发现D组马克隆值在A级和B级的亲本占27.91%,F1占11.33%;E组马克隆值在A级和B级的亲本占79.40%,F1占75.59%。综上,F1的马克隆值整体劣于其亲本。
2.3.1 亲本间遗传距离 利用10个产量和品质性状计算305份陆地棉亲本间的遗传距离(电子附表2)结果显示,5个测试种与300个母本间的遗传距离(欧式距离)的变幅为2.28—61.43,平均为21.55。其中,测试种A(中7886)与300份母本的遗传距离变异幅度为3.44—44.09,平均为16.47;测试种B(中1421)与300份母本的遗传距离变异幅度为2.28—50.94,平均为 11.72;测试种 C(A971Bt)与 300份母本的遗传距离变异幅度为 9.77—54.57,平均为 28.59;测试种D(4133Bt)与300份母本的遗传距离变异幅度为7.27—59.45,平均为33.27;测试种E(SGK9708)与300份母本的遗传距离变异幅度为3.74—61.43,平均为17.70。5个测试种与母本的平均遗传距离D>C>E>A>B,根据 2.2可知 5组中亲优势均值 A>E>B>C>D,并不是组间平均遗传距离越大,优势越强。
2.3.2 群体结构分析 群体结构分析结果(图2,电子附表3)表明,305份材料整体被分为2个主群(图2-a),在D=7.5(D为欧氏距离的平方根)处进行再次划分,可进一步分成5个亚群(Ⅰ—Ⅴ),其中Ⅰ和Ⅱ为一个主群,Ⅲ、Ⅳ和Ⅴ为另一个主群。通过比较其遗传距离大小,发现群间遗传距离大于群内,符合群体聚类原则,同时根据图 2-b的主成分分析,5个亚群的材料聚集在坐标系的不同位置,进一步证明聚类结果的可靠性。其中,5个测试种MA和MD被划分到第Ⅴ亚群,MB被划分到第Ⅲ亚群,MC被划分到第Ⅳ亚群,ME被划分到第Ⅰ亚群。
图2 305份亲本的群体结构分析Fig. 2 Population structure analysis of 305 parents
表3 Cor1遗传距离与杂种优势的相关关系Table 3 Correlation between heterosis and genetic distance by Cor1
2.4.1 Cor1遗传距离与杂种优势的相关性 亲本间遗传距离与杂种优势的相关性分析Cor1结果显示(表3),遗传距离与杂种优势存在显著的线性相关关系,与不同性状或优势的相关性存在差异,与超亲优势以负相关为主。其中,纺纱均匀性指数、衣分、断裂比强度和纤维长度的中亲优势与遗传距离呈极显著正相关,相关性系数分别为 0.3530、0.2459、0.1890和0.1764,单株铃数、马克隆值和单铃重的中亲优势与遗传距离呈极显著负相关,相关性系数分别为-0.3870、-0.3627和-0.1618;10个性状的超亲优势除整齐度指数和伸长率之外,其余均与遗传距离呈显著负相关,其中,纺纱均匀性指数与遗传距离呈显著负相关,显著性系数为-0.0634,其他均为极显著负相关,相关性系数介于-0.5277—-0.1055,相关性程度为单株铃数>马克隆值>纤维长度>株高>单铃重>衣分>断裂比强度;遗传距离与整齐度指数的超亲优势呈极显著正相关,相关性系数为0.0921。
2.4.2 Cor2遗传距离与杂种优势的相关性 亲本间遗传距离与杂种优势的相关性分析Cor2结果显示(表4),遗传距离与杂种优势的相关性总体与Cor1的结果相似,Cor1反映了Cor2中各亚群的整体水平。遗传距离与衣分和纺纱均匀性指数的中亲优势在 5个亚群中均达到极显著正相关,相关性系数分别介于0.1346—0.3801和0.1834—0.4058,与断裂比强度和整齐度指数的中亲优势在 4个亚群中均达到显著正相关,相关性系数分别介于 0.2144—0.2813和0.1173—0.2487,与单株铃数、马克隆值和单铃重的中亲优势在4个亚群中达到极显著负相关,其他性状在各亚群中相关性不稳定;遗传距离马克隆值的超亲优势在5个亚群中均达到显著负相关,相关性系数介于-0.5275—-0.1980,与单株铃数和纤维长度的超亲优势在4个亚群中均达到极显著负相关,相关性系数分别介于-0.6861—-0.4586和-0.5788—-0.2698,与株高和单铃重的超亲优势在 3个亚群中均达到极显著负相关,其他性状在各亚群中相关性不稳定。
表4 Cor2遗传距离与杂种优势的相关关系Table 4 Correlation between heterosis and genetic distance by Cor2
2.4.3 Cor3遗传距离与杂种优势的相关性 亲本间遗传距离与杂种优势的相关性分析Cor3结果显示(表5),遗传距离与各性状中亲优势的相关性在不同组表现不同,与部分性状(尤其是纤维品质性状)的超亲优势呈显著负相关。其中,遗传距离与单株铃数的中亲优势在A、B、C和E组均为显著正相关,与纤维长度和伸长率的中亲优势在A、C和D组均呈极显著正相关,与衣分的中亲优势在A、B和D组均呈显著正相关,与马克隆值的中亲优势相关性不显著;遗传距离与断裂比强度、纺纱均匀性指数和马克隆值的超亲优势在5组中均呈显著负相关,与纤维长度的超亲优势在A、B、D和E组均呈极显著负相关,与衣分的超亲优势在B、D和E组均呈极显著负相关,与整齐度指数和伸长率(P≥0.0416)的超亲优势相关性基本不显著。
表5 Cor3遗传距离与杂种优势的相关关系Table 5 Correlation between heterosis and genetic distance by Cor3
2.4.4 Cor4遗传距离与杂种优势的相关性 亲本间遗传距离与杂种优势的相关性分析 Cor4结果显示(表6,电子附表4),遗传距离与杂种优势的相关性整体比Cor3弱,但其整体结果与Cor3相似。相关性较弱是由于分 5个亚群之后样本量减少所致,所以遗传距离与杂种优势的相关性分析要达到一定的样本量。除E组外,遗传距离与中亲优势相关性显著的相关性系数均为正,其相关性水平并不高,P值介于0.00025—0.04720;遗传距离与超亲优势整体呈负相关,其相关性水平高于中亲优势。其中,在亚群Ⅰ、Ⅱ、Ⅲ和Ⅴ中,遗传距离与衣分的超亲优势均呈较稳定的显著负相关。在亚群Ⅰ、Ⅱ和Ⅴ中,遗传距离与纤维长度、断裂比强度和纺纱均匀性指数的超亲优势均呈较稳定的显著负相关。在亚群Ⅰ和Ⅱ中,遗传距离与马克隆值的超亲优势呈稳定的显著负相关。
综合 4种遗传距离与杂种优势的相关性分析结果,可知,遗传距离与衣分、断裂比强度、整齐度指数和纺纱均匀性指数的中亲优势整体呈显著正相关,与单铃重、单株铃数、纤维长度、马克隆值和伸长率的中亲优势采用不同的分析方案结果不同,与株高的中亲优势相关性较弱。遗传距离与衣分、纤维长度和马克隆值的超亲优势在4种分析方案中整体均表现显著的负相关,与整齐度指数的超亲优势在Cor1中表现显著正相关,与其他性状的超亲优势因方案、亚群和组的不同相关性结果不同。其中,5组中E组比较特殊,遗传距离与部分性状中亲优势的相关性与其他组存在正负差异。4种分析方案在样本量、遗传距离变幅和父本材料上存在差异,得到的结果有所不同。Cor2与 Cor1相比样本量和遗传距离变幅减小,相关性减弱;Cor3和Cor4与Cor1相比样本量和遗传距离变幅减小,相关性减弱,Cor4的相关性最弱,且按父本不同分成5组,不同组结果有所不同;Cor4与Cor2和Cor3相比样本量和遗传距离变幅减小,相关性减弱。Cor2和Cor3因分组(或分亚群)方式不同,结果有所不同。所以,遗传距离与杂种优势的相关性分析要具有一定的样本量,样本量越大相关性越强,相关性也因父本不同而有所差异。
表6 Cor4遗传距离与杂种优势的相关关系Table 6 Correlation between heterosis and genetic distance by Cor4
杂交亲本间的遗传距离影响杂种优势,关系十分复杂,机制尚不明确[28]。数量性状遗传距离在一定程度上可以反映材料间的遗传关系,是材料间表型性状异同程度的综合反映[29],其在陆地棉亲本选配和杂种优势利用上有一定的利用价值。本研究以能代表陆地棉遗传多样性的305份陆地棉核心种质材料为亲本,利用10个数量性状对其群体结构进行分析,将其有效的分成2个主群,5个亚群。对1 500个组合通过4种方案研究遗传距离与杂种优势的相关性,各方案在样本量、遗传距离变幅和父本材料上存在差异,得到的结果有所不同。在样本量较多的情况下,遗传距离与大部分性状的中亲优势和超亲优势之间具有显著或极显著的线性关系,且样本量越大显著性越强,这与赵玉昌等[19]、赵仁渠等[22]等研究结果较一致。与前人对陆地棉亲本间数量性状遗传距离与杂种优势的关系研究[18-21]相比,本试验利用大规模的陆地棉杂交组合来研究两者的关系,此规模在棉花甚至其他作物中都十分罕见,将这些组合按父本分组和群体结构分群进行划分,采用4种方案进行分析,能够更系统、全面和准确的分析遗传距离与杂种优势的关系,对陆地棉亲本选配、强优势组合筛选,以及杂种优势的高效预测有一定的指导作用,但本研究仍未得出十分明确的结果,有待进行更广泛深入的探究。
随着分子标记技术的发展与普及,已有学者广泛利用其来研究遗传距离与杂种优势的关系。武耀廷等[30]利用RAPD、ISSR与SSR标记研究陆地棉遗传距离与杂种F1、F2产量性状杂种优势的关系,发现其相关性程度偏低。杨代刚等[31]利用SSR标记研究陆地棉亲本配合力与杂种优势、遗传距离的相关性,发现配合力与遗传距离相关性不显著,产量性状杂种优势与遗传距离显著正向相关。宿俊吉等[32]利用SSR标记研究遗传距离与纤维品质性状的相关性,发现遗传距离与中亲优势有一定的相关性,但不同性状表现不同。ZHANG等[33]利用RAPD和AFLP标记研究海岛棉遗传距离与配合力和中亲优势的关系,发现与 GCA和SCA存在显著相关。在玉米和油菜中还有利用全基因组 SNP芯片来预测遗传距离与杂种优势的关系,其中,CHRISTIAN等[34]利用285份玉米自交系的56 110个SNP位点预测玉米7个生物量和生物能相关性状的杂种优势,其预测精度可达 0.72—0.81。桑世飞等[35]利用油菜波里马细胞质雄性不育系的6个保持系和8个恢复系的52 157个SNP位点研究油菜遗传距离与杂种优势的关系,发现遗传距离与株高、分枝部位高度和单株产量均呈极显著相关。YANG等[36]利用高通量测序技术获得的 SNP位点研究遗传距离与拟南芥生物量超亲优势的关系,发现二者之间相关性不显著。表型与基因型都是材料间遗传差异的组成部分,利用其计算的遗传距离都可以用于杂种优势预测。目前,成百上千份陆地棉已具有AFLP、RAPD、ISSR、SSR、SNP芯片[37]和高通量测序[1,38-39]等基因型数据,各大作物(包括棉花)的基因型数据库和表型数据库不断建立,利用各种基因型和表型数据相结合研究遗传距离与杂种优势的关系,将在杂种优势预测上取得更好效果,更有利于揭示杂种优势机理。
陆地棉亲本间数量性状遗传距离与杂种优势有一定的线性关系,遗传距离与衣分、断裂比强度、整齐度指数和纺纱均匀性指数的中亲优势呈显著正相关,与整齐度指数的超亲优势呈一定的正相关,与衣分、纤维长度和马克隆值的超亲优势呈显著负相关,且相关性随样本量的增加而增强,利用大规模杂交组合可以提高陆地棉产量和纤维品质性状杂种优势预测效果。
致谢:河南科技学院王清连和张新、湖北省农业科学院经济作物研究所秦鸿德和易先达、中棉种业刘金海和蔡忠民、荆州市晶华种业科技有限公司刘辉、江西省棉花研究所杨军、河北农业大学马峙英和李志坤、国欣农村技术服务总会徐东勇、中棉长江公司杨金龙和周关印、山东众力公司张金彪和李林、湖南省棉花科学研究所张雪林、湖南常德三益种业有限公司黄爱芬以及中国农业科学院朱海勇等人对本试验组合配置和表型性状的生态鉴定做出重要贡献,特表感激。