崔竣杰,吕 振,杨天文,王 静,洪 宇,曹 毅
(佛山科学技术学院 园艺系,广东 佛山 528225)
丝瓜为葫芦科丝瓜属(Luffa)一年生攀缘植物,主要分布在亚种、非洲、澳洲等热带和亚热带地区。丝瓜果实不仅营养丰富,味道鲜美,而且还具有抗炎、保肝等药理作用[1],已成为广大消费者最喜爱的瓜类蔬菜之一。丝瓜属包括8个种[2],其中作为蔬菜栽培的主要有2个种,分别是无棱丝瓜[Luffacylindrica(L.) Roem.Syn.L.aegyptiacaMill.],又称普通丝瓜(sponge gourd)、有棱丝瓜[L.acutangula(L.) Roxb.]、棱角丝瓜(ridged gourd)[3]。
近年来,丝瓜遗传图谱构建和基因/QTL定位相关研究取得了一些进展,促进了丝瓜分子育种理论研究的不断发展。2013年,周庆友[4]利用种间BC1群体和114个COS标记构建了丝瓜第一张遗传图谱,包含17个连锁群,总遗传距离为634.96 cM,平均遗传距离为5.57 cM。随后,Cui等[5]利用种间F2群体和258个SRAP标记构建一张包含24个连锁群的丝瓜遗传图谱,总遗传距离为822.86 cM,平均遗传距离为3.49 cM。Wu等[6]利用种间F2群体和177个SSR标记构建一张包含14个连锁群的丝瓜遗传图谱,总遗传距离为1 436.12 cM,平均遗传距离为8.11 cM。吴宗斌[7]利用种间BC1群体和32个SRAP标记、79个SSR标记构建一张包含12个连锁群的丝瓜遗传图谱,总遗传距离为775.41 cM,平均遗传距离为6.99 cM。秦永强[8]利用2个种间BC1群体和105、100个SSR标记分别构建包含13、11个连锁群的2张丝瓜遗传图谱,总遗传距离分别为835.60、856.80 cM,平均遗传距离分别为7.96、8.57 cM。Lou等[9]利用种内F2群体和3 701个SLAF标记构建一张包含13个连锁群的普通丝瓜遗传图谱,总遗传距离为1 518.56 cM,平均遗传距离为0.41 cM。这些遗传图谱的总遗传距离和平均遗传距离大多较小或者基因组覆盖度尚不清楚。此外,基于上述遗传图谱,研究人员还对丝瓜的种皮颜色[4]、开花相关性状[5]、开花时间和花粉育性[6]、果实苦味[7-8]、黄瓜花叶病毒抗性[9]进行了基因/QTL定位研究。
普通丝瓜和有棱丝瓜遗传背景差异较大,二者花期不遇,存在生殖隔离,但通过人工杂交可产生后代。丝瓜种间杂交能创造更加丰富的变异类型,与常规杂交育种相结合可引入更多的优良基因。近期,普通丝瓜和有棱丝瓜的全基因组测序工作相继完成[10-12],相比较于其他瓜类蔬菜,丝瓜基因组大小相对较大;因此,在进行丝瓜遗传图谱构建时,对图谱的遗传距离长度和标记密度要求更高。另外,对于丝瓜的一些重要外观品质性状,比如果实长度,仍然缺乏相关遗传定位研究的报道。丝瓜果长变异丰富,是影响丝瓜产量和品质的重要农艺性状。普通丝瓜种内遗传分析表明,丝瓜果长遗传由1对加性主基因和加性-显性多基因修饰[13]。普通丝瓜和有棱丝瓜种间遗传分析表明,丝瓜果长遗传由多基因控制[14]。本研究以有棱丝瓜自交系盛优长丝瓜为母本,普通丝瓜自交系苹果丝瓜为父本构建一个回交(BC1)群体,通过重测序进行基因分型进而构建丝瓜种间bin标记遗传图谱,然后对丝瓜果长性状进行QTL定位,旨在为丝瓜种间杂交育种提供理论基础。
本试验选择有棱丝瓜自交系盛优长丝瓜[果实较长,(62.70±1.69) cm]做母本,普通丝瓜自交系苹果丝瓜[果实较短,(13.63±0.25) cm]做父本,试验材料种植在肇庆市沙浦基地。于2020年秋季通过杂交获得种间F1代种子,于2021年春季通过种间F1代杂交种与苹果丝瓜杂交获得67个单株的回交一代群体(BC1)。于2021年秋季将两个亲本材料、F1和BC1群体一起种植,按当地常规栽培方式进行管理。丝瓜开花坐果后约1个月,使用卷尺对亲本、F1和BC1群体的果实长度(果肩至果尾)进行测量,对BC1群体每一株果实进行测量,亲本和F1群体分别测量10株,每株测量3个果。
在丝瓜长出侧枝后,从亲本、F1和BC1群体单株的侧枝上摘取幼嫩叶片,放入-80 ℃冰箱保存,采用CTAB法[15]提取DNA。
使用Covaris仪超声波将提取的基因组DNA随机打断,电泳回收所需长度的DNA片断,加上接头进行cluster制备,在华大基因DNBseq测序平台进行测序。
利用华大自主开发的过滤软件SOAPnuke去除杂质数据,得到有效数据。SOAPnuke软件过滤参数:“-n 0.01-l 20-q 0.3--adaMR 0.25--ada_trim--polyX 50”。过滤步骤如下:
(1)过滤接头。如果测序read匹配上adapter序列的25%或者以上(最多允许2个碱基错配)则切除adapter;如果测序read中质量值低于20的碱基占整条read的30%或者以上则删除整条read。
(2)去N(表示没有测定的碱基)。如果测序read中N含量占整条read的1%或者以上,则删除整条read;如果测序read中polyX(X可为A、T、G或C)长度超过50 bp,则删除整条read。
(3)获得clean reads。输出的read质量值体系设定为Phred+33。
以普通丝瓜SG2019[12]作为参考基因组(组装大小为669 Mb),利用GATK软件进行SNP检测,将67份BC1群体材料的SNP位点与亲本进行对比,如果与苹果丝瓜的基因型相同则记作“b”,杂合的基因型记作“h”,缺失的位点记作“-”,对在群体中发生偏分离(卡方检验,P<0.05)的位点进行过滤。参照Huang等[16]的方法,对BC1群体的每个个体,以15 bp为一个滑动窗口大小进行bin标记的基因分型,每次滑动一个SNP位点,获得bin标记基因型。
将bin标记基因型数据导入到Joinmap 4.0软件中,利用极大似然估计法计算bin标记之间重组率和LOD值。基于构建的bin标记遗传图谱,将图谱数据、表型数据和基因型数据导入MapQTL 6软件,采用MQM模型(Multiple-QTLmodels)进行QTL检测,检测LOD阈值设定为3.0。选取距离QTL最近的标记作为该QTL最关联的标记,用最近标记的效应值代表该QTL的效应值,利用降低1 LOD值划定该QTL的遗传位置区间。QTL采用“q+性状英文缩写+染色体号+被检测QTL序号”方式命名[17]。
对丝瓜果长进行调查和统计分析,盛优长丝瓜和苹果丝瓜的平均果长分别为62.70 cm和13.63 cm,两个亲本的果长具有极显著差异(F=826.31,P<0.01)。由表1可知,F1群体果长平均值为41.04 cm,高于中亲值(38.17 cm),表明长果对短果为不完全显性遗传。BC1群体的果长呈连续分布,表现出数量性状的遗传特点,经正态分布检验符合正偏态分布(P<0.05,Sk>0)(图1),说明可能存在主效的遗传控制位点。
P1和P2分别表示盛优长丝瓜和苹果丝瓜。
表1 丝瓜亲本和群体的果长分布
对丝瓜BC1群体和盛优长丝瓜、苹果丝瓜两个亲本进行重测序,经过数据过滤后分别得到337.23 Gb、25.14 Gb和25.07 Gb的高质量数据。盛优长丝瓜和苹果丝瓜测序深度分别为33.08×和32.98×,测序数据的Q20和Q30都在93%以上。以普通丝瓜SG2019作为参考基因组比对的覆盖率分别为76.10%和97.85%。BC1群体材料的测序平均深度为6.62×,各样本测序数据的平均Q20和Q30分别为96.57%和91.33%,以普通丝瓜SG2019作为参考基因组比对的平均覆盖率为95.66%。
基于盛优长丝瓜和苹果丝瓜两个亲本基因组间的多态性位点,在67份BC1群体材料中共鉴定出5 546 477个SNP位点。由于在本试验回交群体中,理论上只存在苹果丝瓜基因型“b”和杂合基因型“h”两种基因型,因此,在67份BC1群体材料中,对除包含“b”和“h”之外的其他类型基因型位点(如含有3种基因型的位点)进行过滤,剩余1 937 199个SNP位点,保留符合卡方检验的位点,还剩余156 702个SNP位点。为保证在进行bin标记分型时滑动窗口内SNP位点的完整性,对67份BC1群体材料中有SNP缺失的位点进行过滤,还剩余28 344个SNP位点。然后,通过滑动窗口基因分型,过滤掉未知基因型“u”超过20%的位点并将相邻且基因型相同的bin标记合并,最终剩余9 494个bin标记(图2)。
Scaffold1~Scaffold13表示丝瓜的13条染色体,b表示苹果丝瓜基因型,h表示杂合基因型,u表示未知基因型。
将上述9 494个bin标记基因型数据导入到Joinmap 4.0软件,构建遗传图谱。经过连锁分析,最终构建一张包含9 299个bin标记的丝瓜高密度种间遗传图谱,所有bin标记分布于14个连锁群上。其中,scaffold10号染色体对应2个连锁群(Scaf10-1和Scaf10-2),其他12条染色体分别对应1个连锁群(图3)。图谱总遗传距离为2 956.57 cM,标记间平均遗传距离为0.32 cM(表2)。以普通丝瓜SG2019作为参考基因组(基因组组装大小669 Mb),该遗传图谱覆盖约80.47%(538.33 Mb)的丝瓜基因组区域,全基因组范围的重组率约为5.49 cM/Mb。
表2 bin标记在丝瓜连锁图谱上的分布
图3 丝瓜bin标记种间遗传图谱
结合BC1群体植株的果长数据和bin标记遗传图谱,在连锁群Scaf 1上定位到一个果长QTL位点qFL1.1(图4),最近的标记为scaf1-bin182,遗传位置为38.24 cM,LOD值为4.21,表型贡献率为28.90%,来自母本盛优长丝瓜的加性效应为6.04。通过降1 LOD确定该QTL位点的遗传区间在scaf1-bin33(19.76 cM)和scaf1-bin359(92.84 cM)两个标记之间,遗传距离为73.08 cM,该区间的物理距离为4.44 Mb。
图4 丝瓜果长QTL遗传定位结果
我国普通丝瓜和有棱丝瓜种内种质资源的遗传背景比较狭窄[18-19],从而限制丝瓜在种内的持续改良。然而,普通丝瓜与有棱丝瓜种间存在巨大的遗传差异,通过种间杂交可不断地拓宽丝瓜种质的遗传背景。因此,在前期研究中,多数研究人员尝试了使用丝瓜种间杂交群体如种间F2群体[5-6]和BC1群体[4,7-8]作为遗传作图群体。前期研究表明,普通丝瓜和有棱丝瓜种间杂交的F1代植株生长旺盛,表现出极强的杂种优势,但种间杂交F2代种子多数表现为干瘪、无生活力,少数种子萌发后长成的植株也大多表现为畸形植株[5],与之相反,丝瓜种间BC1群体的种子和植株都表现出正常的生长活力,说明对于丝瓜种间遗传图谱的构建,回交群体可作为更理想的作图群体。
通过对丝瓜种间BC1群体材料和盛优长丝瓜、苹果丝瓜两个亲本进行重测序,测序数据的Q20和Q30平均都超过91%,说明测序质量较高,能够满足本研究的数据分析。以普通丝瓜SG2019作为参考基因组,盛优长丝瓜在33.08×的测序深度下,测序覆盖率为76.10%,说明有棱丝瓜和普通丝瓜的基因组具有非常显著的差异;与之相比,苹果丝瓜和BC1群体材料的平均覆盖率都比较高。经过SNP基因分型,本研究在67份BC1群体材料中共鉴定出1 937 199个符合BC1基因型特点的SNP位点,然而,仅156 702个SNP位点符合卡方检验的分离规律,种间杂交亲本遗传背景的差异较大与BC1群体数目较少可能是引起严重偏分离的2个重要原因。尽管如此,本研究依然通过较高深度的重测序确保了足够的SNP位点数量。
随着高通量测序技术的发展,bin标记法已成为一种高效的基因分型方法[16,20],其优点为bin标记作为一个重组断点单位,不但包含大量SNP位点信息,而且极大地减轻分析工作量,已广泛运用于水稻[16,21]、玉米[22]、大豆[23]、黄瓜[24]等作物的遗传图谱构建和QTL定位。在作图群体中,获得高质量、高密度和高覆盖度的SNP是bin标记图谱构建的前提。因此,在丝瓜基因组测序已完成的情况下[10-12],通过重测序获得全基因组范围高质量的SNP是进行丝瓜bin标记图谱构建的理想方式。迄今,已报道的丝瓜遗传图谱总遗传距离为634.96~1 518.56 cM,标记数量为100~3 701,平均遗传距离为0.41~8.11 cM[4-9]。本研究所构建的丝瓜bin标记遗传图谱总遗传距离为2 956.57 cM,标记数量为9 494,平均遗传距离为0.32 cM,并且已覆盖约80.47%的丝瓜基因组区域。可见,本研究构建的丝瓜遗传谱图具有更高的密度和覆盖度。
葫芦科作物果实长度是一个非常重要的外观品质性状,对果长性状的QTL定位或基因克隆已在黄瓜[25-27]、西瓜[28]、甜瓜[29-30]中进行了许多报道。丝瓜果长是一个受多基因控制的数量性状[14]。本研究在丝瓜连锁群Scaf 1上定位到1个果长QTL位点,贡献率为28.90%,说明丝瓜果长主效遗传位点的效应值较低,受环境影响较大。该QTL位点加性效应为6.04,意味着本试验中普通丝瓜材料苹果丝瓜与有棱丝瓜材料盛优长丝瓜杂交后可通过世代定向选育提高果实长度。该QTL位点的遗传距离为73.08 cM,物理距离为4.44 Mb,定位区间较大,有待进一步精细定位和克隆。