金彦龙,李艳军,张新宇,孙 杰,薛 飞
(石河子大学 农学院,石河子大学新疆生产建设兵团绿洲生态农业重点实验室,新疆石河子 832003)
小麦(TriticumaestivumL.)是全世界最重要的粮食作物之一,在其生产过程中常面临锈病、赤霉病和白粉病的危害。其中小麦白粉病是由子囊菌亚门的布氏白粉菌Blumeriagraminis(DC) Speer f.sp.tritici引发的世界性小麦病害。由于小麦白粉菌生理小种变异速度快,以及单一抗性品种的大面积推广,导致品种抗性极易丧失。选择和配置多基因聚合的抗病品种是最经济、有效且环境友好的防治方法[1]。发掘有效且持久的抗性基因资源,并进行精细定位,将有助于现有抗源的合理利用,最终实现小麦的持久抗 病性。
对于大规模SNP和InDel标记开发,SLAF-Seq(Specific length amplified fragment sequencing)具有低成本和高通量的特性,弥补了SSR标记在基因组分布不均的不足。SLAF-Seq技术结合BSA(Bulked segregant analysis)方法已被广泛应用于玉米花序[2]、拟南芥疫霉病[3]、黄瓜果肉[4]、大麦叶色[5]、油菜种子[6]、桃树温敏半矮化[7]、甜瓜风味[8]、番茄叶霉病[9]、水稻分蘖[10]、棉花雄性不育[11]等性状的分子标记开发、QTLs鉴定和候选基因关联分析等。
中国小麦农家品种非常丰富,其中‘小白冬麦’经历漫长年代至今仍保持着一定抗白粉病能力。然而,‘小白冬麦’所持有的抗白粉病基因mlxbd并没有得到充分的研究和利用。本研究将通过构建‘小白冬麦’与感病材料‘陕优225’的F2:3作图群体,基于SLAF-Seq结合BSA方法进一步缩小mlxbd所在染色体候选区域,基于序列差异查找SNP和Indel。并通过生物信息学数据库对定位染色体区间内的候选基因进行分析,为进一步图位克隆抗白粉病基因mlxbd以及深入研究Pm5抗病基因位点提供理论依据。
农家品种‘小白冬麦’作为抗病亲本与感病材料‘陕优225’杂交,获得F1代,自交获得F2:3分离群体。小麦白粉病生理小种E09由中国农业科学院植物保护研究所麦类病害组提供。
对‘小白冬麦’和‘陕优225’组合的F2:3分离群体接种BgtE09进行苗期(1到2叶期)抗病性鉴定,待对照组‘陕优225’充分发病时对F2:3分离群体进行鉴定,按照0~4级分级标准调查小麦白粉病反应型[12]。
选取经鉴定的F2:3免疫及近免疫(等级为0;和0)和高感(等级为4)两个极端个体各50株,抗病亲本‘小白冬麦’与感病亲本‘陕优225’各1株,分别取植株的第1片或第2片叶,液氮冷冻研磨,采用优化的CTAB法[13]提取基因组DNA。用Nanodrop 1000紫外分光光度计检测样品:质量浓度≥30 ng/μL,OD260/280为1.8~2.2, 10 g/L的琼脂糖凝胶电泳检测DNA质量。
根据小麦的基因组大小以及GC含量等信息,以小麦CSS(Chromosome survey sequence)基因组(http://plants.ensembl.org/Triticum_aestivum/Info/Annotation/)作为参考基因组(IWGSC,2014),并组装到染色体水平(ftp://ftp.ensemblgenomes.org/pub/plants/release30/ fasta/Triticumaestivum/dna/)。
为评估酶切试验方案的准确性,选用水稻(Oryzasativa)作为对照进行测序。通过对照(水稻)测序数据的评估监控试验过程是否正常,确定酶切方案实施的有效性(http://rapdb. dna.affrc.go.jp/)。文库质检合格后用Illumina HiSeqTM,PE125bp进行测序。对得到的序列进行GC含量、Q30以及原始reads进行分析,以保证测序质量。
利用Dual-index[14]对测序原始数据进行识别,得到各个样品的reads。过滤测序reads的接头后,进行测序质量和数据量评估。通过将reads与参考基因组比对,在亲本和混池中开发SLAF标签,寻找在亲本中存在多态性的SLAF标签和在reads覆盖区域的SNP。利用欧氏距离(Euclidean Distance,ED)关联分析和SNP-index关联分析两种方法,获得与性状紧密关联的位点,并根据关联阈值确定候选区域。
依据中国春IWGSC RefSeq v1.0基因组(IWGSC,2018)(https://wheat-urgi.versailles.inra.fr/ Seq-Repository/Assemblies)获得候选区域位置。基因功能参照IWGSC RefSeq v1.0注释(https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Annotations/v1.0/),在候选区域内筛选出含有核苷酸结合位点(Nucleotide binding site,NBS)或富亮氨酸(Leucine rich repeat,LRR)等抗病基因保守结构域的基因。利用小麦表达数据库expVIP[15-16](http://www.wheat-expression.com/)进行候选基因表达分析并用HemI软件制作热图。
图1 亲本‘小白冬麦’和‘陕优225’ 接种Bgt E09后第8天的表型Fig.1 Phenotype of resistant parent ‘Xiaobaidongmai’ and susceptible parent ‘Shaanyou 225’ on 8th day post-inoculation with Bgt isolate E09
通过SLAF文库构建和高通量测序,88.61 M的数据被开发,其中双端作图reads占 73.6%,单端作图reads占9.07%,非作图reads占17.33%。Q30的比例为87.87%~ 89.38%,平均比率为88.53%,GC含量为 45.72%。SLAF标记在每个染色体上分布均匀且完整性和准确性高。利用参考基因组开发31 090个SLAF标签。根据基因组SLAF-Seq定位的数据,获得每个染色体上SLAF标签数量(表2)。依据等位基因分析和基因序列之间的差异,其中99 990个具有多态性,SLAF多态率为32.16%。SLAF标签的双亲平均测序深度为30.07x,混合池为65.42x。
表1 抗白粉病基因mlxbd的遗传分析Table 1 Genetic analysis of powdery mildew resistance gene mlxbd
表2 每个染色体上SLAF标签和SNP标记的分布统计Table 2 Distribution statistics of SLAF labels and SNP markers on each chromosomes
SNP标记在每个染色体上分布良好且完整性和准确性高。SNP的检测主要使用GATK软件工具包[17]实现,不同染色体上的SNP标记分布如表2。
在关联分析之前,首先对2 069 543个低质量的SNP进行过滤,过滤多个基因型的SNP位点 3 938个,其次过滤reads支持度小于4的SNP位点1 496 393个,再次过滤混池之间基因型一致的SNP位点270 832个以及隐性混池基因不是来自于隐性亲本的SNP位点198 390个,最终得到高质量可信SNP位点99 990个用于后续关联分析。
通过欧氏距离算法[17],共有99 990个候选多态性SLAFs标签用于关联分析,关联阈值为 0.08(图2)。依据关联结果,在染色体7B上共得到2个关联区域,总长度为18.47 Mb。
通过SNP_index方法[18-19],对99 990个候选多态性SLAFs标签进行关联分析,关联阈值为0.67(图3)。依据关联结果,在染色体2B、3B和7B上共得到6个区域,总长度为37.04 Mb。
取两种关联方法交集,将其缩小到染色体7B的3个候选区域内(表3)。对候选区域内开发的SLAF标签进行分析,发现有788个SNP和47个InDel。
通过关联分析,候选区域被定位在小麦染色体7BL上220 006 508~245 380 515[(参照小麦CSS(Chromosome survey sequence)基因组(IWGSC,2014)],将其对应到‘中国春’IWGSC RefSeq v1.0基因组(IWGSC,2018)上,位置是611 088 744~723 157 603,包含3 043个基因(高置信度基因1 134个(TraesCS7B01G353300.1~Traes CS7B01G466600.1)和低置信度基因 1 909个(TraesCS7B01G590100LC.1~TraesCS7B 01G780900LC.1),其中含有NBS或LRR抗病结构域的基因109个。利用转录组数据库(expVIP)对候选基因的表达情况进行分析,发现56个基因受白粉病菌诱导,其中42个基因在接种后上调表达,14个基因在接种后下调表达(图4)。
横坐标代表染色体名称,彩色的点代表每个SNP位点的ED值,黑色的线为拟合后的ED值,红色的线代表显著性关联阈值。ED值越高,代表该点关联效果越好 X-axis represents wheat chromosomes and colored dots represents the ED value of each SNP locu.Black lines show all fitting results of ED,red lines show the threshold of ED. The larger the ED value is,the stronger the association is.
图2 ED关联分析在染色体上的分布结果
Fig.2 Distribution results of ED association analysis on chromosomes
横坐标代表染色体名称,彩色的点代表计算出来的ΔSNP-index值。黑色线为拟合后的ΔSNP-index,红色线为ΔSNP-index的关联阈值,ΔSNP-index值越高,代表该点关联效果越好 X-axis represents wheat chromosomes and the colored dots represent the SNP-index value. The black lines show all fitting results of ΔSNP-index,the red lines show the threshold of ΔSNP-index. The larger the ΔSNP-index value is,the stronger the association is.
图3 SNP-index关联分析在染色体上的分布结果
Fig.3 Distribution results of SNP-index association analysis on chromosomes
表3 两种关联分析结果交集的信息统计Table 3 Intersection Information statistics of two association analysis results
结合mlxbd和mlmz的遗传连锁图谱[20-21],将mlxbd基因定位在Xgwm611和Xgwm577之间。根据侧翼标记,进一步缩小候选区域,对应‘中国春’IWGSC RefSeq v1.0基因组(IWGSC,2018)位置是700 631 952~711 234 115,包含高置信度基因157个(TraesCS7B01G432900.1 ~TraesCS7B01G448500.1),低置信度基因191个 (TraesCS7B01G735300LC.1~TraesCS7B01 G754300LC.1),其中含有NBS或LRR抗病结构
域基因9个(表4)。在小麦表达数据库中,基因TraesCS7B01G440800.1在白粉病菌诱导后下调表达,基因TraesCS7B01G437300.1、TraesCS7 B01G437400.1、TraesCS7B01G441600.1和TraesCS7B01G441700.1在白粉病菌诱导后上调表达(图4)。
Pm5(Pm5a~Pm5e)是所有抗白粉病位点中唯一一个隐性复等位基因位点。其中Pm5a~Pm5c并没有进行精细定位及遗传图谱构建[22];而Pm5d被定位在染色体7BL远端区域,有6个微卫星标记与其紧密连锁,其中侧翼标记为Xgwm611和Xgwm577,遗传距离分别为2.1 cM和2.0 cM[23];Pm5e被Huang等[24]发现由7个分子标记与其紧密连锁,其中两个共显性标记Xgwm783和Xgwm1267相对较近,两侧遗传距离分别为11.0 cM和6.6 cM。除Pm5复等位基因外,许多重要的抗白粉病基因也被定位在小麦染色体7BL远端区域上,如mlxbd[20]、mlmz[21]、PmH[22]、PmTm4[25]、PmHYM[26]、PmBYYT[27]和PmSGD[28],其中PmTm4、PmHYM、PmBYYT和PmSGD已被精细定位。已有研究表明,在小麦7BL染色体上Pm5位点可能存在更多复等位基因或抗白粉病基因簇[29]。
图4 候选区域内抗病基因在接种Bgt E09后的表达分析Fig.4 Expression analysis of resistance genes (56 genes) in candidate regions after inoculation with Bgt isolate E09
基因名 Gene name染色体位置 Chromosome position功能注释 Functional annotation TraesCS7B01G735900LC.1chr7B:700 820 349..700 821 167Leucine-rich repeat receptor-like protein TraesCS7B01G740600LC.1chr7B:703 703 155..703 706 321Disease resistance family protein/LRR family protein TraesCS7B01G437300.1chr7B:703 714 206..703 718 796 Disease resistance protein RPM1 TraesCS7B01G437400.1chr7B:703 719 566..703 723 769Disease resistance protein (NBS-LRR class) family TraesCS7B01G440800.1chr7B:706 083 250..706 090 834Disease resistance protein (TIR-NBS-LRR class) family TraesCS7B01G441600.1chr7B:706 808 371..706 811 012NBS-LRR resistance-like protein TraesCS7B01G441700.1chr7B:706 811 897..706 816 722Disease resistance protein (NBS-LRR class) family TraesCS7B01G748500LC.1chr7B:708 846 276..708 855 429Disease resistance protein RPM1 TraesCS7B01G748600LC.1chr7B:708 866 559..708 867 224Disease resistance protein RPM1
随着SLAF-Seq、BSR-Seq(Bulked segregant RNA-Seq)、GBS (Genotyping-by-sequencing)以及外显子捕获等技术的出现,越来越多的SNP标记被开发,并被广泛应用于小麦各项研究中[5,28,30-31]。本研究基于SLAF-Seq技术在候选区域内开发788个SNP和47个InDel。薛飞等[20]研究表明,‘小白冬麦’和‘唐麦4号’抗谱相同,且都位于Pm5位点附近区域,推测mlxbd和PmTm4可能含有相同的白粉病抗性基因。PmTm4基因[25]最近的侧翼标记为WGGC6892和WGGC5746。本研究通过SLAF测序发现,在WGGC6892和WGGC5746之间的SNP和InDel分别为15个和2个,这些SNP和InDel将有助于进一步精细定位抗白粉病基因mlxbd。
随着新技术和新方法的不断出现和成熟,二代测序技术的成本急剧下降,一方面加快传统图位克隆的进程,另一方面也可以作为图位克隆的补充技术,将大大促进小麦未知基因的克隆和功能研究。随着‘中国春’小麦全基因组测序的完成[32],小麦基因组研究已进入一个全新的时代。Thind等[33]利用TACCA(Targeted chromosome based cloningvia long-range assembly)技术快速构建抗叶锈病基因Lr22a精细遗传图谱,并获得4个NLR类型的候选基因,最终结合单倍型及EMS突变体确定目标基因NLR1。Xing等[34]采用抗病基因富集测序技术(RenSeq),合理运用靶序列富集,克隆到Pm21小麦抗白粉病基因。Arora等[35]结合关联分析和抗病基因捕捉测序,开发AgRenSeq(Associationgenetics with R gene enrichment sequencing)技术,在短时间内同时克隆多个秆锈病(Stem rust,Sr)抗病基因。Steuernagel等[36]利用MutRenSeq方法(结合化学诱变、外显子捕捉和高通量测序分析)从六倍体小麦中快速克隆两个秆锈病抗病基因Sr22和Sr45。Snchez-Martín等研发出染色体分离测序技术(MutChromSeq),分别对大麦无蜡质基因(Eceriferum-q,位于2H染色体)和小麦Pm2(位于5D染色体)抗白粉病基因的突变体进行分离测序,验证了此方法的有效性[37],为快速克隆目标基因奠定基础。本研究中,通过SLAF-Seq、‘中国春’IWGSC RefSeq v1.0参考基因组(IWGSC,2018)以及小麦表达谱数据库确定mlxbd基因的候选区间。其中9个基因含有NBS或LRR抗病结构域,4个基因在白粉病菌诱导后表达增强,可能是mlxbd的候选基因。然而,在不同品种之间,不仅所含抗病基因不同,且存在候选基因缺失的情况。因此,进一步精细定位抗病基因以及构建抗白粉病基因所在染色体区域的饱和分子遗传连锁图,将为更好的利用现有抗源,以及深入了解mlxbd基因和Pm5位点的关联性提供理论 依据。