郑建敏,罗江陶,万洪深,李式昭,杨漫宇,李 俊,刘于斌,蒲宗君
(1.四川省农业科学院作物研究所/农业农村部西南地区小麦生物学与遗传育种重点实验室,四川成都 610066;2.四川省凉山州西昌农科所,四川西昌 615000)
小麦是我国重要的粮食作物之一,小麦生产对保障粮食安全具有重要战略意义[1]。在播种面积整体下降、总产量反而持续增加的情况下,单产提高是总产增加的主要驱动因素[1]。而单产提高依赖于品种改良。品种改良是根据不同目标(高产、优质、抗病、抗逆等),利用现有材料,采取不同育种方式(杂交、诱变等)和选种方式,在后代大量变异类型中筛选符合目标要求的稳定材料。品种改良具有探索性和不可预见性[2]。在长期和广泛的品种改良探索过程中,科学家发现少数几个亲本材料能衍生出多个品种,提高育种效率,并将这些材料称之为骨干亲本[3-4]。研究表明,骨干亲本及其衍生品种对我国小麦育种和生产做出了巨大贡献[3]。
川麦44是四川省农业科学院作物研究所选育的近强筋小麦品种,具有高产、稳产、广适等特性。据不完全统计,近年来利用川麦44为直接亲本培育出的高代苗头品系达20余个,其中9个已通过审定,5个进入2017-2018年四川省区域试验,3个进入多点联合试验[5-6]。为明确骨干亲本川麦44的遗传特性,挖掘其基因组中具有重要育种贡献的区段和基因,本研究利用小麦高密度660K SNP芯片对川麦44及其衍生品种进行全基因组扫描,筛选川麦44特异SNP位点,分析川麦44对衍生品种的遗传贡献,并筛选出高遗传率片段,以期为进一步开展深入研究奠定基础。
以川麦44和6个衍生品种(昌麦32、川麦67、川麦601、川麦63、川麦1131、川麦1145)以及6个相关亲本材料(西昌19、川麦42、川麦36、贵农21、川麦30、川农23)为研究对象,信息详见表1。13个材料全部委托北京康普森生物技术有限公司进行了小麦660K SNP芯片分型分析。小麦660K SNP芯片介绍详见以下链接:http://wheat.pw.usda.gov/ggpages/topics/Wheat660_SNP_array_developed_by_CAAS.pdf。
表1 川麦44及其6个衍生品种的亲本信息
根据小麦660K SNP标记分型结果,剔除衍生品种中川麦44与其他亲本的无差异位点、不纯合(不稳定)位点、缺失位点、无法确知来源位点及染色体位置不确定位点后,利用剩余有效SNP位点来测算遗传贡献率。公式如下:
遗传贡献率=川麦44的特异位点数/有效SNP位点总数×100%
进一步利用SNP位点对应染色体信息,比较分析川麦44在小麦A、B和D染色体组的遗传贡献率差异及衍生品种在不同染色体的遗传贡献率。在此基础上,根据不同衍生品种同一位点来源于川麦44的比例(如AX-110053833分型结果,6个衍生品种有4个分型与川麦44一致,则遗传率为66.67%,筛选出川麦44高遗传率 (>50%)片段,为进一步研究挖掘有益基因片段奠定基础。用Microsoft Excel及MapDraw V2.1[7]进行数据分析与作图。
利用小麦660K芯片进行全基因组扫描,共计获得630 517个SNP位点分型结果,剔除无效标记位点后,测算川麦44的遗传贡献率。由表2可知,昌麦32、川麦67、川麦601、川麦63、川麦1131和川麦1145的差异位点数分别为136 276、46 006、21 963、90 979、90 979和90 979个,衍生品种差异位点数存在单交(两个亲本)>三交(三个亲本)>双交(四个亲本)的趋势。川麦44特异位点数也存在单交(两个亲本)>三交(三个亲本)>双交(四个亲本)的趋势。计算结果(表2)表明,衍生品种中,亲本的遗传贡献均存在偏亲现象。同是单交选育的衍生品种,昌麦32遗传组成偏向于亲本西昌19,川麦44的遗传贡献率仅为23.77%;而川麦63、川麦1131和川麦1145中,川麦44的遗传贡献率均大于60%。这4个来源于单交育种的衍生品种中,川麦44的平均遗传贡献为57.68%,整体偏向于川麦44。三交组合和双交组合选育的川麦67和川麦601中,川麦44的遗传贡献率小于理论值。川麦44在6个衍生品种中的平均遗传贡献率为48.58%。
川麦44特异位点在6个衍生品种A、B和D染色体组中的分布是不均匀的(图1),B染色体组>A染色体组>D染色体组,B染色体组特异位点数平均比例为53.02%,D染色体组特异位点数平均比例仅为11.23%。这可能与染色体组遗传多样性[8]和不同染色体组的基因变异丰富度[9]有关。
表2 6个衍生品种SNP位点来源分析
图1 川麦44特异位点在A、B和D染色体组的分布
川麦44特异位点在衍生品种各染色体上的分布不均匀(表3),衍生品种昌麦32不同染色体上的特异位点数为50~7 416个,其中川麦44对5A和5D染色体的遗传贡献率大于50%;川麦67不同染色体上的特异位点数为12~1 082个,川麦44仅对1D染色体的遗传贡献率大于50%;川麦601不同染色体上的特异位点数为3~651个,川麦44仅对7D染色体的遗传贡献率大于50%;川麦63不同染色体上的特异位点数为 214~7 323个,其中川麦44对1B、2A、2B、3B、4B、4D、5A、5B、5D、6A、6B、6D、7A和7D染色体的遗传贡献率均大于50%;川麦1131不同染色体上的特异位点数为248~8 128个,其中川麦44对1B、2A、2B、2D、3A、3B、4A、4B、4D、5A、5B、5D、6A、6B、6D、7A和7D染色体的遗传贡献率均大于50%;川麦1145不同染色体上的特异位点数为177~8 514个,其中川麦44对1B、2A、2B、2D、3B、4B、4D、5A、5B、5D、6A、6B、6D、7A和7D染色体的遗传贡献率均大于50%。
表3 川麦44特异位点在衍生品种不同染色体中的分布及其遗传贡献率
括号外的数据为川麦44特异位点数;括号内的数据为川麦44的遗传贡献率,为百分数。
The data outside brackets are the number of specific loci in Chuanmai 44; the data in brackets are the genetic contribution of Chuanmai 44,which is in percentage.
根据不同衍生品种同一位点来源于川麦44的比例,筛选出川麦44高遗传率(>50%)SNP位点,结果表明,在小麦21对染色体上均有川麦44高遗传率位点。再根据SNP位点物理位置与该染色体最大物理位置的比值确定位点间的相对距离,将相对距离值小于0.01且物理位置在高遗传率位点从小到大排序中相邻的两个SNP位点确定为相连位点,统计出连续相连3个位点以上且长度大于或等于0.10 Mb的区段为高遗传率片段。结果如图2所示,除1B和6A外,其他染色体上均存在高遗传率片段,共计筛选出52个川麦44高遗传率片段,在染色体上呈不均匀分布,片段长度为0.10~76.20 Mb,其中5B上的片段数量和累计长度均居首位。
根据高遗传率片段的物理位置信息,在对应的中国春物理图谱中(IWGSC RefSeq v1.0,详见网站https://wheat-urgi.versailles.inra.fr/)获得10 161个预测基因,其中4 201个为高可信度基因(High-confidence genes),5 960个为低可信度基因(Low-confidence genes)。分析表明这些高遗传率片段多为基因密集区段。
图2 川麦44高遗传率片段在不同染色体上的分布
作为常规种的小麦,其衍生品种的偏亲现象较为普遍。前人对多个小麦骨干亲本在后代中的遗传分析均发现偏亲现象[4,10-17]。本研究表明,不同杂交方式获得的衍生品种均存在偏亲现象。单交组合中,昌麦32的遗传组成偏向于亲本西昌19,川麦63、川麦1131和川麦1145的遗传组成偏向于亲本川麦44。三交组合和双交组合选育的川麦67和川麦601中,川麦44的遗传贡献则小于理论值。
依据经典遗传学定律,研究人员可根据品种的系谱推断衍生后代遗传结构的理论值。然而就单个个体而言,遗传构成的偏亲现象属正常情况,理论值是针对群体在理想状态下的构成而言;在自然进化、人工驯化和人工选择过程中,因受生态条件、偶发自然灾害、育种方式、定向选择等众多因素影响,遗传贡献会出现各种类型的偏亲现象。
前人研究表明,小麦骨干亲本碧蚂4号[18]、欧柔[10]、燕大1817[19]、阿夫[20]、繁6[21]、川麦42[14]、周8425B[22]、临汾5064[16]等均存在染色体区段(片段)传递现象。本研究利用660K SNP芯片在19对染色体上也筛选出52个高遗传率片段。李玉刚等[4]认为这是作物育种选择过程存在的选择牵连效应。
张学勇等[23]认为影响选择牵连效应大小的因素主要有群体的交配方式、选择压和被选择位点附近的重组率。育种家对农艺性状(产量、抗性、株高等)的偏好选择,会导致较强的选择牵连效应发生[23]。长期的育种过程中,育种家们为了相同或相似的育种目标而努力,对大量资源材料进行高压选择,改变了基因在人工选择群体中的频率分布,可能产生较多优异基因的连锁现象。骨干亲本一般具有综合农艺性状优良的特征,在人工育种选择过程中,易因肉眼选择保留更多的偏向性表型而形成区段(片段)遗传和牵连效应。
区段(片段)遗传与牵连效应一方面给发掘和研究育种贡献大的优异基因(区段)提供便利,另一方面也可能带来不利影响。如骨干亲本的反复利用可能会导致品种间亲缘关系愈来愈近,遗传基础变得狭窄,致使品种遗传脆弱性增加,易受病害侵袭。如何在不降低遗传多样性的前提下,充分利用骨干亲本的区段(片段)遗传与牵连效应是育种人应该引起重视的问题。
著名小麦专家庄巧生先生[3]统计发现,建国后的50年间,16个小麦骨干亲本衍生至少976个优良品种,约占所有育成品种的一半。此后,小偃6号[24]、矮孟牛[25]、繁6[21]、川麦42[14]、周8425B[22]、京411[15]、豫麦2号[17]、鲁麦14[4]、临汾5064[16]等的研究证明了骨干亲本利用对育种贡献是巨大的。然而在遗传机理机制尚未明晰的情况下,骨干亲本更多是在品种选育完成后归纳提炼出来的,一定程度上制约育种发展,降低骨干亲本利用价值。传统育种极大程度上依赖于表型选择和育种家的经验,提高育种的可预见性和效率,实现从传统的“经验育种”到定向、高效“精确育种”的转变是育种人长久以来的梦想。Peleman和vander[26]首先提出设计育种的概念。此后,万建民[2]和王建康等[27]进一步明确设计育种3个步骤。设计育种是突破传统育种瓶颈的有效途径,是育种未来的发展方向。
骨干亲本为目标基因型提供良好的遗传背景(基础),骨干亲本的区段(片段)遗传与牵连效应为挖掘和研究目标性状基因及相互关系提供便利。随着分子技术的发展[1,28]、小麦基因组测序和物理图谱的完成[29],功能基因组学研究将不断发展和深入,可用于育种的功能标记将越来越多,为鉴定优异资源和开展设计育种奠定基础。然而在重要农艺性状的基因定位/基因功能组学/遗传基础/作用机制/调控网络等研究还很欠缺、生物信息学研究和数据共享体系尚未完善的现实情况下,设计育种还有较长的路要走。
川麦44衍生品种中,川麦44的遗传贡献率为23.77%~72.63%,平均为 48.58%,存在明显偏亲现象。川麦44特异性标记在不同染色体和染色体组中分布不均匀。在除1B和6A外的19对染色体上,筛选出52个川麦44高遗传率片段,长度为0.10~76.20 Mb。