陈小红,何杰丽,石甜甜,邵欢欢,王海岗,陈凌,高志军,王瑞云, ,乔治军
(1山西农业大学农学院,山西太谷030801;2山西农业大学文理学院,山西太谷030801;3山西省农业科学院农作物品种资源研究所/农业部黄土高原作物基因资源与种质创制重点实验室/杂粮种质资源发掘与遗传改良山西省重点实验室,太原030031;4内蒙古鄂尔多斯市农牧业科学研究院,内蒙古鄂尔多斯017200)
【研究意义】糜子(Panicum miliaceumL.)属于禾本科黍属,为干旱和半干旱地区粟类作物。糜子起源于中国,在亚洲(印度、日本、不丹、土耳其、斯里兰卡、伊朗、孟加拉国、阿富汗和黎巴嫩)、非洲(埃及、马拉维)、欧洲(波兰、英国、罗马尼亚、匈牙利、俄罗斯和乌克兰)、美洲(加拿大、美国、巴西和阿根廷)和大洋洲(澳大利亚、新西兰)均有分布[1-10]。糜子生育期短、抗旱耐瘠,在干旱环境中具生产优势,是亚洲国家的粮食作物,在欧洲和美国多用于饲鸟。在中国,糜子曾是华北地区的主粮,如今仅在山区和边远地带栽培;年种植面积约32万hm2、产量约30万吨[5]。糜子不仅富含抗性淀粉,可降低血糖和血脂,是保持肠道健康的功能食品;而且还含有木脂素类营养成分,可预防乳腺癌等多种激素依赖型癌症和减少心脏病发生[9];也是乳糜病患者的理想食品。随着全球气温升高,糜子在旱作生态农业建设、种植业结构调整和国家粮食安全保障中起的作用日益突显[2]。目前,全球有糜子种质资源29 000余份,中国占9 850份,搞清其遗传背景是合理高效利用的前提[1,3]。然而,糜子是异源四倍体,基因组信息复杂,可供准确评估遗传差异的分子标记缺乏,亟待构建一大批SSR以促进糜子作物产业化发展。【前人研究进展】2016年,CAVERS等[7]从称谓、农艺性状描述、经济价值、地理分布、生活习性、栽培驯化史、营养生长、生殖发育、杂交、种群动态、杂草防控、农事操作和病虫害影响等 13个方面详细阐述了加拿大糜子作物的研究近况;WANG等[6]介绍了中国糜子生产概况及资源的遗传特性。2017年,王瑞云[3]概括了糜子 DNA标记的开发、连锁图谱构建、遗传多样性分析、驯化和传播等;HABIYAREMYE等[4]介绍了美国糜子的栽培现状。2018年,刁现民主编著作《中国现代农业产业可持续发展战略研究·谷子糜子分册》,基于中国糜子的分布和生产,系统探究了糜子生产的分布区域及产业发展历程和现状,翔实总结了糜子育种、种质创新、生物技术、植物保护和食品加工等领域研究前沿,深入剖析了中国糜子的生产形势和产业发展中有待改进的问题,探究了产业发展的重要环节和具体内容,提出了产业结构调整和农业供给侧改革形势下产业发展的战略构想及可行建议[2]。2019年,VETRIVENTHAN等[1]调查了印度国际半干旱热带作物研究所(International Crops Research Institute for the Semi-Arid Tropics,ICRISAT)基因库全球糜子资源农艺性状的多样性,以来自30个国家的849份资源为试验材料,发现糜子平均株高62 cm、穗长209 mm,种子颜色共有11种,获得大粒高产资源2份(IPm2和IPm2661)。上述研究多是基于表型的遗传多样性,应用基因分型准确评估资源的研究偏少[10-16]。SSR标记在基因组中分布广、含量丰富、具共显性且重复性好,已广泛应用于水稻、小麦等作物的遗传研究[17-21]。就糜子而言,HU 等[22]和 CHO 等[23]分别首次开发了46和25个种非特异性和特异性SSR。RAJPUT等[24]检测548个柳枝稷SSR,发现339个可用于糜子,其中254个呈多态性,分辨率为0.25—14.75(平均2.71)。目前,基于转录组测序挖掘糜子SSR已开展了多项研究[25-31]。王银月等[25]从4份(3份甘肃和1份山西)糜子资源中挖掘到1 210个SSR,其中116个多态性较高。连帅等[26]用 63个标记评估国内外地方品种和野生资源,发现国内资源遗传多样性较国外材料丰富。刘笑瑜等[27]构建了 85个可以有效分辨不同基因型的高基元SSR。JIANG等[28]从雁黍5号中发掘出8 139个EST-SSR,验证其中24个,发现21个扩增效果好,3个具多态性,开发效率为87.5%。寇淑君等[29]对11个SSR标记荧光后,利用毛细管电泳技术评估中国糜子的遗传差异,检测出的等位变异数(平均为6.5个)超过传统聚丙烯酰胺凝胶电泳鉴定结果(平均为3个)的2倍。石甜甜等[30]用144个(高、低基元分别为64和80个)SSR评估96份国内外(国内、国外分别为71和25份)糜子资源,发现北方春糜子区材料的遗传多样性较丰富;主成分分析将试材划归6类,均与地理来源一致。何杰丽等[31]检测200个SSR,发现80个呈多态性,开发效率为40%;引物分辨率(Rp)为0.67—4.67(平均值为2.00)。【本研究切入点】较大宗作物而言,作为小杂粮的糜子研究深度不够,尤其是可供利用的SSR欠缺,难以全面而准确分析资源间遗传差异。【拟解决的关键问题】本研究拟开发一批新的糜子特异性标记,明确其引物分辨程度、碱基重复分布状况及遗传参数高低,为准确评估糜子遗传多样性提供有效的分子检测工具。
试验选用地理来源差异较大的6份糜子材料(表1),待幼苗长至三叶期,取叶片约0.3 g,置于-80℃保存备用。
表1 供SSR引物筛选的糜子材料Table 1 Proso millet accessions for screening SSR primers
1.2.1 引物设计 利用Primer Premier 5.0[32]设计引物。
1.2.2 DNA提取和PCR扩增 用改良CTAB法[33]提取糜子叶片DNA,用1%琼脂糖凝胶电泳和NanodropND-1000核酸浓度检测仪分别检测 DNA的完整性和浓度,根据 A260/A280和 A260/A230值判断 DNA纯度,A260/A280范围在 1.7—1.9,A260/A230>2.0。PCR 扩增体系(20 μL)为 2×MasterMix10 μL、上下游引物各 0.8 μL(终浓度为 0.4 μmoL·L-1)、DNA 模板 1 μL(30—80 ng·μL-1)和 ddH2O 7.4 μL。反应程序为 94℃ 4 min;94℃ 40 s,退火 40 s,72℃ 8 min。
1.2.3 聚丙烯酰胺凝胶电泳检测 根据电泳条带读取多态性,用“1、0”分别表示扩增条带的有和无。
根据公式Rp = ∑Ib,计算标记的分辨率(resolving power,Rp)[34],其中Ib=1-(2×︱0.5-p︱),Ib表示等位基因信息量,p表示等位基因出现的次数。用软件 PowerMarker 3.25[35]和 PopGen 1.32[36]计算 SSR 遗传多样性参数。
Nanodrop ND-1000核酸浓度检测仪检测到DNA原液浓度为 300—2 200 ng·μL-1,检测到 A260/A280为1.833—1.905,A260/A230为2.008—2.269。琼脂糖凝胶电泳检测糜子叶片基因组DNA,得到清晰明亮的电泳条带(图1),说明DNA完整、浓度高。
图1 基因组DNA琼脂糖凝胶电泳图Fig. 1 Genetic DNA bands running through agarose gel electrophoresis
统计200对引物碱基序列重复的分布情况(图2)。单碱基序列重复引物共 20个,10个(50%)具多态性(电子附图 1);二碱基序列重复引物 36个,15个(41.67%)具多态性(电子附图2);三碱基序列重复引物144个,55个(38.19%)具多态性(电子附图3)。
图2 200对引物碱基序列重复分布Fig. 2 Repeat motif distribution of 200 pairs of primer
200对引物碱基类型共53种,数量较多的(>9)有CGG(13)、CGC(13)、GCC(13)、GCC(11)、GCG(11)、A(10)和AG(10)。其中,具多态性的碱基类型有44种,重复数量最多的是CGG(11),无多态性的碱基类型有35种,AG重复数量较多(7)。
200对SSR引物扩增6份地理来源差异较大的糜子材料,80对引物的扩增条带呈多态性(电子附图1—电子附图 3),其中单、二和三碱基序列重复引物分别为10、15和55对(电子附图1—电子附图3)。分析其碱基序列重复类型如下(图3—图5和电子附表1)。
从图3和电子附表1可以看出,单碱基引物的重复基元为A(50%)和T(50%);从图4和电子附表1可以看出,二碱基引物碱基重复类型有AG(6)、TC(2)、GC(2)、GA(2)、CA(1)、TA(1)和AC(1)7种,其中AG(40%)数量最多;从图5和电子附表1可以看出,三碱基引物碱基重复类型有24种,包括GGC(7)、GCG(6)、GCC(5)、CGG(4)、TGC(3)、CCG(3)、AGC(3)、CTT(3)、GAA(2)、GCT(2)、CGC(2)、GAG(2)、GAC(2)、ACC(1)、AGG(1)、CAG(1)、CGT(1)、AAG(1)、AAC(1)、TCG(1)、CGA(1)、ATT(1)、CAA(1)和CCA(1),其中GGC、GCG和GCC数量较多(分别占13%、11%和9%)。
图3 单核苷酸序列重复SSR的类型及分布Fig. 3 Type and distribution of mono-nucleotide motif SSR
图4 二核苷酸序列重复SSR的类型及分布Fig. 4 Type and distribution of di-nucleotide motif SSR
图5 三核苷酸序列重复SSR的类型及分布Fig. 5 Type and distribution of tri-nucleotide motif SSR
从电子附表2可以看出,单碱基重复引物等位基因大小为50—500 bp,条带数为 5(RYW150)—12(RYW108)。RYW105的等位基因条带最多(12个),位点范围为50—400 bp。RYW150的条带最少(5个),位点范围为 110—500 bp。Rp值的范围为 0.67(RYW110)—4.67(RYW107),平均为2.07;值介于 0.33(RYW110)—0.67(RYW107),平均为0.51。
从电子附表3可以看出,二碱基重复引物的等位基因大小为50—500 bp,条带数为6(RYW165)—16(RYW141)。RYW141的等位基因条带最多(16个),位点范围为100—450 bp。RYW165的等位基因条带最少(6个)。引物 Rp值为 1.33(RYW114和RYW162)—4.33(RYW166),平均为2.73;值介于0.40(RYW168)—0.78(RYW113),平均为0.59。
从电子附表4可以看出,三碱基重复引物的等位基因大小为50—500 bp,条带数为5(RYW134)—20(RYW140)。RYW140的条带最多(20个),位点范围为50—500 bp;RYW134的等位基因条带最少(5个),位点范围为 50—250 bp。Rp值为 0.67(RYW91、RYW98、RYW100、RYW118、RYW126、RYW127 和 RYW148)—4.00(RYW102 和 RYW158),平均为1.83;值为 0.33(RYW91、RYW93、RYW98、RYW100、RYW118、RYW121、RYW126、RYW127和 RYW148)—0.83(RYW153),平均为 0.59。其中Rp和值均为最低的引物有RYW91、RYW98、RYW100、RYW118、RYW126、RYW127 和 RYW148。
分析80个SSR的分布频次(图6)。Rp值在区间 0—1、1—2、2—3、3—4和 4—5分别包含 17(21.25%)、36(75%)、11(13.75%)、14(17.5%)和 2(2.5%)个标记。其中,1—2标记频次最多,4—5标记频次最少。5个标记(RYW107、RYW161、RYW166、RYW115和RYW158)的Rp值信息含量丰富。
分析各类型引物的多态性及遗传参数(电子附表5—电子附表7)。单碱基序列重复标记的观测等位基因数为2—3个(平均为2.2000),8个位点产生2个变异,2个位点产生 3个变异;有效等位基因数为1.8000—2.8800(平均为2.0993);多样性指数为0.6365—1.0776(平均为0.7497);观测杂合度为0.1000—1.0000(平均为0.6567);期望杂合度为0.4848—0.7121(平均为0.5622);Nei's期望杂合度为0.4444—0.6528(平均为 0.5122);PIC为 0.3750—0.5355(平均为0.4293)。可见RYW150的多态性最丰富,RYW103和RYW109的多态性最低。
图6 80个SSR标记的分辨率(Rp值)Fig. 6 Resolving power values of 80 SSR marker in proso millet
二碱基序列重复标记的观测等位基因数为 2—3个(平均为2.5333),7个位点产生2个变异,8个位点产生3个变异;有效等位基因数为1.6000—3.0000(平均为2.2341);多样性指数为0.5623—1.0986(平均为 0.8339);观测杂合度为 0.5000—1.0000(平均为 0.8444);期望杂合度为 0.4091—0.7273(平均为0.4994);Nei's期望杂合度为 0.3700—0.6667(平均为0.5373);PIC为0.2392—0.74384(平均为0.4293)。可见RYW168的多态性最丰富,RYW167的多态性最低。
三碱基序列重复标记的观测等位基因数为 2—3个(平均为 2.4727),29个位点产生 2个变异,26个位点产生 3个变异;有效等位基因数为 1.6000—2.9412(平均为2.2445);多样性指数为0.5623—1.0889(平均为0.8312);观测杂合度为0.5000—1.0000(平均为 0.8448);期望杂合度为 0.4091—0.7333(平均为0.5967);Nei's期望杂合度为0.3750—0.6600(平均为 0.5438);PIC为 0.2392—0.7438(平均为 0.3989)。可见RYW124和RYW137的多态性最丰富,RYW144多态性最低。
HU等[37]用6个ISJ/长片段随机引物(introns splice junction or long random primers)扩增32份中国糜子主产区的材料,检测到56个DNA片段,其中42个具多态性、遗传一致度介于 0.0286—0.4737;聚类结果表明糜子的粳糯性与地理来源有关。HU等[22]首次利用46个糜子非特异性SSR分析中国118份糜子材料,检测到中等水平多态性等位基因226个,每个引物的等位基因数介于2—9,且遗传距离与材料的地理起源呈正相关。但由于标记来自其它作物,通用性低,开发糜子特异性SSR是准确评估糜子遗传多样性的重要环节。CHO等[23]率先构建糜子基因组DNA的SSR文库,筛选143对引物,获得25个多态性标记,多态率为17.5%。2014年以来,基于高通量测序手段挖掘了一大批糜子特异性 SSR。王银月等[25]、王璐琳等[15]和刘笑瑜[27]分别开发了116、17和85个标记,多态率分别为9.59%、24.28%和56.3%。本研究构建标记的多态率为40%,低于刘笑瑜[27]的研究结果,可能与后者构建的SSR碱基序列重复为高基元有关;而高于其他研究结果[15,23,25],可能与本研究选材来源广、数目多有关。
SSR标记开发率是评估构建效率的重要指标。就SSR开发率而言,RAJPUT等[24]和王璐琳等[15]研究结果分别为 62%和 95.7%,本研究为 88.5%,高于RAJPUT等[24]而低于王璐琳等[15]的研究结果,一方面,RAJPUT等[24]发掘的SSR来源于柳枝稷,为非种特异性标记,开发率低于本研究的种特异性标记;另一方面,王璐琳等[15]发掘的SSR为三碱基重复基元,而本研究标记除此外,还包括一、二碱基重复基元,故开发率低于前者。
就糜子作物SSR的Rp而言,以往研究发现其范围介于1.00—5.75(平均为3.15)、0.334—4.002(平均为1.51)和0.25—14.75(平均为2.71)[13,24,27],本研究结果为 0.67—4.67(平均为 2.00),与上述结果基本一致;而其他植物如苎麻(Boehmeria niveaL.Gaudich.)、密花石斛(Crotalaria)、柽麻(Dendrobium nobileLindl.)和穿心莲(Andrographis paniculata(Burm.f.)Nees)分别为3.22、6.15、6.59和10.8,均高于糜子,可能与不同物种自身的遗传特性有关[38-41]。
前人研究表明糜子基因多样性指数分别为0.4902、0.6275、0.7708、0.6284和0.8478,PIC值分别为0.4321、0.4855、0.4723、0.5544和0.5874[15,26-27,13,29],本研究检测到这两个指标分别为0.8215和0.4215,与以往结果基本相符。
迄今糜子中已经开发出一些SSR,其中二、三碱基重复引物占比分别为 13%—87.9%和 12.01%—87%[23-25],本研究结果为18.75%和68.75%,与以往结果相符;而以往研究开发的高基元引物占比仅为9.77%[23],可见糜子中开发的SSR多为低基元重复。
王银月等[25]筛选1210对引物得到116个多态性SSR,二、三碱基重复的分别为 102和 14个,其中AC、GA、AG、CA、TC、AAC、CAA、CAG、CGG和 AAG与本研究结果一致;另外,本研究还发现碱基重复类型T、A、GC、TA、GAG、GCC、CTT、TGC、CGA、TCG、GGC、CGT、GAA、GAC、GCT、GCG、AGC、CGC、CCG、ATT、AGG、CCA和ACC,王银月等[25]还检测到重复类型 GT、CT、TG、ACA、AGA、AGT和 CCT,上述重复类型差异可能与研究材料不同有关。
研究发现,SSR重复基序中A/T较普遍,而G/C发生频率低,这可能与打破G—C的3个氢键比A—T的2个氢键需要更高能量有关[42-44]。本研究基于转录组测序获得的200对SSR引物中,单碱基序列重复基元有20个,19个为A/T碱基重复;筛选出的80个多态性标记中,单碱基序列重复基序类型都是 A/T,与前人研究结果基本一致[42,44-45]。
用6份地理来源差异较大的糜子材料检测200对SSR引物,发现177对(88.5%)可扩增出完整条带,其中80对扩增条带具多态性,多态率为40%。