孙禄娟,何建军,汪军成,姚立蓉,司二静,杨轲,李葆春,马小乐,尚勋武,孟亚雄*,王化俊*
(1. 甘肃农业大学省部共建干旱生境作物学国家重点实验室,甘肃省作物遗传改良与种质创新重点实验室,甘肃兰州 730070;2. 甘肃农业大学农学院,甘肃 兰州 730070;3. 甘肃农业大学生命科学技术学院,甘肃 兰州 730070)
盐生草(Halogeton glomeratus)属于中央种子目,藜科,盐生草属,为广泛分布于干旱和半干旱区的一年生草本荒漠盐生植物[1-3]。地上部多分枝的茎和肉质化的叶使其拥有很强的防风固沙、保水保土、抗旱及耐盐能力[4-5]。因此,盐生草可用于大量耐盐、抗旱基因的开发研究。盐生草籽所含营养丰富且全面,可作为优质蛋白饲料、油料及提取抗氧化物材料的来源[6]。此外,盐生草具有一定的药用价值[7],如发汗解表、止咳平喘、祛湿等。
转录组是特定的细胞或组织内全部的RNA 转录本,是生物体在特定的环境条件、生命阶段、组织类型及生理状态下转录产物的集合,包含mRNA、rRNA、tRNA 和非编码RNA[8]。转录组学从RNA 水平研究基因表达的情况,从整体水平研究基因转录情况以及转录调控规律[9],是细胞表型和功能研究的一个重要手段。其测序分析能够有效地检测不同器官或组织在特定时间点几乎所有基因的表达情况,同时也可以检测一些特异表达基因及简单重复序列[10-11]。因此,转录组测序广泛应用于基因功能注释、差异表达分析、单核苷酸多态性分析及ESTSSR 标记开发等方面[12]。
SSR(simple sequence repeats)即简单重复序列,又名微卫星DNA,通常由几个核苷酸(一般为1~6 个)作为重复单位组成长达几十个核苷酸的串联重复序列,在真核生物基因组中广泛分布[13],SSR 重复类型和重复次数的差异导致了其长度的高度变异[14]。其具有多态性丰富、呈共显性、遗传方式简单、重复性好、所需DNA 量少、操作简便等优点[15-16],对于研究群体数量过大作物有着明显的优势,是研究种质资源遗传多样性最为方便的分子标记,被大量应用于作物种间遗传差异和杂种优势等的研究[17]。
近年来,在植物遗传多样性分析、遗传图谱构建、纯度鉴定和分子标记辅助育种等方面,分子标记技术得到了广泛的应用[18]。在木本、草本、水生等植物中,采用转录组序列对SSR 标记进行开发的技术已取得了很大成果[19]。目前,关于盐生草的研究主要针对盐和重金属胁迫对种子萌发及幼苗的影响以及基因功能验证等方面的内容。如在盐胁迫环境中,探究不同重金属浓度对盐生草种子萌发的影响[20],何建军等[21]研究了不同浓度PEG和盐胁迫下盐生草种子的萌发特性及对盐生草中某些基因的克隆和遗传转化[22-23]等。但利用全长转录组数据对盐生草SSR 标记进行开发及盐生草种质资源的研究还未见报道。本研究基于本实验室已公布的盐生草全长转录组测序数据[5,24-25],在转录组水平进行SSR 位点分析,并对18 份盐生草材料进行了遗传多样性分析,旨在为后续开发和利用盐生草种质资源提供参考依据。
本试验于2019 年将甘肃省18 个不同盐碱地区的盐生草材料(表1)播种于10 cm×10 cm 的塑料花盆中,每个来源地材料播种5 盆,每天喷洒Hoagland 营养液。待其长至六叶期,随机取同一来源地不同花盆中不同单株叶片,混合,作为一个样本。用改良CTAB 法提取基因组DNA,使用1%的琼脂糖凝胶电泳检测提取的DNA 是否合格,并用超微量分光光度计测定DNA 浓度和纯度。将检测合格的DNA 样品用双蒸水稀释至30 ng·μL-1,置于-20 ℃冰箱保存备用。
表1 盐生草采样点信息Table 1 Information about the sampled sites of H.glomeratus
参考本实验室已公布的盐生草全长转录组测序数据[5,24-25],利用MISA 软件在转录组水平进行SSR 位点搜索及标记开发,筛选参数为:单~六核苷酸重复次数依次为12、6、5、5、4 和4 次。利用primer Premier 3.0 将获得的盐生草SSR 位点的序列以退火温度50~60 ℃、引物长度20~30 bp、PCR 产物长度100~300 bp 等为条件进行引物设计,随机选择218 对SSR 标记引物,由擎科泽西生物公司合成。
参考刘乃新等[26]和孟亚雄等[27]的方法进行PCR 反应体系和扩增程序,并稍做改进。PCR 扩增体系为10 μL:2×Taq PCR Master Mix 5 μL,ddH2O 2 μL,模板DNA 2 μL(30 ng·μL-1),上下游引物(10 μmol·L-1)各0.5 μL。采用TD-PCR 程序进行PCR 扩增,扩增程序为94 ℃预变性5 min,共40 个循环:首先94 ℃变性40 s,64 ℃退火40 s,72 ℃延伸50 s,退火温度每降1 ℃进行1 个循环,直到降至55 ℃,共10 个循环;然后94 ℃变性40 s,55 ℃退火40 s,72 ℃延伸50 s,进行30 个扩增循环;最后72 ℃延伸10 min,4 ℃下保存至取出。吸取3~5 μL PCR 产物于8%变性聚丙烯酰胺凝胶上进行电泳,电压为200 V,电泳90~120 min;电泳完成后,关闭电源取下凝胶进行银染;银染完成后加入显色液进行显色,至条带清晰,用超纯水清洗并用数码相机拍照。
以二进制和基因型记录SSR 分析结果,同一位点上具有相同迁移率的条带记为1,无带记为0;以数字1、2、3等表示不同基因型,以此构建出矩阵。参照Nei 等[28]的方法计算遗传相似系数(genetic similarity,GS),GS=2Nij×(Ni+Nj),其中Ni、Nj中i和j分别代表材料中出现的片段数目,Nij为材料共有的片段数目,并按非加权配对法(unweighted pair group method with arithmetic mean,UPGMA)进行聚类分析[29]。使用PowerMarker 3.25 软件[30]计算等位基因数(number of alleles,AN)、基因型数量(number of genotypes,GN)、基因多样性指数(gene diversity index,GD)及多态性信息含量(polymorphism information content,PIC)[31],PIC=1-∑ji P2ij,式中:Pij表示位点i的第j个等位变异出现的频率。
通过对盐生草29640 个SSR 重复单元及重复序列类型分析发现,SSR 种类包含1~6 核苷酸重复类型(图1)。其中,三核苷酸重复单位最多,有10 个类型,共检测到11337 个,占比为38.25%。基序类型最具优势的为ATC/GAT,有2270 个,所占比例为20.02%;其次为AAG/CTT 模式,2113 个,占比为18.64%;AAC/GTT 模式1752个,占15.45%;AAT/ATT 类 型1508 个,占 比 为13.30%;ACC/GGT 模式1292 个,占比为11.40%;AGC/GCT 模 式907 个,占8.00%;AGG/CCT 模 式661 个,占 比 为5.83%;ACT/AGT 模 式400 个,占3.53%;CCG/CGG 模式261 个,占2.30%;出现频率最低的为ACG/CGT 模式,有173 个,仅占1.53%;单核苷酸重复单位类型次之,为10063 个,占总重复单元的33.95%;位居第三的为双核苷酸重复单位类型,有4677 个,占15.78%,其中出现频率最高的为AG/CT模式,共2265 个,其次为AT/AT 模式1474 个,AC/GT 模式935 个,CG/CG 模式出现频率最低,只有3个;六核苷酸重复单位类型1430 个,占比为4.82%;五核苷酸重复单位类型1168 个,占3.94%;四核苷酸重复单位类型最少,为965 个,仅占3.26%。
图1 SSR 类型和数量分布统计Fig.1 Statistics of SSR type and quantity
盐生草SSR 序列重复次数主要分布在4~20 次(表2),占全部SSR(包括复合型SSR)总数的92.94%。重复4~7 次的为16077 个,占SSR 总数的54.24%;重复12~15 次的为6454 个,占SSR 总数的21.78%;重复8~11 次的为2817 个,占SSR 总数的9.50%;重复16~20 次的为2198 个,占SSR 总数的7.42%;>20 次的为2094 个,占总SSR 的7.06%。盐生草SSR 中,单核苷酸重复12~20 次,有8046 个,占SSR 总数的27.15%,最短的为12 bp,最长的大于20 bp。二核苷酸重复6~16 次,共4579 个,约占SSR 总数的15.45%,变化幅度较大,最短的为12 bp,最长的大于40 bp。三核苷酸重复5~13 次,共11206 个,占SSR 总数的37.81%,最短的为15 bp,最长的大于60 bp。四核苷酸重复5~9 次,有934 个,占SSR 总数的3.15%,最短的为20 bp,最长的大于80 bp。五核苷酸重复4~7 次,有1132 个,占SSR 总数的3.82%,其长度为20~80 bp。六核苷酸重复4~7 次,共有1402 个,占SSR 总数的4.73%,其长度最小为24 bp,最大的大于120 bp。
表2 盐生草转录组SSR 重复类型和重复次数Table 2 SSR repeat types and repeat times of transcriptome in H.glomeratus
以18 份盐生草的混合DNA 为模板对218 对引物进行初筛,有110 对引物可扩增出条带。随机选取8 份盐生草DNA 为模板进行复筛,筛选出39 条具有多态性的引物。然后用18 份材料进行第3 次筛选(图2)。最终得到33对具有较高多态性的引物(表3)。
表3 多态性较高的33 对引物Table 3 Statistics of 33 pairs of primers with high polymorphism
图2 部分引物的聚丙烯酰胺凝胶电泳Fig.2 Polyacrylamide gel electrophoresis with partial primers
用多态性较好的33 对标记对甘肃不同生态点的盐生草DNA 进行多态性检测(表4),共检测得到199 个等位基因位点。位点的等位基因数为3~13 个,平均为6.03 个。基因型数量为2~13,平均值为5.88。GD 为0.583~0.869,平均值为0.698。PIC 值为0.527~0.856,平均值为0.623。标记H4 的基因型数量、等位基因数、基因多样性指数和多态性信息含量均最大,分别为13、13、0.869 和0.856。标记H181 的基因型数量最小,等位基因数和多态性信息含量最小的为标记H94,标记H140 的基因多样性指数最小。
表4 盐生草多态性引物遗传信息含量Table 4 Genetic information content of polymorphic primers in H.glomeratus
据GS 计算结果可知,甘肃18 个不同生态点盐生草间的GS 值为0.528~0.859,平均值为0.683(表5)。来自平川区和酒泉市的盐生草材料之间的GS 值最大,为0.859,说明它们之间亲缘关系较近;来自酒泉市和民勤县-重兴镇的盐生草材料之间GS 值最小,为0.528,说明它们之间亲缘关系较远。
表5 18 个盐生草种间的遗传相似系数Table 5 Genetic similarity coefficient among 18 halophyte species
对来自甘肃不同生态点的18 份盐生草材料进行聚类分析(图3),这些材料在GS 为0.68 时被划分为四大类,第一大类包括1 份材料,为民勤县-重兴镇的盐生草。第二大类包括7 份材料,为民乐县、高台县、永昌县、兰州新区、甘州区、兰州市、民勤县-收成镇的盐生草。第三类包括6 份材料,为金昌市、会宁县、山丹县、临泽县、靖远县、景泰县的盐生草。第四类包括4 份材料,为平川区、酒泉市、肃南县、武威市的盐生草。
图3 18 份盐生草聚类分析Fig.3 Cluster analysis of 18 H. glomeratus
盐生草全长转录组中SSR 种类比较丰富,包含6 种核苷酸重复类型。最具优势的重复类型为三核苷酸重复单位,共检测到11337 个,占38.25%。这与李彦等[13]对虎耳草(Saxifraga stolonifera)、左力辉等[32]对榆树(Ulmus pumila)以及上官凌飞等[33]对杏(Prunus armeniaca)的研究结果一致,都表现为三核苷酸基序占SSR 总数的比例最大。但对甘蔗(Saccharum officinarum)[34]、油楠(Sindora glabra)[35]和大花四照花(Cornus florida)[36]的研究表明,单核苷酸重复类型占主导地位。相关研究表明,进化水平较高的物种中短核苷酸重复类型占比较大,而以多核苷酸重复单元为主的物种进化水平相对较低[37]。盐生草SSR 重复类型以三核苷酸为主,说明盐生草在长时间的进化过程中突变频率较高,使其重复单元变短。在二核苷酸重复类型中,AG/CT 所占比例较大,这与燕麦(Avena sativa)[38]、甘 薯(Ipomoea batatas)与 牵牛(Ipomoea nil)[39]、苦荞(Fagopyrum tataricum)[40]以 及 三年桐(Vernicia fordii)[41]的研究结果相符。三核苷酸重复中ATC/GAT、AAG/CTT、AAC/GTT、AAT/ATT 和ACC/GGT 所占的比例差异较小,无明显的优势三核苷酸重复类型,这与对同科植物菠菜(Spinacia oleracea)[37]的研究一致。
目前,相关研究认为转录组SSR 重复次数与位点的多态性呈正相关,重复次数越多表明此物种多态性潜能较高[42],特别是当重复次数大于12 时,多态性位点含量高[43]。本研究中,盐生草SSR 重复次数主要分布在4~20 次,占全部SSR(包括复合型SSR)总数的92.94%,重复频率高于12 次的占27.56%,说明盐生草转录组SSR 重复次数较高,理论上具有较大的开发潜能。有研究表明,多态性高低受SSR 长度的影响,多态性较高的SSR 长度≥20 bp,长度为12~20 bp 的多态性中等,而长度<12 bp 时多态性极低[44-45]。盐生草中,多态性较高的SSR(≥20 bp)数量为9460,占比31.92%,多态性极低的SSR(<12 bp)数量为0,说明本研究中的盐生草材料有较高的多态性。
SSR 标记技术应用的一个重要因素是开发高多态性比率的SSR 引物[46]。本研究用随机合成的218对SSR 引物进行扩增,110 对引物实现有效扩增,有效扩增率为50.46%。110 对有效扩增引物中33 对呈现出较高多态性,占有效引物的30%。这个比率低于蓝靛果忍冬(Lonicera caerulea)的62.50%[47]以及红豆杉(Taxus chinensis)的38.71%[46]。引物退火温度、位置或质量不合适都有可能导致引物扩增失败[48]。
本研究用多态性较好的33 对SSR 标记,扩增出199 个等位基因。位点的等位基因数差异较大,为3~13 个,与杨丹丹等[49]对楸树(Catalpa bungei)的研究结果吻合。基因型数量为2~13,基因多样性指数为0.583~0.869,多态性信息含量值为0.527~0.856,平均值为0.623。Kimaro 等[50]的研究结果显示坦桑尼亚木豆(Cajanus cajan)的PIC 值为0.46。Oh 等[51]对韩国紫苏(Perilla frutescens)的研究表明,其PIC 值为0.592。从分子层面来说,PIC值越高,表明物种间遗传差异越大,遗传多样性越丰富。本研究中不同盐生草间多态性信息含量值较高,表明不同生态点的盐生草材料间具有丰富的遗传多样性。
聚类分析结果表明,GS 为0.528~0.859,说明18 份盐生草材料遗传多样性较为丰富。在GS 为0.68 处,可将供试材料分为四大类,在第四类中,来自平川区和酒泉市的材料亲缘关系很近,但两地地理位置相差较远。张兆辉等[52]对瓠瓜(Lagenaria siceraria var.hispida)的研究以及薛杨等[53]对梨(Pyrusspp.)砧木的研究结果表明,地区分布相近的材料有聚为同一类的趋势,本研究结果与此不一致。但也有研究表明不同地区的种质材料会聚为一类,来源相同的材料却没有聚为一类,这说明来源相同的材料其遗传背景会存在差异,来源不同的材料其遗传背景有可能相同或相近[54]。
本研究基于已公布的盐生草全长转录组信息,在转录组水平进行SSR 位点分析,并对甘肃18 个不同生态点盐生草材料进行了SSR 标记位点的开发及遗传多样性分析。得到以下结论:在盐生草转录组水平,共鉴定到29640 个SSR 位点,平均每4.93 kb 有1 个SSR。SSR 种类包含1~6 核苷酸重复类型,重复次数主要为4~20 次。用多态性较高的33 对共检测得到199 个等位基因位点,等位基因数、基因型数量、基因多样性指数、多态性信息含量和遗传相似系数分别为3~13、2~13、0.583~0.869、0.527~0.856 和0.528~0.859。聚类分析表明,在遗传相似系数为0.68 处,将供试材料分为了四大类。本研究将为进一步研究盐生草遗传多样性及相关性状的连锁分析提供参考。