华蟹甲的简化基因组测序及SSR引物开发

2021-06-25 02:08兰进茂覃瑞夏婧
关键词:碱基核苷酸多态性

兰进茂,覃瑞,夏婧

(中南民族大学 生命科学学院 & 武陵山区特色资源植物种质保护与利用湖北省重点实验室,武汉430074)

菊科华蟹甲属(Sinacalia)是中国特有属,与蟹甲草属(Parasenecio)的显著区别是头状花序具有舌状花以及具有肥大的块茎. 该属于1973年从蟹甲草属分出成立,仅包括4个种:华蟹甲、双花华蟹甲、革叶华蟹甲和大头华蟹甲[1-3]. 不过最近的分子系统发育分析揭示出华蟹甲属和蟹甲草属都是多系的,但华蟹甲(S.tangutica)和双花华蟹甲(S.davidii)两个物种在一起可以保留华蟹甲草属[4-5]. 其中华蟹甲是分布相对较广的高大草本植物,常见于我国中西部地区的1250~3500 m的山坡草地、悬崖、沟边、草甸或林缘和路边. 近年的研究表明华蟹甲是一种在抗氧化和抗II型糖尿病等方面具有潜在应用价值的重要植物[6-9]. 目前从生物学角度对华蟹甲的研究工作非常少,除了刘建全等对华蟹甲的染色体核型进行了研究以及近年来构建菊科千里光族的谱系发育树包括了华蟹甲之外[4-5,10],从遗传多样性角度以分子生物学角度分析的研究工作几乎是空白.

SSR(Simple Sequence Repeats)是第二代分子标记,具有共显性、多态性高等特点,其数量丰富,分布广可以覆盖整个基因组. 鉴于华蟹甲属目前没有公布的基因组或转录组数据,本研究采用简化基因组测序(Reduced Representation Genome Sequencing)的研究技术[11-13],对华蟹甲的SSR信息进行全面的分析,并据此开发其SSR分子标记,为华蟹甲的遗传多样性和遗传结构研究奠定基础. 同时,华蟹甲作为一种具有潜在入侵性的大型草本植物[14],开发其SSR的分析标记有助于为外来物种管理提供依据.

1 材料与方法

1.1 实验材料和DNA提取

本研究所用华蟹甲采自湖北省七姊妹山国家级自然保护区(109.7737° E,30.0418° N). 沿着保护区到椿木营的小路,于2019年8月采集华蟹甲叶片材料,每株取植株上的幼嫩叶片,用变色硅胶装入自封袋干燥. 共采集153株,用其中16株的材料进行SSR引物的筛选. 使用植物DNA提取试剂盒(TSINGKE通用性)进行基因组DNA提取,

1.2 简化基因组文库构建与测序

将检验合格的DNA样品交由北京擎科进行简化基因组建库与测序. 使用酶切法将DNA随机打断之后,再经末端修复、加A尾、加测序接头、纯化、PCR扩增进行文库构建,然后进行高通量测序(DNBSEQ-T7测序仪,华大智造). 原始图像数据文件经CASAVA 碱基识别(Base Calling)分析转化为以FASTQ 格式保存的测序序列(Sequenced Reads),即原始序列数据(raw reads),包含每条测序序列(Read)的名称、碱基序列以及其对应的测序质量信息. 每个碱基所对应的质量字符ASCII 码值减去33得到测序质量得分(Phred Quality Score),代表不同的碱基测序错误率. 然后,原始序列数据用Cd-hit进行聚类并从中选取reads支持数为10~400的类,根据聚类结果用 Velvetopt(Velvet优化程序)对基因组进行组装,得到最后的组装序列[15].

1.3 荧光SSR引物的设计、合成和筛选

1.3.1 引物设计、合成与筛选

利用MISA软件(https://webblast.ipk-gatersleben.de/misa/)对二至六碱基核苷酸重复的SSR进行搜索,利用Primer 3软件进行引物设计[16-18]. 从设计的引物中选出200对SSR引物进行合成作为引物初筛. 多态性引物的合成与筛选由北京擎科完成.

进行第一轮扩增时,在正向引物F的5′端加上通用16个碱基的Tag修饰序列. 从中筛选扩增条带理想的PCR产物,然后用Tag修饰引物和对应的反向R引物进行第二轮荧光引物PCR. 这样,3条引物两次扩增的方式可以达到多重扩增的目的. 对于筛选时有多态性,但是扩增效果不理想的引物,通过设计内引物进行巢式扩增来提高PCR的敏感性和扩增的特异性. 第一轮扩增用外引物扩增,第二轮扩增用带Tag 修饰接头的内引物进行扩增,第三轮筛选扩增条带理想的PCR产物再用Tag修饰引物内引物和对应的反向R引物进行荧光引物PCR.

1.3.2 SSR-PCR扩增与检测

用合成的200对SSR引物对16个华蟹甲样品DNA进行扩增,以擎科2×TSINGKE Master Mix(blue)进行扩增. 第一轮扩增体系各组分如下: PCR反应体系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,正向引物(加接头,10 μM)1 μL,反向引物(10 μM) 1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反应程序为:94 ℃预变性5 min,94 ℃变性30 s、56~63 ℃退火30 s、72 ℃延伸30 s、35个循环,72 ℃延伸阶段5 min,4 ℃保存. 第二轮扩增体系各组分如下: PCR反应体系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,Tag修饰引物1 μL,反向引物(10 μM) 1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反应程序为:94 ℃预变性5 min,94 ℃变性30 s、54~62 ℃退火30 s、72 ℃延伸30 s、35个循环,72 ℃延伸阶段5 min,4 ℃保存. 巢式引物第三轮扩增体系各组分如下:PCR反应体系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,Tag修饰引物1 μL,反向引物(10 μM)1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反应程序为:94 ℃预变性5 min,94 ℃变性30 s、54 ℃退火30 s、72 ℃延伸30 s、35个循环,72 ℃延伸阶段5 min,4 ℃保存.

将扩增好的PCR产物进行琼脂糖凝胶电泳(2 μL样品+6 μL溴酚蓝),300 V电压下12 min,获取鉴定胶图并确定模板浓度. 扩增良好的荧光PCR产物利用3730xl测序仪(美国ABI)毛细管电泳检测.

1.3.3 位点分析与筛选

用软件Gene mapper 4.1进行数据准确位点的分析,分析数据按照引物对应关系的核心碱基重复数来确定位点准确大小. 例如(AG)6片段大小263, 应加了Tag的16个碱基,所以大小实际为279. 根据分析出来的位点信息,选取特异性高,多态性好的位点做为后续研究的重点. 如图1所示XJSSR119位点即为筛选出的一个多态性和特异性都很好的SSR引物.

图1 XJSSR119位点在3个样品中的基因型Fig.1 Genotypes of 3 samples at No. XJSSR119 SSR locus

2 结果与分析

2.1 简化基因组测序数据质量评估

华蟹甲DNA的RAD测序共产生Raw reads 1.910 G. 如果测序错误率用e表示, DNASEQ T7平台测得数据的碱基质量值用Qphred表示,则有:Qphred =-10log10(e). 华蟹甲简化基因组原始数据中Phred数值大于20的碱基数量占总碱基数量的百分比(Q20)为96.7%;GC含量为36.8%. 质量评估结果表明测序质量合格,GC分布正常.

2.2 简化基因组组装

对华蟹甲简化基因组进行组装,总长度为357574425 bp,组装总个数为2085798,组装的平均长度为171 bp. 序列从大到小排列,当长度达到组装总长度一半时,contig的长度为200 bp.

2.3 SSR检测结果

对样本组装 contig 进行过滤,共得到双端含有100 bp(用于之后设计引物)的精确型SSR 位点46674个,复合型SSR位点3062个. 其中,包含均有引物片段的SSR数目为43235,片段引物设计率为92%. 华蟹甲简化基因组SSR位点类型丰富,单核苷酸至六核苷酸重复类型均存在(表1). 各组分数量分析结果表明,华蟹甲的核基因组SSR主要以单、二和三碱基重复单元为主,单核苷酸重复、二核苷酸重复和三核苷酸重复类型的数量较多,占主导地位(图2). 其中,单碱基重复基序数量最多(21529条,占总数46.13%),其次为二核苷酸重复序列(18426条,占比39.48%),再次为三核苷酸的重复序列(5861条,占12.55%),其他类型的SSR序列很少(858条,只占1.84%). 重复单元数量分析结果表明:华蟹甲简化基因组的精确型SSR位点总共含有321种重复单元;如图2所示,重复单元最多的是单核苷酸重复(A/T)n,其次为二核苷酸重复(AC/GT)n和(AG/CT)n. 最常见的重复次数是重复10次,其次是6次(表2).

表1 华蟹甲简化基因组SSR引物检测结果Tab.1 The abundance of SSRs in S. tangutica

图2 分布最丰富的SSR序列类型Fig.2 Numbers of the most abundance SSRs classified based on their motifs.

表2 华蟹甲简化基因组不同类型SSR重复单元类型分布Tab.2 Frequencies of different SSR repeat motif types in S. tangutica

2.4 多态性SSR引物的开发与筛选

利用已合成的200对引物对16个华蟹甲样品进行荧光SSR扩增,共筛选出特异性和多态性较高的引物共20对,其中5对引物另外设计了半巢氏引物(表3).

表3 华蟹甲SSR引物序列信息Tab.3 The information of SSR primer sequences of S. tangutica

3 讨论

随着新一代测序技术的快速发展,高通量测序技术被广泛应用于SSR标记的开发. 目前开发SSR引物可以通过转录组测序、全基因组测序和简化基因组测序等多种方式进行. 但与前两者相比,简化基因组测序只对全基因组中限制性内切酶酶切位点附近的片段进行高通量测序,从而降低了基因组的复杂性和测序量,因此获得目标物种的序列遗传信息经济快速. 此外,标记寻找采用不受参考基因组限制的tag 同源聚类的方法. 对于没有足够核算序列参考的物种而言,利用简化基因组测序来开发SSR引物是一种比较理想可行的技术[11-13]. 本研究通过简化基因组测序和组装过滤,共得到双端含有100 bp(用于之后设计引物)的精确型SSR 位点46674个,说明华蟹甲的SSR位点非常丰富. 虽然目前从200对合成引物中只筛选出了20对多态性高特异性强的引物,但是本研究将为后续基于SSR标记上的华蟹甲居群遗传结构和指纹图谱等研究提供SSR标记数据库.

菊科植物化学成分的复杂性和多样性均居植物界之首,几乎包括了所有的天然化合物类型,是非常重要的天然药库.近年来对华蟹甲化学成分和药理活性的研究都表明其有效成分具有抗肿瘤、消炎、抗菌和杀虫等生物活性,可能会成为新型抗肿瘤、抗氧化、抗菌等特效药物的重要来源[6-9,19-21]. 目前对华蟹甲的生物学研究非常少,尤其华蟹甲的遗传多样性和遗传结构还一无所知,而这些恰恰是今后物种可持续利用和保护的基础. 要开展遗传多样性的研究以及分子标记辅助育种(marker- assisted selection)等研究,分子标记的开发是第一步[11]. 虽然利用近缘种开发的SSR引物筛选目标物种所需标记也是一种相对快捷的手段,但是其通用性并不稳定,存在较大的波动[22]. 此外,目前橐吾—垂头菊—蟹甲草复合群(Ligularia-Cremanthodium-Paraseneciocomplex)中,已开发出来的SSR引物只有鹿蹄橐吾中的14对SSR以及大吴风草中的8对引物[23-24],在与之关系最近的蟹甲草属中仍无相关报道. 因此,开发SSR 标记将为今后进行华蟹甲的遗传多样性和遗传结构研究奠定基础,也可作为其近缘属种的遗传多样性研究提供参考,具有重要的实际意义.

与此同时,菊科也是入侵植物中最多的一个科[25]. 外来物种入侵是导致正在进行的第六次物种大灭绝中的一个重要原因,最近的一项研究表明自1500年以来全球超过25%的植物物种灭绝和33%的动物物种灭绝源于外来物种入侵. 目前,生物入侵已成为当今世界的一个严重的环境问题[26-27]. 华蟹甲虽是中国分布的特有物种,但是其具有的有效的种子传播和扩散机制、通过块茎进行繁殖的良好集群能力,这些特征使华蟹甲具有非常强的扩散能力. 通过近几年的野外调查,本课题组已经发现华蟹甲在七姊妹山国家级自然保护区的扩散趋势逐年增强(未发表数据). 奥地利的研究者在近期的外来植物调查中也开始关注华蟹甲在当地的扩张,华蟹甲作为一种观赏植物在1970年被引入当地山区,基于华蟹甲在过去50年内的扩散情况及其繁殖特性,作者建议对其进行监控和管理[14]. 遗传多样性对外来物种的短期入侵成功和长期进化都具有重要的影响,弄清外来入侵物种的遗传背景, 同时开展原产地和引入地之间的比较研究可以为物种管理提供科学的依据[26,28]. 因此成功筛选华蟹甲SSR引物也为该物种在引入地的管理提供科学参考依据.

猜你喜欢
碱基核苷酸多态性
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
RANTES及其受体CCR5基因多态性及环境因素在昆明汉族T2DM发生中的交互作用
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基因“字母表”扩充后的生命
应用思维进阶构建模型 例谈培养学生创造性思维
Acknowledgment to reviewers—November 2018 to September 2019
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员