扁玉螺转录组SSR信息分析

2018-08-20 01:06卢玮筱陈永霞祁鹏志
关键词:基元碱基核苷酸

卢玮筱,陈永霞,祁鹏志

(国家海洋设施养殖工程技术研究中心,浙江舟山 316022)

扁玉螺Neverita didyma,属于软体动物门Mollusca,腹足纲Gastropoda,玉螺科Naticidae,玉螺属Neverita,俗称“香螺”,“肚脐菠萝”。其主要分布于我国的南北沿海地区,比如渤海、东海等。扁玉螺具有低脂肪、高蛋白的特性,营养价值较高。食用扁玉螺还会有强身健体、美容养颜的功效[1]。但是随着过度捕捞和栖息地丧失,扁玉螺的资源量日益减少,保护扁玉螺资源已经成为重要的任务。所以分析扁玉螺的遗传变异及其结构,发现其遗传多样性规律,这对于以后扁玉螺的繁殖发展具有重大意义[2]。目前尚缺乏扁玉螺基因组分析和遗传多样性的相关研究,其分子标记分析研究仅见孙史威等[3]利用ISSR分子标记技术,用13对引物对90个扁玉螺进行了PCR扩增,同时研究建立了扁玉螺ISSR-PCR反应体系[4]。

简单序列重复分子标记(Simple sequence repeat,SSR),也可以称为微卫星(Microsatellite),其存在于原核生物及其真核生物基因组[5]。它一般以1~6个碱基为重复单元,KALIA,et al[5]在研究中发现每50 kb中存在1个SSR。按照来源来分的话,SSR可以分为g-SSR(基因组)和EST-SSR(转录组SSR)[6]。相对于前者,后者的标记方式更为方便,而且省时省力。同时EST-SSR标记方法,由于其基因功能和其多态性相关性,可以在相近的物种之间达到一种良好的通用作用[7]。目前发现,关于EST序列的SSR标记分子大多研究报道的是植物,动物相对较少。吕振明等[8]对曼氏无针乌贼Sepiella japonica作出研究报道。对扁玉螺SSR的应用很少,本文研究了扁玉螺转录组测序得到EST序列,发现扁玉螺的SSR位点,分析研究扁玉螺SSR位点的特点及其组成,以期为扁玉螺物种的遗传多样性及其标记分子育种提供理基础数据。

1 材料与方法

1.1 转录组数据来源

扁玉螺转录组数据来源于课题组2017年Illumina高通量深度测序结果,分析的组织是扁玉螺的肝脏。委托北京诺禾致源科技股份有限公司采用Illumina HiseqTM进行RNA-seq转录组测序利用Trrinity进行序列组装,得到233 858条Unigenes,以此作为分析数据。

1.2 扁玉螺EST-SSR的筛选

为检测扁玉螺的SSR位点,利用MISA软件[9]对其Unigene序列进行分析。SSR位点包含了单核苷酸、双核苷酸、三核苷酸、四核苷酸、五核苷酸以及六核苷酸重复。判断的标准为单核苷酸重复至少10次;双核苷酸重复至少6次;三核苷酸重复至少5次、四核苷酸重复至少5次、五核苷酸重复至少5次、六核苷酸重复至少5次。

1.3 扁玉螺EST-SSR引物设计

对识别出的SSR序列,采用Primer3软件进行引物设计,引物的设计标准是:退火温度(Tm)为58~60℃,上游引物和下游引物的Tm差值不能大于2℃;引物长度在11~20 bp;GC量在43%~45%。

1.4 扁玉螺EST-SSR引物筛选

结果中没有引物的SSR,是因为Primmer 3无法对其设计出引物来。关于扩增是否会产生引物二聚体的问题,可从多对引物中挑选出最好的引物进行扩增。筛选原则:2个引物之间不发生互补,特别是引物3'端,即使无法避免,其3'端互补碱基也应不大于2个碱基。随机选择引物,验证SSR引物是否可用,进行PCR扩增。

2 结果与分析

2.1 扁玉螺转录组测序结果与统计

通过对扁玉螺的转录组进行高通量测序,共获得305 060 534条序列,其中中间未知碱基序列的片段N为0.02%,并且每个扁玉螺的Q20%和Q30%均不大于97%,平均每个样品的GC含量占该样品总碱基数的43%~45%,这些数量和质量都比较高,这为下一步的分析组装奠定基础。最终被拼装成N 50为2 131 bp,N 90为558 bp,平均长度为1 304 bp的233 858条Unigenes,具体序列长度分布(表1)并且我们可以发现序列长度与长度范围成反比,这可以证明扁玉螺测序及组装效果颇好,这为接下来的功能研究提供数据依据。

表1 扁玉螺Unigene数据组装结果Tab.1 Results of assembled Unigene for N.didyma

2.2 扁玉螺转录组的位点数量与分布

利用MISA工具搜索扁玉螺转录组的233 853条Unigene中找到202 337个符合条件的SSRs,发生频率(含SSR的Unigene数与总Unigene数之比)为45.34%。55 225条Unigene含有单个SSR位点,50 813条Unigene含有复合SSRs。SSR位点的出现频率(SSR数目与总Unigene的数目比值)为:86.53%。平均每10 kb有1.91个SSR位点,见表2。

表2 扁玉螺转录组中的SSR搜索结果Tab.2 Searching results of SSR in transcriptome of N.didyma

扁玉螺EST-SSR类型丰富,从表3可以发现,单核苷酸到三核苷酸重复最多,占总SSR位点数量的99.1%,其中单核苷酸重复率最高,占到63.44%;其次为双核苷酸和三核苷酸,分别为24.12%和6.73%。四、五、六核苷酸重复率总计0.9%,数量很少,见表3。

2.3 扁玉螺重复基元的特性

以单核苷酸重复基元A/T最多,占总SSR的54.15%;其次为双核苷酸AC/GT和单核苷酸C/G最多,分别为15.90%和9.3%;单核苷酸重复基元最多,共占63.45%。二核苷酸重复基元中以AC/GT、AG/CT、AT/AT为多,共占27.69%,CG/CG所占SSR比例非常少,仅有0.20%。在三核苷酸重复基元中,AAC/GTT、ACC/GGT、AGC/CTG所占比例多,分别为2.05%、1.81%、1%。其他四核苷酸、五核苷酸和六核苷酸重复基元类型较多,数量非常少,出现频率很低,见表4。

表3 EST-SSR不同重复基元分布情况Tab.3 Distribution of different repeat motifs in N.didyma

表4 扁玉螺EST-SSR重复基元的类型Tab.4 EST-SSR repeat motifs in N.didyma

2.4 扁玉螺转录组中的SSR重复次数

长度可以影响SSR的多态性,并且SSR重复次数可以决定重复片段的长度。扁玉螺SSR的碱基重复次数非常广泛,整体波动在5~85次,多集中于5~30次。单核苷酸重复10~98次;双核苷酸重复6~36次;三核苷酸重复5~21次;四核苷酸重复6~21次;五核苷酸重复6~17次;六核苷酸重复6~12次。重复10次的频率最高,总共有43 049个,占总SSR总数的21.27%,其次是重复6次(12.84%)、11次(12.81%)、12次(8.7%)、7次(6.22%),30次以上共占7.46%。总体上可以看出,扁玉螺转录组SSR的重复次数以5~10次最多,占总SSR总数的50.76%,11~20次次之,为40.53%;重复次数21~30次为4.45%;重复次数大于30的为4.26%。

虽然SSR在基因组上的位置不相同,但是由于其两端的序列大多是保守的单拷贝序列,所以可以依据SSR两端的互补序列设计出引物,并且通过PCR反应体系扩增出含有SSR位点的片段。因为重复单位的串联重复次数不同,所以采用PCR的方法扩增出不同长度的PCR产物,并且对其进行凝胶电泳,即可显示SSR位点的长度多态性。我们采用Primer 3进行SSR引物设计,并针对预测到的每一个SSR位点分别设计了部分引物,见表5。

表5 PCR筛选引物Tab.5 Filtering primers with PCR

3 讨论

近些年以来,高通量技术不断发展,测序的成本也非常低。其测序的数据也包含了特定的时期和组织的转录本,特别是基因组信息特别缺乏的物种,因此转录组学越来越受到重视[10]。因其SSR分子标记含有丰富的多态性和等位差异,植物的遗传多样性多用此标记方式[11-12],但是动物研究相对较少。

本文以扁玉螺转录组信息进行了扁玉螺EST-SSR的研究开发,结果显示表明扁玉螺转录组中含有丰富的SSR位点从扁玉螺转录组中共搜索出202 337个SSR,分布于233 858条Unigenes上。SSR的出现频率为86.52%。物种的不同,SSR的搜索标准、数据库的完整性都会影响SSR的出现频率[13]。由于SSR标记技术,多用于植物,大多数的植物EST-SSR以二核苷酸和三核苷酸为主。扁玉螺SSR重复基元以单核苷酸最多,占到63.44%,其次为双核苷酸和三核苷酸,分别为24.12%和6.73%。这与曼氏无针乌贼Sepiella maindroni[8]略微有所不同,单核苷酸(38.69%)、三核苷酸(31.14%)、二核苷酸(26.35%),同时本研究也发现扁玉螺转录组中,SSR位点最多的是单核苷酸的重复基元A/T最多,占总SSR的54.15%;其次为双核苷酸的AC/GT,为 15.9%。

整体来说,扁玉螺转录组的SSR类型丰富,出现频率很高,这些SSR在提高多态性潜能方面发挥着重要的作用。结果表明为更好的研发新的扁玉螺功能基因SSR分子标记提供了基础数据。这对于开展扁玉螺种质资源研究和未来分子育种具有重要作用。

猜你喜欢
基元碱基核苷酸
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
面向异构履带车辆的统一运动规划方法
基于多重示范的智能车辆运动基元表征与序列生成
应用思维进阶构建模型 例谈培养学生创造性思维
有级转向履带车辆的驾驶员操控行为模型
中国科学家创建出新型糖基化酶碱基编辑器
Acknowledgment to reviewers—November 2018 to September 2019
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员