基于转录组测序的温带臭虫SSR和SNP位点分析

2019-06-24 08:43李敏王青陈晨付艺杰石太瑞
关键词:臭虫温带基元

李敏,王青,陈晨,付艺杰,石太瑞

(1.太原师范学院 生物系,山西 晋中 030619;2.山西农业大学 农学院,山西 太谷 030801)

温带臭虫(Cimexlectularius)属于半翅目(Hemiptera)臭虫科(Cimicidae)臭虫属(Cimex),是一种以吸食人类血液为生的昆虫。因其唾液中含有抗凝剂,能够刺激受害者皮肤,引起发红、瘙痒,影响人类睡眠,还传播某些疾病,如回归热、鼠疫等[1]。温带臭虫在我国各地均有分布,近年来温带臭虫咬人事件呈上升趋势,尤其以珠江三角洲等地区最为严重,其发生的场所包括工厂宿舍、出租房、军营等[2~4]。自20世纪90年代以来,铁路旅客被臭虫叮咬的事件经常发生,迄今为止报道的列车干线已有6条[5]。近日笔者在山西省临汾市某酒店和忻州市某学校也发现温带臭虫。因此,研究温带臭虫的遗传多样性、种群遗传结构和历史动态对其预测、预防和防治具有重要意义。

随着分子生物学的发展,分子标记技术已成为物种遗传多性性研究的重要手段之一。微卫星,也称简单重复序列(Simple Sequence Repeat, SSR),是以1~6个核苷酸碱基(bp)为重复单位组成的5~40个的简单串联重复序列[6]。微卫星标记技术因其数量多、多态性信息丰富、易于检测、呈共显性遗传等优点成为系统进化、群体遗传学、保护遗传学以及遗传育种等研究的有力工具,在植物、动物、微生物及人类医学等学科领域得到了广泛应用[7~9]。以往的SSR发掘方法较为繁琐,需要多个步骤,花费大量的财力和时间。随着高通量测序技术的发展,可以快速精确地从转录组序列中发掘出物种中的SSR位点。单核苷酸多态性(Single Nucleotide Polymorphisms, SNP)指同一物种的不同个体在基因组水平上由单个核苷酸变异引起的DNA序列多态性,通常只有频率大于1%时才被称为SNP,占已知多态性的80%以上。多倍体物种中的SNPs大致可分为simple SNPs、hemi-SNPs和homoeo-SNPs[10]。SNP标记作为目前最具发展潜力的分子标记,在基因组中具有遗传稳定、数量多、分布广且易于检测等特点,适合于数量庞大的检测分析,也是研究遗传多样性的主要分子标记之一[11,12]。

本研究拟利用软件msatcommander v0.8.2[13]和SOAPsnp v1.03[14]对温带臭虫转录组数据进行SSR和SNP位点分析,以期为温带臭虫及近缘种的SSR标记和SNP标记的开发提供生物信息学基础,为进一步研究其遗传多样性、种群遗传结构和历史动态乃至对臭虫的预测防治奠定理论基础。

1 材料与方法

1.1 转录组数据的获取

温带臭虫转录组数据及其全基因组数据均来自美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI),在genome数据库中的ID为11279。该转录组数据和全基因组数据分别包含25 468和41 503个unigene,平均长度均大于200 bp,可以用于温带臭虫SSR与SNP的发掘。

1.2 温带臭虫转录组数据中SSR与SNP位点的发掘

SSR位点的发掘是使用msatcommander v0.8.2 软件对获得的温带臭虫全转录组数据进行分析,核苷酸重复次数分为单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复、六核苷酸重复,重复次数分别为12、6、5、4、4、4。最终得到的符合标准的核苷酸重复在本次实验中定义为SSR。

SNP的发掘是以温带臭虫全基因组作为参考基因组,转录组数据作为测序数据,使用SOAPaligner/soap2软件进行比对。将得到的SOAP比对结果进行排序,排序后的SOAP比对结果输入到SOAPsnp v1.03进行预测,最终得到的结果为SNP。

2 结果与分析

2.1 温带臭虫转录组SSR数量及分布特征

温带臭虫转录组序列经过msatcommander v0.8.2软件的分析后,共得到了4 758个SSR,占总转录组序列的18.68%,即出现频率。这4 758个SSR分布于4 171条序列中,占总序列的16.38%,即发生频率。所发现的SSR长度在12~45个碱基之间变化。从温带臭虫转录组中发掘出的6种核苷酸重复中,单核苷酸重复次数最多,占总SSR数量的58.74%,其次是三核苷酸重复,其数量少于单核苷酸重复,占总SSR个数的20.68%。六核苷酸重复的次数最少,只有2个,仅占总数的0.04%,并且每种核苷酸重复在重复次数上存在一定的差异(表1)。例如,单核苷酸重复一般出现12~14次,二核苷酸重复则较多地出现,为6~7次,三核苷酸重复的重复次数主要为5~6次,而四、五、六核苷酸重复次数主要为4次。

表1 温带臭虫中开发的SSR数量及分布Table 1 The amount and distribution of SSR detected in Cimes lectularius

2.2 温带臭虫SSR重复基元的种类及分布特征

在温带臭虫转录组中发掘出的4 758个SSR中,共有30种重复基元,6种核苷酸重复基元的种类数量分别为2、3、10、12、2、1。 在单核苷酸重复中,出现最多的是A/T,共出现2 757次,占总数的57.94%,出现频率为10.825%。二核苷酸重复中,出现最多的基元为AT/AT,出现了474次,是总数的9.96%,出现频率为1.861%。其次为AG/CT,是总数的4.17%。三核苷酸重复出现最多的为ATT/AAT,占总数的7.91%。四核苷酸重复、五核苷酸重复、六核苷酸重复出现的次数较少,共占总数的4.5%(表2)。

2.3 温带臭虫SNP特征分析

用SOAPsnp v1.03对温带臭虫转录组25 468条Unigene预测得到109 301个SNP位点,每条unigene平均含4.29 个SNP 位点。其中simple SNPs与hemi-SNPs分别为76 562个和32 739个。simple SNPs中转换型46 634个,占60.91%,颠换型29 928个,占39.09%。6 种单核苷酸变异中,C/T和A/G发生的频率最高,分别为30.69%和30.22%。其它4种单核苷酸变异中A/T、C/G、A/C和 G/T的发生频率分别为13.41%、9.57%、8.65%和7.46%(表3)。

3 讨论与结论

通过转录组测序的方法,本研究在温带臭虫中发掘出4 758个SSR位点,出现频率为18.68%。比已报道的鞘翅目云南切梢小蠹Tomicusyunnanensis(1.293%)[15]、鳞翅目荔枝蒂蛀虫Conopomorphasinensis(15.25%)[16]、东方粘虫Mythimnaseparata(11.505%)[17]、细梢小卷蛾Rhyacionialeptotubula(3.091%)[18],双翅目桔小实蝇(4.232%)[19]、半翅目蠋蝽Armachinensis(7.60%)[20]、扶桑绵粉蚧Phenacoccussolenopsis(6.334%)[21]等大多数昆虫的出现频率都要高,一定程度上说明温带臭虫SSR标记数量的丰富,较高多态性潜能,但是跟缨翅目西花蓟马(18.954%)[22]的出现频率高的物种相比则要低,出现这种频率差异的原因可能与物种的特异性、测序数据量大小和搜索序列标准有关。

温带臭虫微卫星种类较为丰富,其中单核苷酸重复出现的次数最多,这与报道的荔枝蒂蛀虫[16]、西花蓟马[22]、玉米粘虫[23]结果相似。然而,印度谷螟[24]则以二核苷酸重复最多,与此同时,云南切梢小蠹[15]、桔小实蝇[19]、阿麦叶蜂Dolerusaeneus[25]、二点委夜蛾Athetislepigone[26]、褐飞虱Nilaparvatalugens[27]以及灰飞虱Laodelphaxstriatellus[28]则是以三核苷酸重复最丰富,可见各物种间的SSR类型仍存在着明显差异[29]。

温带臭虫的重复基元主要分布在单、二、三核苷酸重复,占总SSR的95.48%,单核苷酸重复的主要重复基元A/T,与当前发掘的大多数昆虫的单核苷酸重复相同。与印度谷螟相似,温带臭虫的二核苷酸重复以AT/AT为主,但与以AC/GT为主的西花蓟马的重复基元不同。二核苷酸重复中的GC/GC基元没有在温带臭虫上出现,这跟以往研究的大部分昆虫中GC/GC的含量非常低甚至没有相一致;与之相反,在鳞翅目玉米粘虫、二点委夜蛾和细梢小卷蛾中GC/GC基元,不仅常见而且所占比例较高,因此需要进一步研究来确定此重复基元的具体功能。三核苷酸重复基元温带臭虫的ATT/AAT占优势,而玉米粘虫和印度谷螟以CCG/CGG为优势重复基元。

表2 SSR重复基元分布特征Table 2 The distribution characteristics of the motifs in Cimex lectularius

对温带臭虫SNP类型分析发现,simple SNPs

表3 温带臭虫转录组中SNPs 位点统计Table 3 The statistics of SNP sites in Cimex lectularius

中转换类型占总数的60.91%(46 634个),颠换类型占总数的39.09%(29 928个),颠换类型明显少于转换类型。在转换类型中,C-T的发生频率非常高,这可能是由于在CG序列上SNP的发生频率最高,而胞嘧啶(C)通常以甲基化的形式存在,且脱氧之后就变成胸腺嘧啶(T)[30],这与钱荷英等人在家蚕的SNP发掘过程中得到的结论基本一致[31]。

本试验基于温带臭虫的转录组数据发掘出大量SSR和SNP位点,并进行了特征分析,研究结果将为温带臭虫的分子标记开发提供宝贵资源,对温带臭虫的遗传多样性、遗传图谱构建、功能基因组学以及制定合理的检测及预防措施等研究奠定了基础。

猜你喜欢
臭虫温带基元
面向游戏场景生成的细分插槽WFC算法研究
Facts of Yellowstone
基于多重示范的智能车辆运动基元表征与序列生成
红黑床单易招臭虫
人类的吸血鬼室友
人体细胞内存在全新DNA结构
发现最古老臭虫
温带季节性分层水库浮游植物功能类群的时空演替
生态脆弱的温带地区草原生态移民分析——以甘肃省古浪县为例
基元树建筑物图像伪造组件检测算法