蝎蝽次目线粒体基因组22个tRNA基因的比较研究(半翅目:异翅亚目)

2019-03-02 02:09张丹丽张苗苗田菁李悦锐张虎芳
关键词:仰泳密码子碱基

张丹丽,张苗苗,田菁,李悦锐,张虎芳

(1.太原师范学院 生物系,山西 晋中 030619;2.忻州师范学院 生物系,山西 忻州 034000)

线粒体是真核细胞中重要细胞器之一,存在基因组。线粒体基因组因其结构简单、母系遗传、相对于核基因组较快的进化速率,含有大量的直同源基因等特点,近年来被广泛应用于生物系统学及进化生物学的研究。线粒体基因组的核苷酸序列、基因含量、基因排列方式,均可提供系统发育信号。线粒体基因组tRNA (transfer RNA)基因是具有携带并转运氨基酸功能的一类小分子核糖核酸。线粒体DNA 编码22个tRNA,用于转运20种氨基酸,可以满足线粒体蛋白质翻译过程中所有密码子的需要。tRNA长度一般在73~93 bp之间,可排布成三叶草型结构。由于tRNA 基因序列较短,所以长期以来的系统发育研究中对其关注较少,抑或只是关注其在线粒体基因组中的位置变化。目前,关于昆虫线粒体tRNA研究中较多的是其一级结构核苷酸序列应用于系统发育研究分析中及对其二级结构进行预测。在已有的研究中,Chiotis[1]对臭蚁亚科包括外群在内的17属的tRNA-Ile的二级结构进行了比较,与根据Cytb、CO1的氨基酸序列得到的系统发育假设吻合度很高,所以tRNA的二级结构可能比序列本身提高了信息的利用率。由于每一种tRNA 都很小,所能提供的信息十分有限,而且目前对于不同分类阶元水平上tRNA二级结构的比较研究十分欠缺。

蝎蝽次目隶属于昆虫纲半翅目异翅亚目,共包括6总科11科,之前基于蝎蝽次目的系统发育多是以线粒体基因组中13个蛋白质编码基因和核糖体RNA中的12S和16S为主[2~4],而基于tRNA及其二级结构的研究则较少。本研究选取类群全面,覆盖了蝎蝽次目11科,将蝎蝽次目线粒体基因组中所有的tRNA二级结构信息综合在一起,则tRNA的二级结构有可能得到更好的应用。

本研究以半翅目异翅亚目蝎蝽次目为研究对象,选取已获得线粒体基因组序列的蝎蝽次目6总科11科12种,通过MITOS获取22个tRNA序列及二级结构,对蝎蝽次目11科tRNA的基因序列特征、遗传距离、同源基因相同核苷酸百分比和tRNA二级结构进行比较研究,并将结合二级结构进行校正后的tRNA串联序列进行建树,以头喙亚目1种和黾蝽次目2种为外群,采用最大似然法和贝叶斯法探讨蝎蝽次目总科及科间的系统发育关系,补充了tRNA在蝎蝽次目研究中的不足。

1 材料与方法

1.1 材料

本研究以蝎蝽次目6总科12个种为研究对象,覆盖了蝎蝽次目11科,从GenBank下载了12个种的所有22个tRNA基因序列(表1)。

表1 本研究所选物种Table 1 List of species used in this study

1.2 分析方法

在NCBI(https://www.ncbi.nlm.nih.gov/)中检索蝎蝽次目11科代表种全线粒体基因组序列,下载12个代表种所有的22个tRNA基因序列,并通过RNA structure 5.8[5]推测其二级结构。在MEGA 6.0[6]中计算22个tRNA基因的碱基长度、碱基组成、AT含量、AT偏斜和GC偏斜,同时计算保守位点、变异位点和简约信息位点。在BioEdit 7.1[7]中对每一个同源tRNA基因用ClustalW进行比对,基于比对的结果在tRNA二级结构中标注11科代表种的保守位点,并总结tRNA二级结构中茎环结构特点。在BioEdit 7.1中计算每组同源基因的相同核苷酸百分比(Percent of identical nucleotides,%INUC)。在MEGA 6.0中基于Kimura-2-Parameter(K-2-P)计算科间遗传距离。在RAxML 8.2.8[8]和 Mrbayes 3.2.5[9]中分别基于最大似然法(Maximum Likelihood,ML)和贝叶斯法(Bayesian inference,BI)构建系统发育树。进化模型利用jModelTest 2.1.1[10]测得为GTR+I+G模型。所构建的系统发育树采用Figtree 1.4.3查看并进行编辑。

2 结果与分析

2.1 tRNA基因序列特征及遗传距离分析

蝎蝽次目11科12个代表种的22个线粒体tRNA基因在60~80 bp之间,序列总长略有差异,每一个同源tRNA基因比对后未发现大段的插入和缺失,将比对后的22个同源tRNA基因串联起来得到1 525 bp序列,其中含有764个保守位点,742个变异位点,443个为简约信息位点。

对蝎蝽次目12个代表种核苷酸组成分析如表2所示,蝎蝽次目22个tRNA基因长度在1 428~1 481 bp之间,4种碱基(A、T、G、C)的组成比例并不均衡,(A+T)%含量在70%~80%之间,平均含量为76.41%,反映了核苷酸组成的AT偏好性。其中仰泳蝽科(Helotrephessp.)AT含量最高为79.08%,小划蝽科(Micronectasahlbergii)最低为73.81%。核苷酸组成偏好如图1所示,12个代表种碱基A和T的含量均高于G和C,其中除了Helotrephessp. 和DiplonychusrusticusT稍高于A之外,其余种A均高于T,所有种G均高于C。碱基组成的偏向性(Strand-specific bias)或称为链组成的不对称性(Strand Asymmetry)由AT偏斜(AT skewed=(A-T)/(A+T))与GC偏斜(GC skewed=(G-C)/(G+C))来表示,其中A、T、G与C分别表示一条链上相应4种碱基的含量。正值代表A含量高于T,G含量高于C。12个种tRNA基因均表现为GC偏斜,除了蚤蝽科(Helotrephessp.)和负子蝽科(Diplonychusrusticus)为TA偏斜外,其余均为AT偏斜(表2;图1)。

表2 蝎蝽次目核苷酸组成分析Table 2 Nucleotide composition of Nepomorpha mitochondrial genome

通过MEGA 7.0对蝎蝽次目12个种11个科科间的遗传距离进行计算(表3)。由表3可以看出,蝎蝽次目科间的遗传距离在0.13~0.26之间。6总科内的遗传距离在0.06~0.23之间,仰泳蝽总科内的遗传距离最小为0.06,小划蝽总科内的遗传距离最大为0.23。

图1 核苷酸组成Fig.1 Nucleotide composition

2.2 tRNA同源基因相同核苷酸百分比(%INUC,Percent of identical nucleotides)

在蝎蝽次目12个种内,tRNA同源基因相同核苷酸百分比如图2所示,核苷酸序列保守性较高的tRNA基因主要是tRNA-L2、tRNA-T和tRNA-M(%INUC>61),其中tRNA-L2 的保守性最高;上述这些核苷酸保守性较高的tRNA基因均位于线粒体基因组的J链。核苷酸保守性较低的tRNA基因主要是tRNA-V和tRNA-F(%INUC<37),其中tRNA-V的保守性最低;上述这些核苷酸保守性较低的tRNA基因均位于线粒体基因组的N链。

表3 基于22个tRNA基因科间遗传距离Table 3 The inter-family distance (K2P) of 22 tRNA

注:*代表各个总科内的遗传距离。

Note: *represents the genetic distance within each superfamily.

图2 tRNA同源基因相同核苷酸百分比(%INUC)Fig.2 Percent of identical nucleotides of homeotic tRNA gene

上述蝎蝽次目昆虫线粒体tRNA基因序列的保守性反映在其二级结构上如图3所示。在蝎蝽次目12种内tRNA茎表现为较高的保守性,而环中除了反密码子环相对保守外,其余环都有不同程度的碱基变异。几乎每一个同源tRNA基因二级结构均出现非经典G-U配对,G-U配对于维系tRNA二级结构的稳定性非常重要。在蝎蝽科的二级结构上标记11科12种的保守点,具体表现为:tRNA-L2的氨基酸接受茎保守性较高(长度均为7 bp,其中只有3个碱基表现为不保守),D茎保守性极高(长度均为3 bp,所有碱基全部保守),反密码子茎保守性极高(长度除仰泳蝽科Notonectidae sp.为4 bp外,其余均为5 bp,只有1个碱基不保守),TψC茎保守性极高(长度除仰泳蝽科Enitharestibialis为4 bp外,其余均为5 bp,所有碱基全部保守)。而在tRNA-L2的D环,反密码子环,可变环和TψC环4个环中只有反密码子环保守性较高(长度除仰泳蝽科Notonectidae sp.为9 bp外,其余均为7 bp,只有2个碱基不保守),而在其余3个环中存在较多变异位点)。

tRNA-V的氨基酸接受茎保守性极低(长度均为7 bp,保守的碱基数为4),D茎保守性极低(在仰泳蝽科Enitharestibialis和 Notonectidae sp.中长度变异较大),反密码子茎保守性相对高些(长度均为5 bp,保守碱基数为6),TψC茎保守性极低(在划蝽科Sigaraseptemlineata和仰泳蝽科Notonectidae sp.长度变异为4 bp,其余科的长度均为5 bp,保守的碱基数为3)。而在tRNA-V的D环,反密码子环,可变环和TψC环4个环中只有反密码子环保守性较高(长度均为7 bp,保守碱基数为5 bp)。

由二级结构进一步分析得出:氨基酸接受茎保守性高(不保守的碱基数为3或4)的tRNA有tRNA-L2、tRNA-Q、tRNA-K、tRNA-T、tRNA-N,D茎保守性高(全部碱基保守)的tRNA有tRNA-L2、tRNA-T、tRNA-N、tRNA-W、 tRNA-P,反密码子茎保守性高(全部碱基保守或只有一个碱基不保守)的tRNA有tRNA-L2、tRNA-Y、tRNA-M、tRNA-K、tRNA-A,TψC茎保守性高(全部碱基保守)的tRNA有tRNA-L2,其余tRNA的TψC 茎保守性均较低。

2.3 系统发育分析

系统发育结果显示,基于ML(图4)和BI(图5)算法构建的系统发育树结果基本一致,固蝽总科、仰泳蝽总科和划蝽总科均为单系,其中固蝽总科和仰泳蝽总科为姐妹群关系,其余总科的单系性没有得到很好的解析,可能与tRNA基因序列相似度较高,能够提供的有效系统发育信号较少有关。蟾蝽总科中的蜍蝽科和蝎蝽总科中的蝎蝽科为姐妹群关系,蟾蝽总科中的蟾蝽科和潜蝽总科中的潜蝽科为姐妹群关系,潜蝽总科中的盖蝽科与固蝽总科和仰泳蝽总科形成的支系为姐妹群。

3 讨论与结论

线粒体tRNA基因作为携带并转运氨基酸功能的一类小分子核糖核酸,在蛋白质翻译过程中起着非常重要的作用,目前关于线粒体tRNA 研究中较多的是其一级结构核苷酸序列应用于系统发育研究分析中及对其二级结构进行预测[11~15]。本研究获得蝎蝽次目11科所有12个种的22个tRNA,其排列位置与果蝇Drosophilayakuba[16]的相同。通过对tRNA的碱基组成分析发现,12个物种的A+T%含量在70%~80%之间,呈现明显的AT偏好性,通常昆虫线粒体基因组中A+T%的含量高于G+C%[17]。12个代表种碱基A和T的含量均高于G和C,其中除了Helotrephessp. 和DiplonychusrusticusT稍高于A之外,其余种A均高于T,所有种G均高于C,呈现了明显的AT偏斜和GC偏斜,而大多数昆虫线粒体基因组中A的含量高于T, C的含量高于G[18],呈现AT偏斜和CG偏斜。本研究中tRNA基因呈现的GC偏斜与大多数昆虫线粒体基因组呈现的CG偏斜不一致。碱基组成的偏好性一般被认为是由于四种碱基不对称的突变和选择压力所导致的,主要来自复制和基因的转录。Wei[19]结合基因组复制起点的二级结构及线粒体基因组复制和转录方式的分析,发现GC之间的相对含量与复制起点的方向相关,而AT之间的相对含量因复制起点方向、基因方向以及密码子位置的变化而改变。因而,碱基组成的偏向性对研究线粒体基因组复制和转录的机理具有重要参考价值。

图5 基于22个 tRNA基因构建的BI系统发育树(分支节点内数字代表节点支持率)Fig.5 Phylogenetic tree inferred from 22 tRNA genes constructed using BI analysis

通过比较蝎蝽次目11科12种22个tRNA基因序列和二级结构差异可以看出,不同线粒体tRNA基因间以及同一基因不同区域内的核苷酸变异均存在显著多态性,不同物种的同源tRNA均使用相同的反密码子。22个tRNA基因中,tRNA-L2的变异位点数最少,保守性最高,占核苷酸总数的73%以上;tRNA-V的变异位点数最多,保守性最低,占核苷酸总数的34%以下。科间茎区序列变化较少,其中D茎最为保守而TψC茎变异相对较多;环区变异速率远远高于茎区,变异主要发生在D环和TψC环,而反密码子环十分保守,且不同物种的同源tRNA均使用相同的反密码子,可能与其行使转译功能有关。tRNA基因进化主要是以碱基替换为主[20],茎区比环区保守性更高,可能是由于线粒体tRNA 基因茎区和环区受到的选择压力不同,茎区序列为维持其二级结构变化较慢而环区变化较快的结果[21~23]。

基于ML和BI算法的系统发育结果基本一致,显示固蝽总科和仰泳蝽总科为姐妹群关系,这一观点在Li[3]和Zhang[4]中都得到了证实。其余总科的单系性并未得到很好的解析,可能与tRNA基因序列过短,能够提供的信息量十分有限有关。在今后的研究中,仍需加入大量的基因序列来确定蝎蝽次目各总科及科间的系统发育关系。关于线粒体tRNA基因的二级结构特征在蝎蝽次目乃至异翅亚目类群的分类进化中的适用性以及系统发育关系方面有待于做进一步的研究。

猜你喜欢
仰泳密码子碱基
我国优秀女子仰泳运动员两种出发技术运动学特征研究
应用思维进阶构建模型 例谈培养学生创造性思维
密码子与反密码子的本质与拓展
中国科学家创建出新型糖基化酶碱基编辑器
鸡蛋会仰泳
新型密码子、反密码子、氨基酸对应盘
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
10种藏药材ccmFN基因片段密码子偏好性分析
烟草叶绿体密码子的偏好性及聚类分析