光眉刺蛾的线粒体基因组研究及系统发育分析

2024-02-27 02:10林兴雨
生物学杂志 2024年1期
关键词:刺蛾密码子线粒体

林兴雨, 宋 南

(河南农业大学植物保护学院, 郑州 450002)

近年来,随着下一代测序技术的快速发展,线粒体基因组测序已成为一种方便、快速的测序方法。鳞翅目昆虫线粒体基因组通常为一个环状、闭合、双链的DNA,由37个相对保守的基因构成,其中,包括13个蛋白质编码基因(PCGs)、22个转运RNA(tRNAs)、2个核糖体RNA(rrnL和rrnS)以及1个非编码控制区(non-coding control region)。昆虫线粒体基因组因其具有结构简单和基因排列顺序相对保守等特点被广泛用于昆虫系统发育分析[1-3]。

光眉刺蛾Narosafulgens又称褐点眉刺蛾,属于鳞翅目Lepidoptera斑蛾总科Zygaenoidea刺蛾科Limacodidae。迄今为止,刺蛾科包含301属1 672个已知种,在我国各地广泛分布[4]。它们的体背具有五颜六色的毒毛,用来保护它们免受天敌的伤害[5]。刺蛾科昆虫以多种果树及园艺植物的叶片为食,严重时可对农林业造成一定的经济损失,是果树及园艺植物的重要害虫[6]。目前,GenBank中公布的刺蛾科线粒体基因组数据仅有8条。有限的线粒体基因组数据不利于人们从线粒体基因组角度去研究刺蛾科的系统发育关系。为更好地了解刺蛾科的线粒体基因组特征以及系统发育关系,本研究利用下一代测序技术获得光眉刺蛾的线粒体基因组全序列,分别对其线粒体基因组序列进行注释,并对碱基组成、密码子使用频率的情况以及tRNA基因的二级结构等线粒体基因组结构特点进行详细分析和预测。

此外,结合已经公布的斑蛾总科的16个物种作为内群,分别选择木蠹蛾科和网蛾科各1个物种作为外群。本研究构建线粒体基因组中13个蛋白质编码基因的核苷酸和氨基酸序列矩阵以及第1、2密码子的核苷酸序列矩阵,分别利用最大似然法(Maximum likelihood)和贝叶斯法(Bayesian inference),重建刺蛾科的系统发育关系,探究光眉刺蛾的系统发育位置。为更好地理解刺蛾科和光眉刺蛾的系统发育提供线粒体基因组数据。

1 材料与方法

1.1 材料

标本采集和DNA提取。供试光眉刺蛾于2022年7月采集于河南省平顶山市画眉谷(33°47′N, 112°19′E)。将采集到的光眉刺蛾泡在无水乙醇中,存放到河南农业大学植物保护学院标本馆并置于-20 ℃冰箱保存直到用于DNA提取。实验室内使用天根公司的动物基因组DNA提取试剂盒(TIANamp Genomic DNA Kit,中国)提取光眉刺蛾胸部肌肉的总DNA。经NanoDrop 2000分光光度计和1%琼脂糖凝胶电泳进行总DNA的质量和浓度检测。

1.2 方法

1.2.1 下一代测序及线粒体基因组的组装

将质量检测合格且质量浓度大于20 ng/μL的高质量DNA送至河南微智因生物科技有限公司构建350 bp的小片段文库并进行高通量测序,基于MGI 2000测序平台进行双末端(Paired-end,PE)测序。最后,将下机的原始数据去除接头和质控。利用GetOrganelle v1.7.5.2软件[7]进行线粒体基因组的组装和拼接,从而得到完整的线粒体基因组序列。

1.2.2 线粒体基因组、注释和分析

将组装得到的光眉刺蛾的线粒体基因组数据在MITOS[8]网站上进行初步的基因注释,具体参数设置:Genetic Code:05-inverterbrate;Reference:RefSeq 89 Metazoa,其余均按照MITOS默认参数进行设置。22个tRNA的二级结构通过MITOS预测。然后,通过近缘种线粒体基因组的序列比对,手动矫正13个蛋白质编码基因边界。将注释好的线粒体基因组序列上传至GenBank,得到光眉刺蛾的GenBank登录号:OP919326。利用MEGA 7.0[9]软件分析光眉刺蛾线粒体基因组的蛋白质编码基因的碱基组成以及密码子的使用频率情况。利用AT-skew=(A-T)/(A+T)和GC-skew=(G-C)/(G+C) 公式分别计算AT偏斜和GC偏斜。

1.2.3 多序列比对

利用MAFFT软件对蛋白质编码基因进行序列比对[10]。使用trimAl v1.4对模糊比对的序列进行修剪和去除[11]。最后,运用FASconCAT-G_v1.04进行串联矩阵[12]。用于系统发育分析的数据矩阵包括:13个蛋白质编码基因的核苷酸序列构建的数据矩阵用于最大似然法分析;13个蛋白质编码基因的氨基酸序列构建的数据矩阵用于贝叶斯法分析;13个蛋白质编码基因的第1、2密码子的核苷酸序列构建的数据矩阵用于最大似然法和贝叶斯法分析。

1.2.4 系统发育分析

利用测序获得的光眉刺蛾线粒体基因组,并结合GenBank中下载的17种昆虫(15种斑蛾总科昆虫,以及木蠹蛾和网蛾科各1个物种)的线粒体基因组序列(表1)的13个蛋白质编码基因构建的3个数据矩阵。通过最大似然法和贝叶斯法构建斑蛾总科的系统发育树。利用 IQ-TREE 2.0.6[13]进行最大似然法分析:由软件自动筛选最适模型为GTR+F+I+G4模型,系统发育树的节点支持率通过自举检验置信度进行评估(运行次数设置10 000),构建系统发育树。使用MrBayes v3.2 进行贝叶斯法分析[14]。运算包含4条蒙特卡罗马尔柯夫链(Markov Chain Monte Carlo,MCMC)同时运行10 000 000代,每1 000代抽样一次,丢弃25%,构建多数一致树。

表1 本研究中用于构建系统进化树的物种样本信息Table 1 Species sample information used in the phylogenetic tree construction in this study

2 结果与分析

2.1 线粒体基因组分析

光眉刺蛾的线粒体基因组结构图利用OGDRAW Version 1.1绘制[15](图1)。光眉刺蛾的线粒体全基因组长度为15 296 bp,其中,A+T含量为80.30%,G+C含量为19.70%,其线粒体基因组包含37个基因和1个非编码控制区,H链(Heavy strand)编码23个基因,分别包括9个蛋白质编码基因和14个转运RNA基因;L链(Light strand)编码14个基因,分别包含4个蛋白质编码基因和8个转运RNA基因以及2个核糖体RNA基因。此外,控制区位于rrnS和trnM之间,长度为363 bp(表2)。光眉刺蛾的整个线粒体基因组、13个蛋白质编码基因、核糖体RNA和转运RNA的AT含量为77.2%至85%不等,具有较高的AT含量。AT偏斜和GC偏斜分别为-0.182~0.038和-0.209~0.453(表3)。

图1 光眉刺蛾线粒体基因组结构Figure 1 Structure of the N. fulgens mitochondrial genome

表2 光眉刺蛾线粒体基因组注释Table 2 Annotation of the mitochondrial genome of N. fulgens

表3 光眉刺蛾的核苷酸组成和偏斜Table 3 Nucleotide composition and skewness of the N. fulgens mitochondrial genome

2.2 蛋白质编码基因分析

光眉刺蛾线粒体基因组的13个蛋白质编码基因的序列全长为11 091 bp,其中,A+T含量为78.31%,G+C含量为21.39%。H链上的9个蛋白质基因序列总长为6 861 bp,A+T含量为77.2%。L链上的4个蛋白质基因序列总长为4 302 bp,A+T含量为80.2%。光眉刺蛾的蛋白质编码基因具有较高的AT含量。13个蛋白质编码基因的起始密码子除cox1利用CGA开头外,剩下的12个蛋白质编码基因的起始密码子都是以典型ATN开头,终止密码子除cox2和nad4以不完整的T结尾外,剩下的11个蛋白质编码基因的终止密码子都是以TAA和TAG作为结尾。在所有蛋白质编码基因的氨基酸使用中,苏氨酸(Thr)、丙氨酸(Ala)、半胱氨酸(Cys)和甘氨酸(Gly)有较高的使用频率,它们平均使用的比例从多到少的顺序依次为41.14%、39.16%、11.90%和7.78%。其余氨基酸均未使用。光眉刺蛾线粒体基因组的相对密码子使用频率见表4。

表4 光眉刺蛾线粒体基因组的相对密码子使用频率Table 4 Relative synonymous codon usage of the mitochondrial genome of N. fulgens

2.3 tRNA和rRNA基因分析

光眉刺蛾线粒体基因组的22个tRNA基因的序列长度为64~71 bp。trnR和trnS2基因最短为64 bp,trnK基因最长为71 bp。其中,16个tRNA基因位于H链,序列全长为926 bp。A+T含量为82%。6个tRNA位于L链,序列全长为532 bp,A+T含量为82.1%。除trnS1因缺少二氢尿嘧啶臂(DHU臂)导致形成一个简单的环,不能形成完整的三叶草结构,剩下的21个tRNA基因均能形成完整的三叶草结构。此外,trnS1的反密码子不是常见的GCU而是UCG(图2)。光眉刺蛾的线粒体基因组rrnL的全长为1 335 bp,A+T含量为85.24%,G+C含量为14.76%。rrnS的全长为732 bp,A+T含量为84.70%,G+C含量为15.30%。

图2 光眉刺蛾22 个 tRNA基因的二级结构Figure 2 Secondary structure of 22 tRNAs genes of N. fulgens

2.4 系统发育分析

以斑蛾总科的16个物种作为内群,并选择木蠹蛾科和网蛾科各1个物种作为外群,基于它们的13个蛋白质编码基因的核苷酸和氨基酸序列矩阵以及第1、2密码子的核苷酸序列矩阵,分别利用最大似然法和贝叶斯法构建系统发育树。如图3和图4所示,两种不同的系统分析方法基于3种不同数据矩阵构建的树拓扑结构相同。斑蛾总科内的科级别系统发育关系显示:刺蛾科和斑蛾科分别为单系群且有较高的节点支持值(BS≥91,PP=1)。此外,两种系统发育树的结果都支持本文测定的光眉刺蛾与龟形小刺蛾N.nigrisigna互为姐妹群,且在该分支上最大似然法与贝叶斯法都显示出较高的节点支持率(BS=100,PP=1)。利用 Kimura-2-Parameter 模型计算刺蛾科8个物种(Iragoidesfasciata、Latoiahilarata、Monemaflavescens、光眉刺蛾N.fulgens、龟形小刺蛾N.nigrisigna、Parasaconsocia、Quasithoseasythoffi和Thoseasinensis)之间的种间遗传距离,结果显示:光眉刺蛾与龟形小刺蛾的遗传距离最近,为0.115;光眉刺蛾与M.flavescens、L.hilarata、I.fasciata、P.consocia和Q.sythoffi的遗传距离分别为0.171、0.173、0.174、0.175和0.179;与T.sinensis的遗传距离最远为0.181(表5)。种间遗传距离与系统发育树所显示的亲缘关系支持光眉刺蛾与龟形小刺蛾互为姐妹群。

图3 基于13个蛋白编码基因的核苷酸和氨基酸序列构建的系统发育树Figure 3 Phylogenetic tree inferred from the nucleotide and amino acid sequences of 13 protein-coding genes

图4 基于13个蛋白编码基因的核苷酸序列第1、2密码子构建的系统发育树Figure 4 Phylogenetic tree inferred from codon 1 and 2 of the nucleotide sequences of 13 protein-coding genes

表5 光眉刺蛾与刺蛾科昆虫的线粒体蛋白质编码基因基于Kimura-2-Parameter模型的遗传距离Table 5 Pairwise genetic distances of mitochondrial protein-coding gene sequences between and other species of Limacodidae based N. fulgens on Kimura-2-Parameters

3 讨论与结论

尽管斑蛾总科的昆虫在全世界分布广泛并且具有重要的经济意义,但对该类群的系统发育研究仍较少。利用下一代测序技术获得完整的光眉刺蛾线粒体基因组全序列,分别预测和分析光眉刺蛾的转运RNA的二级结构和线粒体基因组结构等特点。光眉刺蛾线粒体基因组全长为15 296 bp,在昆虫的线粒体基因组长度范围内[16]。光眉刺蛾的线粒体基因组的37个基因的排列顺序与鳞翅目昆虫线粒体基因组排列顺序(trnM-trnI-trnQ)一致[17-18]。此外,光眉刺蛾除trnS1基因因缺少二氢尿嘧啶臂(DHU臂)导致不能形成稳定的三叶草结构外,其余转运RNA基因均能形成完整的三叶草结构。这种现象在其他昆虫中也有出现[19-26]。

种间遗传距离与系统发育分析结果都支持光眉刺蛾与龟形小刺蛾有较近的亲缘关系。这可能是由于在传统的形态分类中,它们同归为Narosa属且都是植食性昆虫,生活习性基本相同。

本研究结合已公布的斑蛾总科的线粒体基因组数据,研究斑蛾总科内部的系统发育关系。使用斑蛾总科的16个物种作为内群,木蠹蛾科和网蛾科的各1个物种作为外群的线粒体基因组的13个蛋白质编码基因的核苷酸和氨基酸序列矩阵以及第1、2密码子的核苷酸序列矩阵,分别利用最大似然法和贝叶斯法构建的系统发育分析结果显示,刺蛾科和网蛾科分别形成单系群且有较高的节点支持值。这一结果与Epstein等[27]基于成虫和幼虫的形态特征、Peng等[28]基于线粒体基因组数据,利用谷蛾科的2个物种,刺蛾科的2个物种,卷蛾科的3个物种作为内群,Thitarodespui和Hepialusxiaojinensis作为外群,通过邻接法Neighbor Joining (NJ)构建的系统发育关系、Zhang等[29]基于线粒体基因组数据利用贝叶斯法和最大似然法重建的系统发育关系以及Bian等[16]基于13个蛋白质编码基因的线粒体基因组数据利用最大似然法和贝叶斯法重建的鳞翅目的系统发育关系结果一致,支持刺蛾科为单系群。

研究利用下一代测序技术获得了光眉刺蛾的线粒体全基因组,预测和分析光眉刺蛾的转运RNA的二级结构以及线粒体基因组等特点,丰富了刺蛾科的线粒体基因组数据,证实光眉刺蛾与龟形小刺蛾的姐妹群关系,为后续斑蛾总科的系统发育以及光眉刺蛾的种群遗传学等研究提供线粒体基因组数据。

猜你喜欢
刺蛾密码子线粒体
刺蛾遇刺
南昌茶区刺蛾发生及综合防治技术
棘皮动物线粒体基因组研究进展
线粒体自噬与帕金森病的研究进展
辽宁柞园刺蛾种类调查
密码子与反密码子的本质与拓展
蓝莓采后立即追肥 谨防黄刺蛾介壳虫
10种藏药材ccmFN基因片段密码子偏好性分析
NF-κB介导线粒体依赖的神经细胞凋亡途径
茶树CsActin1基因密码子偏性分析