孔 勇, 王众潇, 汪雨馨, 李 冉
(曲阜师范大学生命科学学院,273165,山东省曲阜市)
0引 言
线粒体是一种真核细胞器,由两层膜包被,广泛存在于昆虫体内,在控制昆虫的新陈代谢、生命周期、凋亡、病害等方面起着重要作用[1]. 昆虫线粒体基因组为闭合的环状双链DNA,总长一般为14~20 kb,能够稳定地编码37个基因[2,3]. 线粒体基因组具有母系遗传、较为保守的基因组分、进化速率较快、不含内含子等优势,广泛应用于昆虫系统发育、进化和种群遗传等方面的研究[4-7]. 除此之外,在漫长的进化过程中,相比于祖先基因排列顺序,有些昆虫类群的某些基因在经历重排事件后会发生方向和位置的改变[8]. 不同类群出现的基因重排在昆虫基因组进化中具有一定规律,已有研究表明,基因重排能够为探究昆虫之间的系统发育和进化关系提供证据[9]. 自1995年首个直翅目Orthoptera昆虫飞蝗Locustamigratoria的线粒体全基因组被报道以来,随着各种测序技术的不断发展,直翅目昆虫的线粒体基因组全序列逐渐被测定和注释[10-12]. 迄今已测序的物种零星散布在各类群,亟需更多物种的线粒体基因组数据,为深入理解直翅目昆虫线粒体基因组起源和系统演化过程提供新的依据.
隆X小车蝗OedaleusabruptusThunberg,1815隶属于直翅目Orthoptera蝗总科Acridoidea蝗科Acrididae斑翅蝗亚科Oedipodinae,主要分布于我国的湖南、湖北、福建、海南、广东、云南、广西等省份及地区[13]. 该物种是禾本科植物的一种重要害虫,它的爆发对甘蔗、水稻、小麦、玉米、高粱等作物造成损害,进而影响农业发展[14]. 近年来对于隆X小车蝗的研究主要聚焦于行为和生理方面[14,15]. 由于其线粒体基因组的结构和进化特征仍不明确,对于该物种的系统发育分析主要基于单个基因或者形态特征[16]. 本研究采用Sanger测序技术测定隆X小车蝗的线粒体基因组全序列,对其基本结构、核酸组分、蛋白编码基因、tRNA和rRNA以及非编码区等信息进行全面分析,挖掘该物种的线粒体基因组特点,阐述其在直翅目昆虫线粒体基因组中的进化共性. 同时,结合已发表的斑翅蝗亚科线粒体基因组序列对其系统发生关系进行了探讨,为蝗科分类及直翅目线粒体基因组研究提供科学依据.
隆X小车蝗成虫标本采集于海南省三亚市吉阳区六盘岭. 所有标本均野外采集后保存于无水乙醇中,并长期贮存于实验室超低温冰箱(-80 ℃). 标本的形态鉴定工作由南京农业大学李保平教授帮助完成.
本实验主要选取隆X小车蝗的后足肌肉组织,使用吸附式DNA提取试剂盒(TransGen)提取分析样本的基因组总DNA. 使用NanoDrop 2000微量核酸/蛋白分析仪检测提取的总DNA的浓度和质量(纯度). 对检测合格的模板进行稀释并分装,DNA样品置于超低温冰箱保存待用.
本实验选择了5对直翅目昆虫线粒体基因组通用引物[17,18],将已扩增片段作为上下游序列,使用软件Premier 5设计特异性引物,扩增通用引物无法得到的片段,进而获取线粒体基因组全长序列[19]. 本研究选用扩增效率较高的ExTaq酶进行扩增,且总反应体系为25 μL. PCR反应程序为:93 ℃预变性2 min;98 ℃变性10 s,45~60 ℃(根据引物而定)退火30 s,72 ℃延伸1 min(根据产物长度而定,扩增效率为1 min/kb),扩增30个循环;98 ℃变性10 s,72 ℃延伸1 min(根据产物长度而定,扩增效率为1 min/kb),扩增30个循环;72 ℃最后延伸7 min;4 ℃结束并保存. PCR扩增所得产物通过琼脂糖凝胶电泳检测,条带单一、清晰且大小与本实验所设计的扩增产物一致后,直接将PCR产物送至金斯瑞生物科技有限公司进行测序.
测序结果首先利用NCBI中的Blastn进行序列相似性比对,以确保所得序列为该物种的线粒体基因组序列. 随后使用DNASTAR软件中的SeqMan将测序数据进行拼接[20]. 最后,使用Geneious软件对测序结果重叠组装验证[21]. 拼接完整的线粒体基因组序列使用在线软件MITOS进行初步注释[22]. 蛋白编码基因的起始位置利用近缘种参考序列进行手动校正. 使用ARWEN和tRNAscan-SE两个软件预测tRNA的二级结构[23,24]. 基因间隔、基因重叠以及AT富集区通过MEGA比对确定[25]. 线粒体基因组结构图通过在线软件OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)绘制. 使用PhyloSuite和MEGA统计和分析碱基组分、密码子使用和同义密码子使用频率[25,26]. 核苷酸组分的偏好性,即AT偏好性和GC偏好性的计算公式为:AT-skew = (A-T)/(A+T)和GC-skew = (G-C)/(G+C)[27].
为探究隆X小车蝗在斑翅蝗亚科中的分类地位及其系统发育关系,下载Genbank中的22个斑翅蝗亚科物种,并选取槌角蝗亚科Gomphocerinae的2个物种作为外群,重建系统发育树. 使用PhyloSuite对13个蛋白编码基因依次进行提取、比对、修剪、串联、数据分区和模型选择[28]. 利用RAxML和MrBayes分别构建ML树(Maximum Likelihood)和BI树(Bayesian Inference)[29,30]. 最后,使用Figtree 1.4对系统发育树进行美化[31].
隆X小车蝗线粒体基因组为全长15 746 bp的闭合环状双链DNA结构(GenBank登录号:MK352098). 该线粒体全基因组共由37个典型的基因组成,包含13个蛋白编码基因(PCGs),22个转运RNA(tRNAs),2个核糖体RNA(rRNA)以及1个主要的非编码AT富集区(AT-rich region). 其中23个基因由J链(Majority strand,J-strand)编码,包括9个PCGs和14个tRNAs;其余14个基因由N链(Minority strand,N-strand)编码,包括4个PCGs、8个tRNAs和2个rRNAs(见图1,表1). 与假定的祖先昆虫亚库巴果蝇Drosophilayakuba线粒体基因组相比,2个tRNAs的位置在进化过程中发生颠倒,即基因排列顺序发生变化,由tRNALys—tRNAAsp重排为tRNAAsp—tRNALys.
图1 隆X小车蝗线粒体基因组结构
表1 隆X小车蝗线粒体基因组的注释和基因结构
隆X小车蝗线粒体全基因组及其不同类型基因和AT富集区的核苷酸组分由MEGA分析统计. 结果显示,该线粒体全基因组的碱基组分为:A=45.09%,T=30.31%,G=10.03%,C=14.58%;A+T总含量为75.40%. PCGs,tRNAs,rRNAs和AT富集区的A+T含量分别为:74.27%,74.10%,77.11%,86.31%. 除此之外,隆X小车蝗线粒体基因组全序列、tRNAs和AT富集区呈现AT偏斜,全线粒体基因组,PCGs,tRNAs和AT富集区呈现CG偏斜.
隆X小车蝗线粒体基因组13个PCGs总长度为11 173 bp,约占全序列的70.96%,其中ATP8(156 bp)序列最短,ND5(1 714 bp)序列最长. ND1,ND4,ND4L和ND5等4个基因由N链编码,其余9个基因由J链编码(见表1). 13个基因均起始于典型的ATN密码子(ATA,ATG,ATC,ATT),其中7个基因以ATG作为起始密码子. 终止密码子方面,10个基因是以TAN(3个基因为TAG,8个基因为TAA)为终止密码子,而COI,COII和ND5终止于不完整的密码子T. 除终止密码子外,共编码3 714个氨基酸. 使用频数最多的密码子是AUU,共331次(RSCU=1.72)(图2). 隆X小车蝗线粒体基因组所有蛋白质的氨基酸组成中异亮氨酸Isoleucine(Ile),亮氨酸Leucine 2(Leu 2)和苯丙氨酸Phenylalanine(Phe)数量相对较多.
图2 隆X小车蝗线粒体基因组蛋白编码基因同义密码子相对使用度
隆X小车蝗线粒体基因组包含全部22个典型的tRNA基因,其中有2个氨基酸包含两组同功受体(Leucine和Serine). 所有tRNA长度在64~71 bp之间,序列最长的是tRNASer(UCN),tRNALys和tRNAVal,最短的是tRNAArg. 利用MITOS预测二级结构显示,21个tRNAs都能够形成典型的三叶草结构,具有完整的氨基酸接受臂、双氢尿嘧啶(DHU)臂和TΨC臂,而tRNASer(AGN)由于缺少一个稳固的双氢尿嘧啶(DHU)臂而无法形成三叶草结构(见图3). 除了正常的碱基配对外,在预测的tRNA二级结构中共发现24个碱基错配的情况,其中G—U错配比较常见,共出现19对.
图3 隆X小车蝗线粒体基因组tRNA基因的二级结构
隆X小车蝗线粒体基因组包含2个与其他蝗虫序列具有同源性的rRNAs,分别是大亚基12S和大亚基16S. 12S的长度为828 bp,位于tRNAVal和AT富集区之间,16S长度为1 317 bp,位于tRNALeu(CUN)和tRNAVal之间.
隆X小车蝗线粒体基因组共测得16个基因间隔区,长度为1~21 bp;且基因排列紧凑,共发现11个基因重叠区,长度为1~8 bp. 在基因ATP8与ATP6之间发现保守的重叠序列ATGATAA,在基因ND4与ND4L之间发现保守的重叠序列TTAACAT. 除此之外,隆X小车蝗线粒体基因组含有一段长的非编码区(891 bp),即为AT富集区或称控制区,位于tRNASer(UCN)和ND1之间,A+T含量为86.31%,表现出明显的AT碱基偏向性.
为明确隆X小车蝗在斑翅蝗亚科中的系统发育地位,我们选择25个物种(Genbank数据库已提交的22个斑翅蝗亚科物种+1个新测物种+2个槌角蝗亚科外群)分别构建最大似然树(ML)和贝叶斯树(BI). 系统发育树以PCG数据集(13 PCGs,11 082 bp)来构建. 结果表明BI树的节点支持率总是高于ML树、且两种分析方法所得到的拓扑结构完全一致(见图4). 系统发育分析均支持小车蝗属Oedaleus为单系群,即该属4个物种聚为一支. 同时,系统树显示小车蝗属物种与云斑车蝗Gastrimargusmarmoratus(车蝗属)为姐妹群,再与飞蝗属Locusta聚在一起,由于车蝗属目前仅仅只有1个物种具有线粒体基因组,此发育关系仍需要更多的取样物种来验证. 在小车蝗属内部,隆X小车蝗与亚洲小车蝗Oedaleusasiaticus互为姐妹群,黄胫小车蝗Oedaleusinfernalis和红胫小车蝗Oedaleusmanjius互为姐妹群. 具体的系统发育关系如下:((隆X小车蝗+亚洲小车蝗)+(黄胫小车蝗+红胫小车蝗)).
图4 基于13个蛋白编码基因序列构建的斑翅蝗亚科系统发育树
3讨 论
直翅目昆虫的线粒体基因组和其他昆虫一样为闭合双链DNA,包含典型的37个基因:13个蛋白编码基因,22个tRNA基因和2个rRNA基因. 目前已发表的直翅目昆虫完整线粒体基因组长度为14 957 bp(蜢总科,Pseudothericlescompressifrons,KM657335)到17 033 bp(中华华绿螽Sinochlorasinensis,MK903598). 本研究所测的隆X小车蝗的线粒体全基因组为15 746 bp,介于直翅目线粒体基因组长度范围之内,与已发表的斑翅蝗亚科昆虫线粒体全基因组大小十分接近. 与假定的祖先昆虫线粒体基因组相比,隆X小车蝗的2个tRNAs在进化过程中位置发生颠倒,由tRNALys—tRNAAsp重排为tRNAAsp—tRNALys. 目前,对造成基因重排现象的解释有很多种,如重组、复制随机删除模型、复制非随机丢失模型以及由tRNA基因错误起始引起的复制等. tRNAAsp—tRNALys重排在蝗下目昆虫中非常保守,可以用复制随机删除模型解释. 早期研究认为该重排模式可能是蝗下目Acrididea重要的进化特征,可为后续开展该类昆虫系统发育研究提供假定的靶标[32]. 系统发育分析结果均显示小车蝗属与车蝗属为姐妹群,而后与飞蝗属聚为一支. 该系统发育关系与利用单个基因构建的系统发育结果并一致[33],可能的原因是在我们的研究中车蝗属仅有一个代表物种. 小车蝗属4个种聚为一支且4个物种的进化关系为((隆X小车蝗+亚洲小车蝗)+(黄胫小车蝗+红胫小车蝗)). 即在小车蝗属中隆X小车蝗和亚洲小车蝗亲缘关系较近,该结果支持传统的形态分类和基于单个基因的系统发育分析[16]. 如需进一步明确小车蝗属、车蝗属和飞蝗属的系统发育关系,更多的物种取样和线粒体基因组序列需要补充.