绿翅短脚鹎线粒体基因组测序分析

2018-12-06 10:59:04陈映竹宋旭颢周闯张文博陈本平吴少彬岳碧松
四川动物 2018年6期
关键词:控制区密码子碱基

陈映竹, 宋旭颢, 周闯, 张文博, 陈本平, 吴少彬, 岳碧松*

(1. 四川大学生命科学学院,生物资源与生态环境教育部重点实验室,成都610065; 2. 四川老君山国家级自然保护区,四川屏山645350; 3. 长江师范学院生命科学与技术学院,重庆408100)

绿翅短脚鹎Ixosmcclellandii隶属于雀形目Passeriformes鹎科Pycnonotidae短脚鹎属Ixos,主要分布于印度、中国、缅甸、越南、老挝、泰国和马来半岛等地,常栖息在海拔1 000~3 000 m的阔叶林、针阔叶混交林及次生林等,尤以林缘疏林和沟谷地带较常见,主要以植物果实、种子和昆虫为食(Moyle & Marks,2006;邓青珊等,2008;丁虎林等,2013;郑光美,2017)。尽管该物种较为常见且分布较广,但与其相关的研究资料却十分缺乏。

线粒体是生物体内重要的细胞器,参与能量转换、细胞凋亡等重要生理过程(Cleland & Youle,2011;Bessetal.,2012;Minetal.,2013)。线粒体基因组以其结构简单、进化速率快、分子量小、拷贝数高、不含内含子、遗传过程中不发生重组或倒位,以及严格遵守母系遗传等特点,成为分子系统学和物种进化研究中的常用分子标记,在生物的起源演化以及种群遗传学研究中被广泛使用(Parmakelisetal.,2015;Lietal.,2017;Zhengetal.,2018)。在雀形目鸟类线粒体基因组中,控制区(control region, CR)的数量有2种情况,大多数鸟类线粒体基因组只有1个非编码控制区,如绿背山雀Parusmonticolus(白洁,2012)、苍头燕雀Fringillacoelebs(Marshalletal.,2013)、鸦科Corvidae和椋鸟科Sturnidae(钱朝菊,2013)等。部分物种的线粒体基因组具有2个控制区,根据相似性又分为:1)控制区高度相似,如阔嘴鸟科Eurylaimidae(Mindelletal.,1998)、家燕Hirundorustica(陈娟,2015)、长尾山雀属Aegithalos(Wangetal.,2015)和鹎科(Wen & Liao,2016)等;2)控制区高度异质,如百灵科Alaudidae的云雀Alaudaarvensis(Elodieetal.,2011)等。本研究对绿翅短脚鹎线粒体基因组进行测序分析,为该物种的相关研究提供基础数据。

1 材料和方法

1.1 样品采集和DNA提取

绿翅短脚鹎肌肉样品采自四川老君山国家级自然保护区,利用试剂盒TIANamp Genomic DNA Kit(北京天根生化科技有限公司)提取线粒体基因组DNA。

1.2 引物设计及PCR扩增

线粒体基因组PCR扩增引物用Premier 5.0设计。PCR反应程序为:95 ℃预变性5 min;94 ℃变性40 s,50~60 ℃退火30 s,72 ℃延伸1 min,35个循环;72 ℃延伸10 min;4 ℃保存。PCR产物经电泳检测后,选择条带明亮、清晰单一且长度一致的送成都擎科科技有限公司测序。测序结果峰图文件首先在NCBI的GenBank数据库中进行局部序列相似性搜索(BLAST),以确定得到的测序结果为目的片段。得到的正确DNA序列数据用DNASTAR中的Editseq进行编辑处理。将拼接好的序列以Fasta格式输出,利用SeqBuilder工具完成基因注释。

2 结果

2.1 线粒体基因组结构

绿翅短脚鹎线粒体基因组序列全长17 838 bp(GenBank登录号:KX640824),为一双链闭合环状DNA分子,包含37个编码基因(22个tRNA基因、13个蛋白质基因、2个rRNA基因)以及2个高度相似的控制区(CR1和CR2)(表1)。其中,除了8个tRNA基因和ND6基因在轻链上编码外,其余都在重链上编码。该线粒体基因组A、T、G、C的含量分别是27.81%、28.45%、25.36%和18.38%。

2.2 蛋白质基因

在绿翅短脚鹎线粒体基因组中,部分基因间存在重叠或间隔现象,重叠长度一般为1~10 bp,间隔1~16 bp。其中,有2个重叠的开放阅读框:ATP6和ATP8重叠了10 bp,ND4L和ND4重叠了7 bp。另外,还有一些重叠发生在蛋白质基因和相邻tRNA基因之间。除COX Ⅰ、ND3基因的起始密码子分别为GTG、ATA外,其余蛋白质基因的起始密码子均为ATG,而终止密码子则有6种,即TAA、TAG、AGG、ATA、TA和T(表1)。13个蛋白质基因中,密码子的组成及使用具有一定偏倚,使用频率最高的密码子为CUA(217次)和ACC(205次),而GGU和GCG的使用频率最低,均为24次(表2)。

2.3 tRNA和rRNA基因

绿翅短脚鹎线粒体基因组中,12S rRNA和16S rRNA位于tRNA-Phe基因与tRNA-Leu (UUR)基因之间,被tRNA-Val基因分隔开(表1)。tRNA基因分布在rRNA基因和蛋白质基因之间,序列长度为64~75 bp。通过tRNAscan-SE 1.21(Lowe & Chan,2016)预测22个tRNA基因,结果显示,除tRNA-Ser (AGY)基因在DHU臂上形成1个简单的环,其他21个tRNA基因的二级结构均为典型的三叶草形。

2.4 非编码控制区

绿翅短脚鹎线粒体基因组的2个控制区(CR1和CR2)位于tRNA-Thr和tRNA-Phe基因之间,被tRNA-Pro、ND6和tRNA-Glu基因分隔开,长度分别为1 116 bp和1 144 bp。CR1与CR2相似度达91.6%,序列相同部分约1 000 bp,仅在两端序列之间有所不同。2个控制区均可分为3个结构域,即Domain Ⅰ、Domain Ⅱ及Domain Ⅲ(图1)。Domain Ⅰ包含ETAS1元件和1个茎环结构,2个控制区中均未发现ETAS2元件。Domain Ⅱ中分布着6个保守序列元件,即F-box、E-box、D-box、C-box、Bird-box和B-box。Domain Ⅲ中只有1个保守元件CSB1,且上游存在1个插入片段。

3 讨论

3.1 线粒体基因组分析

本研究中测定的绿翅短脚鹎线粒体基因组与已公布的部分雀形目鸟类(Chenetal.,2015)具有类似组成及结构,即基因组为双链闭合环状的DNA分子,包含37个编码基因和2个高度相似的控制区。线粒体基因组中,13个蛋白质基因中相邻的2个基因之间、一些蛋白质基因和相邻tRNA基因之间均存在碱基的重叠,这一特征说明了线粒体基因组的紧凑和精简性(Curole & Kocher,1999;Kumaretal.,2015)。密码子第三位上的碱基变异在蛋白质基因中可以同义替换,即不会改变阅读框所编码的氨基酸(Choudhuryetal.,2017)。本研究结果显示,同一个氨基酸同时有几个密码子,如编码亮氨酸的密码子有TTA、TTG、CTT、CTC、CTA和CTG等,均符合密码子简并性特点。第三位上的碱基变异在进化上的选择压力较小,碱基的偏倚性最能体现序列进化的变异特征。碱基含量中,A+T(56.26%)高于G+C(43.74%)。这一现象和多数脊椎动物线粒体基因组一致(Zhuangetal.,2013;孙利元等,2017;Zhangetal.,2018)。

3.2 控制区分析

控制区是线粒体中变异最大的区域,线粒体长度的变异也主要集中在控制区,大多数表现为碱基的缺失、插入和串联重复序列的不同等,而控制区的主要功能是调控线粒体基因组的复制和转录(Mjelleetal.,2008;陈四海等,2011;Mikamietal.,2013;Tzur & Rosset,2015)。控制区作为线粒体最主要的非编码区域,其碱基偏倚是反映线粒体基因组在进化历程中变异积累的重要特征。它是整个线粒体基因组序列变异最大、碱基替换速率快、进化最快的一个区域,其序列差异可能是造成鸟类不同物种线粒体基因组序列差异的重要原因。控制区序列已经成为鸟类系统发育关系研究的一个重要分子标记(Keithetal.,2012;Schirtzingeretal.,2012;Songetal.,2014;章明等,2016)。

比较雀形目鸟类已有的线粒体基因组发现,控制区存在3种类型:1)常见于多数物种的单控制区;2)2个高度相似的控制区;3)2个异质性很高的控制区。以本课题组测得的绿翅短脚鹎、金眶鹟莺Seicercusburkii及棕腹大仙鹟Niltavadavidi线粒体基因组为代表加以阐述。

绿翅短脚鹎线粒体基因组的2个控制区可分为3个结构域(Domain Ⅰ、Domain Ⅱ、Domain Ⅲ),其相似度达91.6%,二者序列相同的部分约1 000 bp,仅在2个控制区开始部位约70 bp和存在于CR2末端约90 bp的序列有所不同,其余部分完全相似。2个控制区的存在可能是有利的或具有一定的功能性,因此,在某些情况下可以在进化过程中保留而不完全退化(Eberhardetal.,2001)。值得注意的是,本研究并未在2个控制区的Domain Ⅲ中发现对线粒体基因组复制和转录起始有重要作用的LSP/HSP元件,但在画眉Garrulaxcanorus中则存在该结构(Chenetal.,2015)。

表1 绿翅短脚鹎线粒体基因组特征Table 1 Characteristics of the mitochondrial genome of Ixos mcclellandii

注: L表示该基因位于轻链; 间隔区中的负数表示邻近基因之间重合的碱基数

Note: “L” indicates that the gene is located in the light chain; negative numbers in the “intergenic nucleotide” indicate the number of overlapping bases between adjacent genes

表2 绿翅短脚鹎13个蛋白编码基因的密码子使用情况Table 2 Codon usage in the 13 protein-coding genes of Ixos mcclellandii mitogenome

图1 绿翅短脚鹎线粒体控制区的结构Fig. 1 The structure of 2 control regions (CR) in Ixos mcclellandii mtDNA

与绿翅短脚鹎相比,金眶鹟莺的线粒体基因组含有2个异质性很高的控制区,长度分别为1 127 bp和269 bp(未发表数据)。尽管2个控制区也位于tRNA-Thr和tRNA-Phe基因之间,且同样被tRNA-Pro、ND6和tRNA-Glu基因分隔,但控制区之间的相似度仅为16.6%。在CR1中,Domain Ⅰ分布着C-stretch、ETAS1-2及CSB1-like元件;Domain Ⅱ为中央保守区,主要分布有F-box、E-box、D-box、C-box、Bird-box和B-box元件;Domain Ⅲ主要分布有CSB1和LSP/HSP 2个保守元件。与绿翅短脚鹎线粒体基因组不同的是,在金眶鹟莺的CR2中未能找到这些保守元件。灰头鸦雀Paradoxornisgularis和云雀等物种线粒体具有与金眶鹟莺类似的控制区结构(Qianetal.,2013)。

棕腹大仙鹟线粒体基因组中只有1个控制区,位于tRNA-Thr和tRNA-Phe基因之间,长度为1 193 bp(未发表数据)。在Domain Ⅰ中,分布着CSB1-like、ETAS1-2元件;Domain Ⅱ中分布有F-box、E-box、D-box、C-box、Bird-box和B-box元件;Domain Ⅲ中,分布着1个CSB1保守元件,下游有1段poly-T序列,这种控制区结构与大多数鸟类线粒体基因组的控制区相同,如长尾山椒鸟Pericrocotusethologue、灰背伯劳Laniustephronotus、树麻雀Passermontanus和黑枕黄鹂Orioluschinensis等(林立亮,2011;高瑞瑞,2013;钱朝菊,2013)。

猜你喜欢
控制区密码子碱基
基于OMI的船舶排放控制区SO2减排效益分析
海洋通报(2020年5期)2021-01-14 09:27:06
应用思维进阶构建模型 例谈培养学生创造性思维
密码子与反密码子的本质与拓展
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
科学24小时(2019年5期)2019-06-11 08:39:38
生命“字母表”迎来4名新成员
发明与创新(2019年9期)2019-03-26 02:22:48
10种藏药材ccmFN基因片段密码子偏好性分析
中成药(2018年7期)2018-08-04 06:04:10
管好高速建筑控制区
中国公路(2017年18期)2018-01-23 03:00:42
阿什河流域非点源污染优先控制区识别
山东日照划定大气污染物排放控制区
汽车纵横(2017年3期)2017-03-18 23:19:33