长臂缨鲆核糖体RNA基因序列多态性特征分析

2019-01-16 07:17杨敏孔晓瑜时伟龚理
热带海洋学报 2019年1期
关键词:核糖体长臂鱼类

杨敏, 孔晓瑜, 时伟, 龚理, 3



长臂缨鲆核糖体RNA基因序列多态性特征分析

杨敏1, 2, 孔晓瑜1, 时伟1, 龚理1, 3

1. 中国科学院热带海洋生物资源与生态重点实验室, 中国科学院南海海洋研究所, 广东 广州 510301; 2. 中国科学院大学, 北京 100049 3. 浙江海洋大学, 海洋科学与技术学院, 国家海洋设施养殖工程技术研究中心, 浙江 舟山 316022

为了解鲽形目Pleuronectiformes鲆科Bothidae长臂缨鲆(Jordan & Starks, 1906) 核糖体RNA基因的序列多态性特征, 本研究共获得该鱼类包括18S、5.8S、ITS1和ITS2全长及28S部分序列的128条克隆序列。经序列比对、聚类分析以及重组检测, 结果显示5.8S (158bp) 无长度变异, 而其他4个基因片段则表现出较高的长度多态性, 并可分为不同序列类型: 18S (1856~1893 bp) 有4种序列类型A、B、C和R; 28S (967~974bp) 和ITS1 (407~ 505bp) 均有3种类型A、B和R; ITS2 (423~447 bp)存在2种类型A和B。此外5个基因片段在碱基组成中均表现出GC偏倚, 并且ITS2 (71.14%)>ITS1 (65.37%)>28S (62.22%)>5.8S (57.67%)>18S (54.95%)。对具有不同序列类型的18S、28S和ITS进行真、假基因推断时, 通常的判别特征不足以提供有力依据, 因此增加了与4种鲆科近缘鱼类长冠羊舌鲆、青缨鲆大鳞短额鲆以及冠毛鲆相应基因片段的比对。各基因片段的插入/缺失以及特异性碱基差异位点比对结果显示: 18S和28S的短序列类型A与4种鲆科鱼类序列一致, 而其他序列类型则不同; ITS1序列类型A与4种鲆科鱼类在类型B的缺失位点均无缺失, 因此推测18S、28S和ITS1的A类型为真基因, 而其他类型为假基因。ITS2的A和B类型在差异位点上与4个鲆科鱼类不存在一致性, 没有足够的依据对两个类型做出真、假基因的推断。长臂缨鲆核糖体RNA基因中, 5.8S序列最为保守遵循协同进化的方式, 而其他4个基因片段为非协同进化的方式。

核糖体RNA基因; 长臂缨鲆; 多态性; 假基因; 非协同进化; 重组

真核生物细胞核中核糖体RNA基因 (ribosomal DNA, rDNA) 为多拷贝的串联重复序列, 位于一条或者多条染色体上。每个转录单元包含核糖体RNA编码基因18S、5.8S和28S rDNA以及位于两个编码基因之间的内转录间隔区 (internal transcribed spacer, ITS1和ITS2) 组成(Hillis et al, 1991)。

核糖体RNA编码基因18S、5.8S和28S在种内具有高度的保守性, 常应用于高级阶元的系统进化关系重建(Hillis et al, 1991; Dabert et al, 2014)。Daber等(2014)应用18S、28S对缓步动物属的分类问题进行了研究, 在分别构建的4超科19属代表物种的18S、28S以及这两个基因联合的系统树中, 该属的代表种与Isohypsibioidea科的种类具有比其他3个超科更近的亲缘关系, 支持归属于Isohypsibioidea超科。ITS序列由于进化速率相对编码基因较快, 在种内趋于相似而种间存在较大差异, 因此, 核糖体ITS序列广泛地应用于物种鉴定、低阶元的分类关系以及地理格局分布等研究(Álvarez et al, 2003; Pérez et al, 2005; Yao et al, 2010; Kumar et al, 2013)。Kumar等(2013)研究了5种印度淡水鲃鱼(mahseer) 25个个体18S、ITS1以及ITS2序列, 并分别利用这几个基因及其联合数据集构建系统树, 得到的系统关系中均能够有效地将不同种类区分开。

学者们最初普遍认为核糖体RNA基因的进化遵循协同进化的方式 (concerted evolution), 即串联重复的多基因家族不同拷贝在同一物种内保持一致或者高度的相似性, 而在近缘物种基因组内该基因之间存在差异(Elder et al, 1995; Liao, 1999)。然而, 随着不同物种核糖体RNA基因数据的积累, 研究者在个体内以及种内发现了越来越多的碱基突变、插入/缺失等原因导致不同拷贝之间的多态性特征, 这种现象不仅出现在了具有较高变异程度的ITS区(Xiao et al, 2015; Gong et al, 2016a), 在保守的核糖体RNA编码基因18S、5.8S和28S也均有发现(Márquez et al, 2003; Krieger et al, 2006; Meyer et al, 2010), 如Krieger等(2006)在14种欧亚鲟鱼 (Eurasian acipenseriform species) 和6种北美鲟鱼 (North American paddlefish) 中发现18S广泛存在种内变异, 在789个位点上种内分别存在9~18个变异位点, 研究人员认为其协同进化速率是降低的。Zuriaga等(2015)在13个锥蝽属物种中发现长度差异显著、突变位点增多的不同类型的5.8S和ITS2序列共存于基因组内。当基因片段的同质化进程低于不同拷贝之间的变异速率时, 就会造成不同拷贝之间序列的异质性 (heterogeneity), 导致了非协同进化 (non-concerted evolution) 的进化方式(Keller et al, 2006; Xiao et al, 2010)。

在非协同进化中, 当序列变异的程度导致基因原有生物学功能缺失时会退化为假基因(Mighell et al, 2000)。根据前人对核糖体RNA基因的研究, 推断假基因的依据有以下几个方面: 具有更短的序列长度、更高的变异速率、更低的GC含量和最小自由能等特征(Bailey et al, 2003), 而在随后的一些研究中也证实了这些特征的适用性。在对桑给巴尔舌鳎ITS2序列的研究中, Gong等(2016b)发现了两种ITS2序列类型A和B中, 比较发现假基因类型B在长度 (319bp vs 497bp)、GC含量 (73.4%~74.6% vs 75.3%~76.1%)、核苷酸变异程度(π, 0.00920 vs 0.00553) 以及最小自由能 (-160.7kcal·mol-1vs-261.0kcal·mol-1) 等特征上均明显与真基因类型A存在差异, 符合假基因的特征依据。然而, 在假基因的推断中也有不完全符合判断标准的情况, 比如Gong等(2016a)在线纹舌鳎18S的3种序列类型中发现2058bp的类型A除去189bp的重复片段插入外, 其他特征均和1869bp的类型 B相似, 在长度 (1921bp)、GC含量 (54.6% vs 58.2%)、最小自由能 (-740.0kcal·mol-1vs-807.7kcal·mol-1) 等方面明显低于类型C, 因而推断类型A和B均为假基因, 类型C为真基因。

同时, 由于真、假基因共同存在于基因组内, 随着序列的复制以及诸如染色体间的不等交换 (unequal crossing over) 以及基因转换 (gene conversion) 等分子机制的作用, 会出现两者真、假基因片段的重组类型。如石鲽的ITS1序列(Xu et al, 2009)和桑给巴尔舌鳎ITS2序列(Gong et al, 2016b)中都发现了由长、短序列类型重组产生的重组子类型。重组的发生也进一步增加了核糖体RNA基因序列的多态性。

目前对于鲽形目鱼类的研究, 仅石鲽(Xu et al, 2009)、牙鲆(龚理等, 2015)以及舌鳎科Cynoglossidae的3种鱼类(Gong et al, 2016a, b, 2018b)和鳎科Soleidae的11种鱼类(Gong et al, 2018a)的报道, 而对于鲽形目的其他科属鱼类的报道甚少。我们在研究鲽形目其他科鱼类核糖体RNA基因序列时, 分析发现鲆科Bothidae缨鲆属的长臂缨鲆(Jordan & Starks, 1906) (Nelson, 2006)中, 除了5.8S序列具有高度的保守性之外, 18S、28S、ITS1以及ITS2序列均表现出明显的序列多态性特征, 甚至可以分为不同的序列类型, 这在鲆科鱼类的研究中甚至鲽形目及硬骨鱼类的核糖体的研究中都是比较少见的现象。因此, 本研究进一步对长臂缨鲆的核糖体RNA基因序列进行了详细的比较和分析, 以期为鲽形目鱼类核糖体RNA基因研究提供更多的分子数据, 并丰富鱼类核糖体RNA基因的多样性及进化方式等方面的研究。

1 材料与方法

1.1 实验材料

研究所用的鲆科缨鲆属长臂缨鲆样品 1尾采集于浙江温岭; 鲆科4种鱼类长冠羊舌鮃、青缨鲆、大鳞短额鲆、冠毛鲆各1尾, 分别采集于泰国普吉岛、广东珠海、广东深圳和澳大利亚新南威尔士。样品用冰盒带回实验室或于95%酒精保存, 鉴定后取肌肉组织约20~25mg于-20℃保存备用。

1.2 DNA提取、PCR扩增和测序

将保存的肌肉组织使用天根海洋动物基因组织提取试剂盒[TIANamp Marine Animals DNA kit, 天根生化科技(北京)有限公司]提取总DNA, 最后用双蒸水溶解, 保存于‒20℃冰箱中。参考Xu等(2009) 和龚理(2016) 研究中的序列设计扩增引物 (表1)。PCR反应总体积为25μL, 包括2.0mmol·L-1MgCl2, 0.4mmol·L-1dNTP, 每个引物0.5μmol·L-1, 1.0U rTaq酶[宝生物工程(大连)有限公司], 50ng模板DNA, 灭菌双蒸水补足至25μL。前期预实验中发现ITS区为高GC含量序列, 在反应体系中加入8%的二甲基亚砜 (DMSO) 变性剂, 将利于提高具有高GC含量的序列的扩增效率。反应在ABI Veriti 96孔梯度PCR仪 (USA) 中进行。PCR扩增程序为: 94℃预变性2min, 94℃变性1min, 50℃退火50s, 72℃延伸1 ~ 2.5min, 35个循环, 后72℃延伸10min。PCR产物用1%的琼脂糖凝胶电泳检测后, 采用凝胶回收试剂盒进行片段回收, 连接pMD19-T载体[宝生物工程(大连)有限公司], 转入大肠杆菌感受态细胞DH5α, 挑取并检测阳性克隆后, 由上海英潍捷基公司ABI 3730 DNA sequencer (Applied Biosystems, USA) 进行双向测序。

1.3 数据分析

对测定的序列利用局部对比基本检索工具(Basic Local Alignment Search Tool, BLAST) 网站(http://blast.ncbi.nlm.nih.gov) 进行检索, 18S、5.8S以及28S序列通过与鲽形目中近缘物种的相似性确定是否为目的片段; ITS1与ITS2序列则通过两端的18S、5.8S、28S序列的相似性进行判断; 提交美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)数据库获得Genbank号 (表1)。应用ClustalX2.0 (Larkin et al, 2007) 软件进行序列比对; 并用BioEdit (version 7.0.1) (Hall, 1999) 软件对序列进行人工调整; 使用MEGA 6.0 (Tamura et al, 2013) 软件统计序列保守位点、变异位点及碱基组成; 应用DNAsp 5.0 (Librado et al, 2009) 软件统计单倍型及单倍型多样性、核苷酸多样性及平均核苷酸差异数。应用RNAfold在线网站(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi) 预测序列最小自由能; 应用软件RDP4.85 (Martin et al, 2015) 和SimPlot 3.5(默认参数值)以及序列比对检测重组片段, 并辅以人工校对。应用MEGA 6.0软件采用邻接法 (neighbor-joining method, NJ), 应用双参数模型 (Kimura 2-parameter distance, K2P), 对长臂缨鲆核糖体RNA不同片段的克隆序列聚类分析, 置信值检测 (bootstrap test) 1000次重复。

表1 核糖体RNA基因片段PCR引物序列及Genbank序列号

注: ITSZ包括ITS1、5.8S和ITS2; *表示不是全长序列; “—”表述无此序列。

由于28S为部分片段, 其中变异位点以及核苷酸多态性、平均核苷酸差异数等对28S全长序列特征不具有代表性, 因此仅作为对28S序列研究的参考。

2. 结果与分析

2.1 长臂缨鲆核糖体基因多态性分析

本研究中共得到128条克隆序列分别是: 14条18S、33条ITS1、45条5.8S和24条ITS2全序列以及12条28S部分序列。对5个基因片段的长度比较发现, 除了5.8S (158bp)以外, 18S、ITS1、ITS2和28S均存在长度异质性: 差异最大在ITS1序列间, 为98bp (407~505bp), 18S相差37bp (1856 ~1893bp), ITS2为24bp (423~447bp) (表2), 28S相差7bp (967~974bp); 长度的差异原因有碱基位点插入/缺失、微卫星重复次数差异以及长片段的缺失 (图1)。

表2 长臂缨鲆核糖体RNA基因序列特征信息统计

注: “—”表示此处无数值。

图1 长臂缨鲆4个核糖体RNA基因不同序列类型与鲆科4种鱼类序列比对

a. 18S序列3种类型, *为类型A, 相较于类型B和类型C序列的特异性差异位点; b. 28S序列2种类型, *为类型A和类型B插缺位点; c. ITS1序列3种序列类型, 灰色底纹表示类型B缺失部分; d. ITS2序列2种序列类型, 下划线位点为微卫星位点。Type_A/B/C—类型A/B/C; A. mac—长冠羊舌鲆; C. azu—青缨鲆; E. gra—大鳞短额鲆; L. gal—冠毛鲆

Fig. 1 Comparison of different types of four ribosomal RNA gene fragments fromwith four species from family Bothidae. a) Three types of 18S rDNA; * showed the indel sites and differential sites among Types A, B and C; b) two types of 28S rDNA; * showed the indel sites in Type A and Type B; c) two types of ITS1 sequences; the grey shadow presents deleted fragments in Type B; d) two types of ITS2 sequences; the loci with underlines were microsatellites. A. mac presentedC. azu presentedE. gra presentedL. gal presented

续图1

为了明确各基因片段的序列多态性特征, 对18S、ITS1、ITS2以及28S序列进行了序列比对(图1)、NJ聚类分析(图2) 以及重组检测(图3), 结果显示各基因的序列可以分为不同的序列类型, 并且各基因内多态性特征各具特点 (表2、图1~3)。

比较18S序列发现, 克隆序列间存在36个位点的缺失和5个特异性差异位点(表2、图1a)。可以将18S区分为3种序列类型A、B和C; 经重组检测和人工校对发现, 类型A、B与类型C以及类型A与类型C在不同位置发生重组产生了4种重组类型R (图3a)。序列比对发现, 18S序列类型的长度大小为类型B (1892~1893bp)>类型C (1877~1878bp)>类型R (1861~1865bp)>类型A (1856~1858bp) (表2)。

28S序列比对显示在5个特异性位点分别存在1~3bp的插入/缺失 (图1b), 据此将28S区分为2种序列类型: 类型A (967~968bp) 和类型B (973~974bp); 重组分析发现有重组类型R (972bp) (图3b)。

ITS1序列具有明显的长度差异, 可以分为长序列类型A (500~505bp) 和短序列类型B (407~408bp), 其中类型B存在6处6~30bp的缺失以及11处1~4bp的插入/缺失位点 (表2、图1c); 重组分析显示, 类型A与类型B产生3种重组类型R (图3c)。

图2 长臂缨鲆18S rDNA(a)、28S rDNA(b)、ITS1(c)以及ITS2(d)序列NJ聚类分析

分支节点位置数字为置信值 (≥50%)

Fig. 2 The cluster trees constructed based on 18S rDNA (a), 28S rDNA (b), ITS1 (c), and ITS2 (d) sequences inby neighbor-joining method. Numbers on internal branches indicate support values (≥50%)

ITS2序列具有类型A (439~447bp) 和类型B (423~429bp) 两种长、短差异类型, 长度差异是由于在不同位点存在1~8bp的插缺, 以及微卫星 (CTC)6~8和 (CG)4~5导致的(表2、图1d); 重组分析显示无重组类型。

以上分析中, 18S和28S序列类型的区分依据序列中位点的插入缺失以及特异性位点的不同, 而ITS1和ITS2序列的不同类型则是由于序列间明显的长度差异进行区分的。由于核糖体RNA的编码基因和非编码的ITS区序列变异不同, 因此依据的分型特征也存在差异。

5个片段的碱基组成均表现出明显的GC偏倚, 均高于50%, 高低的顺序为ITS2(71.14%)>ITS1(65.37%)>28S(62.22%)>5.8S(57.67%)>18S(54.95%), 非编码ITS区的GC含量均高于核糖体RNA编码基因 (表2), 这与司李真等(2017)统计鲈形目鱼类以及硬骨鱼类中核糖体RNA基因GC含量的分布特点相吻合。

2.2 长臂缨鲆核糖体RNA真、假基因推断

长臂缨鲆的18S、ITS1、ITS2以及28S序列表现出序列多态性特征, 包括长度差异、碱基组成以及位点变异等。依据目前假基因的推断特征, 包括具有较短的序列长度、更多的变异位点、更低的GC含量和最小自由能等特点, 对以上4个基因序列的真、假基因进行推断, 同时也进一步与鲆科4种近缘鱼类的长冠羊舌鲆、青缨鲆、大鳞短额鲆和冠毛鲆的18S、ITS1、ITS2以及28S的真基因类型 (实验室数据) 进行了比对分析。

长臂缨鲆中18S具有4种序列类型, 除了类型B具有最高的GC含量和最小自由能, 其他3个类型之间则没有显著的差异 (表2), 在进一步与鲆科4种近缘鱼类18S序列的比对中显示, 类型A在36个插缺位点和5个特异性碱基差异位点上均与鲆科4种鱼类一致, 但类型B和类型C与鲆科4种鱼类不同 (图1a)。比对结果表明长臂缨鲆18S的类型A与鲆科4种鱼类之间具有高度的保守性, 因此, 推测短序列类型A为真基因, 而长序列类型B和类型C为假基因类型, 同时类型R的重组片段中含有来源于类型B和C的部分(图3a), 因此也推断为假基因类型。

图3 长臂缨鲆核糖体RNA基因不同类型序列间发生重组

a. 18S rDNA的4种重组类型; b. 28S rDNA重组类型; c. ITS1的3种重组类型。类型A用黑色标记; 类型B用点标记; 类型C用竖线标记

Fig. 3 The recombination patterns of ribosomal RNA genes ina) Four recombination types of 18S rDNA; b) one recombination type of 28S rDNA; c) three recombination types of ITS1. Type A was presented by black; Type B was presented by dark dot; Type C was presented by vertical lines

28S序列类型A、B和R在序列长度、GC含量、最小自由能等方面都没有显著的差异 (表2), 但与鲆科近缘鱼类的28S序列比较的结果显示, 类型A与鲆科4种鱼类在5个插入/缺失位点上保持一致, 而与类型B不同 (图1b), 表明类型A与鲆科其他鱼类间具有更高的序列相似性。根据这一比对结果推测28S的短序列类型A为真基因, 而类型B以及重组类型R为假基因类型。

ITS1序列的3种类型表现出明显的长度差异, 其中类型A比类型B长出98bp, 而最小自由能也远大于类型B (29.6~44.6kcal·mol-1) 和类型R (12.6 ~40.9kcal·mol-1); 其他序列特征在类型间都没有显著差异 (表2)。在与鲆科4种鱼类序列比对后发现, ITS1序列不同于编码基因的保守性而表现出较大种间差异 (图1c), 但从中依然可以发现类型B存在片段缺失的区域, 在4种鱼类中均无片段缺失。因此推测短序列类型B以及重组类型R为假基因, 类型A是真基因。

ITS2类型间长度差异在10~24bp之间, 由重复序列或微卫星重复数导致; 类型A的最小自由能与类型B存在重叠, GC含量略低于类型B, 其他序列特征也没有明显的差异 (表2)。在与4种鲆科鱼类的序列比对后显示, ITS2序列在种间也同样存在较大种间差异, 在类型A和B的差异位点上与4个鲆科鱼类均无一致性 (图1d), 因此, ITS2序列既不能依据序列多态特征也不能通过与近缘物种间的保守性来进行真、假基因的推断。

3 讨论

3.1 长臂缨鲆核糖体RNA基因进化方式

目前, 硬骨鱼类以及鲽形目鱼类的核糖体RNA基因序列的协同进化以及非协同进化均有报道, 既有个体内及种内序列间高度一致性的严格的协同进化(龚理等, 2017), 也存在差异显著的非协同的进化方式(Gong et al, 2016a)。

本研究中, 长臂缨鲆5.8S序列仅存在由单碱基位点突变引起的序列差异, 虽然该基因在5个基因片段中克隆数目最多, 但在单倍型多样性、核苷酸多样性以及平均核苷酸差异数等方面都表现最为保守, 其不同拷贝之间以协同进化的方式存于长臂缨鲆基因组内。

在其他4个基因片段中, 不论是编码基因还是非编码的间隔区, 都存在由于位点、片段的插入/缺失以及微卫星拷贝数目差异导致的长度变异; 同时, 在4个片段序列中, 突变位点即包含单碱基位点突变, 也存在简约信息位点, 均具有较高的单倍型多样性和核苷酸多样性, 且可以划分为不同的序列分型。因此这4种基因与5.8S不同, 遵循非协同进化的方式。

3.2 长臂缨鲆核糖体RNA真、假基因推断

在应用目前的判别核糖体RNA真假基因的特征时, 发现在长臂缨鲆的5个基因片段中, 依据序列中的位点的插入/缺失特征可初步推断18S、28S和ITS1序列的假基因, 而其他的特征诸如GC含量、最小自由能以及核苷酸变异程度等特征不能直接作为推断真、假基因的依据。

在依据序列长度进行真、假基因判断时, 目前的标准是相对较短的序列是假基因, 但在本研究的实际应用中发现直接根据短序列的特征推断真、假基因是比较困难的, 虽然在这些序列间都存在序列的长、短差异, 甚至在18S和ITS1中分别存在37bp和98bp的差异, 但是其他相对应的序列多态特征并不能明确地支持短序列为假基因, 因此, 单纯地依靠序列的缺失就直接推断片段是假基因并不适用所有基因。

本研究发现不仅短序列有可能是假基因, 长序列也可以是假基因: ITS1的短序列类型为假基因, 而在18S和28S序列中的假基因则是长序列类型。这一结果与之前学者在线纹舌鳎(Gong et al, 2016a)和卡氏大鼻鳎(Gong et al, 2018a)中得到18S短序列类型是真基因、而长序列类型是假基因的结果相似。因此, 我们建议将现有判别真、假基因序列时依据的较短序列这一特征改为序列长度的变异特征, 明确较长序列有可能是假基因的现象, 而不能够简单地推断短序列就是假基因。

在其他推断特征如GC含量、最小自由能方面, 通常认为真基因类型会具有更高的GC含量和最小自由能, 如鲽形目中鲽科鱼类石鲽的18S (Xu et al, 2009)、舌鳎科鱼类黑颊无线鳎的ITS1-5.8S-ITS2 (Gong et al, 2018b) 以及桑给巴尔舌鳎的ITS2序列(Gong et al, 2016b), 都能够根据这些评判标准进行推断; 但在有些情况下我们可以发现, 并非完全符合这个评判的标准。首先, GC含量与序列中碱基的组成相关, 序列发生片段缺失、碱基突变时会对序列的碱基组成产生影响。缺失片段如果为高GC含量片段, 那么将可能导致假基因序列GC含量的下降, 反之序列发生片段插入(特别是高GC含量的序列插入)则会上升。最小自由能的差异, 一方面与序列的长度相关, 另一方面也与序列的碱基组成相关。较长的序列长度一般会具有较高的最小自由能; 但如果长度差异较小, 而碱基组成中具有较高GC含量, 也会导致短序列具有较高的最小自由能。

此外, 核苷酸多样性、平均核苷酸差异数以及单倍型多样性等方面在各个片段中的不同变化规律会受到克隆数目的影响。由于核糖体RNA基因为多拷贝的基因家族, 目前的方法是随机选择单克隆进行测序分析, 还不能完全准确地将所有可能的变异位点覆盖, 在将这些特征作为真、假推断依据时要考虑克隆数目这一影响因素。

3.3 重组及重组子

已有关于硬骨鱼类核糖体RNA基因的报道中, 关于不同序列类型的重组现象多集中于鲽形目鱼类中, 如石鲽ITS1序列(Xu et al, 2009)、褐牙鲆与夏鲆杂交F1代的ITS1序列(龚理等, 2015)、桑给巴尔舌鳎的ITS2序列(Gong et al, 2016b)。体内基因的重组可能发生于减数分裂时期同源染色体的四分体联会时期, 来自父本和母本的非姐妹染色单体发生交叉互换, 将不同类型的基因型整合到同一条染色体上(龚理等, 2015), 而已有研究认为核糖体RNA基因重组的产生除了基因组内的正常存在以外, 在PCR扩增中也存在假重组现象 (pseudomorphic recombination)。

PCR的假重组现象可能存在两种产生方式, 分别为PCR反应体系中的亲本错配和跳跃PCR (jumping PCR)。亲本错配即PCR反应体系中以不同类型的亲本序列错配后作为模板扩增产生重组序列, 而这些重组序列的特征是与其亲本序列完全一致(Xu et al, 2015); 当发生PCR跳跃时, Taq聚合酶提前终止延伸, 并在产物末端添加一个腺苷 (A), 而在下一轮PCR过程中, 这个添加过A末端的产物能够充当引物进行新一轮的扩增。如果模板中具有多种类型的核糖体RNA基因序列, 那么这个引物就有可能结合不同类型的模板, 这样不同类型的序列就有可能通过跳跃PCR发生重组, 并且在发生重组的位点具有重复A或T这一特征(Pӓabo et al, 1990; Gong, 2016b)。

在本研究中18S、28S和ITS1的重组子, 不同基因片段的重组位点数目不同, 依次为4、1和2处位点 (图3)。通过分析发生重组位点前后的序列特征及重组的片段相对应的来源序列, 可以发现, 这些位点前后均没有重复的A或T碱基; 除了28S重组序列与相对应的长、短序列类型一致外, 18S和ITS1序列在发生重组后序列均存在不同程度的变异, 而非完全一致序列, 因此可以推断本研究中的18S和ITS1重组子并非是由于PCR反应体系扩增中产生。但是由于28S重组序列与重组来源的序列一致, 虽然可以明确不是跳跃PCR产生的, 但没有特征可以排除PCR扩增过程中存在亲本错配产生的重组可能。

目前, 鲽形目中关于核糖体RNA基因的研究相对较少, 有研究报道的包括鲽科石鲽的18S-ITS1-5.8S序列(Xu et al, 2009)、舌鳎科鱼类线纹舌鳎的18S (Gong et al, 2016a)、黑颊无线鳎的ITS1-5.8S-ITS2序列(Gong et al, 2018b)以及鳎科11种鱼类18S-ITS1-5.8S序列(Gong et al, 2018a)。这些研究都只限于部分基因, 而本研究中同时对长臂缨鲆的核糖体RNA基因的5个基因片段进行了分析研究。

在以上物种的研究中存在协同进化, 如鳎科的带纹条鳎、日本条鳎、蛾眉条鳎、角鳎、东方箬鳎和黑点圆鳞鳎6种鱼类的18S-ITS1-5.8S序列中均只有单一类型, 而其他5种鱼类的不同基因片段中则由于真、假基因的存在而导致非协同进化(Gong et al, 2018a); 而本研究中的长臂缨鲆不同片段的进化方式各有不同, 5.8S为协同进化, 其他4个片段则为非协同进化。

在石鲽、线纹舌鳎、卵鳎、塞内加尔鳎以及卡式大鼻鳎的18S序列, 缨鳞条鳎的18S-ITS1-5.8S序列, 豹鳎的 ITS1-5.8S序列, 以及桑给巴尔舌鳎ITS2序列中, 假基因均具有较长片段的缺失或者插入, 可通过已有的假基因的推断特征进行判别(Xu et al, 2009; Gong et al, 2016b, 2018a); 而长臂缨鲆不同序列类型间的差异不同于已有研究, 不能依据已有的推断标准进行假基因的推断, 而是通过与近缘物种间的真基因序列保守性的比对进行判别。这一结果也为假基因的推断提供了又一特征依据。

在桑给巴尔舌鳎ITS2的重组序列中(Gong et al, 2016b), 发生重组的模板序列间具有较大序列差异特征; 在长臂缨鲆的序列重组中, 仅ITS1序列发生重组的模板序列与桑给巴尔舌鳎的特征相似, 不同序列类型间差异显著, 而18S和28S中的重组序列需要依据位点的插入/缺失特征以及特异性碱基差异位点进行区分, 并无大片段缺失等显著差异。

比较鲽形目中已研究鱼类与长臂缨鲆的核糖体RNA基因, 发现了长臂缨鲆中不同于其他鱼类的序列特征, 也进一步反映出核糖体RNA基因在不同鱼类中具有丰富的多态性的特征。

龚理, 徐晖, 李军, 等, 2015. 褐牙鲆(♀)、夏鲆(♂)及其杂交子一代的ITS1序列特征分析[J]. 中国水产科学, 22(1): 17–23. GONG LI, XU HUI, LI JUN, et al, 2015. Characterization of the first internal transcribed spacer of ribosomal DNA in(♀) and.(♂) hybrids[J]. Journal of Fishery Sciences of China, 22(1): 17–23 (in Chinese with English abstract).

龚理, 2016. 鳎亚目(Soleoidei)鱼类核糖体RNA基因序列特征分析及其在系统研究中的适用性[D]. 北京: 中国科学院大学. GONG LI, 2016. Sequence analyses of the ribosomal RNA gene in Soleoidei and its application in phylogenetic inference[D]. Beijing: University of Chinese Academy of Sciences (in Chinese with English abstract).

龚理, 时伟, 杨敏, 等, 2017. 5种鳎科鱼类核糖体ITS1序列比较[J]. 水产学报, 41(3): 321–329. GONG LI, SHI WEI, YANG MIN, et al, 2017. Comparative analysis of the first internal transcribed spacer of ribosomal DNA in five Soleidae species[J]. Journal of Fisheries of China, 41(3): 321–329 (in Chinese with English abstract).

司李真, 武宝生, 孔晓瑜, 等, 2017. 11种鲈形目鱼类的核糖体基因GC含量及其与硬骨鱼类的特征比较[J]. 中国水产科学, 24(4): 657–668. SI LIZHEN, WU BAOSHENG, KONG XIAOYU, et al, 2017. Analysis of the GC content of ribosomal genes of 11 species of Perci-formes and comparison with other teleostean fishes[J]. Journal of Fishery Sciences of China, 24(4): 657–668 (in Chinese with English abstract).

ÁLVAREZ I, WENDEL J F, 2003. Ribosomal ITS sequences and plant phylogenetic inference[J]. Molecular Phylogenetics and Evolution, 29(3): 417–434.

BAILEY C D, CARR T G, HARRIS S A, et al, 2003. Characterization of angiosperm nrDNA polymorphism, paralogy, and pseudogenes[J]. Molecular Phylogenetics and Evolution, 29(3): 435–455.

DABERT M, DASTYCH H, HOHBERG K, et al, 2014. Phylogenetic position of the enigmatic clawless eutardigrade genusDastych, 1983 (Tardigrada), based on 18S and 28S rRNA sequence data from its type species[J]. Molecular Phylogenetics and Evolution, 70: 70–75.

ELDER JR J F, TURNER B J, 1995. Concerted evolution of repetitive DNA sequences in eukaryotes[J]. Quarterly Review of Biology, 70(3): 297–320.

GONG LI, SHI WEI, YANG MIN, et al, 2016a. Long duplication of 18S ribosomal DNA in(Pleuronectiformes: Cynoglossidae): novel molecular evidence for unequal crossing over model[J]. Acta Oceanologica Sinica, 35(12): 38–50.

GONG LI, SHI WEI, YANG MIN, et al, 2016b. Non-concerted evolution in ribosomal ITS2 sequence in(Pleuronectiformes: Cynoglossidae)[J]. Biochemical Systematics and Ecology, 66: 181–187.

GONG LI, SHI WEI, YANG MIN, et al, 2018a. Characterization of 18S-ITS1–5.8S rDNA in eleven species in Soleidae: implications for phylogenetic analysis[J]. Hydrobiologia, 819(1): 161–175.

GONG LI, SHI WEI, YANG MIN, et al, 2018b. Marked intra-genomic variation and pseudogenes in the ITS1–5.8S-ITS2 rDNA of(Pleuronectiformes: Cynoglossidae)[J]. Animal Biology, 68(4): 353–365.

HALL T A, 1999. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT[J]. Nucleic Acids Symposium Series, 41: 95–98.

HILLIS D M, DIXON M T, 1991. Ribosomal DNA: molecular evolution and phylogenetic inference[J]. Quarterly Review of Biology, 66(4): 411–453.

KELLER I, CHINTAUAN-MARQUIER I C, VELTSOS P, et al, 2006. Ribosomal DNA in the grasshopper: Escape from concerted evolution[J]. Genetics, 174(2): 863–874.

KRIEGER J, HETT A K, FUERST P A, et al, 2006. Unusual intraindividual variation of the nuclear 18S rRNA gene is widespread within the acipenseridae[J]. Journal of Heredity, 97(3): 218–225.

KUMAR R, SINGH M, KUSHWAHA B, et al, 2013. Molecular characterization of major and minor rDNA repeats and genetic variability assessment in different species of mahseer found in North India[J]. Gene, 527(1): 248–258.

LARKIN M A, BLACKSHIELDS G, BROWN N P, et al, 2007. Clustal W and clustal X version 2.0[J]. Bioinformatics, 23(21): 2947–2948.

LIAO D, 1999. Concerted evolution: Molecular mechanism and biological implications[J]. American Journal of Human Genetics, 64(1): 24–30.

LIBRADO P, ROZAS J, 2009. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data[J]. Bioinformatics, 25(11): 1451–1452.

MÁRQUEZ L M, MILLER D J, MACKENZIE J B, et al, 2003. Pseudogenes contribute to the extreme diversity of nuclear ribosomal DNA in the hard coral[J]. Molecular Biology and Evolution, 20(7): 1077–1086.

MARTIN D P, MURRELL B, GOLDEN M, et al, 2015. RDP4: Detection and analysis of recombination patterns in virus genomes[J]. Virus Evolution, 1(1): vev003.

MEYER A, TODT C, MIKKELSEN N T, et al, 2010. Fast evolving 18S rRNA sequences from Solenogastres (Mollusca) resist standard PCR amplification and give new insights into mollusk substitution rate heterogeneity[J]. BMC Evolutionary Biology, 10: 70.

MIGHELL A J, SMITH N R, ROBINSON P A, et al, 2000. Vertebrate pseudogenes[J]. FEBS Letters, 468(2–3): 109–114.

NELSON J S, 2006. Fishes of the world[M]. 4th ed. New York: John Wiley and Sons Inc.

PÄÄBO S, IRWIN D M, WILSON A C, 1990. DNA damage promotes jumping between templates during enzymatic amplification[J]. Journal of Biological Chemistry, 265(8): 4718–4721.

PÉREZ M, VIEITES J M, PRESA P, 2005. ITS1-rDNA-based methodology to identify world-wide hake species of the Genus[J]. Journal of Agricultural and Food Chemistry, 53(13): 5239–5247.

TAMURA K, STECHER G, PETERSON D, et al, 2013. MEGA6: molecular evolutionary genetics analysis version 6.0[J]. Molecular Biology and Evolution, 30(12): 2725–2729.

XIAO LONGQIAN, MÖLLER M, ZHU HUA, 2010. High nrDNA ITS polymorphism in the ancient extant seed plant: Incomplete concerted evolution and the origin of pseudogenes[J]. Molecular Phylogenetics and Evolution, 55(1): 168–177.

XIAO LONGQIAN, MÖLLER M, 2015. Nuclear ribosomal ITS functional paralogs resolve the phylogenetic relationships of a late-miocene radiation cycad(Cycadaceae)[J]. PLoS One, 10(1): e0117971.

XU JIANPENG, ZHANG QUANQI, XU XIAOFEI, et al, 2009. Intragenomic variability and pseudogenes of ribosomal DNA in Stone flounder[J]. Molecular Phylogenetics and Evolution, 52(1): 157–166.

XU JING, XU YING, YONEZAWA T, et al, 2015. Polymorphism and evolution of ribosomal DNA in tea (, Theaceae)[J]. Molecular Phylogenetics and Evolution, 89: 63–72.

YAO HUI, SONG JINGYUAN, LIU CHANG, et al, 2010. Use of ITS2 region as the universal DNA barcode for plants and animals[J]. PLoS One, 5(10): e13102.

ZURIAGA M A, MAS-COMA S, BARGUES M D, 2015. A nuclear ribosomal DNA pseudogene in triatomines opens a new research field of fundamental and applied implications in Chagas disease[J]. Memórias Do InstitutoOswaldoCruz, 110(3): 353–362.

Analysis of polymorphism characteristics of ribosomal RNA genes in(Pleuronectiformes: Bothidae)

YANG Min1, 2, KONG Xiaoyu1, SHI Wei1, GONG Li1

1. Key Laboratory of Tropical Marine Bio-resources and Ecology, South China Sea Institute of Oceanology, Chinese Academy of Sciences, Guangzhou 510301, China; 2. University of Chinese Academy of Sciences, Beijing 100049, China 3. National Engineering Research Center for Facilitated Marine Aquaculture, Marine Science and Technology College, Zhejiang Ocean University, Zhoushan, 316022, China

To better understand the polymorphism characteristics of ribosomal RNA genes of(Jordan & Starks, 1906) fromBothidae, Pleuronectiformes, a total of 128 clone sequences were obtained, including full-length sequences of 18S, ITS1, 5.8S, and ITS2 and partial fragments of 28S. After sequence alignments, clustering analyses and recombination detection, the results showed that only 5.8S (158 bp) had no length variation, while the other four gene fragments showed high length polymorphism and resulted in several distinct types: 18S (1856-1893 bp) with four types of Types A, B, C, and R; 28S (967-974) and ITS1 (407-505 bp) both had three types of Types A, B and R; ITS2 (423-447 bp) had two types of Types A and B. All five gene fragments showed GC-bias, and ITS2 (71.14%) > ITS1 (65.37%) > 28S (62.22%) > 5.8S (57.67%) > 18S (54.95%). The current characteristics criteria were not sufficient to provide strong evidence for the inference of functional gene or pseudogene of 18S, 28S and ITS sequences. Therefore, comparison with each of corresponding gene fragment of four affinis species from family Bothidae was conducted,,and. The alignment showed that the indels and differential sites of Type A sequences of both 18S and 28S were the similar as those of the four species; and Type A of ITS1, as well as the four species, had no fragment deletion at the missing loci of Type B. Therefore, Type A sequences of 18S, 28S and ITS1 were speculated as functional genes, while the other types were putative pseudogenes. As for ITS2, the divergence loci of Type A and Type B compared to each of the four species had no consistency, and there was no evidence to infer the status of ITS2. In this study, 5.8S rDNA is the most conserved gene, suggesting a concerted evolution, while non-concerted evolution was confirmed in other four genes because of high intra-individual polymorphism.

ribosomal RNA gene;; polymorphism; pseudogene; non-concerted evolution; recombination

2018-04-09;

2018-06-07. Editor: SUN Shujie

National Natural Science Foundation of China (31272273)

P735

A

1009-5470(2019)01-0055-12

10.11978/2018038

2018-04-09;

2018-06-07。孙淑杰编辑

国家自然科学基金项目(31272273)

杨敏 (1989—), 女, 山东省日照市人, 博士研究生, 从事鱼类分类及系统进化研究。E–mail: minyang@scsio.ac.cn

孔晓瑜, 研究员。E-mail: xykong@scsio.ac.cn

KONG Xiaoyu. E-mail: xykong@scsio.ac.cn

猜你喜欢
核糖体长臂鱼类
核糖体成熟因子RimP、Era和RimJ的研究进展
核糖体相关质量控制与核糖体自噬研究进展*
降低核糖体蛋白质翻译功能对延缓衰老具有重要作用
鱼类运动会
瑞幸事件,启动“长臂管辖”有多难?
“长臂监管”理念在境外投资领域的实践
美长臂管辖的起源、扩张及应对
奇妙的古代动物 泥盆纪的鱼类
长臂