深海化能极端环境中劳盆拟刺铠虾(Munidopsis lauensis)的全长转录组测序分析*

2023-10-17 07:12沙忠利
海洋与湖沼 2023年5期
关键词:谷胱甘肽深海测序

闫 晗 惠 敏 沙忠利① 程 娇①

(1.中国科学院海洋研究所海洋生物分类与系统演化实验室 青岛市海洋生物多样性与保护重点实验室 山东青岛 266071;2.崂山实验室 山东青岛 266237; 3.中国科学院大学 北京 100049)

自1977 年美国深海潜水器阿尔文号在加拉帕戈斯裂谷附近发现深海热液活动和高密度的热液生物群落以来, 深海化能合成生态系统开始展现于世人面前(Corlisset al, 1979)。随后, 1983 年美国研究人员在广阔的墨西哥湾3 200 m 深处首次发现了海底冷泉系统(Andersonet al, 1983)。与依赖太阳光能的光合生态系统不同, 以热液和冷泉为代表的深海化能合成生态系统主要依靠化能自养微生物利用硫化氢(H2S)、元素硫(S)、甲烷(CH4)和氢气(H2)等还原性物质氧化产生的能量进行固碳、合成有机物, 从而维持生态系统的运转, 这种“黑暗食物链”的发现改变了人们对深海初级生产力主要来源的认知(Dubilieret al, 2008)。此外, 深海化能生态系统是认识特殊生命过程和研究生物适应性进化的天然实验场所。深海化能环境具有黑暗、高压、低氧、寡营养且富含高浓度硫化物、甲烷和重金属等特征, 大型生物却能在如此极端环境中生存并形成群落, 主要原因是它们经过长期的适应与历史进化过程, 形成了独特的生命特征和环境适应机制(程娇等, 2021)。因此, 对深海化能合成生态系统中生物的环境适应机制的研究, 不仅将有助于加深对深海极端环境中特殊生命过程的理解, 也将为深海生物资源的开发利用奠定理论基础。

近年来, 高通量测序技术的快速发展及大数据分析能力的提高, 使得在组学水平探究深海生物演化和环境适应机制成为可能。作为后基因时代应用最为广泛的技术手段, 转录组测序技术可以全面快速获得生物体在特定时空或生理条件下几乎所有转录本的序列信息和表达信息, 已经在深海生物适应性演化机制研究中逐步得到应用。例如, 在双壳纲贝类中, Zheng 等(2017)通过与浅海贻贝的比较转录组分析发现两种深海偏顶蛤(Bathymodiolus platifrons和B.manusensis)中与共生菌识别相关的免疫识别受体发生收缩, 物质转运、溶酶体活动以及细胞凋亡等相关基因受正选择或高表达, 可能有助于共生关系的建立和维持; 在多毛类环节动物中, Zhang 等(2017)对分布于热液区深海多鳞虫(Branchipolynoe pettiboneae和Lepidonotopodiumsp.)与浅海近缘物种进行了比较转录组分析, 发现热液多鳞虫可能通过不同类型的血红蛋白的快速进化或高表达等策略实现对深海低氧环境的适应; 在十足目甲壳动物中, Cheng 等(2019)对冲绳热液与南海冷泉共有优势物种柯氏潜铠虾(Shinkaia crosnieri)进行转录组测序和进化分析, 提出柯氏潜铠虾很可能是通过功能基因的适应性进化和改变基因的表达水平来适应热液与冷泉两种不同的深海化能环境。以上研究结果表明转录组学分析方法已成为探究深海极端环境中特殊生命过程的重要研究手段。然而, 由于二代测序读取长度短, 转录本易发生拼接错误, 无法准确获取完整转录本, 可变剪切和转录本多样性在很大程度上仍然是未知(Zhanget al, 2020), 这限制了深海生物环境适应机制及深海基因资源开发方面的深入研究。

十足目铠甲虾类是深海多样性最高的甲壳动物类群之一。在深海化能生态环境中, 铠甲虾是底栖生态群落中的常见种或优势种。劳盆拟刺铠虾(Munidopsis lauensis)隶属于十足目(Decapoda)、异尾下目(Anomura)、铠甲虾总科(Galatheoidea)、拟刺铠虾科(Munidopsidae)、拟刺铠虾属(Munidopsis), 是深海化能生境铠甲虾类代表性物种, 在西太平洋劳海盆(Lau Basin)、马努斯海盆(Manus Basin)、北斐济海盆(North Fiji Basin)、南海东北部以及印度洋等海域的热液、冷泉区均有分布, 分布水深在1 120~2 000 m之间(Baba, 2005; Martinet al, 2005; Cubelioet al,2007; Hwanget al, 2022)。目前对劳盆拟刺铠虾分子生物学方面的研究仅局限于线粒体基因组的测定(Sunet al, 2019), 以及微卫星分子标记的筛选(Boyleet al, 2013)。针对劳盆拟刺铠虾深海适应性的相关研究尚未开展, 且该物种基因序列信息相对匮乏, 限制了对其适应性分子机制的深入研究。本研究利用PacBio 平台的SMRT 测序技术开展了劳盆拟刺铠虾全长转录组测序, 对获得的转录本进行注释分析, 预测其编码序列、转录因子、长链非编码RNA 等, 挖掘可能与其适应深海化能极端环境相关的关键基因和通路。研究旨在丰富劳盆拟刺铠虾的基因资源, 为进一步探究深海化能生态系统中大型底栖甲壳动物的进化和环境适应分子机制提供数据支持。

1 材料与方法

1.1 样品采集

用于本研究全长转录组分析的劳盆拟刺铠虾样品于2021 年6 月由“科学号”(中国科学院海洋研究所)科考船上搭载的遥控潜水器Quasar MkII 从位于中 国 南 海 的 台 西 南 冷 泉(119°17.01′E, 22°06.91′N,~1 118 m)采集。样品收集到船上后, 通过形态学初步鉴定立即进行解剖。将肝胰腺、鳃、肌肉和肠组织分离并在液氮中速冻后保存在–80 °C 条件下, 以便用于后续RNA 提取。保留部分肌肉组织储存于浓度为70%的乙醇中, 以备于DNA 提取与COI 序列的扩增,从而进行分子鉴定。

1.2 RNA 提取

参照使用说明书, 使用Trizol 试剂盒(Invitrogen,Carlsbad, CA, USA)提取各组织的总 RNA。使用Nanodrop2000 微分光光度计(Thermo Fisher)测定总RNA 的纯度和浓度, 使用Agilent 2100 生物分析仪(Agilent Technologies, Palo Alto, CA, USA)检测总RNA 的完整度以评估RNA 的质量。不同组织检测合格后的总RNA 等量混合, 用于下一步全长转录组cDNA 文库的构建。

1.3 文库构建、测序与数据处理

首先用 Oligo(dT) 磁珠富集 mRNA, 再用NEBNext®Single Cell/Low Input cDNA Synthesis &Amplification Module 将mRNA 反转录成cDNA。然后进行PCR 周期优化, 用于确定下游大规模PCR 反应的最佳扩增周期数, 之后进行大规模PCR 富集合成cDNA。cDNA 经过DNA 损伤修复, 末端修复, 并与adapter 连接。将SMRTbell 模板与测序引物退火并与聚合酶结合形成完整的SMRTbell 文库之后, 在PacBio Sequel II 平台(美国太平洋生物科学公司)上进行测序。

使用SMRT Link-v8.0.0 (Gordonet al, 2015)处理下机的PacBio 序列数据。首先, 从subreads.bam 文件中提取高质量的环形一致性序列(circular consensus sequence, CCS)。通过去除序列中包含的5'端引物、3'端引物和多聚体结构, 获得全长非嵌合体(full length non-concatemer, FLNC)序列。然后使用Minimap2 (Li,2018)对同一转录本的FLNC 序列进行聚类, 获得到一致性序列。再使用Quiver 算法对序列进行校正, 获得高质量一致转录本。使用CD-HIT-v4.6.7 (Cluster Database at High Identity with Tolerance) (Fuet al,2012)对获得的一致性序列去冗余, 得到劳盆拟刺铠虾的全长转录本。最后, 基于BUSCO (Benchmarking Universal Single-Copy Orthologs)的节肢动物单拷贝直系同源基因标准集数据库, 使用 BUSCO-v3.0.2(Simãoet al, 2015)对劳盆拟刺铠虾的全长转录本集进行完整性评估。

1.4 转录本的功能注释

为了获得劳盆拟刺铠虾全长转录本的注释信息,将isoform 序列与NCBI 非冗余蛋白质(Nr)数据库(http://www.ncbi.nlm.nih.gov)、Swiss-Prot 蛋白质数据库(http://www.expasy.ch/ sprot) 、 KEGG 数 据 库(http://www.genome.jp/kegg)和 KOG 数据库(http://www.ncbi.nlm.nih.gov/COG)进行比对分析, 阈值设置为 1E-5。根据 Nr 数据库的注释信息, 使用Blast2GO (Conesaet al, 2005)软件对全长转录本进行GO (Gene Ontology)注释与功能分类。

1.5 转录本的结构分析

使用上述数据库blast 比对和ANGEL (Shimizuet al, 2006)软件预测两种方法获得全长转录本蛋白编码区(CDS)的核酸序列和氨基酸序列。通过hmmscan 将Isoform 的编码序列与动物TFdb 数据库(http://www.bioguo.org/AnimalTFDB/)进行比对, 预测转录因子(transcription factor, TF)家族。使用CNCI-v2 (Sunet al,2013)和CPC (Konget al, 2007)软件预测编码能力,并将两个软件判定为非编码序列的结果合集作为最终长链非编码RNA (LncRNA)的预测结果。利用Perl脚本 MISA (http://pgrc.ipk-gatersleben.de/misa/misa.html)对劳盆拟刺铠虾的全长转录组进行简单重复序列检测。

1.6 候选基因序列分析

使用Genedoc 软件(Nicholaset al, 1997)对劳盆拟刺铠虾全长转录组中注释到的谷胱甘肽 S-转移酶(glutathione S-transferase, GST)候选序列与其他节肢动物不同亚家族的GST 氨基酸序列进行多重序列比对。基于邻接法(neighbor-joining, NJ), 使用MEGA软件(Kumaret al, 2016)进行系统发育树的构建, 并设置1 000 次重复。使用Genedoc 软件对劳盆拟刺铠虾GST theta 亚家族的蛋白序列与包括柯氏潜铠虾、家蚕(Bombyx mori) 、 美州东部熊蜂(Bombus impatiens)、二化螟(Chilo suppressalis)在内的四种节肢动物的GST-theta 蛋白序列进行比对。利用SMART(http://smart.embl-heidelberg.de/)预测劳盆拟刺铠虾GST-theta 蛋白的结构域。

很高兴收到你的来信。真的,十六年我从来不知什么叫高兴。我以为高兴和我无缘了。没想到,突然收到你的信。你想我能不高兴吗?这是我十六年来第一次拥有一个最快乐的日子,比过节还开心快乐。

2 结果与分析

2.1 全长转录本测序数据

经COI 序列扩增、测序与NCBI 数据库进行同源比对后, 从形态和分子层面鉴定所采样品为劳盆拟刺铠虾。采用PacBio Sequel II 平台对劳盆拟刺铠虾肝胰腺、鳃、肌肉和肠组织的RNA 进行全长转录组测序, 共获得55 402 300 条原始序列, 平均长度为1 506 bp, N50 长度为1 587 bp。经零模波导孔(ZMW)循环过后, 通过环型一致性序列分析, 共得到1 210 829个CCS, 平均长度为1 793 bp, 循环数为43。对从CCS 得到的FLNC 序列进行聚类后获得36 573 条一致性序列, 经过校正后的高质量一致转录本为36 037条。去冗余后, 获得28 811 条高质量非冗余isoform,平均长度为2 086 bp, N50 长度为2 275 bp (表1)。BUSCO 结果显示劳盆拟刺铠虾全长转录组中包括节肢动物核心单拷贝同源基因数的60.51% (图1a), 表明本研究三代全长转录组测序获得的非冗余转录本相对完整, 可继续进行下游的数据处理。

图1 劳盆拟刺铠虾转录本的功能注释Fig.1 Functional annotation of M. lauensis full-length transcripts

表1 基于PacBio 测序的劳盆拟刺铠虾全长转录组测序结果Tab.1 Summary for the full-length transcriptome of M.lauensis using PacBio sequencing

2.2 功能注释

2.2.1 基本注释 为了获得劳盆拟刺铠虾更全面的遗传信息, 将获得的全长转录本在Nr、SwissProt、KOG 和 KEGG 数据库中进行了比对分析, 共有20 616 (71.6%)条isoform 得到注释。Nr 数据库搜索比对显示, 共注释到348 个物种, 其中凡纳滨对虾(13 363; 65.01%)、克氏原螯虾(Procambarus clarkii,881; 4.29%)和中华绒螯蟹(Eriocheir sinensis, 458;2.23%)是比对到同源序列数目前三的物种。

2.2.2 KOG 功能分类 共有17 957 条isoform 注释到25 个KOG 分类中。其中, 占比前三位的功能分类首先是一般功能预测(general function prediction only), 具有2 990 条(16.65%)注释信息, 其次是翻译后修饰、蛋白质周转、伴侣(posttranslational modification,protein turnover, chaperones)和信号转导机制(signal transduction mechanisms), 分别有2 095 (11.67%)和1 690 (9.4%)条基因注释信息(图1b)。

2.2.3 GO 功能注释 将测序获得的基因与GO 数据库进行匹配, 共有17 339 条isoform 被划分到三个大类。其中基因划分最多的类别是分子功能(molecular function, 6 669 个), 其次是生物过程(biological process, 5 955 个)和细胞成分(cellular component, 4 715 个)。分子功能类别中可以细分为18个亚类别, 其中占比最多的是结合活性(binding), 占比42.04%; 其次是催化活性(catalytic activity), 占比34.78%。生物过程类别中注释到26 个亚类别, 占比最多的是细胞过程(cellular process), 占比 12.40%;其次是代谢过程(metabolic process), 占比11.30%。注释到细胞成分类别中的基因被划分为23 个亚类别,其中比例最大的为细胞(cell)和细胞组分(cell part),占比分别为 16.98%和 16.95%; 其次为细胞器(organelle), 占比为14.14% (图1c)。

2.2.4 KEGG 功能注释 共有20 117 条isoform 被注释到144 条已知的KEGG 通路中, isoform 数量分布前20 条通路见表2。其中isoform 数量最多的通路是代谢途径(metabolic pathways), 包括3 210 条isoform,其次是溶酶体(lysosome)与RNA 转运(RNA transport),分别有551 条和439 条isoform。

表2 前20 个KEGG 代谢途径Tab.2 Top 20 KEGG pathways

2.3 编码序列预测与全长转录组结构分析

通过对劳盆拟刺铠虾全长转录本进行CDS 预测,共得到21 848 个CDS 序列。CDS 序列长度分布在102~7 719 bp, 平均值为1 049 bp; 5'UTR 的长度分布在3~4 831 bp, 平均值为266 bp; 3'UTR 的长度分布在3~7 189 bp, 平均值为970 bp。

2.3.1 转录因子 转录因子是在转录过程中识别和结合特定核苷酸序列的蛋白质, 通过与其他相关蛋白的相互作用介导附近基因的表达, 发挥重要的调控作用(Babu, 2010)。在劳盆拟刺铠虾全长转录组中共发现了41 个转录因子家族, 包含537 个转录因子。其中最多的转录因子家族是zf-C2H2 家族, 其次是转录因子ZBTB 和CSD 家族(图2a)。

图2 劳盆拟刺铠虾全长转录组结构分析Fig.2 Analysis of full-length transcriptome structure of M. lauensis

2.3.2 长链非编码RNA LncRNA 被定义为长度超过200 个核苷酸且未被翻译成蛋白质的RNA 分子,它们从根本上参与一些生物过程, 如转录、翻译、蛋白质定位、细胞结构完整性、重编码以及其他细胞活动(Maet al, 2013)。基于CPC 和CNCI 两种预测方法,在劳盆拟刺铠虾全长转录组中共发现了6 430 个LncRNA。

2.3.3 简单重复序列 简单重复序列又称为微卫星DNA、短串联重复序列, 通常指以1~6 个碱基为单位组成的短串联重复序列。本研究共检测到6 517条包含SSR 位点的isoform, 其中1 765 条包含超过1个SSR 位点, 以复合形式存在的SSRs 数目为2 044个。进一步根据短串联重复单元的类型对所检测到的10 060 个SSRs 进行分类(图2b)。依据重复核苷酸数目, SSRs 可分为5 种类型, 核苷酸重复数目为2~6 个,其中劳盆拟刺铠虾全长转录组中数量最多的是三核苷酸重复序列(4 233, 42.08%), 其次是二核苷酸重复(4 199, 41.74%)。SSRs 重复次数在4~99 次之间, 主要集中在4~7 次, 且SSRs 数量随着重复次数的增加而降低。

2.4 候选基因及通路分析

对isoform 数量分布最多的前20 个KEGG 通路进行分析, 发现其中有两个通路可能与劳盆拟刺铠虾适应深海化能极端生境相关, 分别为过氧化物酶体(Peroxisome, ko: 04146)和谷胱甘肽代谢(Glutathione metabolism, ko: 00480)。在过氧化物酶体通路中, 共有180 条isoform 编码该通路的31 个关键酶, 其中脱氢酶/还原酶SDR 家族的数量最多, 为27 条; 其次是D-天冬氨酸氧化酶(21 条)和过氧化氢酶(19 条); 甲羟戊酸激酶、α-甲酰基辅酶A 消旋酶、(S)-2-羟基-酸性氧化酶、ATP 结合盒亚家族D(ALD)成员2、2-羟基酰基-CoA 裂解酶1、谷胱甘肽硫转移酶kappa1 等数量最少, 分别有1 条(图3a)。共有213 条isoform 参与谷胱甘肽代谢通路中19 个关键酶的编码, 其中GST 的数量最多, 为59 条, 其次是前列腺素H2 D 异构酶谷胱甘肽转移酶(25 条)和谷胱甘肽过氧化物酶(18 条), 最少的是γ 谷氨酰环化转移酶、蛋白质二硫还原酶(谷胱甘肽)以及谷胱甘肽特异性γ-谷氨酰环转移酶1, 数量仅为1 条(图3b)。

图3 代谢通路图Fig.3 Maps of the metabolic pathway

GSTs 属于多功能酶, 可被分为15 个亚家族, 包括Alpha、Beta、Delta、Epsilon、Kappa、Lambda、Mu、Omega、Pi、Phi、Rho、Sigma、Theta、Tau 和Zeta (Huanget al, 2017)。劳盆拟刺铠虾全长转录组中共有20 条isoform 被分别注释到theta、delta、mu、kappa 四个GST 亚家族中。我们利用邻接法对劳盆拟刺铠虾全长转录组中注释到的GST 候选序列与其他节肢动物的GST 氨基酸序列进行了系统发育树的构建(图4a)。结果显示劳盆拟刺铠虾全长转录组中被注释为不同亚家族的GSTs 分别聚类在相应亚家族的分支上。多重序列比对结果显示劳盆拟刺铠虾的GST-theta 序列与柯氏潜铠虾的序列相似度最高, 第2~74 位氨基酸为N 端结构域, 第108~201 位氨基酸为C 端结构域(图4b)。

3 讨论

近年来, 以Pacbio 平台为代表的第三代测序技术因其强大的读长优势改变了二代测序序列读长短和碎片化的局限性, 极大地提高了获得完整基因信息的能力(Eidet al, 2009)。全长转录组测序目前已成为从超大、复杂基因组物种中获取海量基因序列信息的重要工具, 并逐步应用于水生生物生长发育、胁迫响应、物种适应性进化以及重要基因挖掘等研究(Mehjabinet al, 2019; 王菁等, 2022; Chenget al,2022; Wanget al, 2022)。本研究通过Pacbio Sequel II平台首次对深海化能生境铠甲虾类的全长转录组进行测序和分析。与之前深海化能极端环境中的其他甲壳动物二代转录组结果相比(Huiet al, 2018; Chenget al, 2019), 虽然本研究所获得的转录本数量(28 811 条)相对较少(143 516 条, Huiet al, 2018; 108 237 条,Chenget al, 2019), 但在转录本完整性和质量(N50,2 275 bp)方面却远高于二代(1 068 bp, Huiet al, 2018;1 125 bp, Chenget al, 2019) (图5), 可为后续劳盆拟刺铠虾基因资源的挖掘提供基础, 并为探究该物种在不同条件或不同组织的转录表达差异提供了参考序列。功能注释是了解基因功能、研究基因的表达调控机制与预测蛋白功能的前提。劳盆拟刺铠虾各数据库的转录本注释率为71.56%, 显著高于基于二代测序的长角阿尔文虾(40.27%, Huiet al, 2018)和柯氏潜铠虾(36.78%, Chenget al, 2019)。然而仍有8 195 个转录本未被注释, 推测可能是铠甲虾类或该物种的特有基因, 公共的数据库中缺乏其相关的基因信息等原因造成。通过Nr 数据库的注释发现, 劳盆拟刺铠虾与凡纳滨对虾比对到的同源信息最多, 所占比例为65.01%。仅注释到两个拟刺铠虾科物种, 分别为劳盆拟刺铠虾(116 条)和威氏拟刺铠虾(Munidopsis verrilli, 2 条), 表明拟刺铠虾科的已有基因资源相对匮乏。GO 注释和KEGG 注释结果显示劳盆拟刺铠虾的转录组功能主要集中于细胞过程与代谢过程。这些基因注释和分类信息将有助于对劳盆拟刺铠虾基因功能的理解与深入研究。

转录因子通过特异性结合调控区域的DNA 序列来识别下游靶基因, 从而在调控各种生物过程的激活或者抑制中发挥重要作用(Charoensawanet al,2010)。本研究预测了劳盆拟刺铠虾的转录因子, 其中zf-C2H2 和ZBTB 是最丰富的转录因子家族。C2H2型是锌指蛋白最常见的类型之一, 在真核生物的生长发育以及应激反应过程中起重要的调控作用(Liuet al, 2015)。ZBTB 蛋白是锌指蛋白家族的亚家族之一, 在DNA 损伤反应和细胞发育以及先天淋巴细胞的发育和分化等过程中起重要作用(Renet al, 2019)。本结果与马氏珠母贝(Pinctada fucata martensii,Zhanget al, 2020)、口虾蛄(Oratosquilla oratoria,Chenget al, 2022)、大菱鲆(Scophthalmus maximus, Fuet al, 2022)的全长转录组解析得到的转录因子分析结果相似。近年来研究发现长链非编码RNA 可以通过与DNA 相互作用来调节转录、表观遗传修饰、翻译和翻译后修饰等生物过程(Bridgeset al, 2021)。截至目前, 尚未有关于劳盆拟刺铠虾的长链非编码RNA的报道。本研究鉴定出劳盆拟刺铠虾的 6 430 个LncRNA, 将为LncRNA 具体功能的进一步研究提供基础。SSRs 广泛存在于真核生物体内, 因其分布广、种类多及重复单元的重复次数在个体间呈现高度特异性, 已成为检测物种遗传多样性的有效工具。通过劳盆拟刺铠虾的全长转录组分析共预测到了10 060个SSRs, 结合Boyle 等(2013)对马努斯盆地的劳盆拟刺铠虾开发的10 个SSRs, 可为劳盆拟刺铠虾在不同海盆的遗传连通性和种群遗传结构研究提供候选分子标记。

环境压力可导致细胞内活性氧(ROS)水平的增高(Lushchak, 2011), 而过氧化物酶体是在ROS 的代谢中起主要作用的细胞器(Mannaertset al, 1993)。据报道, 过氧化物酶体在各种化合物包括诱导抗氧化酶的污染物刺激下在生物体内发生增殖(Orbeaet al,2002)。本研究发现过氧化物酶体通路位于isoform 数量分布最多的前20 条KEGG 通路中, 且有部分转录本注释到参与过氧化物酶体生物发生的蛋白质peroxin 编码基因上, 因此我们推测劳盆拟刺铠虾极有可能在深海极端环境中受到外界因子刺激后发生了过氧化物酶体增殖现象, 以应对细胞内高ROS 水平。GSTs 广泛分布于生物体内, 主要通过协助对抗内源或者外来有害物质从而实现细胞解毒功能(杨海灵等, 2006)。真核生物中参与谷胱甘肽代谢的GSTs主要属于MAPEG 超家族, 在内源性脂类新陈代谢以及细胞解毒方面发挥重要的生物学作用(Jakobssonet al, 1996, 1999)。郑佩华等(2020)通过对凡纳滨对虾的GSTs 进行基因克隆, 发现MGST3 在对虾抗逆境胁迫以及抵御病原菌感染的调控机制中发挥重要作用。Cheng 等(2019)在对深海热液和冷泉的共有甲壳动物柯氏潜铠虾进行转录组比较分析时发现编码GSTs 的基因在热液个体中显著上调表达, 推测其有助于柯氏潜铠虾适应理化条件更极端的热液环境。在劳盆拟刺铠虾中, 我们发现了59 个编码GSTs 的isoform, 参与谷胱甘肽代谢过程。此外还检测到了同样具有抗氧化作用的谷胱甘肽过氧化物酶以及参与谷胱甘肽合成的γ谷氨酰转肽酶等。系统发育树与多重序列比对结果显示劳盆拟刺铠虾与柯氏潜铠虾GSTs 序列相似度高, 可能与两物种的分类地位较近以及生存环境相似有关。不同家族的GSTs 的亚基在序列上高度进化, 但都由N 末端和C 末端两个结构域组成。与谷胱甘肽结合的G 位点存在于N 末端结构域中, 与外源性和内源性亲电子底物结合的H 位点存在于C 末端结构域中, 这两者构成了GSTs 的催化反应活性中心(Armstrong, 1991; Ransonet al, 2005)。进一步分析发现劳盆拟刺铠虾的N 末端比C 末端拥有更高的序列相似性, 这种现象在 GTS 家族中也是普遍存在的(Sinninget al, 1993)。这些基因可能在劳盆拟刺铠虾适应高浓度硫以及重金属等的深海化能环境过程中发挥重要作用。

4 结论

鉴于目前对深海极端环境下特殊生命过程的认识不足, 与浅海近缘物种的比较分析是解析深海生物进化与环境适应机制的关键。本研究利用SMRT三代测序技术对劳盆拟刺铠虾进行了全长转录组测序与分析, 不仅丰富了劳盆拟刺铠虾的遗传信息, 同时为深入揭示深海化能生态系统大型甲壳动物的适应性进化机制提供了研究基础与数据支撑。后续可基于本研究进一步开展拟刺铠虾科物种与其浅海近缘生物的比较转录组分析, 从而加深十足目甲壳动物对深海化能极端环境适应机制的理解。

猜你喜欢
谷胱甘肽深海测序
杰 Sir 带你认识宏基因二代测序(mNGS)
向深海进发
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
深海特“潜”队
隐藏在深海里的神秘生物
蚯蚓谷胱甘肽转硫酶分离纯化的初步研究
分光光度法结合抗干扰补偿检测谷胱甘肽
基因捕获测序诊断血癌
TBBPA对美洲鳗鲡谷胱甘肽代谢相关指标的影响
单细胞测序技术研究进展