王美垚 冯群
摘要 从转录组概念、Illumina测序原理及工作流程、Illumina测序技术中生物信息分析相关数据库概念等方面,介绍了高通量测序技术的基本原理,以及该技术在重要洄游性鱼类(鲑鱼、鲟鱼、刀鲚)研究中的应用,旨在为今后更好地开展水生资源修复奠定理论基础。
关键词 高通量测序;洄游;鱼类
中图分类号 S917.4文献标识码 A
文章编号 0517-6611(2020)02-0013-03
doi:10.3969/j.issn.0517-6611.2020.02.004
开放科学(资源服务)标识码(OSID):
Utilization of High Throughput Sequencing in Major Anadromous Fish Species
WANG Mei-yao1,2,3,FENG Qun1 (1.Wuxi Fisheries College,Nanjing Agricultural University,Wuxi,Jiangsu 214081;2.Key Laboratory of Freshwater Fisheries and Germplasm Resources Utilization of Agriculture,Freshwater Fisheries Research Center,Chinese Academy of Fishery Sciences,Wuxi,Jiangsu 214081;3.Aquatic Animals Genome Center,Freshwater Fisheries Research Center,Chinese Academy of Fishery Sciences,Wuxi,Jiangsu 214081)
Abstract This article introduced basic principles of high throughput sequencing and utilizaiton in major anadromous fish species(Oncorhynchus masou,Acipenser sinensis,Coilia ectenes),from transcriptome concepts,Illumina sequencing principle and workflow,database concepts related to bioinformatics analysis in Illumina sequencing technology.This article aimed at laying theoretical foundation for further research on aquatic resource recovery.
Key words High hroughput sequencing;Anadromous;Fish species
高通量測序技术,又称为第二代测序技术,相比第一代测序技术,其具有测序速度快、准确性高、信息量大的显著特点,可以使研究者在更广阔又更为深刻的层面上来开展科学研究[1-2]。洄游性鱼类是现今水生资源修复工作中的重要内容,笔者总结了高通量测序技术在主要洄游性鱼类研究中的应用,旨在为今后更好地开展水生资源修复奠定理论基础。
1 高通量测序技术原理
1.1 转录组概念
转录组广义上是指在某一生理状态下,机体内特定细胞内全部转录产物的集合,包括信使RNA以及非编码RNA如核糖体RNA、转运RNA、小分子RNA等;狭义上是指信使RNA的集合[3-4]。同一细胞处于不同发育阶段及不同的外界环境条件下,其基因表达情况是不同的,因而具有时间与空间特异性[5]。这也是与具有静态特征的基因组学研究的显著不同点,转录组受外源环境因子和内源因子的共同调控,反映了生物体的特定组织或器官处于某一生理状态下,细胞内全部基因表达水平情况,通过比较不同组织或生理状况下的基因表达差异,寻找与特定生理功能相关、发挥重要调控作用的通路、基因等[6]。转录组学研究是一种整体水平的研究方法,作为功能基因组学研究的重要手段,其改变了先前的单个基因的研究模式,大大促进了生物体基因组学的研究进展。
1.2 Illumina测序原理及工作流程 高通量测序技术又名“下一代测序技术”,包括第二代测序技术及第三代测序技术,具有测序速度快、准确性高且成本低等特性。高通量测序不同于以往的测序方法,可以在无参考基因组的情况下,以更快的速率获得生物体某组织或器官在特定生理状态下的整体转录水平[1-2]。现今应用较为广泛的是第二代测序技术,主要包括罗氏公司的454焦磷酸测序技术[7]、Illumina公司的Solexa测序法[8]、ABI公司的SOLiD测序技术[9]以及Helicos公司的大规模并行单分子合成测序法[10]。
Illumina是一种边合成边测序的技术,是基于其核心技术“DNA簇”和“可逆末端终结”来进行的[8]。其工作原理为将DNA随机打断成较小的片段,芯片表面连接有一层与接头互补的寡核苷酸,DNA片段通过接头固定在芯片表面,产生DNA簇,形成PCR桥结构。而后开展PCR桥式扩增,每个分子可以形成1000个以上的单克隆DNA簇群。可逆终止子是带有荧光标记的dNTP,在3′羟基端有可被化学切割的基团,可以封闭dNTP的3′端黏性,从而阻止下一个dNTP与之相连接。进行测序反应时,通过加入可逆终止子,检测释放的荧光信号,通过边合成边测序的方法获得模板链的序列信息。
Illumina的工作流程大体包括如下四方面:①连接接头:将待测样品提取出的基因组DNA或RNA反转录组所得的cDNA打断成长度为100~200 bp的较小片段,并在单链DNA片段两端加上接头。②形成DNA簇:芯片表面连接有一层引物碱基,加入接头的DNA通过接头使其一段固定在芯片上,另一端与最近的另一引物互补而固定,形成桥状结构,通过PCR扩增后,同片段扩增1 000倍以上,所有的扩增产物均被固定到了芯片上,形成单克隆DNA簇。而后所有模板被线性化处理为单链模板。
③测序反应:采用边合成边测序方法,加入DNA聚合酶、引物以及4种可逆终止子dNTP进行扩增,测序仪通过捕捉荧光信号,而后通过计算机软件将光信号转换为测序峰,从而获得测序片段的序列信息。④数据分析:读取碱基,数据转移至自动分析通道进行二次分析。
1.3 Illumina测序技术中生物信息分析相关数据库概念
1.3.1 Nr(NCBI non-redundant protein sequences)数据库。该数据库是 NCBI 官方发布的非冗余蛋白序列数据库,它包含有来自GenBank中基因编码的蛋白序列以及来自Swiss Prot、PDB(Protein Data Bank)、PIR(Protein Information Resource)和PRF(Protein Research Foundation)等数据库的蛋白序列信息。
1.3.2 Nt(NCBInucleotidesequences)数据库。該数据库是NCBI 官方发布的核酸序列数据库,包含有GenBank、DDBJ以及EMBL数据库中的核酸序列信息。
1.3.3 KOG(eukaryotic ortholog groups)数据库。该数据库是NCBI基于基因直系同源进化关系的蛋白数据库,其主要针对真核生物。其是假定构成每个KOG的蛋白都是来自于同一个祖先蛋白,因此属于直系同源蛋白以及旁系同源蛋白。其中直系同源蛋白是由不同物种的由垂直家系(物种形成)进化而来的蛋白,保留了原始蛋白的典型功能;旁系同源蛋白是来自于一定物种的基因复制蛋白,因而可能会进化出新的功能。
1.3.4 Swiss-Prot数据库。该数据库是由富有经验的分子生物学家和蛋白质化学家搜集整理而成的蛋白序列数据库。 每个注释条目都含有结构域、功能位点等详细信息。
1.3.5 GO(gene ontology)数据库。该数据库是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表来描述生物体中基因及其基因产物的分类属性。GO分类系统具有3个本体,包括描述基因的分子功能、所处的细胞位置以及参与的生物过程三大子类。GO的基本单位为词条,均具有相对应的属性。
1.3.6 KEGG(kyoto encyclopedia of genes and genomes)数据库。在生物体内,不同基因通过所处通路、相互协调从而发挥其生物学功能,通过通路显著性富集分析能确定差异表达基因参与的最主要生化代谢途径以及信号转导途径。
2 高通量测序技术在主要洄游性鱼类研究中的应用
在刀鲚上也有基于高通量测序技术的研究报道。主要是集中在刀鲚不同组织如性腺组织的深度测序[11-13],也有操作应激对刀鲚肝组织的影响研究[14]。有关刀鲚洄游中的关键通路及基因的转录组研究较少,仅见刀鲚嗅觉上皮的比较转录组分析研究[15]。
2.1 高通量测序技术在鲑鱼研究中的应用 高通量测序技术在鲑鱼研究上应用涉及的种类较多,包括大西洋鲑(S.salar)[16]、银大麻哈鱼(O.kisutch)[17]、红大麻哈鱼(Oncorhynchus nerka)[18]、大鳞大麻哈鱼(O.tshawytscha)[19]等,现已开展了免疫学、营养学、繁殖学等的研究,其中免疫学方面的研究较多。如 Johansson等[20]开展了降海洄游中大西洋鲑头肾、小肠以及鳃的免疫转录组研究。研究结果表明,头肾、小肠中的基因差异表达显著高于鳃中的。基因群包括先天抗病毒免疫、趋化因子、细胞因子及其受体、信号转导子、体液及细胞免疫因子淋巴细胞等均出现了显著的下调表达。海虱(Caligus rogercresseyi)是大西洋鲑鱼体常携带的寄生虫,严重时甚至会导致鱼体死亡,因而有关海虱对大西洋鲑各组织的转录组研究也多有报道。如Núez-Acua等[16]开展了植食饲料添加剂对增强大西洋鲑抗海虱感染的转录组研究。选取头肾、皮肤开展比较研究,结果表明免疫应答最为显著的组织为头肾,饲喂含有免疫增强效应物的饲料可以上调鱼体代谢方面基因表达,另外,MHC-Ⅰ与MHC-Ⅱ在此过程中出现差异表达,来共同发挥免疫调节功用。Valenzuela-Muoz等[17]近期又开展了感染海虱后铁离子调控在大西洋鲑鱼与银鲑的差异表达研究。选取头肾以及皮肤开展研究,结果表明相比银鲑,大西洋鲑更易感染海虱,且感染会较显著影响细胞铁离子的代谢。而海虱感染对银鲑影响较小,会激活促炎性应答。Mueller等[18]还开展了红大麻哈鱼感染IHNV后的脑转录组影响研究,结果表明上调表达基因集中在抗体生成以及抗原呈递方面;下调表达基因主要与胆固醇合成有关。Valenzuela-Miranda等[21]开展了ISAV感染对大西洋鲑头肾、肝、鳃组织的转录组影响研究,研究表明差异表达基因多是与干扰素通路、先天免疫应答以及细胞繁殖与分化相关。另外,在应答过程中,各组织内部通路受到独立调控。Dahle等[22]开展了大西洋鲑感染PRV后红细胞转录组分析研究,研究表明感染后,一些病毒应答相关基因出现显著表达,涉及干扰素调控的抗病毒基因以及MHC-Ⅰ抗原递呈基因。同时PRV感染也引起了免疫负调节子的表达,包括一些免疫基因、细胞骨架相关组分基因以及离子交换、细胞互作、生长与分化调节因子等基因的下调表达。
在营养学方面,主要开展了饲料添加剂对大西洋鲑消化等的影响研究。如Król等[23]开展了植物蛋白饲料对大西洋鲑肠转录组的影响研究,结果表明混合型植物蛋白饲料在改善鱼体组成等方面功能优于单一组分植物蛋白饲料。De Santis等[24]开展了不同替代水平的蚕豆蛋白饲料对大西洋鲑肝转录组的影响研究,研究表明大西洋鲑可利用中度替代水平的蚕豆蛋白饲料,最适添加量为120 g/kg。同年,De Santis等[24]开展了不同磷脂添加水平及组成的饲料对大西洋鲑肠转录组影响研究,结果表明,发育早期增加磷脂添加量可以对鱼体肠道转录组产生影响,而幼鱼期增大添加可以促进生长,但是对肠道转录组基因无显著作用。
在繁殖学方面,为了探讨上皮组织在大西洋鲑性成熟中的调控作用,Palstra等[25]开展了马苏大麻哈鱼上皮转录组的比较研究,发现了75个已知的以及27个未知的发挥重要作用的差异表达基因。Gomez-Uchida等[19]开展了大鳞大麻哈鱼精巢的转录组测序研究,获得了大量的基因及GO、KEGG富集通路信息,为今后进一步开展大鳞大麻哈鱼的相关研究奠定了理论基础。另外,有关鲑鱼研究多是集中在大西洋鲑上,Kim等[26]还开展了银鲑13个组织的转录组研究,为后续进一步开展银鲑这一物种的相关研究奠定了理论基础。
2.2 高通量测序技术在鲟鱼研究中的应用
有关鲟鱼的高通量测序研究涉及的种类也较多,包括史氏鲟(A.schrenckii)[27]、中华鲟(A.sinensis)[28]、俄罗斯鲟(A.gueldenstaedtii)[29]、意大利鲟(A.naccarii)[30]等,主要集中在性腺组织、免疫组织测序等理论基础研究方面。如Chen等[29]选取不同发育阶段俄罗斯鲟的性腺组织开展了高通量测序研究,结果表明信号转导相关基因富集最显著,体现了信号转导机制对于俄罗斯鲟性腺发育的调控作用。雌性个体的蛋白合成、细胞色素C氧化酶亚单元、核糖体蛋白等相关基因表达显著高于雄性个体,雄性个体在转座元件转座酶、反转录酶以及转座酶等相关基因表达方面高于雌性。Jin等[27]开展了史氏鲟精巢及卵巢的比较转录组研究,获得了1 309个差异表达基因,精巢中有782个基因上调表达,卵巢中出现527个基因上调表达。Yuan等[31]开展了史氏鲟miRNA的高通量测序研究,获得了103个miRNA,其中58个具有强烈的检测信号,25个miRNA在5个检测的组织中均有表达。Yue等[28]开展了中华鲟的精巢与卵巢的转录组测序及比较研究,获得了1 896个差异表达基因,其中1 894个基因在卵巢中出现上调表达,2个基因在精巢中出现上调表达。Vidotto等[30]开展了意大利鲟性腺以及脑组织的高通量测序研究,获得了32个性别相关基因,并发现了其中7个关键基因,在后续的组织学检测中发现其中5个位于雄性个体中,其余2个位于雌性个体中。Jin等[27]开展了多肽激素Kp处理对史氏鲟脑部下丘脑-垂体-性腺轴的转录组影响研究,研究表明多肽激素Kp将会引起G蛋白偶联受体54、促性腺激素释放激素、雄激素受体、雌激素受体等基因的上调表达。Zhu等[32]首次开展了中华鲟免疫组织的高通量测序研究,获得了67 000 000的高质量读本以及91 739个基因序列。GO及KEGG富集分析结果表明获得的大量免疫相关基因包括PRR信号通路、JAK-STAT信号通路、补体凝集通路、T细胞受体与B细胞受体信号通路等。为进一步开展该物种的相关研究奠定了理论基础。
2.3 高通量测序技术在刀鲚研究中的应用
高通量测序技术也已应用在刀鲚的相关研究上,但总体来说,研究较少。已见有关刀鲚不同组织的深度测序研究报道[11-13],Duan等[12]開展了刀鲚卵巢组织的转录组研究,获得了63 141个基因。其中8 570个基因注释到了COG的25个条目中,12 358个基因注释到了234条KEGG通路中。Shen等[13]开展了刀鲚10个组织包括脑、鳃、心、肠、肾、肝、肌肉、胃、卵巢以及精巢组织的高通量测序研究,共获得了65 350个非冗余转录本,序列平均长度为1 520 bp,其中15 055个基因注释到了COG的25个条目中,40 688个基因被注释到GO条目中,32 882个基因富集到了KEGG通路上。另外,Du等[14]也开展了急性操作应激对刀鲚肝组织转录组的影响研究,获得了6 406个差异表达基因。其中,3 416个基因出现下调表达,2 990个基因出现上调表达。KEGG富集分析结果表明,最显著富集的通路集中在代谢相关包括糖以及脂代谢等。另外,也有有关刀鲚洄游机理的关键通路及基因的高通量研究报道,例如Zhu等[15]开展的刀鲚嗅觉上皮的比较转录组分析研究,试验选取野生洄游刀鲚以及非洄游刀鲚上皮组织开展研究,研究表明差异表达基因集中在信号转导通路以及酶活性调节相关通路。同时也发现许多对洄游行为发挥调控作用的基因包括嗅觉受体、环核苷酸门控阳离子通道、依赖钙离子激活的氯离子通道、光传感因子、G蛋白受体激酶等基因。
3 展望
高通量测序技术已成为深入开展科学研究的有效手段,在人、哺乳动物、鱼类等均有广泛的应用。洄游性鱼类是水生资源修复中的重要组成部分,但其鱼体调控机制个体差异性明显,今后还应针对物种自身特性应用高通量测序技术开展深入研究,为更好实现水生生物资源修复奠定理论基础。参考文献
[1] MARDIS E R.The impact of next-generation sequencing technology on genetics[J].Trends in genetics,2008,24(3):133-141.
[2] SCHUSTER S C.Next-generation sequencing transforms today's biology[J].Nature methods,2008,5(1):16-18.
[3] 祁云霞,劉永斌,荣威恒.转录组研究新技术:RNA-Seq及其应用[J].遗传,2011,33(11):1191-1202.
[4] 田英芳,张晓政,周锦龙.转录组学研究进展及应用[J].中国生物教学,2013(12):29-31.
[5] MUTZ K O,HEILKENBRINKER A,LNNE M,et al.Transcriptome analysis using next-generation sequencing[J].Current opinion in biotechnology,2013,24(1):22-30.
[6] WANG Z,GERSTEIN M,SNYDER M.RNA-Seq:A revolutionary tool for transcriptomics[J].Nature reviews genetics,2009,10(1):57-63.
[7] MARGULIES M,EGHOLM M,ALTMAN W E,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437(7075):376-380.
[8] SHENDURE J,PORRECA G J,REPPAS N B,et al.Accurate multiplex polony sequencing of an evolved bacterial genome[J].Science,2005,309(5741):1728-1732.
[9] FEDURCO M,ROMIEU A,WILLIAMS S,et al.BTA,a novel reagent for DNA attachment on glass and efficient generation of soilid-phase amplified DNA colonies[J].Nucleic acids research,2006,34(3):1-13.
[10] HARRIS T D,BUZBY P R,BABCOCK H,et al.Single-molecule DNA sequencing of a viral genome[J].Science,2008,320(5872):106-109.
[11] ZHOU Y F,DUAN J R,LIU K,et al.Testes transcriptome profiles of the anadromous fish Coilia nasus during the onset of spermatogenesis[J].Marine genomics,2015,24:241-243.
[12]DUAN J R,ZHOU Y F,XU D P,et al.Ovary transcriptome profiling of Coilia nasus during spawning migration stages by Illumina sequencing[J].Marine genomics,2015,21:17-19.
[13] SHEN H S,GU R B,XU G C,et al.In-depth transcriptome analysis of Coilia ectenes,an important fish resource in the Yangtze River:de novo,assembly,gene annotation[J].Marine genomics,2015,23:15-17.
[14] DU F K,XU G C,NIE Z J,et al.Transcriptome analysis gene expression in the liver of Coilia nasus during the stress response[J].BMC Genomics,2014,15:1-11.
[15] ZHU G L,WANG L J,TANG W Q,et al.De novotranscriptomes of olfactory epithelium reveal the genes and pathways for spawning migration in Japanese grenadier anchovy (Coilia nasus)[J/OL].PLoS One,2014,9(8):e103832[2018-11-20].https://doi.org/10.1371/journal.pone.0103832.
[16] NEZ-ACUA G,GONC ALVES A T,VALENZUELA-MUOZ V,et al.Transcriptome immunomodulation of in-feed additives in Atlantic salmonSalmo salarinfested with sea lice Caligus rogercresseyi[J].Fish & shellfish immunology,2015,47(1):450-460.
[17] VALENZUELA-MUOZ V,BOLTAA S,GALLARDO-ESCRATE C.Uncovering iron regulation with species-specific transcriptome patterns in Atlantic and coho salmon during a Caligus rogercresseyi infestation [J].Journal of fish diseases,2017,40(9):1169-1184.
[18] MELLER A,SUTHERLAND B J G,KOOP B F,et al.Infectious hematopoietic necrosis virus (IHNV) persistence in Sockeye Salmon:Influence on braintranscriptome and subsequent response to the viral mimic poly(I:C)[J].BMC Genomics,2015,16:1-19.
[19] GOMEZ-UCHIDA D,SEEB L W,WARHEIT K I,et al.Deep sequencing of the transcriptome and mining of single nucleotide polymorphisms (SNPs) provide genomic resources for applied studies in Chinook salmon (Oncorhynchus tshawytscha)[J].Conservation genetics resources,2014,6(4):807-811.
[20] JOHANSSON L H,TIMMERHAUS G,AFANASYEV S,et al.Smoltification and seawater transfer of Atlantic salmon (Salmo salar L.) is associated with systemic repression of the immune transcriptome[J].Fish & shellfish immunology,2016,58:33-41.
[21] VALENZUELA-MIRANDA D,BOLTA A S,CABREJOS M E,et al.High-throughput transcriptome analysis of ISAV-infected Atlantic salmon Salmo salarunravels divergent immune responses associated to head-kidney,liver and gills tissues[J].Fish & shellfish immunology,2015,45(2):367-377.
[22] DAHLE M K,WESSEL ,TIMMERHAUS G,et al.Transcriptome analyses of Atlantic salmon (Salmo salarL.) erythrocytes infected with piscine orthoreovirus (PRV)[J].Fish & shellfish immunology,2015,45(2):780-790.
[23] KRL E,DOUGLAS A,TOCHER D R,et al.Differential responses of the gut transcriptome to plant protein diets in farmed Atlantic salmon[J].BMC Genomics,2016,17(1):1-16.
[24] DE SANTIS C,CRAMPTON V O,BICSKEI B,et al.Replacement of dietary soy-with air classified faba bean protein concentrate alters the hepatic transcriptome in Atlantic salmo(Salmo salar)parr[J].Comparative biochemistry and physiology part D:Genomics & proteomics,2015,16:48-58.
[25] PALSTRA A P,FUKAYA K,CHIBA H,et al.The olfactory transcriptome and progression of sexual maturation in homing chum salmon Oncorhynchus keta[J].PLoS One,2015,10(9):1-17.
[26] KIM J H,LEONG J S,KOOP B F,et al.Multi-tissue transcriptome profiles for coho salmon (Oncorhynchus kisutch),a species undergoing rediploidization following whole-genome duplication[J]Marine genomics,2016,25:33-37.
[27] JIN S B,ZHANG Y,DONG X L,et al.Comparative transcriptome analysis of testes and ovaries for the discovery of novel genes from Amur sturgeon (Acipenser schrenckii)[J].Genetics and molecular research,2015,14(4):18913-18927.
[28] YUE H M,LI C J,DU H,et al.Sequencing and de novo assembly of the gonadal transcriptome of the endangered chinese sturgeon (Acipenser sinensis)[J].PLoS One,2015,10(6):1-22.
[29] CHEN Y D,XIA Y T,SHAO C W,et al.Discovery and identification of candidate sex-related genes based on transcriptome sequencing of Russian sturgeon (Acipenser gueldenstaedtii)gonads[J].Physiological genomics,2016,48(7):464-476.
[30] VIDOTTO M,GRAPPUTO A,BOSCARI E,et al.Transcriptome sequencing and de novo annotation of the critically endangered Adriatic sturgeon[J].BMC Genomics,2013,14:1-16.
[31] YUAN L H,ZHANG X J,LI L M,et al.High-throughput sequencing of microRNA transcriptome and expression assay in the sturgeon,Acipenser schrenckii[J].PLoS One,2014,9(12):1-18.
[32] ZHU R,DU H J,LI S Y,et al.De novoannotation of the immune-enriched transcriptome provides insights into immune system genes of Chinese sturgeon (Acipenser sinensis)[J].Fish & shellfish immunology,2016,55:699-716.