转录组学技术及其在猪肉质遗传研究中的应用

2020-03-27 03:32甘麦邻沈林園杨东丽王定国张顺华
猪业科学 2020年2期
关键词:组学基因组测序

甘麦邻,沈林園,杨东丽,王定国,张顺华,朱 砺*

(1.四川农业大学动物科技学院,四川 成都 611130;2.四川农业大学畜禽遗传资源发掘与创新利用四川省重点实验室,四川 成都 611130;3.泸州市农业农村局,四川 泸州 646000;4.成都市动物疫病预防控制中心,四川 成都 610041)

随着人类基因组计划的完成,大量物种的基因组被解析,大大地加快了相关研究的速度和进展[1]。伴随着相关研究技术和方法的成熟,近年来随着转录组学、蛋白质组学和代谢组学等组学研究的相继出现,开启了生命科学研究的后基因组时代[2-3]。转录本身是一个高度动态和可变的过程,而转录水平的调控是目前研究最广泛、最重要的调控方式。转录组反映特定物种的组织、器官或细胞在特定生理环境和发育状态下的RNA表达情况。转录组同相对稳定的基因组比较,在不同的生理状态和环境的影响下呈现高度的动态变化,能直观反映个体或细胞对环境的应答[4]。

猪不仅可以为人类提供重要的肉产品,而且作为良好的动物模型在人类疾病研究中发挥着重要的作用。2009年由美、英、法等多国科学家组成的研究小组首次绘制出了杜洛克猪的基因组草图,随后又不断进行了完善[5-6]。相关研究结果对提高猪肉产量、增强猪只免疫力,提升种猪繁殖性能的研究具有重要的参考意义。此外,由于猪在解剖结构、生理指标、行为模式和营养需求等方面与人类具有很多相似之处;同时猪也具有对流感易感的特性,基于此科学家们可以以猪为相关人类疾病模型研究人类疾病,兽医专家也可以洞悉猪的疾病;有助于猪流感疫苗、器官移植等涉及人类健康技术的研发。同时为转录组测序提供了可靠的参考基因组。

1 转录组学

在自然界中生物许多性状,尤其是大量的经济性状通常是由许多基因共同调控的。相较于针对单一基因的研究,对多个基因或整体水平同时进行系统地研究,有时能够更为准确地反映生物学问题。转录组学是解读基因组功能元件和揭示细胞及组织分子机制的基础,在生物表观性状和基因表达研究中占据了重要地位。

狭义的转录组学特指编码蛋白的RNA——信使RNA(mRNA)[7],而广义的转录组学则包含编码和非编码RNA(noncoding RNA,ncRNA),如核糖体RNA(rRNA)、转运RNA(tRNA)、小RNA(miRNA)、小干扰RNA(siRNA)、长链非编码RNA(lncRNA)、环状RNA(circRNA)、piRNA(与PIWI蛋白家族成员相结合的小RNA)、tRFs(由特定的核酸酶在tRNA的环上剪切,产生的特定大小的小RNA)等[8-9]。随着对各种非编码RNA研究的不断深入,使得转录组研究范围不断深化。相较于研究起步最早也最为成熟的编码RNA,非编码RNA的研究正如火如荼,尤其以lncRNA和circRNA最甚[10-11]。由于非编码RNA占了转录本的大多数,因此解析非编码RNA的作用机制及其调控网络的构建,对进一步解析相关疾病的发生发展和认识生命的奥秘具有重要意义[12]。

2 转录组测序技术

当前,针对转录组,相关科研团队开发了许多方法。从技术方法分类来看:较为常用的有基因芯片(Gene chip)[13]、表达序列标签(EST)[14]、转录组测序(RNASeq)[15]等,其中转录组测序是当前应用最多的技术手段。转录组测序从研究对象来分又可分为:针对mRNA、miRNA、lncRNA、circRNA及全转录组的测序及分析技术。转录组测序(transcriptme sequencing),也即RNA sequencing (RNA-Seq)又称新一代测序技术(next-generation sequencing,NGS)。转录组测序技术是一种非常有用的遗传信息搜寻工具,同时也能够对转录组进行综合分析,还可以用来鉴别、定位以及定量分析转录组信息[16]。因转录组测序技术具备的众多优点,因此被广泛应用在转录组的相关研究中。

2.1 转录组测序流程

转录组测序的主要流程为:1)细胞或组织总RNA的获得,通常使用Trizo法提取总RNA,或相应改进试剂盒提取目的RNA,目前已有针对miRNA、piRNA等的专门化提取试剂盒;2)对RNA样品进行预处理(如富集处理等);3)RNA样品的片段化处理;4)RNA样品反转录,制成cDNA;5)在反转录好的cDNA两端连接接头;6)进行高通量测序;7)对测序片段进行拼装分析获得转录组的序列信息和遗传信息[17]。

2.2 转录组测序数据分析

转录组测序数据的分析。对于无参考基因组的物种还需要构建参考基因组或使用相近物种的参考基因组[18],针对已有参考基因组的物种,其转录组测序数据分析则主要包含以下步骤(见图1)。

转录组测序在解析转录本的结构和生物学功能等方面发挥着重要作用,如发现可变剪切、融合基因以及非编码的转录本等。由于转录组测序的结果分析,包括了转录本的表达水平、对可变剪切的鉴定以及链方向特异性等,因此转录组测序分析远比基因组复杂,通常适用于基因组的组装算法不能够直接用于转录组测序的数据分析。随着信息技术的发展,生物信息学家又开发了一些新的专门用于转录组组装的软件,这些软件主要有基于参考基因组的组装方法和Denovo组装等方法[19],解决了部分转录组测序分析的困难,为进一步地广泛使用转录组测序技术提供了技术基础。

3 猪肉质相关转录组学研究

利用转录组学技术可分析猪某一组织、器官在不同生理状态、发育阶段以及不同处理条件下转录产物的类别、结构变异及其表达水平的变化,可筛选差异表达基因,进而将基因和性状和环境联系起来,为进一步治疗猪病或搜寻猪遗传育种相关靶点提供了参考[20]。同时还可以进行基于转录水平的分子标记物筛选,加快选育进程,提升选育准确度,为生猪养殖过程提供相应的技术支撑。

通常研究人员通过转录测序用以发现差异表达基因,进一步研究分析差异基因的功能和调控网络。对于世界养猪业,DLY(杜洛克猪×长白猪×大白猪)配套组合已经成为经典,并成为使用最为广泛的商品猪养殖生产模式,极大地推动了世界养猪生产的发展。但由于前期选育主要集中在猪只生长速度和饲料转化率上,一定程度上忽视了对肉质性状的选育。同时随着人们对动物遗传资源和物种多样性的进一步理解,地方品种种质资源保护和开发利用也已经成为了养猪生产的一个重要发展方向。因此对于猪肉质相关的转录组研究,一方面集中在骨骼肌不同发育阶段、生理状态或差异生产性能下转录组差异研究;另一方面通过转录组测序比较地方猪种与主流猪种(杜洛克、长白、大白、巴克夏、汉普夏等)转录差异,为保种及特殊遗传资源开发提供参考。

3.1 mRNA转录组研究与应用

信使RNA作为编码蛋白的RNA,基于mRNA的测序通常能够将基因组和蛋白组紧密关联,发现具有重要遗传效应的基因,利用转录组测序手段大量的研究发现了对猪肉质性状相关的基因并验证了部分基因组测序数据。基于转录组测序的方法Puig等分析了同一猪种不同脂肪沉积亚群背最长肌转录组差异,发现在高脂亚群和低脂亚群鉴定出的131个差异表达基因显著富集到了脂质代谢通路中。同时该研究团队发现其中18个基因位于GWAS鉴定到的肌内脂肪组成相关的基因组区域[21]。对背最长肌含有不同IIB型肌纤维的大白猪进行转录分析,研究人员鉴定到355个差异表达基因,经过分析发现主要与糖酵解代谢通路和肌细胞收缩过程相关[22]。Sodhi等人对成年济州猪(JNP猪)和巴克夏猪的背最长肌进行转录组分析,通过与巴克夏猪比较在JNP猪背最长肌鉴定到了39个基因的表达,主要富集在代谢、蛋白结合等通路[23]。对25日龄沙子岭猪和约克夏猪的背最长肌做了转录组和蛋白组分析,研究人员鉴定得到488个差异表达基因和23个差异蛋白,对其进行功能分析发现差异表达基因主要涉及到代谢、蛋白结合以及骨骼肌发育的通路[24]。对5月龄皖南花猪与大约克夏猪的背最长肌进行转录组分析,差异表达基因主要参与糖酵解代谢、肌肉发育的生物学过程以及与脂肪酸代谢、生长和胴体性状相关的通路[25]。通过以上数据我们可以发现不同生长发育阶段的肌肉转录差异主要集中在肌肉发育、脂质代谢和糖酵解代谢等通路。

通过对骨骼肌不同发育阶段、生理状态或差异生产性能下转录组差异研究,以及不同特性猪种的转录组研究,进一步丰富了基因表达调控网络,为我们解析基因与环境间的互作和种质资源保护提供了参考。

3.2 miRNA转录组研究与应用

miRNA是近年来发现的一种非编码RNA,主要在转录后水平对其靶基因发挥调控作用。大量的研究也证实一些与肌肉相关的miRNA,如miR-1、miR-133、miR-206和miR-27等参与猪骨骼肌发育或肉质相关[26-27]。与mRNA相比miRNA物种间保守性更强,预计miRNA的数量大约1 000个左右,但调控着大约60%的基因表达[28]。miRNA的转录测序是发现新的miRNA和研究已知miRNA差异表达的重要手段。

2012年南京农业大学研究团队对猪18个发育阶段的背最长肌进行miRNA测序,通过与已有的miRNA进行比对发现已知197个miRNA,新发现78个miRNA[29]。2015年四川农业大学猪研究团队通过对5个生长发育阶段猪的背最长肌进行测序,鉴定了404个已知的猪miRNA,18个新的miRNA和101个在其他哺乳动物中保守的miRNA[30]。2017年重庆市畜牧科学院通过测定猪4个不同发育阶段的肌肉和脂肪,鉴定得到329个已知的miRNA和157个新的miRNA[31]。

中山大学陈瑶生团队对长白猪和蓝塘猪骨骼肌发育8个不同阶段miRNA进行基因表达谱分析,筛选到差异表达的258个miRNA在所有生长阶段的背最长肌中均有表达[32]。中国农业科学院相关团队基于长白猪、桐城猪、五指山猪胚胎骨骼肌33、65和90 d的miRNA表达谱分析,分别鉴定得到33、18和67个差异表达miRNA,差异表达miRNA的靶基因主要涉及肌肉收缩和肌肉发育等过程[33]。

从以上研究的发表时间来看,在猪骨骼肌中越来越多的miRNA被鉴定,同时也仍在不断发现新的miRNA。而针对差异miRNA的研究则以其靶基因为核心进行生物功能分析,其靶基因调控通路和生物学过程与前述的mRNA的转录测序分析富集通路结果相似,从侧面互相印证了miRNA及其靶基因所对应的信号通路和生物学过程。基于miRNA的研究进一步丰富了猪肉质相关信号的调控通路,也为遗传改良和养猪生产提供了新见解和新思路。

3.3 lncRNA及circRNA等其他非编码RNA转录组研究与应用

lncRNA是一类长度超过200 nt的非编码RNA,lncRNA占全部非编码RNA的80%以上,与miRNA相比其数量庞大,序列保守性较低,曾一度被认为是转录噪音[34]。circRNA即环状RNA,是一种具有闭合环状结构且能稳定存在于真核细胞中的特殊RNA,随着研究的进一步深入,lncRNA、circRNA等被证明具有丰富的生物学功能,即可调控表观遗传修饰也能影响RNA的可变剪接,对生物个体的正常生长发育和疾病发生发展均有重要作用。

四川农业大学猪研究团队利用转录组测序技术对猪背最长肌和腰大肌进行测序分析,共鉴定出326个lncRNA和56个circRNA[35]。2017年中国农业科学院以贵州小型猪的9种不同组织和3个发育阶段的骨骼肌为材料鉴定得到5 934个circRNA,并系统分析了猪circRNA的时空表达差异和与其他物种的保守性,同时相关研究人员还构建了农业动物首张circRNA的时空图谱和首个数据库(circRNA-miRNAmRNA多维调控网络)[36]。华南农业大学以瘦肉型快速生长的外种猪(长白猪)和我国脂肪型地方猪种蓝塘猪7 d肌肉为材料,鉴定得到4 360个circRNA,在蓝塘猪中1 401个circRNA上调,2 959个下调[37]。此外,2018年7月中国农业科学院又以大白猪和莱芜猪的脂肪为材料共鉴定得到29 763个脂肪组织中的circRNA,在脂肪型的莱芜猪中70个circRNA上调,205个下调,相关研究结果进一步为circRNA在猪肉质改良研究提供了参考[38]。

除了lncRNA和circRNA还有小干扰RNA(siRNA)、piRNA、tRFs等非编码RNA均被证明具有重要的生物学功能[39-40],但由于相关技术手段还不够成熟,研究成本较高,机制解析困难等因素,在猪肉质研究中还鲜见报道,但随着相关技术的升级,必将迎来其研究热潮。

4 总结

随着测序及相关分析技术的成熟,测序成本大幅下降,转录组测序的高通量优势极大地促进了相关研究的发展,在猪肉质研究中也取得了一定的成果。但转录组的研究仍然存在一定的问题,一方面测序所得的庞杂数据量通常需要大型分析仪器,而这些仪器的使用和维护往往非常专业和昂贵,通常实验人员需要同专业测序公司合作完成,由于专业背景差异的存在,在一定程度限制了实验方案的实施;另一方面研究人员面临海量的测序结果如何进行有效地处理和数据分析仍然是最大的挑战。

猜你喜欢
组学基因组测序
两种高通量测序平台应用于不同SARS-CoV-2变异株的对比研究
“植物界大熊猫”完整基因组图谱首次发布
影像组学在肾上腺肿瘤中的研究进展
牛参考基因组中发现被忽视基因
东莨菪碱中毒大鼠的代谢组学
生物测序走在前
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
外显子组测序助力产前诊断胎儿骨骼发育不良
科学家找到母爱改变基因组的证据