基于组学数据的绦虫适应性寄生机制研究进展

2021-12-04 13:47刘师楠徐方方陈文青王翠香姜鹏崔晶王中全张玺
热带病与寄生虫学 2021年4期
关键词:绦虫组学宿主

刘师楠,徐方方,陈文青,王翠香,姜鹏,崔晶,王中全,张玺

郑州大学基础医学院病原生物学系,河南 郑州 450001

生命起源和物种进化,是人类了解自身、探求自然真相的亘古命题[1]。进化理论的发展主要经历了三个重要历程:拉马克提出的用进废退学说,达尔文和华莱士提出的自然选择学说以及木村资生提出的中性进化学说[2-5]。适应性进化是指物种在不同的生存环境中通过对周围环境长期适应而在局部结构和功能上发生相应的变化以更好地适应生存条件,是自然选择、群体遗传及生物个体各种生化反应限制的综合性结果[6-7]。医学绦虫营寄生生活的生物学特点,使其可作为适应性进化研究的绝佳生物材料[8]。且随着现代组学技术的发展,已累积了多种绦虫的组学数据,为其适应性进化研究提供了丰富的素材。医学绦虫的适应性进化与寄生环境改变密切相关。在分子层面,绦虫为适应寄生环境改变所做出的反应主要包括:一些新基因的出现或在原基因基础上进化出新的功能(新基因化);一些基因家族出现扩增;一些基因的丢失或原有基因的功能逐渐退化(假基因化);一些基因家族出现收缩[9]。比较组学方法可以获得大量基因变化信息,从而有助于筛选及锁定关键目标基因,进而为目标基因功能机制的研究奠定基础。近年来,比较组学研究主要集中于比较基因组学、比较转录组学和比较蛋白质组学三个层面。基因组数据信息量大,可提供全面的差异基因信息,有助于寻找在物种适应性进化过程中起关键作用的目标基因;转录组则反映了物种在某发育阶段或功能状态下的基因转录信息,是连接生物基因组信息和蛋白质组信息的桥梁,可据此推断相应未知基因的功能,发现新的转录本,可以提供更高效的有用信息,且更具时间空间性[10];蛋白质组可以对基因调节进行动态描述,对基因表达的蛋白质水平进行定量测定,是研究基因表达调控机制的重要手段,通过蛋白质组学可以更精确地发现哪些蛋白质在寄生虫适应性寄生过程中发生了变化。本文对近年来基于组学分析的绦虫适应性寄生机制研究进行综述,总结绦虫适应性寄生过程中组学特征的变化,以期为进一步研究奠定基础。

1 圆叶目(Cyclophyllidea)绦虫适应性寄生过程中组学变化特征

1.1基因组特征 随着蠕虫基因组计划的实施,一些圆叶目绦虫的适应性进化研究已取得了长足的发展。Tsai等[11]从生活史、形态学和比较基因组学三个方面对4种圆叶目绦虫(猪带绦虫、细粒棘球绦虫、多房棘球绦虫、小口膜壳绦虫)的适应性进化过程进行了总结。生活史特征方面,扁形动物相较于蜕皮动物和后口动物首先获得了内寄生功能,圆叶目绦虫在扁形动物的基础上又获得了在宿主间的被动传播和具有脊椎动物中间宿主的功能,而棘球属绦虫又进一步获得了在中间宿主体内的无性繁殖能力;形态特征方面,扁形动物丢失了眼杯,获得了新皮肤素(neodermatan)合胞体上皮细胞,而绦虫则进一步丢失了肠道,出现了体节的分化,其中棘球属绦虫还进化出了含有特殊糖黏蛋白的薄片层;基因组特征则包括基因的获得和丢失两个方面。首先,在基因组特征的获得方面,整个扁形动物出现了:SL反式剪切;通过苹果酸歧化作用的无氧代谢能力的代谢通路将谷氧还蛋白和硫氧还蛋白并发为硫氧还蛋白-谷胱甘肽还原酶;绦虫和吸虫特异性Argonaute蛋白家族、小外显子基因和G蛋白偶联受体PROF1出现进化。绦虫在扁形动物的基础上又获得了一些新的基因组特征,如:双峰内含子分布和独特的脂肪酸转运蛋白的产生;mu类谷胱甘肽S转移酶基因家族、GP50抗原基因家族和四跨膜蛋白家族成员的扩增。绦虫中带属和棘球属物种则进一步出现了热休克蛋白基因家族和物种特异性抗原基因家族的扩增。其次,在基因组特征的丢失方面,整个扁形动物丢失了Wnt基因;NEK激酶、脂肪酸生物合成能力和ParaHox基因;过氧化酶基因;同时完全丢失了vasa、tudor和piwi基因,NF-κB信号通路以及24个同源异形盒基因家族、代谢性蛋白酶和氨基酸生物合成功能。绦虫进一步丢失的基因组特征包括:蝶呤型钼辅因子生物合成通路及10个同源异型盒基因家族;更少的GPCRs和更少的前肽编码的神经肽。

此外,基于比较基因组学,Wang等[12]对亚洲带绦虫、牛带绦虫和猪带绦虫的基因组分析发现,尽管三种绦虫的基因结构基本相同,但一些特异的基因家族在进化速率及多样化过程中存在差异。亚洲带绦虫和牛带绦虫的分化与中间宿主的转换密切相关,且在牛带绦虫和亚洲带绦虫分化过程中,一些基因功能的多样化起到了较为重要的驱动作用。在亚洲带绦虫的适应性进化过程中,其皮层和膜蛋白经历了较高的选择压力从而更快地进化出了适应宿主转换和物种形成的新基因,而这些皮层表面抗原(如抗原gp50等)在与宿主的免疫系统相互作用中起关键作用,对亚洲带绦虫适应新的宿主环境至关重要。此外亚洲带绦虫基因组中有关稳态调节、体壁维持和脂质吸收等基因家族的加速进化和适应性进化也有助于亚洲带绦虫对新的中间宿主的适应。Li等[13]对多头绦虫的基因组分析发现,自从带属绦虫从棘球属绦虫分化出来后,带属绦虫出现了一些转座因子的扩增和小规模的基因复制事件,且这一现象在多头绦虫基因组中尤为明显,然而转座子扩增及基因复制事件在棘球属绦虫中则没有出现。此外,还发现一些与宿主中枢神经相互作用有关的基因(如SLC1A谷氨酸转运蛋白家族等)以及一些可能发生水平转移的基因,这些基因可能与多头绦虫的适应性寄生生活密切相关。Zheng等[14]将细粒棘球绦虫(绵羊G1株)和其他三类寄生虫(第一类营寄生生活,第二类营部分寄生生活,第三类营自由生活)进行了比较基因组学分析,发现细粒棘球绦虫获得了一系列特有的基因,如细粒棘球绦虫特异性B抗原基因(E.granulosusantigen B,EgAgB)、热休克蛋白70(heat shock protein 70,HSP70)、普遍胁迫蛋白(universal stress protein,USP)家族、多聚二磷酸腺苷核糖聚合酶及前胸腺素基因家族等。此外,相较于线虫,绦虫中肌动蛋白、钙黏素蛋白家族的表达也显著升高,这些特有的或出现明显扩增的基因家族可能有助于细粒棘球绦虫的适应性寄生[15]。Maldonado等[16]通过对加拿大棘球绦虫基因组的分析,发现了包括泛素结合酶、含有GPCR水解位点基序的蛋白和糖基转移酶家族在内的三种绦虫特异性扩增基因家族,这些特异性蛋白家族在绦虫的适应性寄生过程中可能扮演重要角色。

1.2转录组特征 相较于其他扁形动物(如涡虫等),绦虫的Wnt基因类型显著减少,只有5个直系同源的亚家族(Wnt1、Wnt2、Wnt4、Wnt5和Wnt11)[17]。研究表明Wnt基因参与绦虫的体节分化过程[18],且Wnt4基因在猪囊尾蚴头节的外翻过程中发挥重要作用[19]。Li等[17]对多头绦虫的转录组分析发现,多头绦虫缺失了Wnt1和Wnt2,并推测Wnt基因家族与多头绦虫的感染性和致病性密切相关;此外,还发现了大量与MAPK信号通路相关的高表达基因。这些高表达基因及Wnt基因家族的变化对于多头绦虫适应性寄生的作用值得进一步研究。同样基于转录组技术,Zhang[20]对豆状带绦虫的幼虫和成虫进行了比较转录组分析,鉴定出4 093个差异表达基因,其中132个基因在成虫期特异性表达,如钙结合蛋白、锌指蛋白、微管蛋白α链、六钩蚴抗原A等,且这些蛋白在其他绦虫成虫中也特异性高表达[21],提示这些基因可能与绦虫成虫细胞分化及节片生成相关。在绦虫的发育过程中,成虫的生长较快,因此需要更多的能量和营养来满足代谢、发育和虫卵产生所需。而且在绦虫进化过程中,逐渐失去了从头合成一些营养物质的能力,如脂肪酸、固醇及一些特定氨基酸等[11],这些营养物质需要从外界转运至绦虫体内以满足其需求,因此相关基因就会在绦虫体内特异性高表达,对于豆状带绦虫来说,其脂肪酸结合蛋白、磷酸酯酶D1及乙酰转移酶等在成虫阶段均出现上调。此外,一些与节片分化和有性生殖相关的基因,如HSP90、精子表面蛋白等在成虫期同样高表达。GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析显示多数差异表达基因与代谢过程和Wnt信号通路相关,而且在成虫期Wnt1、Wnt4、Wnt5等表达显著上调。Basika等[22]对科特氏中殖孔绦虫的幼虫和成虫的转录组分析发现幼虫期高表达的基因多数与无性生殖及幼虫移行相关,而成虫期高表达的基因则多数与发育、细胞增殖、形态发生密切相关。这些差异基因的筛选及深入分析有助于我们对绦虫适应性寄生机制的理解。

此外,研究者还对一些绦虫的密码子使用偏倚(codon usage bias,CUB)及可变剪接(alternative splicing,AS)等特征进行了分析。Huang等[23]基于转录组数据分析了多头绦虫的密码子使用情况,发现核苷酸组成、突变选择压力、自然选择、基因表达水平、氨基酸亲水性平均系数和芳香性(Aromo)以及氨基酸的有效选择等因素均与多头绦虫的密码子使用偏倚相关,其中自然选择的作用最大。此外,差异较大的物种之间密码子使用偏倚的差异度也较大,如多头绦虫、大肠杆菌、酵母和人之间,然而在亲缘关系较近的物种之间密码子使用偏倚的差异度则较小,如多头带绦虫和豆状带绦虫。因此,密码子使用偏倚可以作为物种进化差异的一个重要指标。可变剪接是导致蛋白质功能多样性的重要原因之一,它使一个基因可编码多个不同转录产物和蛋白产物,是后基因组时代研究的热门领域之一。Liu等[24]对细粒棘球绦虫和多房棘球绦虫的可变剪接进行了研究,结果表明在原尾蚴阶段,这两种绦虫的可变剪切方式基本一致。对于棘球属绦虫,内含子保留是主要的可变剪接类型,而非外显子跳跃。此外,KEGG富集分析表明可变剪接相关基因主要与代谢(如嘌呤、脂肪酸、半乳糖等的代谢)、信号转导(如Jak-STAT、VEGF、Notch和GnRH信号传导途径)、遗传信息处理(如RNA转运和mRNA监测途径)等密切相关。

1.3蛋白质组特征 基于蛋白质组学,Zheng[25]对泡状带绦虫囊蚴的包囊液(cyst fluid,CF)进行了分析,发现与细粒棘球蚴绦虫相比,泡状带绦虫具有更多的与氨基酸合成和补体系统相关的CF蛋白。此外,其还具有更多的与谷氨酸代谢和抗氧化反应相关的蛋白。因此,泡状带绦虫囊蚴囊液具有独特的免疫及抗氧化内部微环境,这种特定的内环境有助于泡状带绦虫囊蚴的适应性寄生。Zheng[26]对羊带状绦虫幼虫的蛋白质组学进行分析,发现包括极低密度的脂蛋白受体、烯醇酶、副肌球蛋白和内膜蛋白B1等24种蛋白质在幼虫期高表达。这些高表达的蛋白可能与幼虫的运动、代谢、信号传导、抵抗外界压力、耐药性及免疫反应密切相关。此外,通过与其他5种绦虫(猪带绦虫、亚洲带绦虫、牛带绦虫、细粒棘球绦虫、多房棘球绦虫)的比较组学分析,鉴定出带属绦虫特异性烯醇酶。总的来说,带属绦虫烯醇酶、副肌球蛋白和脂肪酸结合蛋白家族成员的拷贝数要多于棘球属绦虫,提示这些蛋白家族在带绦虫中可能发挥更重要的作用。Monteiro等[27]对两种多房棘球绦虫棘球蚴分离株(EmH95和EmG8065)的囊液成分进行了比较蛋白质组学分析,发现EmH95和EmG8065囊液差异表达蛋白包括抗原、信号蛋白、蛋白水解酶、蛋白酶抑制因子及分子伴侣等。相较于EmH95,EmG8065抵御宿主有害反应及分解代谢宿主蛋白的能力更强,表明EmG8065宿主适应性水平更高,具体表现为繁殖、发育及传播能力更强。另一方面,EmH95在经历几轮实验动物体内传代后,对宿主的抵抗能力明显下降,甚至有可能失去产生原头节的能力。然而EmH95却表现出高表达EGF样蛋白的能力,体外实验表明EmH95具有较高的增殖速率,可能与高表达的EGF样蛋白介导的EGF/EGFR信号通路活跃有关。该研究表明,即使是同一物种的不同分离株之间蛋白质表达水平也存在较大差异,而这些差异表达的蛋白可能与适应性寄生相关。

2 裂头目(Diphyllobothriidea)绦虫适应性寄生过程中组学变化特征

与圆叶目绦虫包括了多数常见的人体寄生性绦虫不同,裂头目绦虫的类群(如欧猬迭宫绦虫、阔节裂头绦虫等)往往被医学绦虫界所忽视,因此其组学研究也比较薄弱。Bennett等[28]对欧猬迭宫绦虫裂头蚴进行了全基因组测序,分析发现相较于带科绦虫(如猪带绦虫、细粒棘球绦虫、多房棘球绦虫等),欧猬迭宫绦虫裂头蚴出现了一些抗原蛋白家族的完全缺失,如EG95、Antigen B和GP50等;一些蛋白家族的扩增量显著降低,如HSP70、四跨膜蛋白等。同时,也出现了一些蛋白家族的扩增量的显著增加,如乳糖转移酶和脂肪酸结合蛋白。与棘球属绦虫相比,欧猬迭宫绦虫裂头蚴的丝氨酸蛋白酶家族和库尼型丝氨酸蛋白酶抑制剂家族出现明显扩增,这些蛋白家族有助于裂头蚴侵入更广泛的宿主。将这些出现扩增的基因家族按照其所执行的生化功能进行排序后发现有9种参与转录调节,由于欧猬迭宫绦虫的生命周期中包括一些形态迥异的生活史阶段,如原尾蚴、裂头蚴及成虫,且这些幼虫或成虫分别适应于不同的宿主[29],因此这些出现扩增的复杂转录调节因子家族为欧猬迭宫绦虫适应于不同生活史时期所需的不同蛋白表达诉求提供了保障;另外还有9种扩增的基因家族参与代谢加工或解毒作用,这些基因家族提供了一系列代谢和细胞解毒的适应性,从而有助于欧猬迭宫绦虫寄生于多种不同的宿主(如甲壳类、两栖类、爬行类及哺乳动物),甚至在水中营自由生活(如钩球蚴阶段)。

对于裂头目绦虫转录组的研究亦十分薄弱。Kim等[30]对欧猬迭宫绦虫裂头蚴的表达序列标签(EST)进行了大规模测序及生物信息学分析发现:纤连蛋白1、某种泛素基因和糖蛋白出现高表达;与糖酵解通路相关的酶出现表达上调;一些蛋白酶和RNA具有高频保守基序。这些高表达的基因家族可能有助于裂头蚴的适应性寄生。然而就欧猬迭宫绦虫的基因表达情况而言,目前仍缺乏其生活史各阶段的转录组数据。

尽管对欧猬迭宫绦虫的基因组和转录组分析加深了我们对该物种的生长发育及致病机制的理解[29,31],但我们对蛋白质翻译后修饰调节的机制仍然所知甚少,而蛋白翻译后修饰调节对理解迭宫绦虫的生长、发育和繁殖至关重要。Liu等[31]对欧猬迭宫绦虫裂头蚴进行了磷酸蛋白质组分析,在1 758个裂头蚴蛋白质中鉴定出3 228个磷酸多肽和3 461个氧化磷酸化位点,这些磷酸化蛋白参与细胞组成、代谢等多种生物学过程。对磷酸化多肽的GO富集分析显示多数裂头蚴的磷酸化蛋白与细胞骨架成分、信号通路的分子功能以及多种生物学过程相关,包括分子功能调节、鸟苷酸耦合因子活性、蛋白酶活性及钙离子结合等。KEGG分析表明氧化磷酸化蛋白的富集通路主要包括磷脂肌醇信号通路系统、吞噬体、胞吞作用、磷脂肌醇代谢、萜类骨架的生物合成及过氧化物酶体等。该研究首次对欧猬迭宫绦虫进行磷酸蛋白质组分析,为我们理解迭宫绦虫蛋白质翻译后修饰调节机制提供了新的视角。

3 总结与展望

绦虫是一类古老的人体寄生虫,早在公元前三世纪,希波克拉底和亚里士多德在其论著中就有关于绦虫的记载[32]。千百年来人类对绦虫及其所致疾病的认识越来越深入,然而对其适应性寄生机制仍所知甚少,组学技术的发展为我们揭示绦虫的适应性寄生机制之谜提供了新的线索。在基因组层面,绦虫在适应性进化过程中出现了一些特有的新基因以及一些基因家族的扩增(如与应激反应相关的蛋白家族、与氨基酸、脂质、糖类及核苷酸代谢相关的蛋白家族、与细胞骨架以及与免疫反应相关的蛋白家族等);同样也发生了一些基因功能的丢失及基因家族的收缩;此外,一些基因功能多样化事件在绦虫分化过程中也起到了一定的驱动作用,这些基因组特征的特异性变化为我们探究绦虫适应性寄生过程中可能起关键作用的目标基因或基因家族提供了重要线索。在转录组层面,在绦虫不同生活史阶段出现一些特异性高表达基因,这些基因与绦虫的生长、发育及环境适应性密切相关;Wnt信号通路及其相关蛋白可能在绦虫的适应性寄生过程中发挥重要作用。在蛋白质组层面,不同绦虫之间蛋白表达水平存在较大差异,这些差异表达的蛋白可能与绦虫的环境适应性相关。纵然现代组学的研究为我们理解绦虫的适应性进化提供了些许的蛛丝马迹,然而,对于多数蛋白家族的进化模式、表达调节机制以及在绦虫的适应性进化过程中的具体作用等仍所知甚少,还需要做进一步的研究,以期早日解开绦虫进化机制这一亘古之谜。

猜你喜欢
绦虫组学宿主
鲫成鱼绦虫病治疗一例
媒介取食偏好和宿主群落组成对多宿主-媒介系统疾病风险的影响
影像组学在肾上腺肿瘤中的研究进展
基于影像组学的直肠癌术前T分期预测
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
牛羊绦虫病的预防和中西医治疗分析
鸟界“神偷”——大杜鹃公审案
抓住自然宿主
绦虫大战,争夺宿主控制权