彭 坤,张少丽,2,魏振宇,李 洁,蓝贤勇*
(1.西北农林科技大学 动物科技学院,陕西 杨凌 712100;2. 西北农林科技大学 创新实验学院,陕西 杨凌 712100)
朊蛋白基因家族的4个基因(PRNP、PRND、PRNT、SPRN)在不同种属之间相当保守,被称为“朊蛋白基因复合体”(Prion gene complex)。传染性海绵样脑病(Transmissible spongiform encephalopathies, TSEs)也称朊病毒病(Prion diseases),朊病毒(Prion)在脑内的淀粉样沉积,引起中枢神经特定区域出现海绵状空泡变化,最终导致人和许多动物出现致死性神经退行性疾病。目前关于TSEs的研究主要集中在PRNP基因上,但PRNP基因作为朊蛋白基因家族的一员,与其它3个基因在定位、结构、表达及其编码产物间存在很多相似性,提示其它3个基因很可能作为TSEs研究的候选基因[1],因此对朊蛋白基因家族的研究对防治TSEs有重要意义。为此,本文从朊蛋白基因家族的结构特征、编码产物的结构及其相互关系、朊蛋白基因家族在TSEs中发挥的作用等三方面进行综述,以期为研究TSEs提供新的思路与理论支持。
作为调控哺乳动物TSEs的主要基因,朊蛋白基因(PRNP)由宿主常染色体上单拷贝基因所编码,基因结构较简单,大多含有三个或五个外显子,无内含子,其开放阅读框(ORF)编码一个约由250个氨基酸组成的正常朊蛋白PrPc,而PrPc构象改变生成的致病朊蛋白PrPsc又称朊病毒(Prion)。人PRNP基因定位于20号染色体的短臂上,小鼠PRNP基因定位于2号染色体的短臂上,常见反刍家畜中PRNP基因大多被定位于家畜13号染色体。PRNP基因在中枢神经系统的神经元中表达量很高,而且该基因具有高度保守性,这也为朊病毒跨物种传播提供了分子基础。
叠朊蛋白基因(PRND)位于PRNP基因下游[2],该基因是单拷贝基因,其基因组成在不同种属之间存在差异,如在人、鼠中由三个外显子框组成,而在牛、羊中则只有两个外显子框,都含有两个内含子,唯一的开放阅读框(ORF)在不同种属中均位于第二个外显子上[3-4]。同一物种PRND基因的变异很小,不同物种间PRND基因的相似程度与物种间亲缘关系远近有关,而且不同种属PRND基因的编码区序列的同源性较高,而非编码区特别是内含子部分的同源性较差,表现出种属间差异性。PRND基因和PRNP基因有各自的启动子,这两个基因的第二外显子序列可以相互剪接,从而产生多种基因间剪接产物。虽然PRNP基因和PRND基因在核酸水平无显著的序列同源性,但是许多学者依然认为二者之间可能存在过基因复制现象[5],而且这种复制源于同一个原始基因SPRN基因[6]。
生物信息学分析表明最初的朊蛋白基因是SPRN基因,随后才有PRNP基因和PRND基因的进化[7]。基因组序列中,PRNP基因、PRND基因与PRNT基因在位置临近,小鼠上位于2号染色体,而SPRN基因位于小鼠的7号染色体上。SPRN基因在自然界中高度保守,小鼠与人类的SPRN基因具有两个外显子,内含子非常短[8],其编码区位于第二个外显子上,基因序列中GC含量较高,不含TATA盒或CCAAT盒,存在转录因子Sp1、AP-2和YY1的结合位点。SPRN基因主要在脑中表达,在其他组织中呈低水平表达。
PRNT基因由于仅在成年动物的睾丸中表达,而被称为睾丸特异性基因(Testis-specific gene)[1],该基因位于基因组序列中PRND基因和PRNP基因的下游,更靠近PRND基因。PRNT基因在人上由两个外显子组成,山羊上则由一个外显子组成[9]。在牛上PRNT基因编码长度为55个氨基酸的N端截短的蛋白质,与人上94个氨基酸长度的同源物相比,这种大小差异是由于牛上该基因5'末端序列中出现了两个单核苷酸缺失,导致终止密码子提前出现。2017年Yong等[9]发现韩国本土山羊的PRNT基因在进化上接近绵羊,这种高多态性的倾向显示出韩国本土山羊与绵羊在序列上的同源性。关于反刍动物PRNT基因是否为假基因的说法一直存在争议,Pimenta等[10]的研究证实公羊和山羊PRNT基因能够表达,提示反刍动物的PRNT基因发挥着相应功能而不是一个假基因。
PRNP基因编码的朊蛋白PrP存在两种形式:正常朊蛋白PrPc和致病朊蛋白PrPsc(朊病毒),PrPc是一种含有糖基磷脂酰肌醇(GPI)的正常宿主膜相关蛋白[11],整个肽分为三个部分:N-端由22个氨基酸残基组成信号肽,C-端由23个氨基酸残基组成的信号肽,中间部分为成熟蛋白的一级序列。当PrPc在翻译后发生某些修饰而错误折叠而转变为PrPsc,会导致朊病毒疾病的发生,PrPsc作为PrPc的构象异构体,两者具有相同的氨基酸序列组成和共价修饰,且一级结构相同,但是在二级结构上差异很大[12]。PrPc对蛋白酶K敏感,而PrPsc的C-端141个氨基酸组成的核心片段则不能被蛋白酶K降解,具有相对的抗蛋白酶水解特性,这是二者的主要区别特征,这一特征是朊病毒检测技术的基础。
PRND基因编码的叠朊蛋白Doppel(PRNPdownstream prion-like protein)是由179个左右氨基酸残基组成的锚定于细胞膜的糖蛋白,其N-端1-23氨基酸残基为信号肽,中间为成熟蛋白,C-端153-179氨基酸残基参与GPI的形成[13]。Doppel为可溶性蛋白,具有热稳定性,在热变性过程中,表现出协同作用和可逆性伸展,在尿素使其化学变性后,表现出完全的、可逆的伸展,同时对蛋白酶K敏感[14]。Doppel与PRNP基因编码的正常朊蛋白PrPc十分相像,作为PrPc的一种横向同源物,其在一级结构上与PrPc的C-端2/3序列约有25%的同源性,缺少PrPc以108位氨基酸残基为中心的构象可塑性区域、八肽重复区(Cu2+结合位点)和一段高度疏水区[4]。Doppel和PrPc的翻译后修饰过程很相像,都包括切除氨基端的信号肽,添加C-端的GPI锚定位点,进行糖基化和形成链内二硫键等。同PrPc一样,哺乳动物的Doppel也存在二聚体结构[15]。尽管Doppel和PrPc在结构上相似,但是两者在分布上差异很大,PRNP基因在几乎所有组织中表达,而PRND基因的表达具有高度的组织特异性和发育期依赖性,主要在睾丸、心脏等组织中表达,乳腺、脾等组织中表达量相对较低[16]。
SPRN基因编码的类朊蛋白Shadoo(Shadow of Prion Protein)是Premzl等[17]利用比较基因组学在基因数据库中发现的一个新朊样蛋白,Shadoo蛋白包括130~150个氨基酸,N-端保守,含有最多6个富含Arg的四肽XXRG(X是G、A或S)重复的碱性区域和长度约为20个AA的与PrPc有非常高同源性的疏水区,蛋白酶消化后都有一个稳定的C1片段,且c-端都有一个GPI锚定位点。Shadoo和PrPc蛋白有很多重叠的生物学性质,PrPc和Doppel都存在的α螺旋在Shadoo中也有,不过Shadoo中的α螺旋更短,所以它不能像PrPc那样组成3个α螺旋的结合体。所有动物的Shadoo都包含一段丙氨酸富含区,唯一与PrPc不同的是Shadoo所表现出来的丙氨酸残基数量的变异性[18]。在羊的脑组织中SPRN基因和PRNP基因的mRNA表达呈现显著的正相关,说明Shadoo与PrPc可能起到一种共同调节的作用[19],在有PrPc的小脑颗粒神经元中Shadoo含量较低,在无PrPc小脑的颗粒神经元中Shadoo含量较高。
PRNT基因编码的Prt蛋白没有信号肽,表明Prt蛋白可能是一种细胞内蛋白[20]。人类PRNT基因的三种亚型都仅在成人睾丸中表达,并不存在于任何胎儿组织中[21]。有人通过免疫荧光技术在公羊精子的顶体区域发现了Prt蛋白,该蛋白主要在公羊精原细胞和精母细胞的核中表达,随后表达于伸长的精子细胞和顶体的脊状子域上,推断Prt蛋白可能在磷酸化信号传导途径中起作用,这一传导途径是精子发生顶体反应和卵细胞受精前的重要条件[11]。上述发现表明,Prt蛋白可能在精子发生起重要作用,影响精细胞的增殖、成熟及受精。
典型的传染性海绵样脑病(TSEs)包括人的克雅氏病(Creutzfeldt-Jakob disease, CJD)、库鲁病(Kuru)、牛的疯牛病(Bovine spongiform encephalopathies, BSE)和羊的瘙痒病(Scrapie)等[22]。TSEs根据其发病原因可以分为散发型(Sporadic)、遗传型(Genetic)和感染型(Infectious)三大类。任意一类TSEs都具有潜在传染性,当PrPsc从一个物种传向另一物种时,PrPsc的致病作用会暂时降低,尤其在第一代中表现为潜伏期延长,表现出“种间障碍”。
PrPsc的致病作用分为三个阶段:第一阶段是PrPsc的形成和蓄积。由于PrPsc的抗蛋白酶的特性而在细胞表面蓄积。在这一期间,PrPsc获得磷酸肌醇磷脂酶C(PIPLC)抗性,其GPI锚能够抵抗PIPLC的降解,于此同时PrPsc的二级结构开始形成较多的β折叠[23-24]。第二阶段是Ctm PrP的形成。在细胞内质网上PrP形成两种显著的形式:镶嵌于膜上和能透过膜的形式,这种透过膜的形式可被蛋白酶降解为两部分:一部分含羧基和糖基,即Ctm PrP;另一部分是含氨基不含糖基,即Ntm PrP。这一过程也是朊病毒单体聚集、聚合的过程,大约有30个左右的单体聚合在一起,而且能够抵抗去污剂的降解。第三阶段是Ctm PrP透过细胞内质网间隙,侵害神经系统。研究表明,Ctm PrP透过细胞质膜间隙后,还可能参与细胞凋亡[25-28]。
TSEs的发生与PRNP基因的遗传多态性有显著相关,该基因的遗传变异主要集中在PrP的编码区[29],在绵羊第三外显子的突变多以单核苷酸突变为主。绵羊第136位(A136V)、154位(R154H)和171位(Q171R或Q171H)氨基酸发生不同取代与绵羊瘙痒病的抗病性/易感性密切相关,AHQ、ARQ、ARH和VRQ被认为是易感的基因型,且VRQ个体具有最高的易感性,而ARR个体具有最强的抗病性[30],此外,编码区102位,112位和137位等多个密码子也影响了绵羊瘙痒病的易感性[31-32];山羊PRNP基因的多态性,如I142M,H143R,N146S/D,R154H,R211Q和Q222K也对羊瘙痒病的感染表现出明显的抗性;在牛PRNP基因的多态位点中,启动子区23 bp、内含子1中的12 bp和翻译区序列中的24 bp片段的indel多样性影响其抗病性,分析增加23 bp插入和12 bp插入的基因频率,可有效提高牛的抗病性[33-34]。
曾有研究称PRND基因的表达上调会加速海绵状脑病的发展[35]。当小鼠大脑中缺乏PrPc时Doppel被表达,随着小鼠年龄的增长可引起神经元的凋亡。而PRND基因敲除小鼠不易感染朊病毒病。但Doppel可能没有参与PrPsc的形成。研究发现,在中枢神经系统中过表达Doppel并不影响朊蛋白的潜伏期、空泡形成和PrPsc聚集或分散等病理过程。由此可见,Doppel可能不与PrPsc发生直接相互作用,不影响PrPsc的形成速率。研究显示,Doppel在啮类动物感染TSEs中不产生影响,说明它可能也同样不涉及其他物种自然发生的TSEs。同时人们也检测了TSEs中PRND基因突变的可能性,通过对人的克雅氏病患者PRND基因分析,发现Doppel蛋白存在一些多态性位点,如T26M,P56L以及T174M等,但这些多态性和人类朊蛋白疾病间似乎并无太大的关系。
PRNP基因突变与朊病毒菌株的易感性使人们意识到了SPRN基因的杂合突变效应,在羊SPRN基因中存在多态性,认为SPRN基因是一个与TSEs有关的一个候选基因。Lampo等[36]对比利时25个不同绵羊品种群体进行研究,发现Shadoo蛋白疏水区两个甘氨酸残基的缺失增强了对羊瘙痒病的易感性;SPRN基因单碱基插入引起的移码突变与人变异克雅氏病相关,两个连锁的SNPs(内含子1和第7密码子)与人克雅氏病有关[37];山羊SPRN基因3'UTR区602-606ins CTCCC与羊瘙痒病存在显著相关;王东旭等[38]发现在转基因小鼠感染朊病毒后,Shadoo蛋白高表达能中和部分PrPsc造成的毒性,Shadoo高表达使神经元糖蛋白显著增加,从而提高了神经保护作用;在朊病毒感染的小鼠脑组织中研究发现,SPRN基因在朊病毒感染的小鼠脑组织中表达量显著下调,当SPRN基因被敲除后,会加重朊病毒感染,反之,提高SPRN的表达量可降低朊病毒的感染机率,证明SPRN基因具有与PrPc相似的神经保护作用;王海鹰等[39]研究发现Shadoo的高表达改变了朊病毒感染小鼠脑的病理方式;而天然Shadoo和PrPsc的终止密码子具有相似的结构域,且都会产生淀粉样蛋白沉淀。
研究表明,PRNT基因在葡萄牙绵羊中具有高度的多态性。2017年Li等[40]对来自五个不同品种的285只绵羊测序,发现了PRNT基因的7个SNP突变。由于PRNT基因在进化和功能上可能与PRNP基因和PRND基因相关,进行PRNT基因相关多态性功能研究对评估其在TSEs中的关系十分重要。TSEs的主要特征是朊病毒PrPsc在脑内聚积形成的淀粉样斑块,尽管Prt蛋白在TSEs中的作用尚未被证实,但Pimenta等[10]通过测定山羊和绵羊的Prt蛋白的结构,发现由于苯丙氨酸残基的存在使山羊Prt呈现出了不同的初级、次级和三级结构,山羊Prt似乎比绵羊Prt更容易形成淀粉样蛋白,表明其与PrPsc存在相关性[11]。
传染性海绵样脑病(TSEs)涉及范围广、危害严重,已引起世界范围的广泛关注。PRNP基因与TSEs的发生有密切关系,PRNP基因编码的正常朊蛋白PrPc构象改变生成的致病朊蛋白PrPsc是TSEs发生的主要原因,PRNP基因的多态性能够影响动物对TSEs的抗病性/易感性。PRNP基因作为朊蛋白基因家族的一员,朊蛋白基因家族其他成员作为研究TSEs的候选基因应该引起研究人员的关注。朊蛋白家族的4个基因PRNP、PRND、PRNT和SPRN在结构、定位、表达上存在联系,它们的编码蛋白PrP、Doppel、Prt和Shadoo在结构上也具有相似性,在功能上往往发挥着协同或拮抗作用,提示朊蛋白基因家族及其编码产物间的相互关系在未来应该进行更深入的研究。