徐文华 牛长敏 夏蒙蒙 郑 英**
1. 扬州大学医学院组织学与胚胎学教研室(江苏扬州 225000);2. 江苏省非编码RNA 基础与临床转化重点实验室(江苏扬州 225000)
精子发生是精原细胞经过高度复杂的分裂增殖、分化变形, 最终形成精子的过程。 精原干细胞(spermatogonial stem cell,SSCs)经过一系列有丝分裂扩增产生初级精母细胞,后经历连续两次的减数分裂,形成单倍体圆形精子细胞,再经过一系列如染色质浓缩、精子尾部形成等细胞学和形态学变化, 最终形成结构完整的精子。
从分子水平看, 精子发生和成熟分化过程是一系列特定基因程序性表达的过程。 众所周知,转录水平的调控在基因表达调控中发挥重要作用,随着研究深入,科学家发现转录后调控在基因表达调控中同样起着十分重要的作用。 基因在核内转录后, 新合成的前体mRNA(pre-mRNA)或核异质RNA(hnRNA)经过加帽、选择性剪切和合成多聚腺苷酸尾等一系列事件后成为成熟的mRNA。 成熟的mRNA 被运送到细胞质,其在细胞质中的定位、翻译和代谢受到严格的调控。
RNA 结合蛋白(RNA Binding Protein,RBP)是一类伴随RNA 的调控代谢过程, 与RNA 结合的蛋白质总称。RBP 在转录后基因表达调控中起着重要作用,它参与RNA 代谢的各个方面。 RBP 和RNA 可以在细胞核结合,也可以在细胞质,但是功能有所不同。 在胞浆发生结合的RBP 参与RNA 的翻译以及mRNA 的稳定性保持, 而在胞核发生结合的RBP 可能与剪接或成熟相关。RBP 对目标序列的要求并不如DNA 结合蛋白一般严格, 一般结合在3' 非翻译区(3'untranslated region,3'UTR),少数在5'UTR,极少见于蛋白质编码区。
在精子发生中,RBP 的功能多样,除了在精子发生后期mRNA 的剪切加工、运输及翻译等方面起作用外,还在雄性和雌性配子发生的减数分裂前期起重要作用,因此,其结构或者功能的异常往往导致疾病的发生。
本文总结了目前与哺乳动物精子发生相关的RNA结合蛋白,并按照有无RNA 识别基序(RNA recognition motif,RRM)进行分类,试图揭示它们与不孕不育症之间的联系, 并为临床上不育症的诊断和治疗提供思路及理论依据。
RRM 又被称为RNP 基序(ribonucleoprotein motif,RNP) 或者CS-RBDs (consensus sequence RNA-binding domain)。 具有RRM 的RNA 结合蛋白在已知的RNA结合蛋白中被研究得十分深入。 这些RNA 结合蛋白参与RNA 前体的剪接、RNA 的细胞定位和维持RNA 的稳定性等转录后调控过程。1976 年Tiepob 等在Y 染色体上发现了与精子发生相关的基因并提出了无精子因子位点假说(azoospermia factor,AZF),后Vogt 发现Y染色体长臂上的缺失不是单一的位点, 而是三个非重复区域,称之为AZFa-c,在这三个区域上克隆的多个候选基因都是具有RRM 的RNA 结合蛋白。
RBM 基因家族最早被发现时,它定位在人类Y 染色体长臂末端,该区域在一部分不育男性中缺失。 应用RBM 抗体在Y 染色体缺失的不育男性睾丸组织进行免疫细胞化学研究, 结果证明大部分或所有活性拷贝都位于AZFb区域内。目前发现RBM 家族有三个成员,分别是RBMY(RNA binding motif Y chromosome)、RBMX(RNA binding motif X chromosome)和hnRNPGT(an acronym of heterogeneous ribonucleoprotein G expressed in the testis)。RBMY 在人类、小鼠和有袋类动物的Y 染色体上发现, 在进化上高度保守。 人类RBMY 蛋白在生殖细胞的所有转录活性阶段都有表达, 且仅在细胞核中表达, 而小鼠RBMY 只在精原细胞和早期精母细胞中表达, 这提示在小鼠中RBMY 基因可能在减数分裂过程中失活。对RBMY 功能进入深入研究时,使用的是染色体为XO 的雄性小鼠。 这些小鼠含有编码Sry 的转基因和一个Y 染色体编码的RNA 结合蛋白Eif2s3y。在这些小鼠的精子发生中能够完成第一次减数分裂,这意味着RBMY 的表达在精子发生的后期才需要。
RBMY 有一种广泛表达的X 染色同源蛋白RBMX。 Ehrmann 等研究了RBMX 的同源蛋白RBMXL2(RNA binding motif X chromosome like 2),其基因缺失会阻碍雄性小鼠产生精子,小鼠不育,他们进一步利用RNA 测序实验表明,RBMXL2 蛋白通过防止小鼠基因中的外显子和内含子被重新排列来确保正确剪接[1]。 在表达RBMXL2 减数分裂及减数分裂后生殖细胞中,RBMX 和RBMY 基因在XY 异染色体结构中被转录失活。 因此,在第一次减数分裂中,RBMX 或RBMY 不可能产生冗余效应。分析表明,RBMXL2 蛋白是减数分裂的关键蛋白, 在保护减数分裂转录组免受染色体剪接位点异常选择方面起着重要作用[2]。
这个基因家族的第三个重要成员是hnRNPGT,它是逆转录基因编码的。 hnRNPGT 蛋白在粗线期精母细胞核和圆形精子细胞中特异性表达。 这种减数分裂特异性表达提示hnRNPGT 在XY 体内失活时可能取代RBMX 的功能,或在RNA 加工的调控中承担了其它功能。 hnRNPGT 基因缺陷导致小鼠生育能力下降,提示该基因的遗传缺陷可能是人类男性不育的原因。 与此假设相一致,hnRNPGT 基因突变已在精子发生受损的不育患者中发现[1]。
DAZ 基因是从位于人类Y 染色体长臂的AZFc区域分离得到的, 此区域在精子轻度缺乏及重度缺乏的男性不育患者中广泛缺失。DAZ 家族由三个成员组成:包括1 个Y 染色体基因DAZ 和2 个常染色体基因DAZL(deleted in azoospermia-like,DAZL)、Boule[3]。
这3 个基因的编码蛋白均为RNA 结合蛋白,在生殖细胞中特异表达,参与调节生殖细胞的发育和分化。DAZ 只存在于灵长类动物中, 而DAZL 和BOULE 则存在于所有脊椎动物中。 DAZ 家族成员仅在生殖细胞中表达,其蛋白产物含有高度保守单一的RRM 和独特的DAZ 重复序列。DAZ 和DAZL 蛋白已经在原始生殖细胞(Primordial germ cells,PGCs)和精原细胞中表达,并定位在细胞核中。 它们持续表达于精母细胞中,其定位转换为细胞质。 相比之下,BOULE 的表达较晚,在睾丸减数分裂前后表达。
DAZ 基因是精子生成的关键基因, 在减数分裂过程中起重要作用。DAZ 基因缺失,会导致精原细胞和精母细胞不能成功变形为精子, 分别表现为无精子症和严重少精子症而导致不育。有研究结果表明,DAZ 不仅通过连接到多个RNA 上来介导与多核糖体的联系,而且在精子发生的第一阶段起维持精原干细胞群数量的作用。 另外,DAZ 在精子发生后期RNA 代谢过程中起调节作用。
小鼠生殖细胞中DAZL 在出生后特异性缺失不影响雌性生殖能力,但可导致雄性完全不育,精原干细胞逐渐丧失,减数分裂停止。研究发现小鼠DAZL 在3'非翻译区(3'UTR)与大量睾丸mRNA 转录物结合,并与含有ploy(A)结构的翻译蛋白相互作用。 在缺乏DAZL 的情况下,多聚体相关的靶基因转录显著减少,导致大量生精蛋白的减少,从而导致精子发育停滞[4]。 由此推断DAZL 是精子发生必需的翻译调节因子。
BOULE 基因表达水平的降低或缺乏、BOULE 蛋白表达的缺乏引起减数分裂阻滞 (meiotic arrest,MA)和精子生成障碍,从而导致不育。 BOULE 蛋白在转录后翻译水平上起重要作用。 研究发现,果蝇的BOULE基因通过调控twine 基因(Cdc25 磷酸酶基因)来实现对减数分裂过程的调控。 另外还有研究发现, 将人类BOULE 基因转入BOULE 基因突变的不育果蝇中可以恢复其精子发生过程,说明在人类中BOULE 蛋白作为减数分裂调控因子可能与果蝇同源基因有相同或相似的功能。
Elavl1 类蛋白含有3 个高度保守的RRM 结构域,其中两个是串联重复的, 第三个RRM 与前两个RRM由富含碱性氨基酸的片段分开。 Elavl/Hu 家族主要由四个蛋白构成,Elavl1(又称HuR)是其中之一,它在转录后调控中具有多种作用,包括mRNA 的加工、输出、翻译和降解[5]。 在小鼠生精细胞中,Elavl1/HuR 主要在粗线期精母细胞和圆形精子细胞中表达。Elavl1 缺失导致雄性小鼠不育, 其原因是减数分裂时精母细胞大量死亡以及圆形精子细胞无法分化成细长型的精子细胞。因此,Elavl1 缺失的小鼠附睾中没有精子。有研究表明,Elavl1 缺失或高表达都会导致热休克蛋白A2(Heat Shock Protein A2,HSPA2) 下调,Elavl1 与HSPA2 mRNA 特异性结合, 在生殖细胞翻译水平上控制HSPA2 mRNA 的表达[6]。
TIAR 蛋白在其氨基末端具有3 个RRM(RRM1、2和3), 在羧基末端具有一个富含谷氨酰胺的结构域。TIAR 作用于真核翻译起始因子2α (eukaryotic Initiatiion Factor 2α, eIF2α) 磷酸化的下游, 促进应激颗粒(Stress Granules,SG)的组装,也促进应激情况下mRNA的分型。
敲除TIAR 基因的小鼠显示出生存能力下降,只有14%的小鼠能够成年, 且雄性、 雌性小鼠均不育的。TIAR 基因敲除小鼠的生殖腺中完全没有生殖细胞。 在TIAR 基因敲除小鼠中,11.5 dpc(days post coitum)胚胎PGCs 到达生殖嵴,但与野生型胚胎相比,其数量明显减少。在没有TIAR 的情况下,PGCs 很快从发育中的睾丸中消失。 这些观察结果表明,TIAR 在精子发生初期是必需的[7]。
TDP-43 是一种DNA/RNA 结合蛋白, 它参与了睾丸组织中基因表达的调控, 该基因缺失会影响男性的生育能力。 TDP-43 不仅可以参与mRNA 的剪切,而且还是一个转录抑制因子, 有研究发现TDP-43 中的RRM1 识别位点在转录抑制上起着重要作用[8]。
PIWI 蛋白属于Argonaute 家族的PIWI 家族分支,具有特征性的位于序列中间呈月牙形的PAZ 结构域(PIWI-Argonaute-Zwille domain),PIWI 家 族 在 人 类 中由HIWI、HIWI2、HIWI3 及HILI 四种蛋白组成,而在小鼠中,由MIWI、MIWI2 和MILI 三种蛋白组成。
在小鼠基因敲除实验中,MIWI 和MILI 被证明是精子发生必不可少的[9]。 MIWI 基因敲除小鼠精子发生停滞在早期圆形精细胞阶段;MILI 基因敲除可导致精子发生停滞于减数分裂偶线期和粗线期之间; 而MIWI2 基因缺失的表型类似于MILI 基因敲除小鼠,精子发生停滞在减数分裂前期[10]。
PIWI 蛋白中有许多分子具有生殖系统特异性,并且在生殖发育中功能保守, 它们利用生殖系统特异的PIWI 相互作用RNA(piRNAs)抑制转座因子并保护生殖细胞基因组的完整性[11]。 PIWI 蛋白还可能参与前精原细胞的甲基化重建, 并且调节圆形精子中某些编码RNA 的表达。
小鼠MIWI 与APC/C(anaphase promoting complex,cyclosome)E3 复合物相互作用, 并在晚期精子细胞中被APC/C 泛素化。有研究表明,MIWI/piRNA 机制不仅负责在精子形成后期消除mRNA, 为精子的产生做准备,而且他们意外地发现,同样的机制也负责激活一部分精子mRNA 的翻译,以协调精子形态的转化。这种作用需要piRNAs 与靶mRNA 在其3’UTRs 中以特异性碱基配对相互作用, 通过与顺式作用的富AU 序列偶联激活翻译, 以特定发育阶段的方式形成MIWI/piRNA/eIF3f/HuR 超复合物。 这些发现提示piRNA 在翻译激活中起着关键作用,这在精子细胞发育中是必需的[12]。
STAR 家族是一类参与细胞分化的进化保守型RBP。 他们的特征是具有KH(hnRNP K homology)结构域[13]。 KH 结构域及其邻近区域被称为STAR/GSG(GRP33、SAM68、GLD-1)。 Sam68 亚家族成员在小鼠精子发生中发挥重要作用, 包括Sam68、SLM-1 和SLM-2。
Sam68 在小鼠精子发生中起着重要作用。 Sam68表达广泛,且在精原细胞、粗线精母细胞和圆形精子细胞的核中高表达,Sam68 在精母细胞核中的保留依赖于细胞RNA 的完整性,这表明该蛋白被招募到转录活跃的染色质中。 小鼠Sam68 基因敲除模型的特点是精子发生的阶段特异性停止,实验用磷酸化的RNA 聚合酶II (RNA polymerase II,RNAPII) 染色确定了Sam68的表达仅局限于精子发生的转录活跃阶段。 此外,Sam68 与生殖细胞中的剪接调控因子相关,Sam68 在体内与内含子7/外显子8 周围的序列结合, 从而影响磷酸化RNAPII 和一般剪接因子U2AF65 的募集。这些结果表明,Sam68 可在生殖细胞分化过程中调节转录活性位点的选择性剪接[14]。
SLM-1 可能在有丝分裂过程中作为Src(sarcoma)的多功能转接蛋白发挥作用。 SLM2(又称T-STAR)与Sam68 高度同源, 它在精母细胞和精子以及成人大脑的特定区域高度表达。SLM2 参与组织特异性调节神经元前mRNA 的选择性剪接[15]。 有研究通过对睾丸cDNA 文库进行酵母菌双杂交筛选试验发现SLM2 能与RBM 的SRGY 重复序列发生特异性结合,进一步研究发现SLM2 通过对RBM pre-mRNA 的加工而参与了精子发生过程。
在果蝇中,Nanos 是一种编码RNA 结合蛋白的母源效应基因,它在胚胎轴的形成和性腺中PGCs 的迁移都必不可少。 哺乳动物中的Nanos 家族由Nanos1、Nanos2 和Nanos3 三个基因组成。 小鼠Nanos1 在雄性和雌性生殖细胞中均有表达, 但其缺失并不影响生育能力。 然而Nanos2 和Nanos3 的缺失则可分别导致雄性或两性不育。
Nanos2 蛋白主要在胚胎雄性生殖细胞从14.5~18.5 dpc 表达。 在小鼠精子发生过程中,Nanos2 结合mRNAs 形成的复合物通过双重机制稳定SSCs 的内环境。 其一是直接募集SSCs 分化相关的基因并且抑制其转录物的翻译, 其二则是抑制哺乳动物雷帕霉素靶蛋白敏感型复合体(mammalian Target of Rapamycin complex 1,mTORC1)信号通路[16]。 有研究发现,微小RNA(microRNA,miRNA) 也参与了Nanos2 基因表达的调控,miR-34c 与Nanos2 mRNA 的3’UTR 结合,在转录后水平抑制Nanos2 的表达,促进小鼠精原干细胞分化[17]。同时有研究表明,Dazl 的过表达会阻止雄性PGCs 性别分化, 而Nanos2 能与Dazl mRNA 的3’UTR 相互结合,抑制Dazl 基因的表达,从而促进雄性PGCs 的性别分化[18]。Nanos2 还可以抑制减数分裂诱导因子Stra8(stimulated by retinoic acid gene 8) 的表达, 阻止PGCs进入减数分裂[19]。
Nanos3 表达于9.5~14.5 dpc 的雄性和雌性胚胎生殖细胞中。 尽管Nanos3 在生殖细胞和体细胞中都可以被转录, 但它只在生殖细胞中被有效地翻译。 研究发现, 体细胞中Nanos3 的翻译抑制则是由3’UTR 介导的mRNA 失稳机制引起的。 在CAG 启动子的控制下(CAG 启动子诱导生殖细胞和体细胞中普遍存在的强转录), 在外源基因编码区添加Nanos3-3’UTR 序列也能有效地抑制生殖细胞中的蛋白质表达[20]。
PTB 家族包括PTBP1(通常称为PTB)、PTBP2(又称脑或神经元PTB、brPTB、nPTB) 和PTBP3 (也称为Rod1)。 在小鼠睾丸中,PTBP1 表达局限于精原细胞,而PTBP2 表达于精母细胞和精子细胞。
PTBP1 是一种高度保守的RNA 结合蛋白,是已知的选择性剪接调控因子[21]。在体外培养的生殖系干细胞中,4-OHT (4-羟基他莫昔芬) 诱导生殖干细胞PTBP1基因缺失,可导致严重的细胞增殖停滞,并促进凋亡细胞的死亡。 这些结果表明,PTBP1 通过调节精原细胞增殖而参与精子发生[22]。 Ptbp1 基因敲除可导致小鼠胚胎致死。 在生殖细胞特异性Ptbp1 条件基因敲除(cKO)小鼠,3 周龄之前其睾丸重量与对照组相当, 但2 个月龄时cKO 小鼠的睾丸重量明显比对照组轻[23]。
生殖细胞特异性Ptbp2 基因敲除小鼠精子细胞的延长严重受损[24],这表明PTBPs 是一种高度保守的基因在精子发生中起着必要的作用。 在胚胎大脑中,PTBP2 作为沉默子调控选择性外显子上游和内部的剪切。 在生殖细胞中,PTBP2 是否有类似的作用尚不清楚。 PTBP2 在生殖细胞转录后控制中具有非剪接性作用。Xu 利用磷酸甘油酸激酶2(phosphoglycerate kinase 2,Pgk2)mRNA 的3’UTR 亲和层析, 鉴定出小鼠睾丸中的RNA 结合蛋白PTBP2。 结果表明,PTBP2 与睾丸中Pgk2 mRNA 结合,并且是与Pgk2 3’UTR 的特定区域结合。在HeLa 细胞体外实验中,Ptbp2 增加了PGK2 mRNA 的半衰期,这表明Ptbp2 在精子形成过程中稳定了PGK2 mRNA 的表达[25]。
Y-box 蛋白是功能保守的DNA 和RNA 结合蛋白,在生殖细胞中,对mRNA 的结合和调控发挥重要作用。 在小鼠中存在三个Y-box 基因:YBX1、YBX2 和YBX3。 YBX2 和YBX3 在减数分裂细胞和减数分裂后细胞中均有表达,对精子形成至关重要。
YBX2 基因敲除小鼠睾丸内减数分裂后的生殖细胞中存在形成缺陷,附睾中未见精子。YBX2 在细胞核中起转录激活作用,在细胞质中起翻译调节作用。通过对敲除了生殖细胞的小鼠中靶mRNA 转录产物(如鱼精蛋白和过渡蛋白)的分析发现,YBX2 缺失主要影响这些mRNA的多体招募[26],表明该蛋白的基本功能是在转录后调控基因表达。 利用YBX3 表达延长到圆形精子细胞后的转基因小鼠, 可以证明了YBX3 干扰了带有3’UTR Y-box识别序列的时间控制mRNA 的翻译激活。
上述RNA 结合蛋白基因敲除后均影响小鼠的生育能力,还有一些RNA 结合蛋白,其基因敲除后对小鼠的生育能力没有显著的影响,例如TIA-1、PUM 等,它们可能与通过与其他分子共同作用调控精子发生过程。
目前,关于RNA 结合蛋白的研究取得了长足的进展,在一定程度上为男性不育的发病机制提供了依据。随着研究技术的不断进步和发展,对RNA 结合蛋白的作用及调控机制将会有更加清晰的认识, 也会为男性不育症的临床诊断和治疗提供新的思路。