饶家辉,周 虚
(吉林大学畜牧兽医学院,吉林 长春 130062)
干细胞(stem cell,SC)是具有自我更新、高度增殖和多向分化潜能的细胞群体。依据其分化潜能的宽窄可分为全能干细胞和三胚层多能干细胞;根据其来源可分为成体干细胞、胎儿干细胞、胚胎干细胞(embryonic stem cel1,ESC)、核移植干细胞和诱导多能干细胞。ESC作为一种高度未分化的典型多能干细胞在近年来受到了学者的广泛研究。它是从囊胚期的内细胞团(inner cell mass,ICM)和早期胚胎的原始生殖细胞(primordial germ cell,PGC)中分离得到的。ESC具有发育的全能性,能分化出成体动物的所有组织和器官,包括生殖细胞。将诱导因子转入分化的体细胞,通过基因重编程的方法获得具有类似ESC并具有相似分化潜能的细胞称为诱导多能干细胞(induced pluripotent stern cell,iPSC)。ESC和iPSC都依赖于基本的转录框架,该框架都被通常的一套核心特异性干细胞转录因子所支配[1]。反过来,这些转录因子又与特异性细胞调控因子一起调节复杂的基因表达程序,这些表达程序在驱使谱系特异化发育程序的同时,还赋予干细胞独特的能力来维持其干性[2]。在ESC和iPSC中,有成千上万的细胞因子表达,而Oct4和Sox2却发挥着这一关键转录因子的调节作用。Oct4和Sox2两种因子能维持ESC的特性,并调控胚层的选择。Oct4能抑制向神经外胚层分化,促进中胚层和内胚层分化,同时Sox2能抑制向中胚层和内胚层分化,而促进神经外胚层分化。分化信号连续不均匀地调节着Oct4和Sox2蛋白水平,改变着他们在基因组中的结合模式,并导致细胞命运的选择和分化[3]。
ESC是否分化及其分化方向受到胞内多种基因的严密调控,Oct4基因是其中关键基因之一。Oct4也被称为Oct3、POU5F1、OTF3或OTF4,是POU转录因子家族中的一员。人的Oct4基因位于6号染色体上(6p21.31),长度为16.40kb,具有多个转录起始位点,转录不同的mRNA亚型(Isoform),从而翻译成多种蛋白质。目前,已发现Oct4基因共有11种亚型Isoform 1~11,翻译7种蛋白质。Isoform 1、2、3、4、5和Isoform 11各翻译一种蛋白质,Isoform 6~10转录的mRNA不同但其翻译的蛋白质相同[4]。限于检测技术的发展水平,目前对Oct4Isoform的研究较少,且多数集中在Oct4 Isoform 1、3、7等3个代表性亚型,尤其是对Isoform 1的研究比较深入。Isoform 1是最普遍,也是转录最主要的亚型之一,在一些文献中常被称为Oct4A,一般关于Oct4的研究都是针对此种亚型;Isoform 3表达于胚胎4细胞以前的细胞质和非多能细胞的细胞核中,为文献中常提到的Oct4B,全长1157bp,编码265个氨基酸,它不能激活Oct4依赖的启动子转录下游基因,但在细胞应激反应中发挥着重要调节作用;Isoform 7在胃、脑、ESC、H9细胞系中均有发现,全长1733bp,编码164个氨基酸,对其功能目前还不清楚。
Oct4转录因子具有5个外显子,4个内含子,全长1387bp,包含360个氨基酸残基,其中N末端133个,POU结合区156个,C末端71个。Oct4蛋白质的N端133个氨基酸翻译的蛋白质含有一个保守的结构域,它能与DNA结合,从而调控下游靶基因的转录,在已分化的细胞中不表达。Oct4蛋白的N端和C端各有一个脯氨酸富集区,这些脯氨酸富集区是Oct4因子的转录活性区。POU结合域有两个亚区,特异结构域和同源异型结构域,每个亚区都能独立地结合DNA八聚体基序。特异域又称保守结构域,位于N末端,由富含脯氨酸和酸性残基的79个氨基酸组成,序列能够包绕DNA转录激活区,具有活化作用。同源域位于C末端,是磷酸化调节位点,由60个氨基酸组成,除富含脯氨酸残基外,还有苏氨酸和丝氨酸残基。这两个亚区间通过含有17个氨基酸组成的易变区相连接,经螺旋-转角-螺旋结构与DNA结合位点发生联系,其回文识别序列为ATTTGAAATGCAAAT,该序列是骨桥蛋白(osteopontin,OPN)的第一个内含子,可结合两个Oct4蛋白分子[5]。POU特异域的特征性结构为ATTTGAAA八聚体结构域,Oct4蛋白分子可与特异域结合,激活启动子和增强子区域内带有顺式反应元件基因的转录。POU同源域的特征性结构为ATGCAAAT八聚体结构域,又称为Oct结构,Oct4分子也可通过结合同源域而活化相应靶基因,激活或抑制干细胞分化过程中基因表型的转变[6]。
Oct4基因对大量靶基因及其自身编码基因的转录调控,主要是通过其前馈系统、自身调节网络和与其他信号转导通路协同作用来实现。Boyer LV等鉴定出人类ESC中有623个(3%)蛋白质编码基因和5个(3%)miRNA编码基因的启动子与Oct4关联。这些基因大约一半是Oct4、Sox2和Nanog共同的靶基因,包括参与维持ESC多潜能性和自我更新的重要调节通路 Tgf-β(如 TDGF1、LEFTY2/EBAF)和 Wnt(如 DKK1、FRAT2)的基因。在人ESC中,Oct4也可通过调节STAT 3的表达来调控JAK-STAT 3信号转导通路,从而对细胞的增殖分化产生作用。此外,Oct4也会通过占据调节细胞分化的PRC2基因的靶基因而控制细胞的分化。通常认为,成纤维细胞生长因子(fibroblast growth factor,FGF)、未分化细胞转录因子1(undifferentiated embryonic cell transcription factor,Utf-1)和锌指蛋白42(zinc finger protein,Zfp-42)等是Oct4在ESC中特异作用的靶基因,但 Otx2、lefty1/Ebaf、Upp/383等在ESC中也依赖于Oct4而表达。同时,ESC也存在负反馈调节机制。Niwa H等研究表明,Cdx2、鸡卵蛋白上游区动子转录因子(chicken ovalbumin upstream promoter-transcription factors,COUP-TFs)和生殖细胞核因子(Germ cell nuclear factor,GCNF)等,可能在不同时期参与抑制Oct4的转录,这些反馈机制把Oct4的表达维持在特定范围内,从而维持ESC的未分化状态及多能性。
在胚胎发育的不同阶段,Oct4的表达具有严格的时间顺序性,从2细胞到8细胞,直至桑葚胚致密化之前,Oct4在胚胎细胞中均高表达,此后表达逐渐下调,直至消失。在体外,Oct4和Nanog都只在未分化的ESC、胚胎细胞(embryonic cel1,EC)和胚胎生殖细胞(embryonic germ cel1,EGC)中表达,当诱导分化时它们表达量下降。Oct4基因敲除的小鼠只能发育到类似囊胚的阶段,然而该囊胚内细胞团中的细胞不具有发育全能性,只能形成滋养外胚层。ESC的多能性对Oct4的表达水平相当敏感,Oct4的过表达也能导致胚胎向中内胚层分化。
Takahashi K等[7]将反转录病毒作为载体,导入4个转录因子 Oct4、Sox2、kLF4和C-Myc,将小鼠胚胎成纤维细胞重编程至多能状态。他们利用同样的4个转录因子导入到人类表皮成纤维细胞中,又获得了人类iPS细胞系。与此同时,YU J等[8]利用慢病毒作为载体,导入4个转录因子Oct4、Sox2、Nanog、Lin28,同样将胎儿成纤维细胞诱导为人类iPSC。Huangfu D等[9]使用丙戊酸(组蛋白乙酰基转移酶抑制剂),只需导入Sox2和0ct4两种因子,即可获得iPS细胞。Nakagawa M 等[10]进一步证实,Oct4不能被其家族成员替代,而另外3个基因Sox2、kLF4和C-Myc则分别可以被Sox1或Sox3、kLF2和N-Myc或L-Myc替代。有研究表明,敲除Oct4基因时,小鼠胚胎是不能形成内细胞群即全能干细胞;通过沉默Oct4基因,鼠和人ESC会向滋养层细胞分化。以上研究结果均提示Oct4在重编程过程中似乎是不可或缺的,但Shi Y等[11]发现BIX-01294(组蛋白甲基转移酶G9a的抑制剂)可以替代Oct4诱导神经干细胞形成iPSC。Lengner C J等[12]研究认为缺失Oct4的鼠成体干细胞依然能够维持其自我更新。Heng J C等[13]报道孤核受体Nr5a2可以取代Oct4,与Sox2、kLF4一同将MEFs重编程为iPSC。这些成果为Oct4作用机制及功能研究提供了一种新的方式,有助于Oct4机制研究的不断深入。
干细胞是否选择分化,Oct4转录因子是关键。Oct4蛋白与竞争对手POU2F1蛋白都能和一种8个碱基的DNA序列相结合。但哪种蛋白先结合,会影响到一个干细胞是分化还是保持多能状态。Ferraris L等[14]研究表明,Sox2蛋白是决定因素,该蛋白能帮助这两种蛋白与DNA序列结合。Sox2是一种与SRY蛋白相关的含HMG box的转录因子,分子质量约为35ku。Sox2的cDNA全长约2.40kb,编码319个氨基酸。Sox2蛋白的N末端第40~65个氨基酸内富含疏水氨基酸,接下来是79个氨基酸的 HMG-box,紧挨 HMG-box的是一段B组的同源序列,然后是199个氨基酸的C末端。Sox2的HMG box以高度亲和力结合特异的DNA靶序列(A/T)(A/T)CAA(A/T))G,其表达蛋白的C末端是其转录激活区域,包含了一段富含丝氨酸的序列。在脊椎动物Sox2mRNA 3′非翻译区(3′un-translated region,3′UTR)中存在4段非常保守的富含AU的区域,Sox2的3′UTR可能参与了其转录后调控。Sox2与Sox1、Sox3同属Sox家族B组的Bl亚组,它们的HMG-box同源性高达96%。与大多数转录因子不同的是,Sox蛋白都是在小沟处结合DNA,并引起DNA双螺旋以80°弯曲。
Stevanovic M等首次克隆出人的Sox2基因,位于第3号染色体的长臂q26.3~27位置。Yuan B等从胚胎癌细胞(embryonic cancer cell,ECC)的cDNA文库中克隆了小鼠Sox2的全长cDNA。他们发现Sox2基因主要是协同Oct4基因发挥调控作用,其启动子区域缺少TATA box元件,但有一个倒转的CCAAT box元件,位于-60bp处。CCAAT box元件能结合NF-Y、CDP和CTF/NF-1等一系列的转录因子。与Oct4基因相似,FGF、OPN、Utf-1、Fbx15等基因是Sox2作用的靶基因,他们通过对靶基因的转录调控或占据靶基因的调节区域来共同控制多能因子的表达。
Sox2基因在成熟的ICM、外胚层和生殖细胞中均表达;在胚胎发育的不同阶段均有表达。在体外,在未分化的ESC、ECC、PGC和神经干细胞(neural stem cell,NSC)等细胞中表达,但会随着这些细胞的分化而下调。Arnold K等[15]研究显示,Sox2不仅在中枢神经系统发育的一些未分化的干细胞或前体细胞中表达,在成人神经区的大脑、视网膜、舌、气管、支气管上皮细胞以及睾丸、子宫颈、晶状体上皮细胞、腺胃、食道鳞状上皮细胞均有表达。同时试验证明,小鼠胚胎E13.5和E15.5的Sox2基因与成人组织表达的Sox2基因均来自ESCSox2基因,这预示着Sox2基因可能是一种“长寿”基因,在各类组织细胞的分化和自我更新中可能扮演着更加重要的角色。
Sox2是脊椎动物早期发育中最早表达的神经系统特异性基因之一,同时在干细胞的维持中也起着关键作用,并常被作为一种多能性细胞谱系的分子标记。Sox2基因在成人组织细胞中表达并具有广泛的调节作用,特别是在保持组织稳态性方面具有重要功能。为此,Sox2可以作为一个共同的干性基因,调节不同类型干细胞和组织的自我更新[16]。缺乏Sox2的胚胎由于不能形成上胚层而在附植时发生死亡,敲除Sox2基因的小鼠胚胎在着床期因卵圆柱结构缺失而死亡,而且这种囊胚无法在体外获得非分化的细胞,只产生滋养外胚层和原始内胚层样细胞。体外敲除Sox2基因可导致ESC分化为滋养外胚层[17]。但随着研究的进一步深入,发现Sox2因子并非不可或缺,可用其他转录因子代替。Kim JB等[18]通过导入外源性转录因子Oct4和kLF4或者Oct4和C-Myc,将NSC重编程为iPSC,之后他们只用了一个转录因子Oct4就将小鼠NSC重编程为iPSC[19]。有试验证明[20],敲除Sox2的小鼠ESC再导入Sox2和Oct4又恢复了ESC功能。这说明Sox2的主要功能是维持Oct4的表达,其作用机制主要是与Oct4一起组成Oct4-Sox2复合物,对Oct4的表达起协同或拮抗作用。Masui S等报道Sox2的作用在于协同Oct4激活Oct4-Sox2增强子,进而调节多能性相关基因Nanog、Oct4和Sox2的表达,使ESC维持在未分化状态。
Nanog基因同Oct4、Sox2一样,在早期胚胎发育和维持干细胞自我更新和多能性方面起着非常重要的作用,在ESC、EGC及ECC中表达,在造血干细胞、腔壁内胚层、成纤维细胞、成体组织或分化的ESC中不表达[21]。Nanog是通过调节 Gata6、Gata4、Oct4、Sox2及其他后生因子的表达来维持干细胞的自我更新[22]。Nanog是一个同源框基因,人、小鼠、大鼠、狗、猪、黑猩猩等的Nanog基因均具有同源性,其同源性与ANTP超家族中NK-2基因家族相似。小鼠Nanog基因的cDNA全长为2184 bp,包含一个开放阅读框,并且包含一个较长的3′UTR,含B2重复单位,这可能有助于Nanog的表达。Nanog基因编码305个氨基酸残基的蛋白质,其结构分为3个区域,即N末端、同源结构域、C末端。同源结构域可发挥蛋白之间的相互作用及与DNA结合的作用;N末端为富含丝氨酸的96个氨基酸,C末端50个氨基酸组成了10个由色氨酸开头的五肽重复序列,这个重复序列对于人和鼠而言高度保守。
Oct4和Sox2作为ESC中的关键基因,他们对相关多能性因子的调节并非单独发挥作用,而是形成Oct4-Sox2异二聚体复合物,这种复合体和细胞转录因子FoxD3分别结合Nanog基因转录起点-180bp和-270bp处,激活其转录。Oct4-Sox2复合物除结合Nanog及自身启动子外,还经常共同结合于 Nanog的靶基因(如FGF4、UTF1、Fbx15等)的启动子区,协同作用,形成调控网络,这些靶基因多数都参与了ESC多能性的维持。Tokuzawa Y等研究表明,与Oct4关联的靶基因启动子中大约有一半同时与Sox2关联,同时与Oct4、Sox2都关联的靶基因启动子中90%以上也能与Nanog结合。这些均表明Oct4-Sox2复合物在ESC转录调控网络中具有至关重要的作用。Chickarmane V等[23]利用计算机并结合生物信息学研究也进一步证实,ESC中存在一个由Oct4-Sox2-Nanog组成的可随着外界环境信号改变而打开或闭合的双稳态开关。当Nanog和Oct4-Sox2复合物表达时,开关开启,细胞增殖基因活化,分化基因抑制,细胞对外界刺激的反应降低;当上述两个调控因子表达低时,作用相反。还有学者提出,在控制ESC多能性和自我更新时,Oct4、Nanog、FoxD3之间可能形成了一个负反馈调节环路。一方面,在亚稳态水平,Oct4结合Nanog启动子促进表达,当Oct4表达量超过稳态,就抑制了自身和Nanog的启动子,通过反馈调节维持Oct4在稳态水平。另一方面,FoxD3拮抗过量Oct4的抑制作用,上调Nanog的表达,而Nanog和FoxD3又激活Oct4表达。
Fongt Y W等[24]利用体外重组转录系统结合生化分析技术鉴别出了一个Oct4/Sox2共激活复合物(stem cell coactivator complex,SCC),并证实SCC可直接与Oct4-Sox2复合物相互作用,共同聚集在Oct4、Sox2和Nanog基因启动子和增强子区域,作为辅助转录因子起始转录。经鉴定证实SCC是一种 XPC-RAD23B-CETN2(XPC)核苷酸剪切修复(nucleotide excision repair,NER)三聚体复合物,这个SCC/XPC具有维持干细胞多潜能性和基因组完整性双重重要功能。SCC亚基的敲除会导致细胞形态明显畸形以及碱性磷酸酶活性降低,迅速促进细胞凋亡或分化。SCC的3个亚基XPC、RAD23B和CETN2两重和三重敲除会分别导致Nanog的mRNA水平以及很多其他的细胞标志物(Fgf4,Zfp42,and Utf1)减少到正常水平的二分之一和三分之一,而SCC单个亚基的敲除对Nanog表达只有很小的影响。
干细胞研究在发育生物学、细胞工程、功能基因、新药开发等基础研究中有重要的理论价值,同时也是研究人类疾病的良好模型,其可塑性以及多向分化的潜能为临床医学中诸如白血病、器官移植、神经系统疾病、自身免疫性疾病等的治愈提供了可能,也为整形美容医学、养生学的发展开辟了新的方向,有着极为广泛的应用前景。近年来,体细胞重编程、去分化和多潜能干细胞来源等一系列热点问题成为干细胞研究的焦点。Oct4和Sox2作为维持干细胞多潜能性和自我更新的两个关键核心调控因子,它们不但可以调控多个维持多能性、自我更新、多向分化相关基因的表达,还参与到信号转导、表观遗传调控等多个过程,因此受到各国学者的广泛研究和关注,其功能和调控机制也越来越清晰。然而,当前干细胞的研究仍处于起步阶段,存在着许多问题和困难,如诱导iPS细胞的产生效率低;组织细胞中Sox2基因的功能;SCC/XPC与细胞外信号通路之间是如何调控;Oct4-Sox2复合物对其他转录因子调控的分子机制等许多环节还不十分清楚。Wernig M 等[25]试验证实:iPSC形成过程中,诱导因子只提供了一种启动因素,而干细胞的多能性和自我更新是通过基因启动后的自我调控网络维持的。因此,对Oct4和Sox2这两个关键性细胞因子的研究还需进一步推进和深入。
[1]Jaenisch R,Young R.Stem cells,the molecular circuitry of pluripotency and nuclear reprogramming[J].Cell,2008,132:567-582.
[2]Chen X,Xu H,Yuan P,et al.Integration of external signaling pathways with the core transcriptional network in embryonic stem cells[J].Cell,2008,133:1106-1117.
[3]Thomson M,Liu S J,Zou L N,et al.Pluripotency factors in embryonic stem cells regulate differentiation into germ layers[J].Cell,2011,145:875-889.
[4]Zheng P S,Cao H Z.Advances of Oct4gene research[J].J Xi'an Jiaotong Uni:Med Sci,2010,31(5):521-526.
[5]Saxe J P,Tomilin A,Plath K,et al.Post-Translational Regulation of Oct4Transcriptional[J].Activit PLoS ONE,2009,4(2):e4467.
[6]Suo G,Han J,Wang X,et al.Oct4pseudogenes are transcribed in cancers[J].Biochem Biophys Res Commun,2005,337(4):1047-1051.
[7]Takahashi K,Tanabe K,Yamanaka S,et al.Induction pluripotent stem cells from adult human fibroblast by defined factors[J].Cell,2007,131:861-872.
[8]Yu J,Vodyanik M A,Smuga-Otto Kim,et al.Induced pluripotent stem cell lines derived from human somatic cells[J].Science,2007,318:1917-1920.
[9]Huangfu D,Osafune K,Maehr R,et a1.Induction of pluripotent stem cells from primary human fibroblasts with only Oct4 and Sox2[J].Nat Biotechnol,2008,26(11):1269-1275.
[10]Nakagawa M,Koyanagi M,Tanabe K,et al.Generation of induced pluripotent stem cells without Myc from mouse and human fibroblasts[J].Nat Biotechnol,2008,26:101-106.
[11]Shi Y,Do J T,Desponts C,et a1.A combined chemical and genetic approach for the generation of induced pluripotent stem cells[J].Cell Stem Cell,2008,2(6):525-528.
[12]Lengner C J,Camargo F D,Hochedlinger K,et al.Oct4expression is not required for mouse somatic stem cell self-renewal[J].Cell Stem Cell,2007,1(4):403-415.
[13]Heng J C,Feng B,Han J,et al.The nuclear receptor Nr5a2 can replace Oct4in the reprogramming of murine somatic cells to pluripotent cells[J].Cell Stem Cell,2010,6:167-174.
[14]Ferraris L,Stewart A P,Kang J,et al.Combinatorial binding of transcription factors in the pluripotency control regions of the genome[J].Genome Res,2011,21:1055-1064.
[15]Arnold K,Sarkar A,Yram M,et al.Sox2+adult stem and progenitor cells are important for tissue regeneration and survival of mice[J].Cell Stem Cell,2011,9(4):317-329.
[16]Driessens G,Blanpain C.Long live Sox2:Sox2lasts a lifetime[J].Cell Stem Cell,2011,9(4):283-284.
[17]Masui S,Nakatake Y,Toyooka Y,et al.Pluripotency governed by Sox2via regulation of oct3/4expression in mouse embryonic stem cells[J].Nat Cell Biol,2007,9(6):625-635.
[18]Kim J B,Zaehres H,Wu G M,et al.Pluripotent stem cells induced from adult neural stem cells by reprogramming with two factors[J].Nature,2008,454:646-651.
[19]Kim J B,Sebastiano V,Wu G M,et al.Oct4-induced pluripotency in adult neural stem cells[J].Cell,2009,136:411-419.
[20]Masui S,Nakatake Y,Toyooka Y,et al.Pluripotency governed by Sox2via regulation of Oct3/4expression in mouse embryonic stem cells s[J].Nat Cell Biol,2007,9:625-635.
[21]Kim J B,Sebastiano V,Wu G,et al.Oct4-induced pluripotency in adult neural stem cells[J].Cell,2009,136(3):411-419.
[22]Zhong X M,Jin Y.Critical roles of coactivator p300in mouse embryonic stem cell differentiation and Nanog expression[J].J Biol Chem,2009,284(14):9168-9175.
[23]Chickarmane V,Enver T,Peterson C.Computational modeling of the hematopoietic erythroid-myeloid lineage switch reveals new insights into co-operativity,priming and irreversibility[J].PloS Comput Biol,2009,5:e1000268.
[24]Fong Y W,Inouye C,Yamaguchi T,et al.A DNA repaircomplex functions as an Oct4/Sox2coactivator in embryonic stem cells[J].Cell,2011,147:120-131.
[25]Wernig M,Meissner A,Foreman R,et al.In vitroreprogramming of fibroblasts into a pluripotent ES-cell-likestate[J].Nature,2007,448(7151):318-324.