赵丹洋,姜红,姜红堃
(中国医科大学附属第一医院儿科,沈阳 110001)
表观遗传学是指不涉及DNA序列改变,但在某些机制作用下基因活性和表达发生改变的染色质活动,主要包含组蛋白修饰、DNA甲基化及非编码RNA 3种修饰方式[1-2]。近年来随着表观遗传研究的迅速发展,染色质修饰相关酶类在肿瘤、免疫、干细胞分化等领域的研究日益深入,已鉴定出多类重大疾病的分子标记物及靶向治疗分子,在疾病的诊断与治疗领域发挥重要作用。
组蛋白修饰多发生于伸出核小体的N-末端残基,包括甲基化、乙酰化、磷酸化、泛素化及ADP-核糖化等,其中组蛋白甲基化是表观遗传机制中的关键调控步骤,该过程失调与人类多种疾病的发生发展密切相关[3-5]。组蛋白甲基转移酶 (suppressor of variegation 4-20 homolog,SUV4-20H) 由SCHOTTA等[6]于2004年首次在哺乳动物中发现,越来越多的研究[7-8]显示,SUV4-20H基因及其编码蛋白参与DNA损伤修复、DNA复制、基因表达及沉默等表观遗传调控过程,在神经系统疾病、骨骼肌肉系统疾病、肿瘤、代谢及营养疾病、先天性心脏病等多种疾病的发生发展中扮演重要角色。本文就其最新研究进展进行综述。
人类SUV4-20H基因包括SUV4-20H1(又称KMT5B)基因及SUV4-20H2(又称KMT5C)基因。SUV4-20H1基因位于第11号染色体长臂1区3带 (11q13.2),含13个外显子;SUV4-20H2基因位于第19染色体长臂1区3带 (19q13.42),含11个外显子[9]。所编码蛋白SUV4-20H包含相同的催化结构域、N端结构域及锌结合后结构域,以一腺苷甲硫胺酸 (s-adenosyl-l-methionine,SAM) 作为甲基供体进行甲基化,包括SUV4-20H1(含885个氨基酸残基) 及SUV4-20H2 (含462个氨基酸残基) 2个亚型,两者高度同源,分子量分别为99×103,52×103[10]。
组蛋白甲基化修饰可发生于精氨酸和赖氨酸残基,其中赖氨酸甲基化最为常见。在组蛋白H4前5个赖氨酸中,仅K20位点在哺乳动物中被甲基化,从酵母到人类,H4K20位点甲基化在进化上高度保守。组蛋白甲基化具有位点特异性,不同的甲基化位点对基因转录具有不同的调节作用,H4K20通常富集于基因异染色质中,参与转录抑制[7-8]。
SUV4-20H属于组蛋白赖氨酸甲基转移酶(histone lysine methyltransferases,HKMTs),是核小体特异性HKMTs。SUV4-20H在核小体组装后,在组蛋白H4赖氨酸20 (H4K20) 位点,催化底物单甲基化组蛋白H4K20 (H4K20me1) 二甲基化与三甲基化,生成产物H4K20me2与H4K20me3。
2013年WU等[11]在人体SUV4-20H1及SUV4-20H2蛋白与SAM复合物的高分辨率晶体结构的研究中发现,SUV4-20H蛋白含有独特的N端结构域和锌结合后SET结构域,具有底物特异性。2016年WEIRICH等[12]采用SPOT肽阵列方法来检测2种甲基转移酶的底物序列识别基序,结果显示SUV4-20H1蛋白识别 (RY) -kme1-(IVLM) -(LFI) -x-序列;SUV4-20H2蛋白识别X-Kme1-(IVLMK) -(LVFI) -x -(DEV) 序列,且特异性比SUV4-20H1蛋白差。目前在动物体内实验显示,SUV4-20H1蛋白主要负责催化H4K20me1生成H4K20me2,SUV4-20H2蛋白负责H4K20me3的产生。而在体外研究发现,SUV4-20H蛋白可以直接将未修饰的H4K20三甲基化,不需要以H4K20me1为底物,且SUV4-20H1/H2蛋白对未修饰的H4K20的催化活性是H4K20me1的3倍[8-10]。QIAN等[13]研究发现K20me3的减少可能只是因为K20me2的减少,特别是在K20me3完全由K20me2生成的情况下,意味着SUV4-20H2蛋白可能仅催化H4K20me1生 成H4K20me2。WANG等[14]的研究虽未明 确H4K20me3的生成是否需要SUV4-20H1/H2蛋白,但研究结果表明,SUV4-20H1/H2蛋白可能不会直接介导活细胞中的K20me3,或者其动态程度远不如K20me2。
2016年,EID等[15]研究发现,SUV4-20H1/H2蛋白可在小鼠胚胎着床前大部分缺失,H4K20me3的表达水平从双细胞阶段起开始迅速下降,而H4K20me3重构在受精后可促进DNA复制。意大利学者PEDROTTI等[16]在动物实验中证实,SUV4-20H1基因敲除的小鼠整体生长发育迟缓,在围生期死亡;而小鼠缺乏SUV4-20H2基因可导致胚胎成纤维细胞在端粒维持方面存在缺陷,但仍能存活。2017年,BROMBERG等[17]在遗传学研究中发现,SUV4-20H蛋白可通过催化H4K20me1的二甲基化及三甲基化,促进非同源末端连接 (non-homologous end joining,NHEJ) 定向修复DNA。同年,西班牙学者在实验研究后提出,在设定的类别转换重组 (class switch recombination,CSR) 位点的表观遗传状态时,SUV4-20H蛋白表达水平下降可导致活性诱导的胞苷脱氨酶 (activation-induced cytidine deaminase,AID) 缺乏症[18]。
综合国内外学者大量的实验研究发现,SUV4-20H蛋白作用于H4K20可出现不同程度的甲基化水平,从而产生不同的生物学过程。当SUV4-20H蛋白的表达水平未能使底物甲基化时,可参与DNA双链断裂 (dna double-stranded break,DSB) 的修复过程和DNA转录激活[19-20]。当使底物高水平甲基化时,可在复制前及复制后的染色质中区分DSBs,并参与DNA修复的正确路径;亦可选择异染色质区域复制起始位点等[21-22]。
近年的研究[21-22]显示,组蛋白赖氨酸甲基化相关基因是智力发育相关基因,准确控制组蛋白甲基化在神经发育的过程发挥重要作用,并提出SUV4-20H基因及其编码蛋白质在大脑发育中具有病理意义。研究[23-24]发现,SUV4-20H1蛋白在胚胎与成人大脑中均呈现高表达水平,SUV4-20H1基因缺失可使小鼠在胚胎期死亡,体长及体质量下降;SUV4-20H1基因突变则会导致智力障碍的过度生长综合征。从大规模的人类DNA测序研究发现,SUV4-20H1基因可能是神经发育表观遗传修饰的关键基因,如EHMT1 ARID1B,分别与Kleefstra综合征及Coffin-Siris综合征相关。2017年,STUDY等[25]发现SUV4-20H1基因突变可导致在生长发育障碍;在同年,美国学者STESSMAN等[26]对11 730余例神经发育障碍患者与2 867例对照组的208种基因进行测序表明,SUV4-20H1基因变异的患者普遍具有相同特征,如智力障碍/发育迟缓、孤独症谱系障碍诊断、语言延迟、运动延迟及发热性癫痫发作。2016年,RHODES等[27]对成年狒狒脑人室管膜下区分离的神经干祖细 胞 (neural stem/progenitor cells,NSPCs) 进行研究发现,SUV4-20H1/ H4K20me3可能是一种保护机制,通过减少基因异常表达及调节细胞增殖,防止成人NSPCs异常细胞周期的产生。
2017年,KHANI等[28]研究发现,SUV4-20H2蛋白可控制成骨细胞的H4K20甲基化作用,并参与了成骨细胞分化中的基质矿化过程,对成骨细胞生长至关重要。2019年,SILES等[29]研究发现,SUV4-20H1蛋白通过促进兼性异染色质的形成和对肌肉转录调节因子 (myogenic determination factor,MyoD)位点的控制,调控骨骼肌干细胞的沉默,进而保护和保存骨骼肌干细胞池。SUV4-20H1基因的缺失可降低fHC的合成,诱导MyoD的转录激活及重新定位,远离异色核外围,进而促进肌钙蛋白的活化,导致干细胞衰竭和肌肉再生受损。动物实验研究发现,哺乳动物与果蝇的面肩肱型肌营养不良区域基因1(fascioscapulohumeral muscular dystrophy-1,FRG1) 过表达,可与SUV4-20H1蛋白结合,并干扰细胞SUV4-20H1蛋白的活性。同时发现,敲除SUV4-20H1或FRG1过表达均会抑制肌肉生成[30-31]。近来实验发现,尽管SUV4-20H1_i2蛋白与SUV4-20H2蛋白都可导致H4K20me3升高及H4K20me1降低,但却参与了不同的肌肉生成过程。SUV4-20H1_i2蛋白是肌源性分化的早期标志物,SUV4-20H2蛋白在整个肌肉分化的过程中均富集于肌电阳性细胞。研究[32]发现,复制复合体的起源1 (origin recognition complex 1,ORC1) 能够特异性识别H4K20me2,当SUV4-20H蛋白表达水平降低时,ORC1-H4K20me2相互作用的取消可使细胞周期进展延迟及细胞增殖不足,继而导致比例性低细胞性侏儒症,如Meier-Gorlin 综合征。以上研究表明,SUV4-20H蛋白可调控骨骼、肌肉早期发育过程,SUV4-20H基因及其编码蛋白质异常可在骨骼肌肉系统疾病中发挥重要作用。
2018年,VINCI等[33]对142个肿瘤序列进行分析发现,儿童胶质母细胞瘤中SUV4-20H1基因突变失活 (存在于<1%的细胞) 后通过趋化因子信号传导及整合素调节,使DNA修复失效,并在体内与体外增加对邻近细胞的侵袭及转移。2017年,VELEZCRUZ等[34]研究表明,SUV4-20H2蛋白过表达可纠正视网膜母细胞瘤 (retinoblastoma,RB) 基因缺失时染色质致密化、凝集和染色体分离。H4K20me3是RB缺失时染色体不稳定 (chromosomal instability,CIN) 的主要原因,这一发现可能为逆转或减少某些癌症CIN提供治疗机会。在癌症的发生发展过程中,SUV4-20H1基因及/或SUV4-20H2缺失可使端粒延长;H4K20me3缺失与端粒伸长及端粒重组减压有关,可诱导促癌基因的表达,从而促进肿瘤进展。2015年,SHINCHI等[35]研究显示,SUV4-20H1/H2蛋白在乳腺癌细胞中异位表达可抑制细胞侵袭,而SUV4-20H2下调则能激活正常乳腺上皮细胞的侵袭。2018年,VIOTTI等[36]研究表明,SUV4-20H2蛋白表达水平过高与进行性侵袭性癌症上皮特征的丧失有关,同时显示,SUV4-20H2蛋白可用于胰腺癌细胞系间质识别,亦可作为上皮/间质状态调控的上游表观遗传学调控因子。综上可知,SUV4-20H基因及其编码蛋白质与肿瘤疾病联系紧密,对其进行深入研究,将有助于进一步理解肿瘤疾病的发病机制,可以更好地为临床应用和治疗提供新思路。
2014年,ÖST等[37]在对果蝇、小鼠及人类的代谢编程中发现了SUV4-20H蛋白,其在体内及体外研究中均可响应环境刺激与调节新陈代谢。2019年,PARIKH等[38]在动物实验中发现,SUV4-20H是过氧化物酶增殖体激活受体γ的主要表观遗传监管机构及响应环境刺激控制代谢与平衡体质量的重要途径。2014年,HUNG等[39]研究发现,SUV4-20H蛋白在肥胖中可发挥重要作用,SUV4-20H蛋白及H4K20me3主要调控正常棕色脂肪组织生长与脂肪代谢状态。研究显示,因人类SUV4-20H1基因在11q13 (22) 号染色体上可定位到一个400 kb的糖尿病区域,表明糖尿病可能是与SUV4-20H1突变导致的相关代谢疾病中的一部分。同时,有研究[40]发现,SUV4-20H蛋白及H4K20me3的增加与糖尿病视网膜病变的发生发展有关。由此可知,SUV4-20H基因及其编码蛋白质在代谢过程中扮演了重要角色,当其发生变化,机体内稳态失衡会导致一系列疾病的发生发展。
研究[41]发现,组蛋白甲基化在心肌生长过程中具有调控作用。如H3K4甲基转移酶、H3K9甲基转移酶等都可参与心脏的发育过程,其表达异常能导致先天性心脏病的形成[42]。近来研究发现一种含有SET域结构的蛋白——NSD1,包含SUV4-20H蛋白活性,其突变或缺失可引起Sotos综合征,以室间隔缺损、房间隔缺损和动脉导管未闭为特征的冠状动脉粥样硬化性心脏病发病率较高[43]。由此可以推断,SUV4-20H蛋白可参与先天性心脏病发生发展的过程,但其在疾病中的具体作用机制尚未明确,有待进一步研究。
组蛋白甲基转移酶SUV4-20H作为一种重要的表观遗传调节因子,具有广阔的研究价值与临床应用前景。其可通过对H4K20不同程度的甲基化修饰,以及与其他组蛋白修饰 (去甲基化、乙酰化、磷酸化、泛素化等) 的协同作用,调节基因的转录与表达,参与组织器官的形成与抑癌基因表达等过程,在多种疾病的发生发展过程中发挥至关重要的作用[1,5,43]。虽然目前对SUV4-20H的研究已不断深入,但仍有大量问题亟待解决。如SUV4-20H在细胞环境与细胞周期不同的情况下,如何启动对H4K20的甲基化修饰作用;SUV4-20H对基因转录调控的具体机制;SUV4-20H1异常表达导致神经系统障碍的生物学过程;SUV4-20H与先天性心脏病发生的作用机制等。相信随着实验研究的日益完善,SUV4-20H的作用及其机制将更加明确,其有望作为疾病诊断的生物标志物,成为疾病治疗靶点。