王鹤潼,贾春云,张延召,赵强,李晓军,巩宗强,刘宛*
(1.中国科学院沈阳应用生态研究所污染生态与环境工程重点实验室,沈阳110016;2.沈阳大学生命科学与工程学院,沈阳110044;3.洛阳师范学院,河南 洛阳471022;4.黑龙江八一农垦大学农学院,黑龙江 大庆163319)
Cd 是我国水体及农田土壤污染危害最严重的一种重金属元素。土壤Cd污染具有隐蔽性、长期性、不可逆性和高富集性等特点。据2014 年《全国土壤污染状况调查公报》显示,土壤重金属Cd 污染面积大,Cd污染点位超标率达7%,污染程度严重。有充分的实验证据显示,Cd在生物体内的半衰期长(18~30 a)、化学性质活跃、遗传毒性大[1-3]。土壤中的Cd 极易被植物吸收,富集在农作物的可食部分,并通过食物链危害人体健康。目前,Cd 污染已经成为影响我国未来农业可持续发展和人体健康的环境问题之一[1-3]。
Cd 胁迫下,植物细胞内会出现不同形式的DNA损伤,例如碱基错配、碱基改变、DNA 氧化、DNA 加合物、DNA 单链断裂(SSBs)、DNA 双链断裂(DSBs)、DNA 插入缺失环、DNA 链间交联连接(Interstrand cross-links,ICLs)、DNA 链内交联和甲基化[1-4]。DNA损伤迅速诱导:(1)DNA 损伤响应(DDR)信号,如毛细血管扩张性共济失调突变蛋白(ATM)、毛细血管扩张性共济失调突变相关蛋白(ATR)及其下游的信号通 路SOG1、BRCA1、MAD2、KU70、MRN(MRE11-RAD50-NBS1)复合体、单链结合蛋白(RPA)复合体。(2)细胞周期阻滞(如G1/S 或G2/M 期阻滞),细胞内复制以及细胞凋亡。(3)不同形式的DNA 修复途径。a.DNA 错 配 修 复(MMR)系 统,如MSH2、MSH3、MSH6、MSH7、MLH1、PMS1;b.碱基剪切修复(BER),poly(ADP-ribose)polymerase-1(PARP-1)等;c.核苷酸剪切修复(NER),XPB、XPD、p53 等;d.同源重组修复(HR),BRCA1、ATM、ATR 等;e.非同源末端连接修复(NHEJ),DNA-PK 等;f.ICLs 修复。如果DNA 损伤严重,则诱导细胞分裂停止、甚至细胞凋亡[1-8]。本文就Cd 胁迫条件下,植物细胞内DNA MMR 系统对DNA 损伤的感知/修复、细胞周期检验点的响应上的作用机制,以及表观遗传因素如DNA 甲基化、染色质重塑、组蛋白修饰和非编码RNA 修饰(如miRNAs/lncRNAs)等调控DNA MMR 基因的作用机理作简要综述。
维持基因组的完整性对植物的生长、代谢和发育过程极为重要。当植物进行细胞分裂时,通过DNA复制形成的新生细胞从母细胞中获得一套完整的基因组。但是在Cd 胁迫下,植物细胞内会出现不同形式的DNA 损伤,后者迅速诱导DDR 信号通路,如DNA 损伤的感知、DNA 修复因子的招募、DNA 修复途径的启动和协调、细胞周期阻滞(如G1/S、S 或G2/M期阻滞)和细胞凋亡[2,4,7]。
许多研究结果表明,Cd 胁迫下,识别植物细胞内不同种类DNA 损伤的感受器主要包括3 类:MutS、单链结合蛋白RPA(Replication protein A)复合体和MRN 复 合 体[2,4,7]。MutSα、MutSβ 和MutSg 是DNA MMR 系统中的3 种异源二聚体蛋白复合体,分别由MSH2/MSH6、MSH2/MSH3 和MSH2/MSH7 组成,其在DNA 损伤修复过程中的DNA 损伤识别、位点结合和细胞周期检验点激活过程中发挥不同作用[1-2,7]。MutSα 主要识别单个碱基错配,如氧化的碱基错配(Dihydro-8-oxo-guanine)、甲基化的碱基错配(O6meG:T和O6meG:C)和小的插入缺失环(IDL),这些单碱基错配主要来源于绕过DNA 损伤合成(TLS)途径和/或易错DNA聚合酶(Error-prone polymerases)。MutSβ 主要感知IDL 和ICL。MutSg 识别G/G、G/A、A/A 和C/A 单碱基错配,但比MutSα 识别C/A 的能力更强[1,2,7,9]。另外,尽管紫外线(UV)诱导的DNA 损伤,如环丁酰环,即嘧啶二聚体(CPD)和(6-4)嘧啶-嘧啶酮二聚体(6-4-PP),主要由核酸剪切酶识别,但是由于在DNA 复制中CPD 和6-4-PP 等损伤位点会发生错配,因此也可被MutSα 识别,并诱导DNA 损伤反应[9-10]。另外MutS,特别是MutSα 可以不依赖DNA 复制过程而识别基因组DNA 损伤,并诱导DNA 损伤信号,但是目前有关其详细机理仍然不甚清楚[1-2]。
Zou 等[11]研究表明,人细胞通过ATR-ATRIP识别RPA-ssDNA(单链DNA)复合体,从而感知DNA复制胁迫和SSB;由于DNA 聚合酶解偶联和DNA解螺旋,所以在复制叉上产生长片段的ssDNA。RPA感知/包裹ssDNA,依次招募Rad9-Hus1-Rad1 复合体和Rad17–replication factor C(RFC)复合体,并结合于ssDNA。上述过程亦发生于NER 和DSB 修复过程中[4]。当DSB 存在于一条姊妹染色单体时,通过MRN复合体进行识别DSBs 末端[4,12]。例如污染胁迫下,拟南芥mre11 和rad50 突变体幼苗表现出高度敏感性[4],类似现象亦存在于脊椎动物的胚胎细胞中[13]。而且,mre11 或rad50 突变体的有丝分裂细胞中出现高水平的染色体桥,表明基因组DNA 不稳定性显著增加[4]。与RPA 感受器相似,ICL 修复和DNA MMR 系统参与识别和修复DSBs[14]。尽管植物的三类DNA 损伤感受器均可以参与DDR 信号通路,但是我们对拟南芥和大豆的实验结果显示,DNA MMR 系统在修复Cd诱导DNA损伤方面的作用更为重要[1-2,7]。
ATM 和ATR 是含有丝氨酸/苏氨酸的两种关键蛋白激酶(300~500 kDa),属于进化上高度保守的磷脂酰肌醇蛋白激酶家族(PIKK)。在正常条件下,ATM 和ATR 以二聚体状态存在,没有活性。但在拟南芥DDR 中,Cd 胁迫引起的DNA 损伤可由MSH2 与MSH6 识别/感知,从而激活DNA 损伤检验点信号转导[1-2,7,15-16]:(1)MSH2 可直接向ATR 传递损伤信号,通过PRD与Bridge结构域构象改变,激活ATR;(2)利用MSH2 产生γ-H2AX 位点,募集DNA 修复蛋白,可将DNA 损伤信号传递给ATM,使ATM 同源二聚体解离成单体,激活ATM 活性。在激活Cd诱导的DDR 信号途径和维持基因组DNA 稳定性方面,激活态的ATR/ATM 具有极大的促进作用[2,15-16]。例如,ATR通常与组成性相互作用伴侣(IP)结合,形成ATRATRIP 复 合 体[4]。RPA 和MutS 识 别DNA 损 伤 后,与ATR-ATRIP 相互作用,从而激活依赖ATR 的DDR[11];RPA-ssDNA 复合体于S 期复制叉部位形成,而招募MutS 与DNA 复制无关[17]。上述复合体形成后,ATR立即发生反式自磷酸化作用,与TopBP1对接后,进一步增强ATR 的活性[18]。Yoo 等[19]报道,磷酸化的ATM与TopBP1 对接后,亦可以增加ATR 的活性。对DNA DSB而言,通过NBS1的C末端,ATM 被招募到DSB位点自磷酸化,从而激活有关DDR 信号途径中的大量下游元件磷酸化。例如,具有重要功能的组蛋白变种H2AX 被磷酸化后,产生γ-H2AX[19-20]。在DNA DSB位点,这些γ-H2AX 招募DNA 修复蛋白后,可以进一步增强DDR 信号[21]。植物ATM 突变体(Knock out,KO)或ATR-KO 幼苗,在没有胁迫的正常情况下可以正常生长、开花、结实种子;拟南芥ATR-KO 幼苗对DNA 复制胁迫试剂(如阿非迪霉素、羟基脲)高度敏感,不能完成正常的生长发育;而DSB试剂(如离子辐射、甲基甲烷磺盐)则显著抑制拟南芥ATM-KO 幼苗的生长发育[21-22]。
Cd 胁迫下,ATR 和ATM 被DNA 损伤激活后,立即在DNA 损伤位点发挥作用,激活信号传导通路下游的1 000 多种转录因子,同时亦在基因组水平上磷酸化700 多种底物。这些底物执行一系列下游的信号传导功能,包括激活DNA复制起点、稳定/重新启动DNA 复制叉、修复不同种类的DNA 损伤、激活细胞周期检验点、细胞内复制和细胞凋亡[1-2,4,7,21,23]。
1.3.1 Cd胁迫诱导的G2/M期阻滞
许多研究[1-2,7]报道,细胞内主要存在3 类细胞周期检验点:G1/S 期检验点、S 期检验点和G2/M 期检验点,它们均可以引起细胞周期阻滞。遗传学和生物化学结果表明,细胞周期进程至少被两类蛋白复合体调控:细胞周期蛋白依赖性蛋白激酶(CDKs)和细胞周期蛋白(Cyclins)。与动物细胞类似,不同的CDKs/Cyclins 复合体在细胞周期的不同阶段推动细胞周期的运转,其中Cyclins 为调节因子,分子量为45~60 Ku。植物Cyclins具有多样性,目前至少已经发现了4种Cyclins(A、B、D、H)。植物中亦存在广泛的CDKs家族,目前已在苜蓿、水稻、拟南芥、豌豆以及玉米等多种植物中发现了编码CDKs 的基因[24]。通过对苜蓿、烟草及拟南芥等植物的研究表明,植物中至少存在4 种不同的CDKs:最典型的一种CDK 包含PSTAIRE 序列,在G1/S 及G2/M 期转换中具有重要作用;另外一种CDK 是植物特有的,具有PPTALRE 序列,其活性水平在G2 晚期及M 期达到峰值,这种CDKs 与植物有丝分裂特性有关[2,24]。逆境胁迫条件下,细胞中不同种类的DNA 损伤激活细胞周期检验点,抑制CDKs/Cyclins 复合体的活性,从而引起不同种类的细胞周期阻滞[1-2,7,24]。
ATR 和ATM 下游的很多蛋白激酶可以在检验点信号传导过程中调控细胞周期的运转。尽管不同物种间感知DNA 损伤的机制是保守的,但是植物缺乏与哺乳动物细胞周期检验点信号途径中某些同源的基因,如p53和Chk1/2激酶[4]。但是,植物会利用一些特殊的蛋白酶响应DDR 信号,从而阻滞细胞周期,如SOG1(γ 射 线 反 应 抑 制 剂1,Suppressor of gamma response1)被作为是植物中p53 的对应组分[25-26]。目前,SOG1 调控G2/M 期阻滞的详细机理仍然不清楚,但是SOG1 是以依赖ATM 的方式,通过靶向CDK的抑制剂,抑制CDKA;1 的活性,从而促进细胞周期从G1/S期到M 期的运转[4,25-26]。另外一种组分是存在于动/植物细胞中的WEE1 蛋白激酶,其优先被ATR激活,降低CDK 活性(如植物特有的CDKB1;1),从而导致G2/M期的阻滞[1-2,7,27]。
在Cd 诱导的DDR 中,G2/M 期阻滞存在于动/植物细胞中,有利于维持基因组DNA 的稳定性和完整性[1-2]。例如,植物细胞中G1/S 或G2/M 期细胞阻滞的调控主要依赖于DNA MMR 系统中的MutS 识别DNA损伤,依次激活ATR,从而抑制B-type CDK(CDKB1;1)[2]。我们在Cd 胁迫下拟南芥/大豆MSH2-KO 和MSH6-KO幼苗的实验中,亦得到相似的结果;而且大豆耐Cd 品种CN20 可以将G2/M 阻滞转化为G1/S 阻滞[1,7,27]。
1.3.2 Cd胁迫诱导的植物细胞内复制和细胞死亡
Xu 等[28]报道,严重DNA 胁迫条件下,为了减轻DNA 损伤累积的风险,哺乳动物细胞会启动程序性细胞死亡(PCD),以清除严重受损伤的细胞,这是生物生存的一种适应反应机制。类似PCD 的情况亦存在于植物的分生组织细胞中[4]。但是,动物和植物所利用的PCD 机制不同:动物通过p53 磷酸化激活PCD信号;植物是利用SOG1 激活PCD 信号通路,因为植物中缺乏p53 蛋白。例如,离子辐射和/或DSB 药物处理后,植物SOG1-KO 不能诱导依赖ATM 磷酸化SOG1 的PCD 信号,明显增加了死亡细胞的比例[29]。Sherrer 等[30]研究证实,Cd 在细胞内的主要靶位点为DNA MMR 系统。Cd 胁迫下,随着动物细胞内DNA损伤的增加,MSH2参与招募DNA 双链断裂修复蛋白和HR;严重的DNA 损伤则减弱DDR,如降低DNA MMR 系统中关键基因(如MSH2、MSH3、MSH6)的修复能力和DNA MMR 系统对HR 的招募能力等,从而产生PCD[31]。
如果哺乳动物或人细胞中一旦出现有丝分裂异常和细胞内复制现象,则表明严重的疾病灾难(如癌症)即将发生;而植物细胞出现DNA 胁迫时,则诱导细胞周期阻滞、细胞内复制和细胞凋亡[4]。植物细胞内复制是DNA 胁迫的显著标记之一,而且亦偶尔存在于植物正常生长和发育的细胞中。很多研究表明,DNA DSBs 是刺激植物细胞内复制的主要影响因素[7,23]。与诱导细胞死亡不同,ATM 和ATR 在调控植物细胞内复制方面起到多信号同步作用,即ATMSOG1 和ATR-SOG1 信号负责激活植物细胞内复制。例如,在博来霉素胁迫下,ATM/ATR-KO(双突变体)植株幼苗细胞的DNA 损伤水平增加,内复制明显受到抑制;植物SOG1-KO 幼苗细胞中DSBs水平明显增加,亦出现类似的细胞内复制现象[23]。但是,在Cd 胁迫下,拟南芥MSH2–KO 和MSH6–KO 幼苗中,ATMSOG1信号途径在激活细胞内复制过程中起到明显的关键作用,不存在ATR-SOG1 信号途径,因为缺失从MMR 到ATR 的信号瀑布[7,32]。另外,在土豆MSH2-KO幼苗中,观察到明显的多倍体或非整倍体细胞,说明DNA MMR 系统在阻止细胞内复制方面具有关键的促进作用[32]。
1.3.3 Cd胁迫下HR和DNA MMR系统的激活
DNA 修复系统在感知DNA 损伤、激活细胞周期检验点、修复不同种类的DNA 损伤、维持基因组DNA的稳定性和保证DNA 复制的精确性等方面发挥关键作用。DNA修复系统主要包括6类[1-8]。通常情况下,上述DNA 修复系统借助于组蛋白修饰和依赖于ATR/ATM 信号途径,参与DDR 信号[33-34]。尽管不同种类的DNA 损伤对应于不同的DNA 修复系统,但是DDR 信号通路中不同修复系统之间亦存在相互作用。例如,早在1970 年即发现,NER 和HR 参与ICL修复过程;DNA MMR 系统招募HR 相关蛋白,尽管有关详细机制不甚清楚[14,35]。
由于激活不同种类的DNA 损伤修复蛋白依赖于细胞周期检验点或DDR 信号通路,因此不同蛋白激酶会被选择性地招募于DNA 损伤位点。例如,正常条件下,NER 在整个细胞间期发挥作用,而且在G0~G1 期和G2~M 期检验点出现两个活性高峰;紫外线诱导的DNA 损伤,仅在S 期以依赖于ATR 的方式激活NER[36-37]。但是,在g射线胁迫下,NER的活性高峰在G0~G1期检验点显著增加,而在G2~M 期检验点则降低[38]。类似情况亦存在于HR 和NHEJ 过程中,HR 主要在姊妹染色单体完成复制的G2 期和S 期发挥作用;而在G1 期,NHEJ 的作用明显大于HR[39-40]。与HR 的作用类似,DNA MMR 系统亦在G2 期发挥作用,通过MutS 识别不同种类的DNA 损伤,引起G2/M期阻滞[1-2,7]。因此,这些实验结果建议,由Cd 诱导的DNA损伤主要被DNA MMR系统和HR修复。
DNA MMR 系统是一种DNA 复制后修复,在感知DNA 损伤、激活细胞周期检验点、确保基因组DNA 的稳定性和DNA 复制的精确性,以及修复Cd 诱导的DNA 损伤等方面发挥关键作用,而且MSH2参与招募DNA 双 链 断 裂 修 复 蛋 白[1-2,7,41]。Culligan 等[42]首 次 报道了关于植物DNA MMR 家族方面的研究工作。植物DNA MMR 家族为MutS-MutL 系统,其中与DNA MMR 反 应 有 关 的MutS 同 系 物(MutS homologues,MSH)为MSH2、MSH3、MSH6 和MSH7,MutL 同系物(MutL homologues,MLH)为MLH1、MLH3 和PMS1。植物DNA MMR 家族中,3 个异源二聚体MutSα(MSH2 / MSH6)、MutSβ(MSH2 / MSH3)和MutSγ(MSH2/MSH7)具有识别不同种类DNA 损伤,并结合在DNA 链接上招募MutL 和激活检测点的作用;MutL合体由两个异源二聚体MutLα(MLH1/PMS1)和MutLβ(MLH1/MLH3)组成,正常情况下MutLα 的功能 明 显 大 于MutLβ[2,9,42-43]。异 源 二 聚 体MutLα 和MutLβ 与结合在DNA 链上的MutSα、MutSβ 或MutSγ形成临时复合体,并与有关酶相互作用,从而启动DNA MMR 反应;MutSα-MutLα 复合体征募ATR-AT⁃RIP/ATM 到DNA损伤位点,启动DNA损伤检验点,并调节细胞分裂进程,最终完成修复含错配碱基的DNA序列[1-2,9,30,42-43]。
DNA 错配被识别后,异源二聚MutLα 与结合在DNA 链上的MutSα、MutSβ 或MutSγ 形成临时复合体;DNA 夹钳(Clamp)PCNA 与RFC 结合后,与MutLα相互作用,从而发挥PMS1 的内切酶活性;通过切割不连续链,MutLα 为EXO1 5′-3′外切酶产生新的进入位点,此过程对3′-末端参与的错配剪切是必需的,并被PCNA–RFC 促进[1-2,9,43]。然而,在5′-末端,PCNA-RFC 参与剪切的作用非常有限[2,44-45]。因为PCNA 仅参与DNA 复制机制的一部分,DNA MMR 识别与DNA 复制偶联仅占DNA MMR 功能的10%~15%,或者二者之间毫无关系[46]。切除DNA 错配碱基可以由依赖EXO1 的机制完成,亦可能二者之间没有相 关 性[47]。FEN1 内 切/PMS1 内 切/EXO1 外 切DNA 错配碱基后,RPA 结合/保护ssDNA,并且促进外切作用的结束;最后,DNA 聚合酶d 合成新的DNA 片段填补被切除的碱基,DNA 连接酶Ⅰ连接新合成的DNA 链,从而完成修复含错配碱基的DNA序列[2,7,30]。
HR修复在有丝分裂和减数分裂同源染色体的配对和分离过程中具有切除DSBs 的重要作用。Mimi⁃tou 等[48]报道,HR 依赖同源配对的姊妹染色单体,可以修复有丝分裂过程中的断裂染色体。HR在SSR修复和恢复停止/损伤DNA的复制叉过程中亦具有重要作用。HR 启动核苷酸水解产生DSBs 的3′ssDNA 片段,此反应由参与DNA MMR 系统的MRE11 或EXO1完成[48]。外切酶切除后,ssDNA 与RPA 形成复合体,依赖辅助因子取代RAD51,形成的RAD51 核蛋白细丝有助于DNA 片段的侵入和交换,最终形成Holliday联接体(HJ)[49]。最新研究证实,HR 过程中,BRCA1与RAD51 结合(后者是BRCA1 发挥作用的早期标志)后,DNA 双链断裂修复(DNA double-strand break repair,DSBR)和依赖于DNA 合成链退火(Synthesisdependent strand annealing,SDSA)修复途径迅速执行功能,但是其反应产物不同[39]。在SDSA 模型中,经过DNA 片段的置换,单链延伸,并退火到另一断裂链末端的ssDNA,然后进行缺口处的DNA 合成和连接,从而产生非交叉链(Non-crossover)产物。在DSBR模型中,由供体双螺旋(D-环)作为DNA 置换链,结合于DSB 的另一端后,引发前导链的第二轮DNA 合成,并进一步形成一个双链HJ(dHJ)中间体,最后dHJ 降解产生交叉链产物,或者非交叉链产物[48]。
在Cd 诱导的植物DDR 信号传导过程中,识别DNA 损 伤 后,MutS 异 源 二 聚 体(MutSα、MutSβ 和MutSγ)中的MSH2 不仅招募MutLα、PCNA 和EXO1,而且招集ATR/ATM 和BRCA1,共同进行DNA MMR、DSBs 或者ICLs 修复[35]。尽管HR 过程中MSH2 招募的详细机制不清楚,但是却发现:(1)HR修复的SDSA途径与MMR 同样发生于减数分裂期G2 期,在HR 修复中优先发挥作用,通过ATR 促进基因转换,从而产生非交叉链产物,即不需要形成HJ;(2)HR 修复的DSBR 途径会形成dHJ,并可产生交叉链产物,使与DNA 复制相关的DNA 损伤被HR 修复;(3)在两条单链DNA 片段退火中,MSH2 抑制同源二聚体HJ 的形成,且招募SGS1[50-51]。这些结果说明,在HR 过程中,DNA MMR 系统在G2 期阻滞中以依赖ATR 的方式优先激活SDSA 途径,在此过程中由于MSH2 抑制同源重组,所以MLH1不会与MLH3形成MutLβ、不参与交叉链的形成,MLH1 主要与PMS1 结合形成MutLα,参与DNA MMR过程[2,52-54]。
Kim 等[55]报道,在DDR 信号通路中,与MSH2 迅速被激活不同,MLH1 以依赖于c-Abl 的方式在HR、DNA MMR 系统和ATM 参与的MAPK 信号瀑布中均发挥重要作用。胁迫诱导细胞内产生DNA 损伤后,尽管ATM 和ATR 均有活性,但是ATM(不是ATR)快速激活来源于c-Abl 活化的MAPK 信号通路[56-57]。MLH1 参与上述调控过程,特别是在胁迫激活蛋白激酶/Jun-N 末端蛋白激酶(JNKs)依赖的MAPK 信号途径中发挥重要作用,此结果在人MLH1-KO 细胞系响应N-甲基-N′硝基-N′-亚硝基胍(MNNG)胁迫过程中亦得到了证实[55]。Mao 等[58]研究证实,在人体外/内细胞系的HR 和MAPK 信号通路中,MLH1 和miR-422a 形成反馈循环,表明MutLα 可以刺激miRNAs 的生物合成。我们的研究结果表明,拟南芥/大豆MLH1-KO 幼苗在响应Cd 胁迫诱导的DDR 过程中,MLH1 参与了依赖于ATM 的信号通路[1-2,7]。Cd 胁迫下,DNA MMR 系统功能正常的植株细胞将被阻滞在G2/M期,但是植株MSH2-KO细胞则被阻滞在依赖于ATM 的G1/S 期;在 植 株MSH2-KO/MLH1-KO 细 胞中,依赖于ATM 的G1/S 期阻滞则明显降低,表明在动/植物细胞响应Cd 诱导的DDR 过程中,MLH1 参与了依赖于ATM 的MAPK 信号通路[2,7]。因此,MLH1作为多功能蛋白,具有如下重要作用:(1)MLH1 与PMS1结合形成MutLα,修复DNA 损伤;(2)当MutS 绕过DNA 损伤识别时,MLH1 参与ATM 激活的MAPK信号传导;(3)MutLα参与miRNAs的生物合成;(4)在DNA 损伤不存在的条件下,MLH1 与MSH3 结合,参与减数/有丝分裂M期的同源重组过程[2,58]。
表观遗传是指在基因组DNA 序列不变的情况下基因表达发生变化的现象。表观遗传参与植物的生长、发育、代谢、衰老、死亡、胁迫响应等重要生命过程,并在其中发挥了重要作用。表观遗传学作为一门新兴学科在近20 年间得到了快速发展,成为当前植物、动物和医学领域的研究热点之一[59]。目前,植物表观遗传学的相关研究主要集中在模式植物拟南芥和主要作物(如水稻、玉米、小麦)的DNA 甲基化、组蛋白修饰、RNA 甲基化、染色质重塑和非编码RNA 修饰等方面,并且取得了许多重要成果。传统遗传学产生的遗传变异是稳定的,很少逆转,而表观遗传现象与环境条件变化之间密切相关,表观遗传变异通常是可逆转的。因此,表观遗传现象具有以下特点:DNA序列未发生改变;具有跨代遗传特性;对表型调控具有可逆性[59]。
DNA 甲基化主要发生于二核苷酸CpG 位点,由DNA 甲基化转移酶(Dnmts)家族催化S-腺苷蛋氨酸(SAM)上的一个甲基转移到胞嘧啶(C)的第5 位碳原子上形成5mC[59]。DNA 甲基化是在DNA 水平上调控基因表达的表观修饰方式之一,主要是通过阻止转录因子结合于DNA 链上发挥作用。DNA 甲基化水平会改变基因表达,从而影响DNA 修复、细胞周期、细胞分裂、细胞分化、细胞凋亡和胁迫响应[60-65]。Mäki-Nevala 等[66]报道,基因启动子区域中CpG 岛(CpG 含量大于50%的区域)很容易被甲基化,从而导致基因表达的沉默。研究发现,人结肠直肠癌(CRC)DNA MMR 系统中,hMSH2/hMLH1 基因启动子区CpG 岛超甲基化(Hyper-methylation)可抑制hMSH2h/hMLH1基因的功能,而且hMSH2h/hMLH1 基因表达降低与其启动子区高甲基化水平密切相关[66-67]。Leong 等[67]报道,人散发性肿瘤中DNA MMR 功能失活是由hMLH1 基因启动子部位的甲基化引起的。Loktionov等[68]研究证明,人hMLHl启动子区高甲基化是指示CRC形成的表观遗传生物标记物(Epigenetic biomarker)。近年来,很多研究表明,CpG 甲基化亦是人CRC 和胃癌的分子生物标记物[69-71]。而且,人结肠癌细胞DNA损伤后,MutSα 可以招募DNMT1,从而在CpG 岛高甲基化诱导hMLH1 基因功能失活过程中起到促进作用[72-73]。有关植物基因组CpG 位点的甲基化状态以及甲基化多态性研究,主要集中在植物甲基化状态如何调控植物的生长发育或逆境胁迫与基因表达水平之间的相关性[2,60-65,74-76]。例如,逆境胁迫下,植物体内胁迫反应基因表达上调与基因组甲基化水平密切相关[76]。Cd 胁迫诱导拟南芥幼苗细胞内DNA 甲基化水平明显上升[65]。但是,我们的实验结果表明,Cd 胁迫下,拟南芥DNA MMR 系统中MSH2 和MLH1 基因启动子部位的CpG 甲基化水平没有显著改变[2]。正常情况下,植物MSH2 和MLH1 基因启动子部位的CpG 甲基化含量明显高于动物和人体[2]。因此,Cd 胁迫下,DDR 信号通路中植物DNA CpG 甲基化状态对DNA MMR系统中关键基因表达的调控作用不明显。
染色质是由DNA、RNA 和蛋白质组成的核蛋白复合体,在有丝分裂过程中,染色质有利于DNA 执行功能,并调控DNA复制、基因表达和保护DNA避免受到伤害。组蛋白是染色质的基本组分,由两个拷贝H2A、H2B、H3 和H4 形成的8 聚体。每个组蛋白8 聚体由147 bp 的DNA 片段组装为核小体,而且染色质中的组蛋白与DNA 含量比为1∶1。组蛋白上的氨基酸残基可以发生很多共价修饰,进而改变染色质的构型,导致基因转录激活或沉默。常见氨基酸残基的修饰种类包括组蛋白乙酰化/去乙酰化、甲基化/去甲基化、泛素化/去泛素化和磷酸化/去磷酸化[2,59]。正常情况下,组蛋白H3 第4 位与第36 位赖氨酸二或三甲基化(H3K4me2、H3K4me3、H3K36me2、H3K36me3)、H3和H4 的乙酰化均是活跃的甲基化转录信号组分,而H3K9me3和H3K27me3则是不活跃的甲基化状态,这些被修饰的H3 亦与DNA 损伤水平和DNA 修复功能密切相关[77]。例如,DNA DSBs 可以诱导染色质组分中的组蛋白H2AX 磷酸化(g-H2AX),而组蛋白乙酰化可以调控DSBs 修复,因为依赖于乙酰化的组蛋白参与DSBs 损伤识别,而组蛋白脱乙酰化酶(HDAC)则参与DSBs 损伤信号传导。因此,这些组蛋白修饰在NHEJ和HR修复途径中具有重要作用[33,78]。
H3K36 甲基化可以改变染色质构象和一系列生理生化过程,特别在DNA MMR 系统中亦发挥重要作用。例如,小鼠胚胎Dnmt1-KO 干细胞中,微卫星不稳定性(MSI)显著增加,表明DNA 甲基化参与了小鼠DNA MMR 过程[79]。人Dnmt1-KO 细胞中组蛋白H3甲基化后,改变了染色质的构象,导致MutL的多种功能显著减弱,尽管DNA MMR 关键基因启动子部位CpG 位点的甲基化状态没有变化[78,80]。近年来,Li等[81-82]研究表明,人细胞DNA 损伤后,H3K36me3 招募MutSα,与MSH6 蛋白的PWWP 域相互作用,改变了MutSα 的构象,从而影响DNA 损伤反应的识别信号,诱导MSI 增加,但是其DNA MMR 系统中关键基因的表达没有明显变化。人组蛋白H3K36附近的H3第34 位甘氨酸(H3G34)突变同样可以抑制DNA MMR 功能,增加MSI,从而诱发癌症的形成[83]。因此,人H3K36me3在维持正常DNA MMR系统功能方面是一种重要的组蛋白修饰。但是,有关植物组蛋白甲基化修饰在调控DNA MMR 系统中的作用,目前尚未见报道。
后基因组时代的开启,为研究者们打开了探索新知识的大门。尽管非编码RNAs(ncRNAs),如miRNAs、长链非编码RNA(Long non-coding RNAs,lncRNAs)和环状RNA 等不编码蛋白,但可以直接在RNA 水平发挥功能[59]。其中miRNAs 是一类约有22 个核苷酸(nt)的内源性、非编码单链小RNA,通过和靶基因mRNA 上的一些特定序列结合,诱导靶基因mRNA 被剪切或抑制其翻译,从而在转录后水平对细胞内的DDR、DNA 修复途径、细胞的分化/增殖和凋亡等多种代谢过程发挥关键调控作用[84]。DNA 损伤诱导小RNA 的大量产生,并积累于DSB 位点附近。这些小RNA 参与DNA 修复途径的选择和DNA 修复信号传导通路,但是不参与DNA 损伤的识别[85-86]。最新研究证实,人癌症细胞中,靶向DNA MMR 基因的miRNAs调控DNA MMR 关键基因的表达,亦影响MSI[87-90]。例如,Bobowicz 等[87]报道,与人DNA MMR 功能缺失的结肠癌T2-T3N0 细胞系相比,DNA MMR 功能正常细胞系中miR592 的表达增加了11.9 倍。人CRC 细胞系中,miR21 过表达会明显降低MSH2 和MSH6 蛋白的表达;然而,miR21 表达降低则明显增加此二种蛋白的表达[88]。双荧光素酶检测结果表明,miR155 可以靶向人CRC 细胞系中MLH1、hMSH2 和hMSH6 基因mRNAs 的3′UTR 区域,从而降低其相应编码蛋白的表达[89]。同样,人CRC 肿瘤活组织检查结果表明,miR-155过表达与MSH2和MLH1蛋白表达降低之间呈现出显著的负相关关系[89]。上述结果表明,DNA MMR 功能缺失的人CRC 肿瘤细胞中,DNA MMR 基因与miRNAs 之间的反馈调节机制被严重干扰,从而导致DNA MMR 系统中关键基因的异常表达[17,90]。Mao 等[58]研究证实,在人体外/内细胞系中,miR-422a结合于MLH1 3′端非编码区,从而抑制MLH1 的表达;而且,MLH1 和miR-422a 形成反馈循环(Feed⁃back loop),可以刺激某些miRNAs的生物合成。近年来有多位学者认为,miRNAs 可以作为反式激活元件(Trans-activating elements),从而调控等位基因和基因的表达[91]。这些结果进一步表明,miRNAs 在非孟德尔(Non-Mendelian)调控DNA MMR 基因表达过程中具有重要作用。
近年来,全基因组表达结果表明,植物miRNAs通过和靶基因mRNA上的一些特定序列结合,诱导靶基因mRNA降解或抑制其翻译,从而在转录后水平调控植物的生长、发育和逆境响应信号系统[92]。例如,miRNAs不仅在植物的时序转换、花器官发育、土豆块茎形成和豆科结瘤中具有关键调控作用,而且也参与多种植物(如拟南芥、小麦、大麦、水稻等)对生物胁迫和非生物胁迫(如微生物浸染,重金属Cd、铬、砷,缺硫、氮、磷,干旱和盐碱等)的响应过程[93-99]。不同植物中,参与生物/非生物胁迫的保守和非保守miRNAs包括:miR156a-f/h、miR166、miR167c-d、miR170、miR171b - c、miR172a / b-5p / c、miR395、miR397、miR472-5p、miR846-3p/5p、miR5651、miR5995b 和miR8182[76,100]。更为重要的是,逆境胁迫发生时,一些miRNAs 会表达上调,而另一些miRNAs 则表达下调。miRNAs正是通过下调胁迫应答过程中的负调节子靶基因或者上调胁迫应答过程中的正调节子靶基因,以减弱胁迫引起的毒性效应,从而发挥miRNAs重要的生理调控作用[2,51,76,92,100]。另外,Fu等[92]从油菜中分离到一系列miRNAs,并且验证了根系中有22 个miRNAs、地上部有29 个miRNAs 响应Cd 胁迫。miR⁃NAs 调控水稻耐Cd 研究亦有其他报道[100-103]。探讨miRNAs及其靶向基因可以深入了解植物响应重金属胁迫的调控机理[103]。在生态毒理学研究领域中,拟南芥细胞中靶向DNA MMR 系统关键基因(如MLH1、MSH2、MSH3、MSH6、MSH7 和PMS1)的miRNAs 鉴定及其在Cd 胁迫下调控DNA MMR 系统、胁迫响应系统、DNA 损伤和细胞周期G1/S 或G2/M 期阻滞的机制研究,目前国内外报道尚少。然而,本科题组利用miRNAs 测序和生物信息分析,筛选出了靶向拟南芥DNA MMR 系统中关键基因(如MSH2、MSH3、MSH6、MSH7、MLH1和PMS1)的miRNAs;利用烟草双萤火素酶报告系统,验证了3 个miRNAs(miRNA172b-5p,miRNA172e-5p 和miRNA472-3p)靶向MSH6,并且响应Cd 胁迫[3]。这些结果表明,miRNAs 对Cd 胁迫下植物DNA MMR基因具有关键调控作用。
lncRNAs 是一类长度超过200 nt 的非蛋白编码RNA,大多数由RNA聚合酶Ⅱ转录产生。lncRNAs可分为正义lncRNAs、反义lncRNAs、双向lncRNAs、基因内lncRNAs 和基因间lncRNAs 5 种主要类型[104]。lncRNAs 能利用其一级核苷酸序列或高级结构来结合DNA、RNA 以及蛋白质,并参与细胞内转录前、转录及转录后调控,其具体机制包括基因印记、顺式(Cis)调节、染色质重塑及剪切调控等[105-106]。例如,lncRNAs 可以通过Cis 调节方式参与基因转录水平调控。Cis 调控作用是指lncRNAs 对调节序列与被调节的编码序列位于同一条DNA 链上的编码蛋白基因进行转录水平的调控。而反义lncRNAs 与邻近蛋白基因在基因组上以头对头的方式反向排列和转录,由于其具有独立的转录单元或转录区与蛋白编码基因存在重叠,在转录后甚至是转录过程中并不需要转运或再处理,可以通过Cis 调节邻近基因的表达[105]。因此,反义lncRNAs 可以通过对序列位于同一条DNA链上的邻近编码基因进行转录水平上的调控,即Cis调控方式,参与一系列细胞核内基因水平的生物学过程[106]。
目前,在拟南芥、小麦、玉米、高粱和杨树等植物中,很多lncRNAs 已经被筛选出来,它们的表达具有组织和胁迫特异性[107-114]。植物lncRNAs 亦可以与DNA、RNA 以及蛋白质相互作用,并且在细胞核或细胞质中具有调控功能。在细胞核中,lncRNAs 可以通过顺/反式转录调控作用改变基因的表达,或者类似于组蛋白或者可变剪切作用,调控蛋白质代谢[104,115-116];在细胞质中,lncRNAs 参与形成蛋白复合体、抑制miRNAs 参与的转录调控过程,从而影响靶向mRNA 的稳定性以及降解和翻译过程[117-118]。目前,尽管调控植物DNA MMR 系统的lncRNAs 尚没有报道,但是参与DNA 修复(如HR 和NHEJ)、细胞周期和细胞凋亡的某些lncRNAs 已经被筛选出来[119-120]。lncRNAs 具有调控植物DNA MMR 系统的潜在可能性,可能不久的将来会有科学报道[2]。
植物DNA MMR 系统在修复Cd 诱导的DNA 损伤方面发挥重要作用。Cd 胁迫下,植物基因组DNA 不稳定性明显增加,导致DNA 复制过程中复制滑移和碱基错配频次增加;另外,DNA 损伤通过跨DNA 损伤(Translesion)复制途径导致DNA 错配损伤明显增多。DNA 错配损伤主要在G2 期被MutS(如MSH2、MSH3、MSH6、MSH7)识别,从而激活DNA MMR 系统;然后MSH2 继续激活ATR/ATM,从而诱导DDR 信号系统,包括招募其他DNA 修复系统(如HR、NHEJ)等有关酶,参与依赖于ATM 的MAPK 信号传递,识别/修复DNA 损伤,调控细胞周期检验点、内复制和程序性细胞死亡。在植物MutS 功能正常情况下,Cd 诱导的DNA 损伤激活ATR 后,MutS 引起G2/M 期阻滞,降低细胞内复制,增加DNA MMR 和HR 无差错修复活性,以及显著降低程序性细胞死亡的可能性,从而增强植物对Cd 胁迫的耐性。然而,MSH2、MSH3、MSH6、MSH7 缺失的植株将会绕过(Override)DNA MMR 系统参与的DDR 响应,释放出MLH1,从而导致植株对Cd 胁迫的微弱耐性。因此,在不改变植物细胞内DNA MMR 基因DNA 序列的前提下,通过调控转录后水平,即调控ncRNAs(miRNAs、lncRNAs 等),分别构建植物DNA MMR 系统中关键基因(如MSH2、MSH3、MSH6、MSH7、MLH1和PMS1)的ncRNAs敲减/过表达转基因品系,一方面可以进一步明确Cd的毒理机制;另一方面可以改造DNA MMR 系统中不同基因的转基因品系功能,分别筛选改良性状良好、对Cd耐性强的品系,从而获得具有较高DNA MMR 系统活性、功能以及强耐Cd 性能的转基因品系,从而为早期生物诊断、风险评价、培育新型、高效的抗逆境植物品种和生物修复Cd污染土壤提供科学依据。