真核生物转录因子与DNA互作的研究方法进展

2023-02-16 02:13杜晓悦刘淑英
动物医学进展 2023年1期
关键词:染色质荧光素酶基因组

杜晓悦,刘淑英

(内蒙古农业大学兽医学院/农业部动物临床诊疗技术重点实验室/内蒙古自治区基础兽医学重点实验室,内蒙古呼和浩特 010018)

储藏着遗传信息的DNA,需要通过转录和翻译才能表达,进而行使其生物学功能。转录是基因表达中的重要一环,转录因子(transcription factor,TF)通过识别特定的DNA序列以控制染色质和转录,以形成指导基因组表达的复杂系统[1]。真核生物转录起始过程十分复杂,有一个装配的过程,RNA聚合酶必须借助TF的装配才能选择性的结合到启动子上,共同参与转录起始的过程[2]。在过去相当长的一段时间里,研究者们认为TF的作用只发挥在转录起始水平上,随着对其功能研究的深入,发现TF在转录起始的前后也可以通过与基本转录复合体的相互作用而发挥重要的功能[3-4],其中TF在对特定基因的染色质结构的组装方面起着至关重要的作用,可使基因的染色质结构处于开放的有利于转录的状态,或者形成更加紧密的闭合结构而不能进行转录。

TF是指除RNA聚合酶外,参与转录及转录调节的一类蛋白质。TF通过直接与特定的DNA序列和其他辅助蛋白相互作用,控制基因的“开关”,以精密调控细胞分化和组织发育等重要生物学过程[5-6],此外对于特定的途径,如免疫反应也有一定的调节作用[7]。TF含有转录激活域和DNA结合域,其中DNA结合域按照结构特征可以分为锌指、螺旋-转角-螺旋、螺旋-环-螺旋和亮氨酸拉链。根据TF的作用特点可分为两类,一类为通用转录因子(general transcription factor,GTF),它们与RNA聚合酶共同组成转录起始复合体时,转录才能在正确的位置开始[8];另一类为特异转录因子(special transcription factor,STF),是在特异的组织细胞中表达或在特定条件下被激活的一类TF。

真核生物中TF对基因的表达调控至关重要。目前,NCBI的GenBank里收录了519 607个TFs,其中真核生物TFs有497 792个。随着对TF调控基因表达理解的不断加深,研究者们发现TF异常表达导致的调控错误可导致人类与动物疾病的发生[9-10],因此TF也成为了很多疾病的治疗靶标。真核生物TF与DNA之间的相互作用对于DNA复制[11]、重组和修复[12]、转录[13]和病毒组装[14]等许多生物学过程具有关键调控作用。目前,针对TF与DNA互作的研究已开发出多种方法,每种方法均有各自的优点与不足,论文在传统研究方法的基础上介绍新兴的研究技术,为研究TF与DNA相互作用提供参考。

1 传统转录因子与DNA互作研究方法

1.1 转录因子结合位点预测

能与TF发生特异性结合并对基因表达起到调控作用的DNA序列称之为转录因子结合位点(transcription factor binding site,TFBS),通常大小在5 bp~25 bp之间。同一个TF在不同的基因上的结合位点具有一定的保守性,但也不完全相同。研究TF与DNA互作首先要分析靶基因上潜在的TFBS,近年来,关于TF的数据库被建立并得到广泛应用,表1列出了这些数据库的名称与网址,综合应用以下数据库可为TF的研究提供较为系统和全面的信息,其中AnimalTFDB于2019年华中科技大学郭安源团队开发[15],是国内首个建立的动物TF注释和预测数据库,包含97个物种全基因组TF和转录辅助因子的分类和注释,其中TF根据其DNA结合域(DNA-binding domain)又分为73个家族,辅助因子分为83个家族和6个类别。因为对人类TF使用的广泛需求,在新版AnimalTFDB数据库中单独设计了一个人类TF数据库网络界面(HumanTFDB:http://bioinfo.life.hust.edu.cn/HumanTFDB/)。

表1 预测TFBS的数据库及网站

1.2 双荧光素酶报告基因系统

双荧光素酶报告基因系统常应用于鉴定基因启动子及其调控元件[16],近年来也用于miRNA靶基因验证[17]等方面的研究。由于荧光酶素活性检测灵敏,单报告基因常会因为细胞状态、转染效率和实验人员操作等影响检测结果,所以通过共转染中加入内参作为对照以实现试验的均一化和数据的可靠性及真实性。双荧光素酶通常是指萤火虫荧光素酶(firefly luciferase)和海肾荧光素酶(Ranillaluciferase),在试验中,前者常作为检测基因,而后者作为内参基因一同转染至细胞中进行检测。

利用双荧光素酶报告基因系统研究TF的应用较为广泛,其中检测启动子活性的一般过程为:将启动子DNA片段连接至萤火虫荧光素酶报告载体上,构建萤火虫荧光素酶报告基因质粒,将报告质粒和内参一同转染至特定细胞中,检测相对荧光酶素活性[18]。为进一步确定核心启动子片段可将启动子DNA片段进行截短突变、缺失突变和定点突变。在研究特定TF的作用时,可构建TF过表达载体,将其与报告质粒和内参一同转染至特定细胞中,通过与未过表达处理的对照组相比,检测相对荧光酶活性的高低以判断其对启动子转录活性的影响。

1.3 电泳迁移率变动分析

电泳迁移率变动分析(electrophoretic mobility shift assay,EMSA)是一种研究TF和其相关的DNA结合序列相互作用的经典方法,可用于定性和定量分析[19-20]。TF在特定状态下入核,通过与基因组上特定序列结合以调控基因的转录与表达,因此通常需要提取细胞核蛋白进行试验。DNA探针的标记分为放射性标记和非放射性标记,放射性探针一般用32P标记,由于32P的寿命短、具有放射性和制作耗时较长等缺点,该方法逐渐被替代,而非放射性标记(地高辛、生物素或红外荧光标记)具有高效、省时和费用低等优点,现在被广泛使用。

该方法的基本原理和过程如下:将细胞核蛋白和标记的DNA探针于室温进行孵育,利用非变性聚丙烯凝胶电泳检测标记DNA-蛋白质复合物的位置。当细胞核蛋白与标记的DNA探针结合后可形成DNA-蛋白质复合物而导致迁移速率变慢,从而分离出DNA-蛋白质复合物和游离的探针。当试验中加入未经标记的DNA探针时,可形成竞争反应,使DNA-蛋白质复合物的标记减少。同一家族的TF存在多种亚型,检测与DNA探针相结合的TF亚型需要进行超级凝胶阻滞试验(super shift EMSA)[21],即在细胞核蛋白与标记的DNA探针孵育后,再加入特定的TF抗体,若能形成更大的DNA-复合物条带,即可确定TF亚型。

EMSA可在体外快速且灵敏的检测TF和特定DNA序列的结合,但是它不能反映在活细胞内和生理状态下的TF与DNA结合的情况,因此还需要结合体内试验进行进一步的验证。

1.4 染色质免疫共沉淀测序

目前,染色质免疫共沉淀(chromatin immunoprecipitation,CHIP)是在体内研究DNA与蛋白质相互作用的标准方法,CHIP结合高通量测序技术称为ChIP-seq,该方法可在全基因组范围内分析DNA结合蛋白和组蛋白修饰[22],是研究基因组表观遗传学的强大工具。

该方法的基本原理和过程如下:首先通过甲醛交联处理细胞,固定活细胞内与DNA结合的蛋白,细胞破碎处理,超声打断基因组DNA,其中断裂的DNA主峰大小以200 bp~500 bp为宜;随后加入TF特异性抗体与DNA-蛋白质复合物孵育,利用可以结合抗体的ProteinA磁珠将抗体-蛋白-DNA复合物抓取下来,之后将DNA与蛋白解离;将DNA片段补平,加A,加接头,最后进行高通量测序,将这些DNA片段与参考基因组进行比对分析,从而获得与TF发生特异性结合的DNA信息及其定位。

ChIP-Seq对抗体的特异性要求较高,需要CHIP或IP级抗体,而市面上大部分的这类抗体通常来源于人和小鼠,这限制了对非模式物种的研究,且试验过程中的甲醛交联、染色质片段化、免疫共沉淀以及文库构建等步骤繁琐且条件较难控制[23-24],试验中需要大量细胞,重复性较差,试验背景较高,在消耗大量细胞和抗体后得到较难分析的数据,这在一定程度上又限制了ChIP-Seq在转录因子与DNA互作研究中的进一步应用。

2 转录因子与DNA互作研究的新兴技术

2.1 DNA亲和纯化测序

DNA亲和纯化测序(DNA affinity purification sequencing,DAP-seq)技术最早发表于2016年的《Cell》期刊上[25],作者O'Malley以拟南芥作为试验对象,对529个TFs进行DAP-seq测序,以研究这些TFs的结合位点及分布规律,试验最终获得了270万个基因组内的TFBS,覆盖了11 Mb(9.3%)的基因组。为验证DAP-seq方法的可靠性,通过对拟南芥的3个TFs进行ChIP-seq分析,对两种方法获得的数据相比较,表明试验生物学重复的相关性高(pearson系数>0.7),结果稳定,表明该技术可用于TF与其结合位点的研究。

该方法的基本原理和过程如下:首先设计合成TF基因,构建含Halo tag与TF基因的载体并表达TF融合蛋白;然后在表达的TF中加入适量基因组DNA进行孵育,利用磁珠富集与TF蛋白结合的DNA片段;最后通过高通量测序技术,对富集的DNA产物进行测序分析,从而定位与TF特异性结合的DNA区域。

DAP-seq以低成本和高通量实现了适用于任何物种的TFBS捕获[26],虽然该方法是一种体外研究TF与DNA互作的方法,但是它可以保留基因的甲基化信息,从而最大程度的还原体内真实环境,结合位点鉴定效果准确,且不依赖于TF抗体,这对于过去无法制备TF抗体的物种、非热门的TFs研究都适用,该方法扩大了TF研究的范围,可以进行大规模基因家族的结合位点鉴定[27]。

2.2 染色质靶向切割与标签化

2019年Henikoff等在《Nature Communication》期刊上发表了染色质靶向切割与标签化(cleavage under targets and tagmentation,CUT&Tag)技术的原理,对比使用了ChIP-seq、CUT&RUN、CUT&Tag 3种方法来研究人K562细胞组蛋白修饰与RNA聚合酶Ⅱ,对比试验结果表明,CUT&Tag有最低的低背景噪声,最强的信号,可用于研究TF调控网络[28]。通过对H3K4me1修饰物进行分析,得到的试验数据证实CUT&Tag的灵敏度最高,试验可重复性最好。CUT&Tag有望将蛋白与染色质DNA互相作用的研究变成了一种类似PCR反应的常规操作,对基因调控、表观遗传等领域的研究具有革命性的意义。

该方法的基本原理和过程如下:活细胞与ConA Beads孵育,对细胞进行渗透性处理,加入TF特异性抗体和相应二抗孵育并结合proteinA/G-Tnp转座子,当其被激活后,可仅在特定组蛋白修饰和TF结合染色质的局部进行目的DNA片段化,同时添加测序接头,并将其释放到细胞外。由于绝大部分无关的染色质还留在细胞核内,因此整个试验的信噪比大幅提高,同时简化了试验步骤。在片段化基因组的同时加上接头,不需要繁琐的补平加A加接头,在1 d内可以完成从细胞到测序文库制备全流程。

CUT&Tag在低细胞数和单细胞水平上证实了对组蛋白修饰和TF分析试验的适用性,是一种革命性的新技术,相较于传统的ChIP-seq,它具有以下优点:省时高效,所需的细胞量少,背景信号低,可重复性好等优点,可用于单细胞水平测序[29-30]。但CUT&Tag与ChIP-Seq都依赖于使用特异性抗体以高效结合目的蛋白,因此获得高品质的抗体是试验成功的先决条件。

3 各类研究方法的比较

上述TF与DNA互作的研究方法各有特点和不同,其对比见表2。TFBS预测是运用数据库初步分析与靶基因结合的TF并给出可结合序列的预测分值。双荧光素酶报告基因系统、EMSA和DAP-seq是体外研究TF与DNA相互作用的方法,而CHIP-seq和CUT&Tag是体内的研究方法,可以在全基因组范围内分析TFBS、组蛋白修饰、核小体定位和DNA甲基化,同时也是研究DNA与蛋白质相互作用的金标准。此外,DAP-seq与CHIP-seq和CUT&Tag一样,能够保留体内的甲基化信息,对于特异性CHIP级抗体难寻和研究非模式物种的情况下,可以考虑该方法进行试验。

表2 转录因子与DNA互作方法比较

4 展望

在真核生物中,TF与DNA的相互作用受到多种因素的影响,如自身基因组DNA序列、DNA修饰、染色质构象和DNA相关蛋白之间动态的相互作用等,因而研究TF与DNA的相互作用也存在一定的困难。TF对于维持生命的正常活动具有重要的作用,大量研究表明TF与疾病的发生发展密切相关[31-32],TF也成为某些疾病的治疗靶标[33-34]。论文详细介绍了目前较常用和新兴的几种研究TF与DNA互作的研究方法,获得的结果极大地丰富了TF调控网络与机制的研究内容。在上述方法中,只有ChIP-seq和CUT&Tag能够反映活细胞内的真实状况,但是上述两种方法都依赖于特异性的CHIP或IP级抗体,这在一定程度上限制了TF与DNA互作的研究,相信随着科学技术的不断进步,未来新技术或许能够去攻克这一难关。

猜你喜欢
染色质荧光素酶基因组
染色质开放性与动物胚胎发育关系的研究进展
哺乳动物合子基因组激活过程中的染色质重塑
NNMT基因启动子双荧光素酶报告系统的构建及其与SND1靶向关系的验证
牛参考基因组中发现被忽视基因
不同双荧光素酶方法对检测胃癌相关miRNAs靶向基因TIAM1的影响
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
重组双荧光素酶报告基因质粒psiCHECK-2-Intron构建转染及转染细胞萤火虫荧光素酶和海肾荧光素酶表达
染色质可接近性在前列腺癌研究中的作用
“哺乳动物卵母细胞生发泡染色质构型的研究进展”一文附图