顾京晶
(1.湖南农业大学 动物科技学院 410128;2.禽畜遗传改良湖南省重点实验室 410128)
生物功能基因组研究中的核心问题在于:如何在整体水平上解析基因与调控元件间、基因与基因间的互作,进而了解生物在生命活动中涉及的基因复杂调控机制。在真核生物的细胞核内,染色体遵循一定规律进行三维折叠,基因的表达、调控,以及基因调控元件间的相互作用都基于复杂的染色体3D结构。Bickmore和van Steensel在2013年的研究表明,染色体在分裂间期的细胞核内存在长片段的核染色质区间(包括异染色质和常染色质)和染色质疆域,同时存在短片段的增强子——启动子连接区域,这些染色质三维结构对细胞正常的基因表达和调控有重要影响[1]。启动子不但与邻近调控元件结合,而且与调控元件借助染色体三维结构存在长距离远程调控机制。例如:Fullwood等人于2009发现在人乳腺癌细胞系MCF7中存在大量远程调控元件参与乳腺癌关联基因的调控。Li等人于2012年在对多类癌症细胞系的研究后发现,大量的启动子与启动子的远程相互作用、基因的共调控,是通过形成特定的染色质拓扑结构来进行的,因此原本线性距离非常远的调控因子可以通过染色质折叠结构,达到空间上的近距离接触。众多科学家们基于一系列染色质构象捕获研究,发现了多种染色质的交互作用类型和染色质结构特征,其中包括启动子与启动子、增强子与启动子的交互作用、染色质区隔、染色质拓扑异构域、染色质环状结构。这些研究成果表明,基于染色质三维构象的基因调控机制的认识正在不断深入,三维基因组时代即将到来。迄今为止,对于三维基因组的研究主要集中在人类的正常以及癌细胞株、小鼠细胞株、酵母、果蝇、拟南芥和棉花中。
下面将从荧光原位杂交技术到Hi-C技术探讨三维基因学研究所采用的技术手段。科学家们对染色质的结构关注由来已久,从十九世纪开始到本世纪初,研究者以显微镜结合荧光原位杂交技术,对细胞核中染色质上单个位点的空间结构进行了观察研究,但这一阶段研究受限于当时的实验技术,只能大略对染色质结构做低分辨率解读。随着基因组研究的不断深入和实验技术的提高,Dekker等人在2002年对酵母的染色质构象进行了研究,提出了称为染色质构象捕获(Capturing Chromosome Conformation,3C)的新技术。3C技术的要点为:在完整细胞状态下,利用甲醛对DNA分子进行原位固定,将交联的蛋白质和DNA分子固定下来,然后对染色质片段进行限制性内切酶酶切和临位连接,获得包含所有连接产物的DNA片段文库,运用获得的片段数据计算出不同位点在染色质上的交互频率,从而推测出位点之间的空间距离,进而绘制出染色质的三维空间构象交互图谱。此后,科学家们在研究两个或少数几个位点之间的3C技术基础上开发出了一系列衍生技术,如特定位点对多位点的4C(Circularized Chromosome Conformation Capture,4C),多位点对多位 点 的 5C(Carbon-Copy Chromosome Conformation Capture,5C),两个或少数几个位点之间的ChIP-3C,全基因组层面一个特定蛋白介导的所有位点对所有的ChIA-PET和全基因组层面所有位点对所有的Hi-C技术。在这些技术中,ChIA-PET和Hi-C技术都可以通过二代高通量测序技术获得海量数据,从而建立高分辨率染色质构象图谱。与ChIA-PET有所区别的是,Hi-C可以无偏差的在全基因组范围捕捉到所有染色质交互信息,在现阶段已经可得到最精细分辨率为1kb的染色质构象图谱(由Rao等人在2014基于人淋巴母细胞系研究)[2]。Hi-C技术作为目前为止可无偏差解析全基因组范围内染色质空间构象的最有效方法,将有助于了解基因组的三维结构,推动功能基因组学研究。