施宏辉 蒲金定 何建行
lncRNA-CCAT1(CCAT1)是1种异常高表达的lncRNA,具有肿瘤细胞增殖等生物学功能。在结直肠癌,胰腺癌以及HBE等的模型中发现Myc直接结合lncRNA-CCAT1的转录调控区对其调节并产生促癌功能[1-3]。CCAT1 的表达上调与其基因启动子区域的E-box(enhancer box,增强子框)元件直接结合 c-Myc 有关,一旦 E-box 元件发生突变,c-Myc 将不能促进 CCAT1 的表达[1,4-5]。在胰腺癌模型中通过RNA免疫沉淀(RIP)和染色质免疫沉淀(ChIP)测定进行分析发现 c-Myc通过E-box元件的结合对CCAT1表达的产生影响[6]。在结肠癌组织也发现了与 CCAT1 上游调控区域,有E-Box的ChIP峰值信号[2]。
在生物机理方面:c-Myc激活的lncRNA CCAT1表达有助于结肠癌肿瘤发生和转移过程,甚至可以预测结肠癌的预后临床结果,极有可能是肿瘤治疗的潜在lncRNA靶标[1-2]。
该人类基因组版本于2009年发布,相较于GRCh38版本,有充分的基因注释信息,因此选取该版本。
ENCODE为国立人类基因组研究中心(NHGRI)联合国际各研究机构针对DNA调控单元发布的基因注释数据库,包括具体调控单元,如何转录以及基因如何激活控制细胞生命过程等等[7]。截止2018年,在数据库发布的中A459细胞ChIP Seq数据库一共374套。(https://www.encodeproject.org/report/?type=Experiment&status=released&assay_slims=DNA+binding&replicates.library.biosample.donor.organism.scientific_name=Homo+sapiens&biosample_type=cell+line&organ_slims=lung&biosample_term_name=A549&biosample_term_name=A549)本研究对该数据集中的重要数据进行数据挖掘和分析。
(http://genome.ucsc.edu/cgi-bin/hgGateway hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0)这是加州大学圣科鲁兹分校开发的一款可以可视化基因组注释数据的浏览器,通过该浏览器,可以分析基因组位点注释情况,以便后续的功能实验。
CCAT1的基因组座位为 hg19 版本DNA的8号染色体chr8:128,219,629-128,231,333,总共跨越约12000bp的基因组区域,转录方向为反向,转录本包含两个外显子。Myc的基因组座位hg19 版本8号染色体chr8:128,748,315-128,753,680 总共跨越 5,366bp,转录方向为正向,转录本共计3个外显子。CCAT1与Myc基因间的DNA线性距离约为517Kbp。
该区域功能序列如:LOC727677,POU5F1B,PVT1,TMEM75,MiR1204-1205-1207基因簇等。见表1。
表1 操纵子主要基因列表
ENCODE项目主要是注释DNA序列的功能信息,在UCSCGenomeBrowser的基因调控单元卡中选取“Regulation”(基因调控)下的“ENC TF Binding”(ENCODE项目的转录因子结合位点注释),http://genome.ucsc.edu/cgi-bin/hgTrackUi hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0&c=chr8&g=wgEncodeTfBindingSuper,选取Uniform TFBS,并打开设置A549细胞的ChIP Seq信息,截止2018年一共有319套数据,有些镜像页面只提供2012年前约100套数据的整合结果,后续新的数据可以直接下载wig文件,上传到浏览器做数据展示。获得主要的转录因子结合序列区域为chr8:128234833-128235142,主要发现该调控区域的实验为GR转录因子的ChIP Seq实验。该区域很有可能是Myc结合区域。
H3K27Ac为基因激活的信号区域,在该蛋白结合的DNA位置,招募RNApol2进行转录的可能性较大。通过2012~2017年的数据集,在ENCODE官网下载H3K27Ac的ChIP Seq数据[7-8]。其主要数据集为“ ENCSR480OHP”(https://www.encodeproject.org/experiments/ENCSR480OHP/)。经基因组浏览器发现:CCAT1 上游染色体DNA区域(CCAT1转录方向为负)至Myc上游染色体DNA区域(Myc转录方向为正)存在大量离散H3K27Ac信号。表明该操纵单元区域转录调控活跃。在CCAT1上游附近的区域,chr8:128,227,795-128,249,933;chr8:128,232,576-128,235,366;chr8:128,229,260-128,238,681;此3个区域的H3K27Ac的ChIP结合信号比较活跃,为CCAT1上游启动子序列中的转录因子结合位点的可能性较大,并起到激活基因转录表达的作用[9]。
通过基因组浏览器,选取“DNA选项”,输入结果2.2和2.3发现的4个候选区域DNA,根据转录的特性选取反向互补序列(CCAT1转录方向为负),①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681。CAC(G/A)TG是Myc作为转录因子的核心结合序列模式。通过BlastN方法比对Myc特异性结合的CAC(G/A)TG序列,发现该4个区域都有两种序列存在。所以该区域很有可能是Myc潜在直接结合区域,并调控CCAT1的转录。
当基因处于转录活性状态时,相较于无转录活性区域,该染色质区域对DNase(1种内切块酶)降解的敏感性较强[10]。在转录活性基因附近的DNA区域,有一中心区域,称为超敏感区域(hypersensitive region)或超敏感位点(hypersensitive site),其对DNaseⅠ具有高敏感性。这些位点或区域将首先受到DNaseⅠ的剪切。通过ENCODE数据库的数据挖掘,可发现TFBS以及H3K27Ac的区域是DNaseⅠ的超敏区域[11]。这也暗示了该区域具有双向调控CCAT1 和Myc等基因的可能。
本研究采用ENCODE数据库中的A549的共享ChIP Seq数据进行具体案例的表观遗传学分析。数据挖掘和预测Myc调控CCAT1上游启动子的具体结合位点[6]。CCAT1 是近几年发现的1种具有促癌作用的lncRNA,在多种肿瘤尤其是消化道肿瘤中异常高表达。Myc可促进 CCAT1基因转录,但具体的上下游作用机制有待深入研究[1,6]。本研究可为后续在表观遗传层面研究CCAT1上游染色质结构的变化提供理论依据。表观遗传突变是对染色体的分子遗传修饰,改变基因表达而不改变DNA序列情况。所涉及的生命过程是DNA甲基化,组蛋白修饰和染色质重塑。癌细胞的性质中,如肿瘤细胞的异质性和对靶向药物的耐药性,并无法完全通过遗传学规律来解释[12]。越来越多的致癌的表观遗传机理被认为比单纯的基因变化更普遍。表观遗传的机制可导致抑癌基因的失活,癌基因的活化和/或基因印迹模式的改变,而不发生基因组不稳定性[11]。
Myc基因最初被发现是从宿主细胞基因组获得的1种癌基因 (v-myc),由1个小组的禽白血病病毒。发现细胞c-myc基因及其直系同源基因(MYCN 和 MYCL) 会受到基因的改变,如扩增,染色体易位,病毒整合,在广泛的癌症导致肿瘤发生[12]。在正常细胞中,内源性Myc基因的上调表达可以激活有丝分裂和组织发育等下游信号通路。Myc 蛋白功能作为重要的转录因子,多方位调控下游各类基因的表达,在细胞生长和增殖过程中发挥重要作用[12-14]。
本研究综合过往研究文献发现CCAT1与临床病理特征显著相关提示其可能具有成为1种早期诊断、临床病理分期和预后判断水平的肿瘤标志物。而且在多种肿瘤细胞里面发现特异高表达[1,2,14],随着研究的不断深入及调控机制的逐步明确、以lncRNA为靶点新型抗肿瘤药物的研发,CCAT1极有可能成为肿瘤诊断与治疗中的1个靶标[14]。在胰腺癌细胞以及结直肠癌模型中,生物信息方法分析发现Myc和CCAT1在基因组中距离不远。暗示Myc和lncRNA CCAT1可能在同一操纵子中。在HBE(支气管上皮细胞)的模型中甚至发现了同一区域的Myc,CCAT1和let-7存在负反馈调控的模式。该研究在表观遗传学角度论证了Myc和lncRNA CCAT1上游调控序列中E-Box的结合,以及let-7对CCAT1,和let-7调控Myc 基因3UTR(3’端非翻译区)的模式。但至今仍然未见在非小细胞肺癌中Myc如何调控CCAT1的细节。查阅文献,总结原因为:①CCAT1现今发表的文章还是偏少(Pubmed,70篇);②现今CCAT1肿瘤学的主流研究还是在lncRNA的表达水平这个领域;③非小细胞肺癌体系中lncRNA的研究还是偏向lncRNA调控靶标分子方面,而在lncRNA的上游调控模式这块,数据偏少。所以本研究还是结合理论实际,采用生物信息方法分析和数据挖掘,以A549为模型,找到Myc调控lncRNA CCAT1的可能位点,为后续表观遗传学方法验证提供支持,甚至为可能存在的非小细胞肺癌中Myc相关负调控模型以及Myc操纵单元中ceRNA负反馈模型等假说提供支持。
联合本研究中Myc结合区域的预测结果,提出如下基因调控假说:在非小细胞肺癌模型中Myc转录因子通过结合①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681四个区域某个或者某几个E-box结构元件正向调控CCAT1的表达,使其特异性上调表达;从而进一步影响肿瘤细胞增殖的功能。
本研究为表观遗传调控模式预测的前置性探索工作。有报道表明在多西他赛耐药的肺腺癌中,CCAT1的异常表达可以释放Bcl-xl,结合miRNA let-7,促进肿瘤细胞的化学耐药性,而CCAT1的下调则可下调降低化疗耐药性[15]。在乳腺癌的放疗模型中,CCAT1的敲低后, miR148a的相关通路被扰动,使得乳腺癌细胞放疗敏感性增强[16],这也证明了CCAT1具有复杂多元的促癌功能。在临床方面,CCAT1上游序列在癌症特异发生过程的表观遗传学的证据可以用来作为识别个体风险的联合指标,并选择最佳干预措施。特定癌基因驱动的突变以及相关的代谢和信号通路的变化,可以提供肿瘤检测,诊断和治疗研发的新思路。然而,现只有有限数量的分子标记被纳入临床指南,所以该领域有很大的空白空间[17-18]。CCAT1具有肿瘤治疗靶点的潜力,但具体的上游的调控研究仍未展开,这是一个极具价值的科学问题。