王欣瑜 祁 迪 王思原 付 慧 刘 威
山西医科大学汾阳学院 山西汾阳 032200;①基础医学部;②科技中心;③医学检验系
长链非编码RNA(l nc RNA)广泛参与重要生物学过程和众多疾病的调控,已成为遗传学和分子生物学关注的新热点。lnc RNA 是一类转录本长度大于200nt、无蛋白质编码潜能但具有调控基因表达作用的非编码RNA 分子。l nc RNA 可在表观遗传水平、转录水平及转录后水平上调控基因的表达[1]。近年来,lnc RNA逐渐成为治疗疾病的新的分子靶标。
恶性肿瘤严重威胁患者的生命,并给患者带来身体痛苦和经济负担。从根本上讲,癌症是一种细胞信息流改变从而导致细胞内稳态改变、并促进细胞生长的遗传性疾病。最新研究表明,在多种癌症类型中均出现lnc RNA 表达显著异常,且l nc RNA 可作为癌基因和抑癌基因等的转录调控分子,调控癌症相关的重要信号通路。因此,lnc RNA 可作为癌症表型的生物标志物、可提供预后价值或甚至为癌症患者提供治疗途径[2]。本文主要综述l nc RNA 参与肿瘤发病分子机制的最新研究成果。
lnc RNA 首次由Okazaki等(2002年)在小鼠全长c DNA 文库测序中发现。根据lnc RNA在基因组中相对蛋白编码基因的位置,将其分为正义、反义、双向、内含子间和基因间lnc RNA 五种类型。lnc RNA 和mRNA 一样,多数由RNA 聚合酶Ⅱ转录形成。lnc RNA 的亚细胞定位也呈多样化,在细胞核、细胞质和细胞器均有分布;lnc RNA 表达广泛,在许多组织中均有表达。与mRNA 相比,l nc RNA 在较大程度上仅限于在某些细胞类型中表达,许多lnc RNA 在分化组织或特殊的癌症类型中特异性表达[3]。lnc RNA 起初被认为是基因组转录的“噪音”,不具有生物学功能。然而,近年来的研究表明lnc RNA 具有广泛的生物学作用。其通常在进化上有保守的功能、二级结构和微同源序列区域[2]。
lnc RNA 在许多生物学过程中发挥重要功能,如X 染色体失活、剂量补偿、基因组印记、染色质修饰与重塑、细胞凋亡、细胞周期及端粒生物学等重要调控过程[4]。
lnc RNA 的功能始于其细胞定位:细胞核l nc RNA 的功能多涉及染色质相互作用、转录调节和RNA 加工,而细胞质lnc RNA 可调控mRNA 稳定性或翻译,并影响细胞的信号级联反应[5]。
lnc RNA 在染色质水平上的转录调控是一个广泛研究的机制,可涉及影响临近染色体基因的顺式调控或靶向不同染色体上基因的反式调控[6]。lnc RNA 可作为增强子相关RNA 通过转录调节、转录因子捕获、染色质成环及基因甲基化以顺式作用对基因进行调控[7]。l nc RNA 还可通过调控转录因子招募、染色质修饰以及在单基因位点上作为多个调节分子组装的“脚手架”而调节远端基因。Xist为最先被注释功能的l nc RNA 之一,其通过定位于X 染色体并直接和间接招募多个因子使X 染色体失活,从而调节雌性哺乳动物的剂量补偿效应。人类恶性肿瘤经常会出现X 非整倍性,这表明X 连锁基因的剂量补偿作用对阻止恶性转移的重要作用[8]。
lnc RNA 与蛋白质相互作用可调节蛋白质功能、蛋白间相互作用或指导蛋白分子在细胞区室内的定位[2]。lnc RNA 可调节mRNA 的稳定性、剪接以及翻译。l nc RNA 和假基因RNA 可作为竞争性内源RNA(ce RNA)或“RNA 海绵”与mi RNA 相互作用,从而隔绝这些mi RNA 分子并减少其对靶标mRNA 的调节效应[9]。
非编码基因组中的突变是造成人类疾病的主要因素之一。许多类型的癌细胞出现了非编码基因突变或表观遗传学改变[10]。DNA 调控序列的突变可改变增强子或启动子活性,甚至改变染色质状态,从而广泛影响基因转录。l nc RNA 基因出现在这些突变区域,会导致表达异常。单核苷酸多态性(SNP)也可显著改变lnc RNA 的转录。例如,SNP在8q24位点上含量丰富,其中一些可影响癌症相关lnc RNA 的表达,包括大肠癌中CCAT2 和前列腺癌中PCAT-1等[11]。
lnc RNA 可作为癌症表型的生物标志物。研究表明,在26 种人类肿瘤类型中,lnc RNA HOTAIR 的失调与癌症的发展有关,且HOTAIR 可预测卵巢癌患者对两种铂化疗的敏感度差异,潜在地指导临床决策[12]。新型前列腺癌抗原3(PCA3)可作为前列腺癌的特异性生物标志物。美国食品药品管理局(FDA)已批准将PCA3用于前列腺癌的诊断,这是FDA 批准的首例基于l nc RNA 的检测。PCA3作为尿液中的前列腺癌生物标志物,已成为前列腺癌的一种有效、无创的检测[13]。同样,对胃癌患者胃液分泌的分析将lnc RNA-AA174084鉴定为区分胃癌与胃黏膜上皮良性疾病的生物标志物[14]。最近有研究发现了新的lnc RNA GASL1在颅内动脉瘤患者的血清和血管平滑肌细胞中表达下调,并在体外调节血管平滑肌细胞的增殖[15]。
肿瘤形成是一个十分复杂的过程,是细胞生长、增殖和凋亡等调控网络发生严重紊乱的结果。在癌症中,细胞内的信号网络受到调节,从而维持细胞增殖、生长的抑制信号和分化信号减弱,而细胞存活力和运动性增强[2]。
3.2.1 增殖信号通路
多种lnc RNA 是趋化因子和激素信号通路的下游靶点。在T 细胞急性淋巴细胞白血病中,Notch1致癌基因在某种程度上通过诱导l nc RNA LUNAR1、上调胰岛素样生长因子1受体表达和信号转导,从而促进生长[16]。在前列腺癌中,一些与前列腺癌细胞增殖有关的lnc RNA 可与雄激素受体直接相互作用或抑制雄激素受体阻滞剂,参与雄激素信号通路[17]。在许多类型的人类恶性肿瘤中,8q24位点的扩增是已被充分表征的导致MYC 基因扩增的致癌性事件,但目前在MYC基因驱动的癌症中,多方证据均涉及lnc RNA。在伯基特氏淋巴瘤中,PVT1是一个位于t(2:8)易位断裂点的l nc RNA 基因,它能使免疫球蛋白增强子结合到PVT1-MYC 位点。在MYC 肿瘤小鼠模型中,仅MYC单拷贝扩增不足以促进肿瘤的形成,而包括MYC 和lnc RNA PVT1 的多基因片段的扩增能高效地促进肿瘤发展。共扩增PVT1与MYC 使MYC 蛋白水平增高,而在MYC驱动的人类结肠癌细胞中降低PVT1的水平时可抑制细胞增殖[18]。并且,结肠癌相关lnc RNA CCAT1(又称为CARLo-5)通过促进MYC与一个增强子元件间的远程相互作用以顺式作用激活MYC 的转录[19]。前列腺特异性的lnc RNA PCGEM1 也位于8q24 位点,与MYC结合并增强MYC 对一些基因的转录激活,这些基因参与前列腺癌细胞生长所需的各种代谢过程。MYC 还以众多l nc RNA 为靶标进行转录调控,进而调节细胞周期的进程[20]。
最近研究发现,lnc RNA HEI H 可与mi R-939相互作用抑制抗凋亡基因Bcl-x L 的转录,从而促进结直肠癌的发生[21]。lnc RNA-SRA1可抑制骨肉瘤细胞的增殖并促进细胞凋亡[22]。
3.2.2 抑癌基因信号通路
近年来,研究发现一些lnc RNA 在调节抑癌基因和生长阻滞通路中起着广泛的作用。肿瘤抑制蛋白TCF21的表达是由它的反义RNA TARID 激 活 的,TARID 招 募GADD45a 至TCF21启动子从而促进去甲基化[23]。
lnc RNA 对p53抑癌基因通路的调控一直是研究者关注的焦点。许多研究表明,lnc RNA可通过多种机制调节p53 的下游靶基因:与DNA 相互作用、与mRNA 及mRNA 前体相互作用、与mi RNA 相互作用,及调控DNA 修复等[24]。母系印记RNA MEG3与p53结合,激活p53 所调控的部分基因的p53 依赖性转录。p53调节的l nc RNA 迅速增加,这表明l nc RNA 广泛参与p53 激活的下游通路[25]。对p53调控的增强子RNA 的全基因组分析鉴定了p53 诱 导 的lnc RNA LED,LED 与 强 增 子(包括CKDN1 A 增强子)相互作用并将其激活,从而促进由p53 引起的细胞周期阻滞。LED 在p53野生型白血病细胞的部分细胞中被沉默,这表明了该l nc RNA 可能具有肿瘤抑制作用[26]。lnc RNA-p21是以p53依赖的方式由DNA 损伤诱导的,其与hn RNPK 相互作用,以顺式作用调节CDKN1 A,并以p21依赖的方式抑制细胞周期[6]。l nc RNA FAL1位于1号染色体上,在癌症中频繁扩增,其招募染色质抑制蛋白 BMI-1 至多个基因(包括CDKN1 A),以促进肿瘤细胞的增殖[26]。p53和DNA 损伤诱导的lnc RNA PANDA 也调节p53通路活性,其通过与转录因子NF-YA 结合并阻止NF-YA 招募至促凋亡基因,从而抑制DNA 损伤诱导的细胞凋亡[27]。
3.2.3 细胞存活信号通路
肿瘤细胞的选择性优势是由端粒的维持、营养胁迫的耐受以及在某些癌症中未分化肿瘤细胞群(肿瘤干细胞)的保留共同驱动的。lnc RNA Gas5在营养不足或缺乏生长因子的细胞中被诱导,Gas5 通过与糖皮质激素受体(GR)DNA 结合域结合并作为一个“诱饵”,阻止糖皮质激素应答基因的表达[28]。这种GR的阻滞减少了细胞凋亡抑制因子2的表达,从而使正常细胞在应急条件下细胞凋亡增加。然而,相对于邻近的正常乳腺组织,人乳腺癌细胞中Gas5受到抑制,这说明在营养成分匮乏的肿瘤微环境中乳腺癌细胞的存活率增加[29]。
肿瘤细胞永生需要端粒的维持以避免复制性衰老。端粒酶RNA 组分(TERC)是核糖核蛋白端粒酶复合体的一个关键组分,编码组成端粒序列的六核苷酸重复序列的模板。虽然大多数人类肿瘤通过过表达逆转录酶TERT 来维持端粒,但TERC 位点的SNP 与端粒延长及发展为高级别胶质瘤的风险增加有关[30]。此外,TERC 基因拷贝数显著增加预示着癌前口腔肿瘤向浸润性癌症的发展[31]。含有RNA的端粒重复序列(TERRA)由子端粒或端粒的DNA 序列转录而来,其以端粒酶依赖和非依赖的方式在端粒的维持中起作用[32]。TERRA的一个作用与其在细胞周期中的动态调节有关,它通过POT-1 调节单链DNA 结合蛋白RPA 的交换,从而调节端粒覆盖染色体末端过程。当细胞从S期向G2期过渡时,缺乏SWI/SNF组件ATRX 的癌细胞在端粒处维持了持久的TERRA 位点,这导致RPA 持续地占据在单链端粒DNA 上,阻止了端粒酶依赖的端粒的延长。这些细胞转而凭借重组依赖的端粒延长旁路途径(需要ATR),致使ATRX 缺陷的癌细胞对ATR 抑制剂高度敏感[33]。
lnc RNA 在维持基因组的稳定性中也起一定作用。非整倍性、染色体畸变已成为癌症的界定特征之一。已有研究证明lnc RNA NORAD 可对染色体的稳定性产生较大影响。NORAD 是一种丰度较高的lnc RNA,可隔绝PUMILIO 蛋白使其远离靶标mRNA(包括参与细胞有丝分裂、DNA 的修复以及复制的基因)。PUMILIO 蛋白通过降低mRNA 的稳定性和减少翻译以负反馈形式调节这些mRNA。因此,NORAD-/-细胞具有极度活跃的PUMILIO,从而导致基因组不稳定性和非整倍性[34]。
lnc RNA 广泛参与干细胞维持和分化的信号通路,癌细胞能通过调节lnc RNA 来协同调控这些信号通路。lnc TCF7招募SWI/SNF复合物至TCF7启动子,从而激活Wnt信号通路以维持肝癌干细胞的自我更新[35]。lnc RNA TINCR 对于角化细胞分化是必需的,其通过招募STAU-1稳定分化相关mRNA,而鳞状细胞癌细胞可抑制TINCR 的表达[36]。
3.2.4 运动性信号通路
MALAT1 是一个在进化上保守、丰度较高的细胞核lnc RNA。研究发现其过度表达可预测早期非小细胞肺癌患者的转移进程。在MALAT1功能缺失的小鼠中,研究表明它在发育过程中或对于成熟的正常组织内稳态是一个非必需基因。在体外肺癌细胞中MALAT1缺失会导致细胞运动性受损,在小鼠中会导致细胞转移减少,这表明癌症中MALAT1过表达可能驱动正常组织发育或内稳态过程中观察不到的功能获得性表型[37]。
许多与肿瘤相关的lnc RNA 参与调节肿瘤的侵袭和转移。转化生长因子β通过两种不同的RNA-RNA 相互作用,诱导lnc RNA-ATB在肝细胞癌细胞中的表达,这能促进上皮向间质的转化、细胞的侵袭和器官的定植[38]。在上皮间质转化的过程中,l nc RNA-ATB竞争性地结合mi R-200 以激活ZEB1和ZEB2的表达,而其与白介素-11 的相互作用增强了STAT3信号通路,从而促进转移。前列腺癌lnc RNA SCh LAP1与预后差及转移进程相关,其通过干扰SMI/SNF复合物的肿瘤转移抑制活性来促进前列腺癌的侵袭和转移[39]。
近年来,抑制转移的lnc RNA 的鉴定,已在l nc RNA 对肿瘤微环境和转移表型的调控方面打开了一个新的视角。核因子k B(NF-κB)为响应炎症信号而诱导l nc RNA NKILA 的表达,NKILA 可通过结合细胞质NF-κB/Ik B复合物介导一个负反馈回路,抑制NF-κB信号并抑制Ik B的磷酸化、NF-κB 的释放及核位移。人乳腺癌中NKILA 的抑制与转移性扩散和不良预后有关[40]。lnc RNA LET 可将缺氧反应与转移联系起来。缺氧诱导的组蛋白脱乙酰酶3抑制LET 启动子,影响其表达并促进NF90积累及缺氧诱导的细胞侵袭[41]。
lnc RNA 作为高度组织特异性的癌症表型驱动因子,将成为癌症治疗的主要靶标。癌症相关l nc RNA 大多数研究均集中于l nc RNA 转录本丰度改变所引起的细胞效应。然而,用结构分析的方法评估l nc RNA 功能显示:SNP 甚至可以改变涉及mi RNA 或蛋白质结合的功能相关位点上的局部RNA 结构[38]。应用癌症中全转录组RNA 结构分析可揭示SNP 的功能或癌症相关l nc RNA 的体细胞突变。想要更深入地阐明癌症相关lnc RNA 的生理作用,将需要在研究方法上从lnc RNA 注释和分子或细胞特征描述向癌症动物基因模型的转变。细胞间信号传递、炎症、血管生成和免疫调节是癌细胞与基质细胞协同作用中的核心因素,是支持肿瘤生长和发展所必需的,而生物模型对于阐释lnc RNA 在这些过程中的生理作用将尤其重要。