解码基因组中的“暗物质”

2011-08-15 00:51:07孙奋勇
同济大学学报(医学版) 2011年1期
关键词:染色质暗物质基因组

孙奋勇

(同济大学附属第十人民医院检验科,上海 200072)

解码基因组中的“暗物质”

孙奋勇

(同济大学附属第十人民医院检验科,上海 200072)

长链非编码RNA;功能;microRNA;疾病;诊断;治疗

长链非编码RNA(long noncoding RNA,lncRNA)是非编码RNA家族的重要成员,因其数量、种类、功能状况都不明确,又被称作基因组中的“暗物质”。本研究对其研究价值、作用的分子机制、与疾病的关系进行了探讨,重点分析了lncRNAs与非编码RNA家族另一重要成员microRNA的相互关系,提出了lncRNAs调控microRNA功能的新假说。目前,关于lncRNA的研究才刚刚起步,相信不久的将来lncRNA会成为分子生物研究领域又一颗璀璨的明星。

20世纪物理学界最重要的发现之一,可能就是暗物质了,这种难以观察的物质以极大的权重裹挟着熟知的“明物质”的世界,动摇着关于物质世界的基本认知与规律。21世纪初,生命科学领域中最伟大的发现毫无疑问是另一种形式的“暗物质”:非编码RNA。之所以称为“暗物质”,是因为其数量,种类与功能均不明确,尚缺乏有效的研究手段,然而正是这些“暗物质”,却蕴藏着调控细胞功能的巨大潜力。

过去10年中,基因组测序获得的数据达到空前规模,让我们对基因组有了更加深刻的认识。但与所期待的结果大相径庭,人、小鼠与线虫的蛋白编码基因数量并没有太大的差异,有些低级的多细胞生命的编码基因数量甚至少于单细胞生命个体[1]。似乎生物的复杂程度与编码基因的数量没有明显的相关性。那么,生命的复杂程度究竟由基因组的什么特性来决定呢?有两方面的证据似乎可以给出答案:(1)高度复杂的生命形式往往具有更加大量的非编码转录本数量;(2)在哺乳动物基因组中,mRNA只占全部转录本的2%,剩余98%是非编码RNA[2]。这些转录本很可能在细胞生命活动的各个环节中承担了极其重要的作用。因此,必须重新思考非编码RNA在细胞中的作用。

1 lncRNAs的潜在作用

新一代测序技术的结果表明,基因组具有密集转录的特点,其中80%的转录本为长链非编码RNA(long noncoding RNA,lncRNAs)[3]。长期以来,这些lncRNAs被误认为是转录的“噪声”,但有4点证据表明这些转录本可能直接参与了细胞功能的调控:(1)lncRNAs通常较长(一般大于2 kb,甚至超过100 kb),具有 mRNA样结构,经过剪接,具有polyA尾巴与启动子结构,分化过程中有动态的表达与不同的剪接方式;(2)lncRNAs启动子同样可以结合转录因子,如 Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2 与 p53[4],局部染色质组蛋白同样具有特征性的修饰方式与结构特征;(3)大多数的lncRNAs在组织分化发育过程中,都具有明显的时空表达特异性,如有人针对小鼠的1 300个lncRNAs进行研究,发现在脑组织中的不同部位,lncRNAs具有不同的表达模式[5];(4)在肿瘤与其他疾病中有特征性的表达方式。

学术界关于lncRNAs序列保守性的纷争,一直是影响其功能评价的主要矛盾焦点。有研究者认为,虽然lncRNAs的序列保守性差,却具有高度保守的结构特征,而RNA与蛋白质的作用主要依赖一些特殊的结构域。2009年,Calin等关于lincRNA的报道堪称非编码RNA研究领域的里程碑,他们通过对转录基因的染色质组蛋白的甲基化修饰进行高通量解析,分别发现小鼠与人类基因组中有1 600与3 000种基因间lncRNAs,具有高度保守的序列特性与调控基因表达的功能[6]。

2 lncRNAs的作用机制

目前,已知lncRNAs具有多种功能,其中最重要的是参与了编码基因表达调控的表观遗传学机制。例如,Hox基因座位能够转录数百种lncRNAs,决定了同源盒基因家族启动子局部染色质开放状态伴随发育轴的时空特性而改变[7]。其中,由HOXC座位转录的lncRNA HOTAIR,能够指导染色质结构调控蛋白PRC2与HOXD家族基因启动子的结合,抑制后者的转录。最新的研究表明,超过20%的基因间lincRNAs(large intergenic ncRNA,lincRNA)具有类似功能[8]。

lncRNAs也能直接调控靶基因的转录与蛋白的降解。例如,lncRNAs Evf2能够激活转录因子Dlx2并招募其结合Dlx5启动子上的高度保守序列而诱导后者的表达[9]。Evf2敲除小鼠在发育早期发生明显的GABA能神经元数量的减少,揭示了Evf2在中枢神经系统发育过程中的重要性[9]。再例如 p53 mRNA,除了可以作为翻译模板,也能够抑制泛素连接酶mdm2与P53蛋白的结合,抑制其泛素化降解。研究表明,一些mRNAs与p53 mRNA相似,具有某种特征性的结构,具有调节性RNA的功能[10]。

某些lncRNAs可能涉及细胞器的形成与细胞内的转运。例如,lncRNAs NRON参与了转录因子NFAT从胞浆到胞核的转运过程[11],而 lncRNAs NEAT/MENε/β则参与了分化细胞核中亚单位区域的形成以及某些特殊mRNA的运输[12]。

3 lncRNAs与m icroRNA的相互作用

多数lncRNAs具有mRNA样结构,提示有可能与ncRNA家族另外一个重要的成员microRNA有相互作用的可能性。例如,人类染色质上有一些在不同物种中极度保守的区域也能够转录出lncRNAs,称作UCRs(ultraconserved regions encoding ncRNAs),虽然其功能尚不明确,但与人类白血病有密切的关系,研究表明 miR-155,miR-24,miR-29b,miR-155 能够靶向调控4种UCRs[13],促进后者的降解。最近,发现在肝癌中过度表达的lncRNA HULC,能够有效结合miR-372,抑制其与下游靶基因的结合以促进细胞增殖。籍此,首次提出miRNAs功能调控的新机制[14]。Steilz等发现了极其相似的情况,Herpesvirus saimiri病毒能够转录两种ncRNA HSUR1与HSUR2,结合宿主细胞表达的miR-27a与miR-142-3p,并抑制其功能[15]。β-secreatase的编码基因BACE1座位能够转录一条反义RNA,通过与BACE1 mRNA的3'UTR相结合,抑制miRNAs对mRNA的降解[16]。值得注意的是,lncRNAs与miRNA相互作用机制的提出,为其功能研究指明了新的方向。

4 lncRNAs与疾病的发生

越来越多的证据表明,lncRNAs至少在转录以及转录后翻译水平两个层面调控了蛋白编码基因的表达,包括一些关键基因。因此,很容易联想到lncRNAs与疾病发生的关系。事实表明,lncRNAs表达的异常能够导致一些复杂疾病的发生,例如:白血病、结肠癌、乳腺癌、肝癌、心肌梗死、Alzhemier病[16]。双链DNA结合蛋白PSF组成性地抑制原癌基因GAGE6的表达,但是至少有5种lncRNAs能够结合PSF而抑制其作用,导致GAGE6表达水平的增加而成瘤[17]。有研究在白血病细胞中鉴定到一种lncRNAs是抑癌基因p15的反义转录本,能够调控p15启动子区域DNA与组蛋白的甲基化状态,影响p15的表达[18]。p21基因也具有相似功能的反义lncRNAs。上述结果提示,存在于数千种蛋白编码基因座位上的反义转录本lncRNAs,极可能通过表观遗传学机制调控邻近编码基因的表达。甚至可以得出结论,导致肿瘤形成的“二次打击”,很有可能包括lncRNAs的异常,并非只局限于编码基因。

目前,流行的 GWAS(Genome-wide association study)技术加速了对lncRNA致病机制的认识,例如:GWAS研究表明,lncRNAs MIAT与心肌梗死有关;由于染色体缺失导致了LUC7L多聚腺苷酸化的异常,能够引起邻近HBA2基因DNA甲基化水平的异常,是引发α-thalassemia的重要原因。FoxL2基因上游250 kb附近约7.4 kb的一段缺失与Blepharophimosis综合征的形成密切相关,研究表明这种缺失导致了一条未知功能的lncRNAs PISRT1的基因突变[19]。

5 lncRNAs用于疾病诊断与治疗

有较多的lncRNAs被发现与疾病形成有关,提示lncRNAs可能是一种有效的疾病诊断标志。据报道,在前列腺癌组织中鉴定到23种内含子lncRNAs与肿瘤的分化程度有密切关系;HULC在肝癌中呈现明显的高表达趋势,而且在患者血浆中也检测到高水平的HULC,进一步研究表明,正常的结肠组织与结肠癌中均不表达HULC,当结肠癌转移到肝脏中时,则表达水平明显增高[20]。有研究针对22个正常组织以及133种白血病与其他肿瘤组织进行表达谱系分析,发现基因组极高保守区域的非编码转录本UREs的表达水平与肿瘤的组织特异性有明显的相关性[11]。

目前,利用lncRNAs作为肿瘤的分子靶点治疗肿瘤的报道还十分罕见。但最近的研究表明乳腺癌细胞中高表达的HOTAIR能够募集PcG蛋白至靶基因的启动子,导致局部的异染色质化,抑制靶基因的表达水平,其中包括HOXD10,该基因具有抑制乳腺癌细胞转移的重要作用[21]。针对HOTAIR进行siRNA干扰,则能够明显抑制乳腺癌细胞的转移。

lncRNA的研究才刚刚开始,随着生命科学技术的不断进步,特别是新一代测序技术与基因芯片技术的广泛应用,将深刻认识lncRNA的功能、机制,与细胞分化、组织发育、疾病形成的内在联系,相信随着lncRNAs致病功能的不断深入发掘,以其作为治疗靶点的临床实践工作将有可能成为现实。

[1]Taft RJ,Pheasant M,Mattick JS.The relationship between non-protein-coding DNA and eukaryotic complexity[J].Bioessays,2007,29:288-299.

[2]Birney E,Stamatoyannopoulos JA,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447:799-816.

[3]Kapranov P,Cheng J,Dike S,et al.RNA maps reveal new RNA classes and a possible function for pervasive transcription[J].Science,2007,316:1484-1488.

[4] Loh YH,Wu Q,Chew JL,et al.The Oct 4 and Nanog transcription network regulates pluripotency in mouse embryonic stem cells[J].Nat Genet,2006,38:431-440.

[5]Mercer TR,Dinger ME,Sunkin SM,et al.Specific expression of long noncoding RNAs in themouse brain[J].Proc Natl Acad Sci USA,2008,105(2):716-721.

[6]Guttman M,Amit I,Garber M,et al.Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals[J].Nature,2009,458:223-227.

[7]Rinn JL,Kertesz M,Wang JK,et al.Functional demarcation of active and silent chromatin domains in human HOX loci by noncoding RNAs[J].Cell,2007,129:1311-1323.

[8]Dinger ME,Amaral PP,Mercer TR,et al.Long noncoding RNAs in mouse embryonic stem cell pluripotency and differentiation[J]. Genome Res,2008,18:1433-1445.

[9]Feng J,Bi C,Clark BS,et al.The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator[J].Genes Dev,2006,20:1470-1484.

[10]Dinger ME,Pang KC,Mercer TR,et al.Differentiating protein-coding and noncoding RNA:challenges and ambiguities[J].PLoSComput Biol,2008,4:e1000176.

[11]Willingham AT,Orth AP,Batalov S,et al.A strategy for probing the function ofnoncoding RNAs finds a repressor of NFAT[J].Science,2005,309:1570-1573.

[12]Sasaki YT,Ideue T,Sano M,et al.MENepsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles[J].Proc Natl Acad Sci USA,2009,106(8):2525-2530.

[13]Calin GA,Liu C,Ferracin M,et al.Ultraconserved regions encoding ncRNAs are altered in human leukemias and carcinomas[J].Cancer Cell,2007,12:215-229.

[14]Wang J,Liu X,Wu H,et al.CREB upregulates long non-coding RNA,HULC expression through interaction with microRNA-372 in liver cancer[J].Nucleic Acid Research,2010,38(16):5366-5383.

[15]Cazalla D,Yario T,Steitz JA.Down regulation of a host microRNA by a herpesvirus saimirinoncoding RNA[J].Science,2010,328(5985):1563-1566.

[16]FaghihiMA,Modarresi F,Khalil AM,etal.Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of β-secretase expression[J].Nature Medicine,2008,14:723-730.

[17]Li L,Feng T,Lian Y,et al.Role of human noncoding RNAs in the control of tumorigenesis[J].Proc Natl Acad Sci USA,2009,106:12956-12961.

[18]Yu W,Gius D,Onyango P,et al.Epigenetic silencing of tumour suppressor gene p15 by its antisense RNA[J].Nature,2008,451:202-206.

[19]D'Haene B,Attanasio C,Beysen D,et al.Diseasecausing 7.4 kb cis-regulatory deletion disrupting conserved non-coding sequences and their interaction with the FOXL2 promotor:implications for mutation screening[J].PLoSGenet,2009,5:e1000522.

[20]Matouk IJ, Abbasi I, Hochberg A, et al. Highly upregulated in liver cancer noncoding RNA is overexpressed in hepatic colorectal metastasis[J].Eur J Gastroenterol Hepatol,2009,21(6):688-692.

[21]Gupta RA,Shah N,Wang KC,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature,2010,464(7291):1071-1076.

R34

A

1008-0392(2011)01-0001-04

10.3969/j.issn1008-0392.2011.01.001

2010-11-01

上海市科委基础研究重点项目(10JC1412800)

孙奋勇(1970—),男,博士,教授.E-mail:sunfenyong@263.net

猜你喜欢
染色质暗物质基因组
染色质开放性与动物胚胎发育关系的研究进展
哺乳动物合子基因组激活过程中的染色质重塑
牛参考基因组中发现被忽视基因
今日农业(2021年11期)2021-08-13 08:53:24
暗能量VS暗物质(下)
染色质可接近性在前列腺癌研究中的作用
“哺乳动物卵母细胞生发泡染色质构型的研究进展”一文附图
生物学通报(2019年2期)2019-06-15 01:33:42
什么是暗物质
什么是暗物质
太空探索(2016年2期)2016-07-12 09:57:45
扑朔迷离的暗物质
太空探索(2014年5期)2014-07-12 09:53:42
基因组DNA甲基化及组蛋白甲基化
遗传(2014年3期)2014-02-28 20:58:49