转录组在肿瘤中的应用及进展

2016-10-19 20:47陈柳华清泉
中国医药导报 2016年6期
关键词:肿瘤

陈柳 华清泉

[摘要] 转录组(RNA-Seq)是新一代测序技术,利用高通量测序技术对组织或细胞中所有RNA反转录而成的cDNA文库进行测序,从整体水平研究基因的功能及其结构,揭示特定生物学过程以及疾病发生过程中的分子机制,而癌症疗效评估的关键在于肿瘤的复发率和对放化疗的敏感性。新一代测序系统有望识别导致肿瘤的形成和对治疗产生抵抗的相关靶基因,对进一步指导临床治疗和诊断具有重要的理论及实践意义。

[关键词] 转录组学;RNA-Seq;肿瘤;测序技术

[中图分类号] R733 [文献标识码] A [文章编号] 1673-7210(2016)02(c)-0058-04

Application and progress of RNA-Seq in tumor

CHEN Liu HUA Qingquan

Department of Otolaryngology & Head and Neck Surgery, Renmin Hospital of Wuhan University, Hubei Province, Wuhan 430060, China

[Abstract] The transcriptome is a new generation sequencing technology, which uses high-throughput sequencing technology to sequence cDNA library formed by the reverse transcription of all RNA from tissue or cells, studies gene function and structure from the overall level, reveals the specific molecular mechanism in the process of biological processes and disease. The key point evaluating the efficacy of cancer is the tumor recurrence rate and sensitivity to radiation and chemotherapy. The new generation sequencing system is expected to identify the related target genes which lead to the formation of tumor and resistance to treatment. Further more, it has important theoretical and practical significance for guiding clinical treatment and diagnosis.

[Key words] Transcriptomics; RNA-Seq; Tumor; Sequencing technology

轉录组是指特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合,包括蛋白质编码的信使RNA和非编码RNA(rRNA、tRNA和其他ncRNAs)。1995年Velculescu等首次提出了关于转录组的概念,并在酵母细胞中获得第1个转录组[1]。肿瘤的发生发展大多是多种基因改变积累造成的,包括致癌基因的激活和抑癌基因的失活。RNA-Seq技术可以从转录水平检测肿瘤中的改变基因。通过相关软件分析,鉴定相关改变基因在肿瘤发生发展中所起的作用。然后经过刷选,进一步挑选出相关靶基因进行实验研究,有望为肿瘤的基因治疗提供新的靶点。

1 转录组学的概念及进展

1.1 转录组学的概念

高通量测序技术也被称为下一代测序(NGS)技术,推进了基因组学的研究进展。该项新技术除了研究静态基因组,近年来也开始应用于动态转录分析,由此衍生的技术称为RNA序列分析(RNA-seq)[2]。在20世纪90年代末和21世纪初,随着DNA基因芯片技术的快速发展,开创了癌症近十年的高通量转录组研究。早期研究的显著发现主要是关于黑色素瘤[3]和乳腺癌[4]。van't Veer等[5]曾使用基因芯片对乳腺癌淋巴结阳性患者进行相关研究,确定了一组70个基因的碱基排列顺序,可以很好地预测乳腺癌患者的预后[6]。近年来,基于利用转录组所得到的成果,转录组逐渐成为研究癌症生物学信息的一个主导实验技术。

1.2 转录组学的相关进展

复合性基因融合现象常见于与血液学关联的恶性肿瘤和罕见的骨骼及软组织肿瘤中。近年来研究表明,常见的实体肿瘤中也有复发性基因融合现象。融合基因是最普遍的癌基因,是由染色体重组造成的。Maher等[7]综合运用转录组技术,在慢性粒细胞性白血病细胞系中发现融合基因BCR-ABL1以及在前列腺的癌细胞系和组织中发现融合基因TMPRSS2-ERG。同时Huang等[8]研究提示RNA-Seq技术可以有效识别移位的染色体,并发现融合基因PARP14-TFE3。另一方面,可变剪接是导致人类蛋白质多样性的主要来源。单个基因经过可变剪接,形成多种不同的mRNAs。据目前情况估计,基于全基因组技术的应用,研究表明超过90%的人类基因都进行过可变剪接[9-10]。在许多癌症中发现可变剪接。许多与肿瘤生物学功能相关的关键蛋白质经过了与癌症相关的可变剪接,这些肿瘤生物学功能包括细胞凋亡、细胞周期调控、入侵和转移[11-13]。近年来,全基因组方法的显著发展有望发现肿瘤中改变的可变剪接基因,有助于发现肿瘤细胞中发生变化的具体信号通路。

2 RNA测序(RNA-Seq)

2.1 RNA-Seq的技术平台

NGS已经彻底改变了既往对研究细胞通路的系统分析方法。癌症是一种复杂的疾病,涉及多种异常的基因表达调控。识别这种驱动肿瘤生物学发展的表达模式为我们理解癌症提供了很好的分子基础[14]。NGS的两个主要平台是全外显子组测序(WES)和RNA-Seq。WES主要是用于发现DNA的变异,RNA-Seq主要用于衡量基因的表达。两种技术都可以用于检测基因变异,尤其是单核苷酸变异(SNVs)[15]。鉴于持续降低成本和改进数据分析方法的优势,NGS已经开始直接影响生物医学的发展[16],其测序步骤依赖于NGS技术。目前使用最广泛并且广受欢迎的应用于RNA-seq的NGS平台有3个,包括454年焦磷酸测序系统、AB固体系统和Illummina基因组分析仪。具体来说,Illumina/Solexa Illumina公司(美国圣地亚哥Illumina公司Inc. CA)平台是基于可逆染料终结合测序原理,而454年和固体系统采用创新型的乳液聚合酶链反应机制。

RNA-seq也被称为整个转录组鸟枪测序(wts)。RNA-seq包含三个步骤:测序文库的建立,在特定NGS平台中测序和生物信息学分析。RNA-Seq是一种基于NGS技术的新的转录分析方法。采用NGS技术对从感兴趣的RNA样本序列反转录得到的cDNA进行测序[17-19]。简而言之,就是对剪切变体、转录后RNA编辑、内含子表达水平和特定等位基因的表达情况进行定性和定量分析。

2.2 RNA-Seq原理

在对基因组测序和分析研究的同时,复杂的转录组研究也广泛发展起来。利用高通量测序技术平台分析转录组的结构和表达水平情况,更能挖掘未知转录本和稀有转录本信息,精确地识别RNA 的选择性剪切以及编码序列的单核苷酸多态性(SPN),进一步解析复杂的转录组信息[20]。最初的转录组研究主要以基因芯片微阵列技术为基础,而基因芯片技术的检测范围取决于芯片上的探针信息,所以只能检测已知序列的特征,缺少发现新基因的能力。而高通量测序技术可以很好地弥补基因芯片技术在这方面的不足。因此,现阶段转录组的研究是借助于NGS[21]来完成的。通过构建cDNA文库并对cDNA 进行高通量测序,分析测序结果进而解析转录组学中的复杂变化。目前,以基因测序技术为核心的新技术平台支撑体系已经相对成熟和完善,例如:Illumina公司的Solexa测序技术、罗氏公司的454测序技术、ABI公司的SOLID测序技术以及美国螺旋生物科学公司的新型纳米孔测序技术等[13]。

随着NGS技术的不断更新和提高而日益成熟完善,RNA测序技术平台在测序通量、测序长度、错配率、碱基配对读取能力等测序性能方面技术的提高均有利于转录组的研究。RNA-Seq技术的不断更新和创新,为人类逐步全面了解真核生物和原核生物的转录组信息提供了新的定性和定量的生物信息学方法。

2.3 RNA-Seq技术优势

相比基因芯片和标记的碱基序列的测序方法,RNA-seq具有一定的优越性。与基因芯片相比,RNA-Seq不仅可以在更高的分辨率下用来测量基因的表达水平情况,还可以揭示未知的转录组和拼接亚型,并为选择性拼接亚型提供定量分析[22]。相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号、更高的检测通量以及更广泛的检测范围,是目前深入研究复杂性转录组的强大工具。鉴于这些优势,RNA-Seq很快就被应用到癌症相关研究的多个方面。Brooks等[23]研究发现,相比于qRT-PCR,NGS能够更加全面以及更加准确地定量和定性评价细胞或组织中的mRNA。NGS可以对细胞或组织中的RNA分子的所有亚型进行量化和综合评价。同时,RNA-seq技术可以检测到低水平表达、未识别的转录子和新拼接亚型基因[24]。另一方面,与基因芯片相比,RNA-Seq有一个更广的检测动态范围,可以研究编码和非编码RNA,更易于基因网络的构建、发现选择性剪切转录物,检测到等位基因的具体表达方式,也可以用来提取基因型信息。在RNA-Seq单细胞研究[25]中,一个主要优势是可以分析整个转录序列,而不是有限制数量的基因,并且,研究DNA和RNA的方法并不是相互排斥的,他们可以相互结合使用,产生更多的生物学上重要的信息[26]。

3 RNA-Seq在肿瘤中的应用

癌症的生物起源、发展、转移与转录组中的许多变化息息相关。基因的选择性剪接是一个主要的转录后调控机制,参与许多恶性肿瘤的发生发展。NGS应用于RNA层面上的研究,为研究转录组提供了一种新技术。同时,实体肿瘤与生物学特征及临床行为息息相关,在治疗方面越来越凸显出个体化治疗的重要性,而RNA-Seq是一种比较合适的技术来评估个性化的治疗效果[27]。

3.1 RNA测序与食道鳞状细胞癌

食管癌是一种常见的恶性肿瘤。陈友芳等[28]对6对食管鳞癌(ESCC)组织及同一患者的正常食管黏膜组织进行RNA-Seq分析,发现142个差异表达基因。Ma等[29]对3例确诊为ESCC患者的癌组织和癌旁组织进行RNA-Seq分析。在癌组织中,PTK6均为低表达,并运用免疫组化、RT-PCR、流式细胞仪等技术进行验证,发现PTK6可能是通过影响Akt/GSK3/β-catenin信号通路,从而促进肿瘤的形成和转移。Jiang等[30]通过对一个确诊为ESCC患者的癌组织和癌旁组织进行RNA-Seq分析,确定新型融合基因HLA-E和HLA-B。该融合基因有望为ESCC的诊断和治疗提供新的靶点,使我们更加了解ESCC的形成机制。

3.2 RNA測序与肺癌

肺癌的5年生存率不到15%。Beane等[31]利用RNA测序技术分析了抽烟对肺癌的影响,揭示了抽烟与肺癌的关系以及肺癌的发生机制。Riccardo等[32]在K-rasLA1/p53R172HΔg小鼠非小细胞肺癌模型中,运用RNA测序技术发现GM-CSF和ADORA3的高表达均与肿瘤的转移相关。ADORA3参与肺癌细胞系中p53诱导凋亡过程。在p53突变的肿瘤中,ADORA3有望成为潜在免疫治疗的靶点。lncRNAs的破坏在非小细胞肺癌的发生发展中起着关键作用,Ricciuti等[33]揭示lncRNAs是早期非小细胞肺癌患者潜在生物标志物,可以预测肿瘤患者对化疗和靶向治疗的敏感性。

3.3 RNA測序与前列腺癌

前列腺癌是男性泌尿系统中最常见的恶性肿瘤之一,同时也是男性中因癌症死亡的第二大原因。Palanisamy等[34]对前列腺癌(PCa)组织标本进行RNA-Seq分析来探索新的嵌合体融合转录片段,最后分析发现了7种肿瘤特异性融合基因——其中有两个是ETS基因家族中的ETl和ERG基因,4个是非ETS基因如CDKNlA(p21),CD9和IKBκB(IKK-beta)。该研究首次把非ETS基因纳入到PCa融合基因中。Eswaran等[35]分析了15例前列腺癌样本的RNA-Seq结果,验证了RAF信号途径在癌症发病过程中起到了非常重要的作用,同时也表明了RAF信号途径中的融合基因有潜力成为抗肿瘤治疗与抗肿瘤药物筛选的靶点。Xu等[36]利用RNA测序数据对前列腺癌的体细胞突变进行筛查,得到一组可用于前列腺癌的诊断和治疗的候选基因。

3.4 RNA-Seq面临的挑战及发展前景

目前,RNA-seq技术仍处于起步阶段,然而它的优越性明显超过传统的芯片杂交测序方法。在过去的几年中,RNA-seq在研究人类癌症的转录注释、基因转录结构的确定、不同转录生物过程的定量分析中做出了不可磨灭的贡献。随着RNA-seq技术不断发展和成本持续下降,在未来几年中,将RNA-seq技术应用于人类肿瘤的研究中,相信很有可能会产生更加令人振奋的发现。

此外,RNA-Seq实验还可以揭示出那些基因芯片不能检测出的新型的转录子、非编码RNA和其他小分子RNA 。我们认识到,拼接变异以及其他基因组变化是肿瘤重要的驱动因素[34]。RNA-Seq可以有效捕获内含子水平的亚型和非编码基因。在寻找与癌症预后、诊断及治疗靶点的生物标志上,RNA-Seq是一种很有潜力的实验技术,为研究肿瘤的发生、发展提供了一个前所未有的机遇。

恶性肿瘤严重威胁人类健康,是世界各国医学科学领域中的重大科研课题。目前每年大约有200万例新发病例,130万人死于恶性肿瘤,是目前中国人的第三大死因。早治疗、早诊断可以提高患者生活质量。我们相信,基于网络的生物学方法可以为解释肿瘤的发病机制和发现肿瘤的新药物靶点奠定有力基础;为肿瘤患者的预诊断及治疗提供理论及实验依据,有望进一步提高肿瘤患者的生活质量。RNA-Seq可以有效捕获内含子水平的亚型和非编码基因[19]。在寻找与癌症预后、诊断及治疗靶点的生物标志上,RNA-Seq是一种很有潜力的实验技术,为研究肿瘤的发生、发展提供了一个前所未有的机遇。

[参考文献]

[1] Bawa P,Zackaria S,Verma M,et al. Integrative analysis of normal long intergenic non-coding RNAs in prostate cancer [J]. PLoS One,2015,10(5):1-14.

[2] Qian X,Ba Y,Zhuang Q,et al. RNA-Seq technology and its application in fish transcriptomics [J]. OMICS,2014,18(2):98-110.

[3] DeRisi J,Penland L,Brown PO,et al. Use of a cDNA microarray to analyse gene expression patterns in human cancer [J]. Nature Genetics,1996,14(4):457-460.

[4] Kononen J,Bubendorf L,Kallioniemi A,et al. Tissue microarrays for high-throughtput molecular profiling of tumor specimens [J]. Nat Med,1998,4(7):844-847.

[5] van't Veer LJ,Dai H,van de Vijver MJ,et al. Gene expression profiling predicts clinical outcome of breast cancer [J]. Nature,2002,415(6871):530-536.

[6] Roukos DH. Next-generation sequencing and epigenometechnologies:potential medical applications [J]. Expert Rev Med Devices,2010,7(6):723-726.

[7] Maher CA,Kumar-Sinha C,Cao X,et al. Transcriptome sequencing to detect gene fusions in cancer [J]. Nature,2009,458(7234):97-101.

[8] Huang W,Goldfischer M,Babyeva S,et al. Identification of a novel PARP14-TFE3 gene fusion from 10-year-old FFPE tissue by RNA-seq [J]. Genes Chromosomes Cancer,2015. [Epub ahead of print]

[9] Wang ET,Sandberg R,Luo S,et al. Alternative isoform regulation in human tissue transcriptomes [J]. Nature,2008,456(7221):470-476.

[10] Pan Q,Shai O,Lee LJ,et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing [J]. Nat Genet,2008,40(12):1413-1415.

[11] Venables JP. Aberrant and alternative splicing in cancer [J]. Cancer Res,2004,64(21):7647-7654.

[12] Liu S,Cheng C. Alternative RNA splicing and cancer [J]. Wiley Interdiscip Rev RNA,2013,4(5):547-566.

[13] David CJ,Manley JL. Alternative pre-mRNA splicing regulation in cancer:pathways and programs unhinged [J]. Genes Dev,2010,24(21),2343-2364.

[14] Danan-Gotthold M,Golan-Gerstl R,Eisenberg E,et al. Identification of recurrent regulated alternative splicing events across human solid tumors [J]. Nucleic Acids Res,2015,43(10):5130-5144.

[15] O'Brien TD,Jia P,Xia J,et al. Inconsistency and features of single nucleotide variants detected in whole exome sequencing versus transcriptome sequencing:a case study in lung cancer [J]. Methods,2015,83:118-127.

[16] Ding L,Wendl MC,Koboldt DC,et al. Analysis of next generation genomic data in cancer:accomplishments and challenges [J]. Hum Mol Genet,2010,19(R2):188-196.

[17] Morozova O,Hirst M,Marra MA. Applications of new sequencing technologies for transcriptome analysis [J]. Annu Rev Genomics Hum Genet,2009,10:135-151.

[18] Wilhelm BT,Marguerat S,Watt S,et al. Dynamic repertoire of a eukaryotic transcriptome surveyed at single-nucleotide resolution [J]. Nature,2008,453(7199):1239-1243.

[19] Feng H,Qin Z,Zhang X. Opportunities and methods for studying alternative splicing in cancer with RNA-Seq [J]. Cancer Lett,2013,340(2):179-191.

[20] Ding X,Zhu L,Ji T,et al. Long intergenic non-coding RNAs(LincRNAs)identified by RNA-Seq in breast cancer [J]. PLoS One,2014,9(8):1-10.

[21] Iyer MK,Niknafs YS,Malik R. The landscape of long noncoding RNAs in the human transcriptome [J]. Nat Genet,2015,47(3):199-208.

[22] Peng Z,Cheng Y,Tan BC. Comprehensive analysis of RNA-Seq data reveals extensive RNA editing in a human transcriptome [J]. Nat Biotechnol,2012,30(3):253-260.

[23] Brooks MJ,Rajasimha HK,Roger JE,et al. Next-generation sequencing facilitates quantitative analysis of wild-type and Nrl-/- retinal transcriptomes [J]. Mol Vis,2011, 17:3034-3054.

[24] Trapnell C,Williams BA,Pertea G,et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation [J]. Nat Biotechnol,2010,28(5):511-515.

[25] Hitzemann R,Bottomly D,Darakjian P,et al. Genes,behavior and next-generation RNA sequencing [J].Genes Brain Behav,2013,12(1):1-12.

[26] Lee MC,Lopez-Diaz FJ,Khan SY,et al. Single-cell analyses of transcriptional heterogeneity during drug tolerance transition in cancer cells by RNA sequencing [J]. Proc Natl Acad Sci,2014,111(44):4726-4735.

[27] Meiβner T,Fisch KM,Gioia L,et al. OncoRep:an n-of-1 reporting tool to support genome-guided treatment for breast cancer patients using RNA-sequencing [J]. BMC Med Genomics,2015,8(24):1-8.

[28] 陈友芳,曹训,黄志良,等.RNA测序技术在筛选食管鳞癌差异表达基因中的应用[J].广东医学,2014,35(6):844-847.

[29] Ma S,Bao JY,Kwan PS,et al. Identification of PTK6,via RNA sequencing analysis,as a suppressor of esophageal squamous cell carcinoma [J]. Gastroenterology,2012,143(3):675-686.

[30] Jiang YZ,Li QH,Zhao JQ,et al. Identification of a novel fusion gene(HLA-E and HLA-B)by RNA-seq analysis in esophageal squamous cell carcinoma [J]. Asian Pac J Cancer Prev,2014,15(5):2309-2312.

[31] Beane J,Vick J,Schembri F,et al. Characterizing the impact of smoking and lung cancer on the airway transcriptome using RNA-Seq [J]. Cancer Prev Res(Phila),2011,4(6):803-817.

[32] Riccardo F,Arigoni M,Buson G,et al. Characterization of a genetic mouse model of lung cancer:a promise to identify non-small cell lung cancer therapeutic targets and biomarkers [J]. BMC Genomics,2014,15(Suppl 3):S1.

[33] Ricciuti B,Mencaroni C,Paglialunga L,et al. Long noncoding RNAs:new insights into non-small cell lung cancer biology,diagnosis and therapy [J]. Med Oncol,2016, 33(2):1-18.

[34] Palanisamy N,Ateeq B. Rearrangements of the RAF kinase pathway in prostate cancer,gastric cancer and melanoma [J]. Nat Med,2010,16(7):793-798.

[35] Eswaran J,Horvath A,Godbole S,et al. RNA sequencing of cancer reveals novel splicing alterations [J]. Sci Rep,2013,3:1689.

[36] Xu YM,Liu HZ. Related biomarkers in the diagnosis of prostate cancer [J]. Zhonghua Nan Ke Xue,2015,21(10):937-940.

(收稿日期:2015-10-02 本文編辑:张瑜杰)

猜你喜欢
肿瘤
《肿瘤预防与治疗》2021年总目次
与肿瘤“和平相处”——带瘤生存
切除“面积”中的“肿瘤”
北京肿瘤防治联盟(BJCA)
北京肿瘤防治联盟(BJCA)
滚蛋吧!肿瘤君
《肿瘤预防与治疗》2017年总目次
ceRNA与肿瘤
床旁无导航穿刺确诊巨大上纵隔肿瘤1例
肿瘤标志物在消化系统肿瘤早期诊断中的应用