侯德富 ,关勇军 ,万恂恂 ,谭宇婷 ,欧阳咏梅 ,余艳辉 ,陈主初 2,
(1.湖南师范大学医学院,湖南 长沙410013;2.中南大学湘雅医院卫生部肿瘤蛋白质组学重点实验室,湖南 长沙410008;3.中南大学肿瘤研究所3,湖南 长沙410008)
选择性剪接在哺乳动物的基因表达中是一种广泛存在的现象,最新研究报道有高达92%~94%的多外显子基因通过选择性剪接产生多个mRNA剪接变异体,并可能编码多种蛋白异形体,为人类蛋白质组多样化的重要机制[1]。NPCEDRG基因(GenBank No.AF538150)是由基因定位候选克隆策略获得的一个在正常鼻咽和鼻咽癌组织表达差异具有显著性的基因,定位于湖南家族性鼻咽癌的遗传易感区3p21.31~21.2区域内[2,3]。我们前期研究结果表明,NPCEDRG基因在正常人多种组织中表达,而在鼻咽癌组织、鼻咽癌细胞系及其他肿瘤细胞系中表达下调,功能研究提示NPCEDRG基因可能为一个鼻咽癌候选抑瘤基因[4-6]。我们最近的研究成功克隆并鉴定NPCEDRG基因启动子区,初步证实启动子核心元件CCAAT/NFY可能参与该基因的转录调控[7,8]。本研究拟应用5'-RACE和3'-RACE等技术对NPCEDRG基因mRNA剪接变异体进行分析,并成功克隆得到一个新的NPCEDRG基因mRNA剪接变异体,为进一步阐述NPCEDRG基因在鼻咽癌发生发展中的可能作用提供线索。
1.1.1 细胞系及其培养 鼻咽癌细胞系CNE1由中南大学肿瘤研究所提供,于RPMI 1640+10%新生小牛血清 (newborn calf serum,NCS)的培养基中,37℃、5%CO2、饱和湿度条件下培养。
1.1.2 主要试剂/试剂盒 TRIzol试剂为Invitrogen公司产品,DNA-free?Kit为Ambion公司产品,RPMI 1640培养基为Gibco BRL公司,新生小牛血清为杭州四季青公司产品,5'-Full RACE kit、3'-Full RACE、Agarose Gel DNA Purification Kit、TaKaRa LA Taq 酶、DNA Marker DL2000、pMD20-T 载体为TAKARA公司产品,其他试剂为国产分析纯试剂。1.1.3引物 依据mRNA序列比对分析结果,用primer 5.0在线程序设计引物,由大连宝生物公司合成,所用引物序列见表1。
表1 5'-RACE、3'-RACE引物
1.2.1 5'-RACE扩增NPCEDRG基因的5'-末端的全长序列
按TRIZOLTM试剂操作程序进行培养细胞总RNA的抽提,rDNase I消化 Total RNA中残留gDNA,于1.0%琼脂糖凝胶电泳确定RNA的质量和完整性,用紫外分光光度仪检测RNA的浓度和纯度。使用 5'-Full RACE Kit对 2μg CNE2细胞Total RNA进行CIAP、TAP处理,并与5'-RACE Adaptor连接后,反转录合成cDNA,同时设立MMLV(-)对照。10 L逆转录反应体系:Ligated RNA 6 l,Random 9 mers(50 M)0.5 L,dNTP Mixture(10 mM each)1 L,5×M-MLV Buffer 2 L,RNase Inhibitor (40 U/L)0.25 L,Reverse Transcriptase M-MLV (RNase H-)(200 U/L)0.25 uL,RNase Free dH2O 4.5 L;反应条件:30℃,10 min 42℃,60 min 70℃,15 min。 以5'-RACE Adaptor cDNA 第一链为模板,进行巢式PCR第一轮扩增。50 μL Outer PCR反应体系:5'-RACE Adaptor cDNA第一 链 2 μL、1×cDNA Dilution Buffer II 8 μL、5'-RACE Outer Primer(10 μM)2 μL、GSP-R1(10 μM)2 μL、2× GC Buffer I 25 μL、TaKaRa LA Taq?(5 U/μL)0.5 μL、dH2O 10.5 μL。 PCR 反应条件:94℃ 3 min;94℃ 30 s,55℃ 30 s,72℃ 2 min,30 Cycles;72℃ 10 min。取10 μL PCR扩增产物进行 2%琼脂糖凝胶电泳检测。将PCR扩增产物1:100稀释后取2μL为模板进行第二轮扩增巢式PCR(方法同前),引物对5'-RACE Inner Primer和GSP-R2扩增NPCEDRG剪接变异体 5'末端序列。PCR产物进行琼脂糖凝胶电泳检测。
1.2.2 3'-RACE扩增NPCEDRG基因的3'-末端的全长序列
取3μg CNE2 Total RNA为模板,以3'-RACE Adaptor Primer作为逆转录引物,由Reverse Transcriptase M-MLV(RNase H-)将 Poly(A)+RNA逆转录成带有3'-RACE Adaptor的cDNA第一链,然后再使用TaKaRa LA Taq,以带有3'-RACE Adaptor的cDNA第一链为模板,进行巢式PCR第一轮和第二轮扩增,反应体系及反应条件同5'-RACE。
1.2.3 PCR产物回收及鉴定
上述PCR产物利用PCR产物纯化试剂盒纯化后,胶回收后连接入pMD20-T载体,转化至大肠杆菌JM109感受态中,涂板、37℃培养过夜,挑取阳性菌落扩大培养,直接送菌液至大连宝生物公司进行测序。
在GenBank数据库中,NPCEDRG基因共有包括非冗余参考序列 (NCBI RefSeq)NM_032316.3在内的9种mRNA剪接变异体,编码3种不同蛋白质。通过与gDNA序列的比对分析,如图1所示,9种mRNA剪接变异体分别包含6-7个不同的外显子,各条mRNA的所有外显子序列均有所不相同,说明NPCEDRG基因经转录后要通过选择性剪接机制进一步形成各种不同的成熟mRNA。各mRNA剪接变异体的5'-UTR和3'-UTR长度各不相同,表明NPCEDRG基因的转录起始位点和3'末端加工位点都具有不均一性。
依据各mRNA剪接变异体的比对分析结果,在共有序列(NM_032316的外显子4处)设计外引物GSP-R1进行第一轮PCR,针对AF538150序列中特有序列(第4内含子保留区域),设计内巢引物GSP-R2(见图 2A、表 1)进行内巢 PCR。 以第一轮PCR产物为模板,5'-RACE Inner primer/GSP-R2为内巢引物(见图2A,表1),取10μL PCR产物进行2%琼脂糖凝胶电泳(见图2B),结果显示扩增得到两条长度不同的PCR产物,即剪接变异体1(Variant 1,V1)约 500 bp 和剪接变异体 2(Variant 2,V2)约为400 bp,分别切下进行胶回收、T/A克隆,随机挑取V1和V2数个克隆进行测序,分别获得2个V1 cDNA序列和2个V2 cDNA序列。应用DNASTar软件包中MegAlign(ClustalW)程序进行比对分析,如图2C所示,比对分析结果表明V1 cDNA序列的转录起始位点位于ATG上游25个核苷酸(-25nt)处,完全包含在AF538150序列中,结果表明V1 cDNA序列为AF538150的PCR产物,即AF538150的转录起始位点为-25 nt处。V2 cDNA序列与V1 cDNA比较,5'端有2 bp的缺失,且中间有139 bp核苷酸片段的缺失,因此推测V2 cDNA序列可能为NPCEDRG基因新的剪接变异体的部分mRNA序列,其转录起始位点可能位于ATG上游23个核苷酸(-23 nt)处。
A:NM_032316和AF538150 gDNA结构及引物设计示意图;B:巢式PCR扩增产物2%琼脂糖凝胶电泳结果;C:转录起始位点在gDNA序列上的定位示意图。D:巢式PCR产物V1和V2经T-A克隆并测序,阳性克隆测序序列比对分析结果。
应用ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)在线预测剪接变异体V2片段,发现其编码一种由98个氨基酸组成的蛋白质 (见图3B),其分子量为10.4 kD,等电点为7.1。V2与AF538150比对结果显示V2缺失AF538150 CDs区域的139 bp而致读框移码并导致其终止密码子TGA提前出现(见图3A、B),因此其编码蛋白序列变短。
依据各mRNA剪接变异体的比对分析结果,在共有序列(NM_032316的外显子2处)设计外引物GSP-F1进行第一轮PCR,针对AF538150序列中特有序列(第4内含子保留区域),设计内巢引物GSP-F2(见图2A、表1)进行内巢PCR。以第一轮PCR产物为模板,GSP-F2/3'-RACE Inner primer为内巢引物(见图2A,表1),PCR扩增AF538150及其相关的剪接变异体mRNA 3'端序列,取10 μL PCR产物进行2%琼脂糖凝胶电泳,结果显示PCR扩增得到2条特异性产物,分别命名为剪接变异体Va和Vb(见图3A)。PCR产物经胶回收、T-A克隆,随机挑选各数个阳性克隆测序。如图3B所示,其中剪接变异体Va经测序证实获得了3个长度不同的cDNA序列,分别为命名3Va-1(1706 bp)、3Va-3(1783 bp)、3Va-5(1730 bp)。 与 AF538150 比较 ,3Va-3保留了AF538150的第4内含子及第5、6外显子的截短;3Va-1和3Va-5均有第5、6外显子的截短。剪接变异体Vb经测序证实获得一个长度为926 bp的cDNA序列,命名为3Vb-1,比对分析结果显示3Vb-1为在第5外显子处提前终止而形成一种新的NPCEDRG基因转录本的3'端序列(见图3B),该序列可能为NPCEDRG基因新剪接变异体V2的3'末端序列。
选择性剪接在哺乳动物的基因表达中是一种广泛存在的现象,剪接的方式随着发育阶段,特定的组织部位以及疾病状态的不同而发生变化。研究表明约有35~94%的基因在个体的发育过程中会发生选择性剪接[1,9-11],这表明选择性剪接是哺乳动物功能多样性,甚至是基因组多样性的重要因素。一般情况下,绝大多数的基因产生数量适中的剪接本,但有一些基因则象拥有一个选择性外显子库,可以组合形成大量的剪接本[12]。选择性剪接过程受到许多剪接相关蛋白和因子的调节[13,14]。剪接过程的缺损现象已经越来越被认为是一些疾病产生的原因[15,16],并且这种疾病状态具有非常复杂的遗传方式。因此,对剪接情况的分析需要通过系统的收集选择性剪接的外显子数据,内含子数据以及剪接本的数据进行综合分析。
我们通过生物信息学方法系统的分析了NPCEDRG基因的基因结构,其定位于湖南家族性鼻咽癌的遗传易感区 3p21.31~21.2区域内[2,3]。NPCEDRG基因有至少9中不同的mRNA剪接变异体,编码至少3种不同的蛋白质。我们前期研究结果[7]表明NPCEDRG基因总mRNA表达在HK1和6-10B两株鼻咽癌细胞中非常低,在其他鼻咽癌细胞和其他肿瘤细胞中表达相对较高;而AF538150在约75%(9/12)鼻咽癌细胞系中表达非常低,而在鼻咽癌细胞CNE1、CNE2和永生化鼻咽上皮细胞系NP69,以及其他肿瘤细胞中表达相对较高。因此,在本研究中选用CNE2等相对高表达的细胞作为mRNA剪接变异体分析的靶细胞。
近来一系列研究应用寡核苷酸帽法对人和小鼠等基因转录起始位点分析表明,多数真核生物基因并非某一固定的TSS开始转录,往往是在某一50~100 bp区域的不同位点上开始转录,也就是说其转录起始位点是分布在一定的区域内[17-19]。我们应用5'-RACE技术在CNE2细胞中特异性针对AF538150进行的5'-RACE扩增得到2条不同的5'-末端序列 (V1和V2)。其中5'-末端序列V1与AF538150完全匹配,但其5'-末端序列短于AF538150,其TSS位于ATG上游25个核苷酸(-25nt)处,而AF538150是我们实验室利用EST拼接而成,其5'端序列未经实验证实,比对分析发现其前6个核苷酸为污染序列,因此证实AF538150的转录起始位点为-25 nt处;V2与V1比较,5'端有2 bp的缺失,且中间有139 bp核苷酸片段的缺失,且该序列在GenBank中未见公布,进一步应用ORF Finder预测其编码一种98个氨基酸组成的蛋白,因此,我们推断该序列为NPCEDRG基因新的剪接变异体5'-末端序列。应用3'-RACE技术扩增得到4条不同的3'-末端序列(3Va-1、3Va-3、3Va-5和3Vb-1),但是我们无法界定该4条3'-末端序列是否为AF538150或新剪接变异体V2特有或共有。这些结果表明NPCEDRG基因转录后调控机制非常复杂,且其转录起始位点和3'末端加工位点都具有不均一性。
总之,本研究在鼻咽癌细胞系CNE2中成功克隆得到一种新的mRNA剪接变异体V2,预测其编码一种98个氨基酸组成的蛋白;确定NPCEDRG基因存在不同的转录起始位点,其中AF538150的TSS位于ATG上游25个核苷酸(-25nt)处,而新的mRNA剪接变异体V2的TSS位于ATG上游23个核苷酸(-23nt)处。因此,这些结果为进一步阐述NPCEDRG基因表达调控机制、功能研究及其在鼻咽癌发生发展中的可能作用提供重要的理论基础。
[1]Wang ET,Sandberg R,Luo S,et al.Alternative isoform regulation in human tissue transcriptomes [J].Nature,2008,456(7221):470-476.
[2]Xiong W,Zeng ZY,Xia JH,et al.A susceptibility locus at chromosome 3p21 linked to familial nasopharyngeal carcinoma[J].Cancer Res,2004,64(6):1972-1974.
[3]Zeng Z,Zhou Y,Zhang W,et al.Family-based association analysis validates chromosome 3p21 as a putative nasopharyngeal carcinoma susceptibility locus[J].Genet Med,2006,8(3):156-60.
[4]贺修胜,陈主初,田芳,等.鼻咽癌中染色体3p21区域一个表达下调的EST的鉴定[J].癌症;22(1):1-5.
[5]关勇军,贺修胜,侯德富,等.一个鼻咽癌相关EST的鉴定及其全长cDNA序列分析 [J].生命科学研究 2006,10(2):173-177.
[6]阳帅,胡华,邓敏,等.鼻咽癌相关新基因NPCEDRG表达对CNE2细胞生长的影响 [J].生物化学与生物物理进展,2010;37(2):167-174.
[7]Hou D,Guan Y,Liu J,et al.Cloning and characterization of the NPCEDRG gene promoter[J].Mol Cell Biochem,2011,346(1-2):1-10.
[8]侯德富,关勇军,关瑞,等.人NPCEDRG基因启动子的克隆及CCAAT/NFY结合位点初步分析[J].生物化学与生物物理学进展,2011(http://www.pibb.ac.cn/cn/ch/common/create_pdf.aspx?file_no=20100673&flag=1).
[9]Modrek B,Lee C.A genomic view of alternative splicing[J].Nat Genet,2002,30(1):13-19.
[10]Johnson JM,Castle J,Garrett-Engele P,et al.Genomewide survey of human alternative pre-mRNA splicing with exon junction microarrays[J].Science,2003,302(5653):2141-2144.
[11]Kim N,Alekseyenko AV,Roy M,et al.The ASAP II database:analysis and comparative genomics of alternative splicing in 15 animal species[J].Nucleic Acids Res,2007,35(Database issue):D93-98.
[12]Schmucker D,Clemens JC,Shu H,et al.Drosophila Dscam is an axon guidance receptor exhibiting extraordinary molecular diversity[J].Cell,2000,101(6):671-684.
[13]Sperling J,Azubel M,Sperling R.Structure and function of the Pre-mRNA splicing machine[J].Structure,2008,16(11):1605-1615.
[14]Bessonov S,Anokhina M,Will CL,et al.Isolation of an active step I spliceosome and composition of its RNP core[J].Nature,2008,452(7189):846-850.
[15]Faustino NA,Cooper TA.Pre-mRNA splicing and human disease[J].Genes Dev 2003;17(4):419-437.
[16]Garcia-Blanco MA,Baraniak AP,Lasda EL.Alternative splicing in disease and therapy[J].Nat Biotechnol,2004,22(5):535-546.
[17]Carninci P,Sandelin A,Lenhard B,et al.Genome-wide analysis of mammalian promoter architecture and evolution[J].Nat Genet,2006,38(6):626-635.
[18]Engstr?m PG,Suzuki H,Ninomiya N,et al.Complex Loci in human and mouse genomes[J].PLoS Genet,2006,2(4):e47.
[19]Faulkner GJ,Forrest AR,Chalk AM,et al.A rescue strategy for multimapping short sequence tags refines surveys of transcriptional activity by CAGE[J].Genomics,2008,91(3):281-288.