刘心伟,朱文豪,李 何
(1.河南省体育科学研究所,河南郑州 450044;2.河南省农科院畜牧兽医研究所,河南郑州 450002;3.信阳职业技术学院化学工程系,河南信阳 464000)
基因克隆技术研究进展
刘心伟1,朱文豪2,李 何3
(1.河南省体育科学研究所,河南郑州 450044;2.河南省农科院畜牧兽医研究所,河南郑州 450002;3.信阳职业技术学院化学工程系,河南信阳 464000)
基因克隆;图位克隆;转座子标签;表达序列标签;差异表达基因
几种模式生物基因组测序和人类基因组计划(human genome project,HGP)的相继完成,使人们对基因的研究很快进入后基因组时代。基因组学时代的主要任务是图谱制作和序列测定,后基因组学时代则是进行基因组功能注释(genome annotation),这也是功能基因组学的主要研究目标[1-2]。如何利用基因这一重要的资源,日益成为研究焦点。关于基因专利权的建立和完善的基因争夺大战的硝烟也正在弥漫全球。克隆化基因不仅可以用来兴旺生命科学工业 (制药业等),改良农作物、畜禽品种等,还可以对遗传性疾病进行基因治疗,探索疾病的分子机制和生物发育调控规律。克隆基因的途径有两种,正向遗传学和反向遗传学途径。前者是依据目标基因所表现的功能为基础,通过鉴定其产物或某种表型突变而进行的;后者则着眼于基因本身,通过特定的序列或在基因组中的位置进行。基因的克隆一般采用下列技术:同源序列技术、差异表达基因分离技术、表达序列标签技术、图位克隆技术和转座子标签技术等。
1.1 通过基因产物的克隆技术 在传统遗传学
(正向遗传学)占主导地位的时代,人们以基因产物为导向来分离克隆基因 (功能克隆)。由于基因产物的结构、功能已知,可通过分析部分多肽或末端氨基酸序列,反推其核苷酸序列,设计探针或引物从基因组DNA文库或 cDNA文库中筛选克隆,也可以制备产物抗体,从表达载体构建的 cDNA文库中筛选相应克隆,进而分离目的基因。
若研究者可得到足够多的纯化目的蛋白以用于制备特异性抗体时,可以采用经典的免疫筛选表达文库的方法,筛选阳性克隆获取其目的基因[3],除了免疫筛选方法外,也可根据目的蛋白的生物学功能,利用同位素标记的配体来筛选受体表达的阳性克隆。当所分离的目的蛋白较难大量获得,但纯度较高时,可利用其中的一段氨基酸序列,反推出其基因序列,据此合成寡核苷酸用于 cDNA文库的筛选;或根据所获得的基因序列,指导 5’端的引物合成,根据 mRNA 3’端 poly-A序列指导合成 poly-T的 3’端引物,用 PCR技术从制备细胞的 mRNA或直接从胞浆内溶物物中合成相应的 cDNA,将该cDNA克隆到表达载体上进行产物表。
1.2 同源性序列克隆技术 随着基因研究的不断深入,人们发现几乎所有的基因与其他的基因都有一定的联系:生物的种、属之间编码基因序列的同源性高于非编码区的序列。基于此原理,在其他种属同源基因被克隆的前提下,构建 cDNA文库或基因组文库,然后用已知分子高保守序列设计简并引物,并用简并引物对含有目的基因的 DNA文库进行 PCR扩增,再对 PCR扩增产物进行扩增、克隆和功能鉴定。
对于同源性很高的基因,可以直接用作探针进行非严谨性杂交筛选另一物种的 DNA文库。如Funkenstein等用红海鲷和红鳟鱼的生长激素 (GH)基因的 cDNA筛选 gsb的 cDNA文库,得到 gsb GH的 cDNA克隆[4]。Almuly等用 gsb GH的 cDNA筛选 gsb的基因组文库,进一步克隆了 gsb GH基因[5]。
同源性序列克隆技术自提出以来,受到了国内外学者的广泛重视,发展很迅速,但有些问题是值得重视和思考的:①由于密码子的简并性和不同同源序列间同源程度的差异,简并引物的特异性要设计得当,必要时需要设计几套引物组合。②由于某些同源序列并不专属于某一基因家族,因而扩增产物不一定是某一基因家族成员。③基因家族成员往往成簇存在,克隆的基因片段是否为目的基因尚需进一步判断。因此对 PCR扩增产物和克隆产物,有必要进行基因与性状共分离分析,插入失活或遗传转化等功能鉴定工作,以便最终筛选到目的基因。
细胞在增殖、分化、外界环境变化等某些异常状态下 (如癌变、异常增生),常有某些新基因特异性表达或表达异常地增高,而另一些基因可能表达降低或缺失,因而分离差异表达基因将是认识生物体的生长发育等生命活动过程的入手点,以此为基础,才能深入理解基因的结构、功能、表达与调控。差异表达基因的分离方法也伴随分子生物学技术的发展由单一化发展为多元化,而且呈各种方法互相结合的趋势。
分离差异表达基因的 3种基本方法为:差式筛选 (differential screening)[6]、扣除杂交 (subt ractionhybridization)[7-9]、差异展示反转录 PCR(differential display reverse t ranscription PCR,DDRTPCR[10])。差式筛选法是分别从有特异表达基因的目标样 (target sample,TS)和无特异表达基因的参照样 (reference sample)中提取 mRNA,反转录为cDNA,并构建 TS的 cDNA文库,分别将从 TS和 RS中提取 mRNA制成 cDNA探针,分别用 TS和 RS的cDNA探针与 TScDNA文库的菌落或噬菌斑作原位杂交,选出只与 TS杂交,而不与 RS杂交的克隆即为 TS特异表达的克隆。此法常要经过多轮菌斑杂交,不仅费力费钱,重复性差,而且灵敏度很低。扣除杂交则是用 TS提取的 mRNA反转录成 cDNA探针与 RS的过量 mRNA或 cDNA杂交,经两轮充分杂交后,移去杂交分子和过量的 RS的mRNA或 cDNA,将不形成杂交体的 TS的 cDNA纯化富集,扩增,建立相应 cDNA文库即为差异表达基因 cDNA文库。但此法回收 cDNA量有限,重复性差,灵敏度低。DDRT-PCR则是分别用 TS和 RS的总mRNA作模板,利用 12个可能的锚定引物 T11MN锚定mRNA的 olyA末端,借助逆转录酶合成 cDNA第一链,得 mRNA/cDNA,再用相同的 3’锚定引物和 5’端随机引物分别扩增 TS、RS的 mRNA/cDNA,扩增产物用序列胶电泳分析差异表达情况,将差异带DNA回收,可进一步鉴定分析,最终获得差异表达基因。它与前二者相比,速度快,易操作,可以鉴定低丰度差异表达的 mRNA,分析 2种以上样品基因的差异表达等优点,但仍存在假阳性率高、重复性差、扩增片段短等问题。下面就这些方法的具体过程作详细介绍。
2.1 代表性差示分析法 (RDA) 该法可用于分离与生理条件改变相关的基因及不同发育阶段差异表达的基因,具体过程个如下:①制备扩增子。提取TS和 RS的 mRNA并反转录制备双链 cDNA即 tester cDNA和 driver cDNA。然后用限制性内切酶切,将酶切片段装上接头,末端补平后,加入接头引物进行 PCR扩增。②扣除杂交。去除接头后仅对 tester片段加上新的接头,用过量的 driver cDNA与之杂交退火,将形成三种产物:tester/tester、tester/driver、driver/driver。③特异性片段的扩增。末端补平后,加入新接头引物进行 PCR。3种产物中仅自身退火形成的 tester/tester两端均能和新引物配对而呈指数扩增,tester/driver仅一端可和新引物配对而呈线性扩增,Driver/driver无引物配对不扩增。然后用绿豆核酸酶去除单链 DNA分子,再进行 PCR富集特异表达 cDNA片段。④对特异片段进行克隆,通过 FISH等技术进一步分离特异表达基因。
2.2 抑制性差减杂交 PCR法 (SSH) SSH的基本流程如下:①第1次杂交。提取 TS和 RS的 mRNA反转录为 tester cDNA和 driver cDNA,用 Rsa I或HaeⅢ酶切成平头末端 cDNA,分成均等 2份,分别加不同的接头,再分别与过量的 driver cDNA杂交,将形成 4种产物:a,单链 tester cDNA、b,自身退火的tester/tester双链、c,异源退火 tester/driver双链、d,drivercDNA。②第2次杂交。合并 2份杂交产物,加入新的变性 driver cDNA退火、杂交,这次除了 a、b、c、d 4种产物外还形成产物 e,e是 tester自身退火形成,但两端带不同接头。③特异性片段的扩增。末端补平后,先后加接头的内、外侧引物扩增,a和 d无扩增,b由于两端接头互补形成发夹结构也无扩增,c仅一端有引物结合呈线性扩增,仅 e两端可配不同引物而呈指数扩增。④特异性片段 e克隆,并进一步分离差异表达基因。
该法通过 2次杂交和 2次 PCR,使假阳性率可降到 6%[11],且灵敏度高。用 SSH可一次同时分离几十至几百个差异基因,效率大增。
2.3 交互差减差异 RNA显示 (RSDD) RSDD的主要过程如下:①交互差减。分别提取具有差异表达的 2种组织细胞 A、B的 mRNA,反转录为 cDNA,并构建 cDNA文库。将这 2个文库进行交互差减得到 A减B和 B减 A的 2个差减 cDNA文库,由于构建文库所用的噬菌体载体上带有质粒载体的结构,载体进入宿主后,其上质粒载体被切下,得质粒cDNA文库。②差异显示。用 3’锚定引物和 5’随机引物对 2个差减文库提取的 DNA分别进行 PCR扩增,将扩增产物用 5%序列胶电泳,显示并分离差异条带,回收差异 DNA,再次扩增后,获得富集的差异表达片段。③表达分析。采用反向Northern分析和Northern分析鉴定经再次扩增的差异 DNA片段的真伪。反向Northern分析是将差异显示得到的扩增后 DNA片段转膜,分别与来自 A、B细胞系的总mRNA经反转录制备的 32 P标记的 cDNA第一条链探针进行杂交,只与亲本来源细胞系杂交,而不与另一细胞系杂交的即为真正差异表达的基因。④对差异片段克隆、测序,并进一步分离获得差异表达的基因。
RSSD可以有效快速地鉴定由于细胞生理变化而在基因组中差异表达的基因,它结合了 DDRTPCR和扣除杂交的优点,减少或消除了共有序列,使序列胶上条带清晰度增加,并使低丰度序列得到富集,降低了假阳性率,且 RSDD仅用较少的引物进行逆转录 PCR就可分析全部差异表达基因,但RSSD并不能完全杜绝假阳性。Kang等用 RSDD法克隆并证实了促进肿瘤发展的基因(PEGene)和抑制肿瘤发展的基因 (PS Gene)[12]。
随着各种生物分子标记连锁图的相继建立和越来越多的基因被定位,在 90年代初图位克隆技术也应运而生。其原理是根据功能基因在基因组中存在相对较稳定的基因座,在利用分子标记技术对目的基因进行精确定位的基础上,用与目的基因紧密连锁的分子标记筛选 DAN文库 (如 YAC、BAC或 Cosmid文库),构建出目的基因区域的物理图谱,再通过染色体步行 (chromosome walking)逐步逼近候选区域或通过染色体登陆 (chromosome landing)的方法最终找到包含该目的基因的克隆进而克隆该基因。
定位克隆理论上适用于一切基因,但也存在应用上的一些不足:如果要构建完整的基因组文库,建立饱和的分子标记连锁图和完善的遗传转化体系,对基因组较大、标记数量不多而重复序列较多的生物采用此法投资大且效率低,因而图位克隆技术目前仅局限于拟南芥、水稻、番茄等图谱饱和的模式植物上。
EST是完整基因上能特异性标记基因的一部分序列,通常包含了基因足够的结构信息区,从而与其他基因相区分,大规模 EST克隆和资料库的建立,为利用生物信息学克隆基因提供了条件。其基本原理是从组织特异性或细胞特异性的 DNA文库中随机挑选克隆,并进行 5’和 3’端部分测序,通过对基因库的检索,可以检测所测序以及翻译的多肽氨基酸序列与基因库中已知的是否有同源性,最后对发现的新基因进行突变检测和表达分析。基本过程如下:①对已知的部分序列进行数据库分析,筛选出代表新基因的 EST及相应的重叠群,定位信息等,根据所得信息设计引物,制备探针。②用探针进行cDNA文库筛选,得 cDNA阳性克隆,接着用设计引物与所得 cDNA阳性克隆载体臂进行巢式 PCR和5’、3’-RACE,得 5’端和 3’端部分序列 (约 400 bp)。③对所得阳性克隆和末端序列进行测序。④通过数据库对新序列进行分析,包括与已知基因的同源性分析、拼接延伸、ORF识别、结构分析、翻译蛋白质分析等。⑤若第一步有新 EST的定位信息,即可对基因进行定位和结构分析;若无定位信息,还要筛选基因组文库,进行测序和 FISH定位等工作。⑥最后对发现的新基因进行突变检测和表达分析。
该技术建立在大量已有的生物信息资源基础上的,同时,结合了目前的新技术,为大规模克隆基因提供了捷径。它不仅可检测到许多已知的基因,更可以发现许多未知的基因。
EST还具有广泛的用途。利用对独立 EST的拼接可获得新基因的全长 cDNA序列;利用 EST标签克隆的斑点杂交可鉴定涉及组织或器官发育过程不同阶段各个基因表达的不同,与其他差别杂交方法相比,它能进行初步筛选和鉴定,因而节省了时间;由于事先获得了某个基因的 EST,所以可加速对该基因的克隆以及序列测定。
转座子是染色体上一段可以移动的DNA序列,它可以从一个基因座位转移到另一个基因座位,当转座子插入到某个功能基因内部或邻近位点时,就会使插入位置的基因失活并诱导产生突变型,通过遗传分析可以确定某基因的突变是否由转座子引起,由转座子引起的突变可用转座子 DNA为探针,从突变株的基因组文库中钓取含该转座子的 DNA片段,获得含有部分突变株DNA序列的克隆,然后以该DNA序列为探针,筛选野生型植株的基因组文库,最终得到完整的目的基因。该技术主要用于植物基因的克隆[13],由于可供利用的转座子的种类太少,而转座子在不同的植物中转座的频率和活性相差很大,并且需要筛选大量的个体来鉴定转座子突变个体,限制了转座子标签法的应用范围。
基因克隆的技术发展很快,种类也越来越多,但每一种方法都有它的优势和劣势及适用范围和限制因素。综合来看,不同的克隆策略,虽主导思路不同,但常常是相互联系相互补充的,有些过程也是共通的,因而实验者必须根据所克隆基因的类型和实际条件选择最佳的方案。随着各种知识的积累,克隆基因的技术也逐步完善,速度效率也不断提高,相信人类终将掌握大规模、快捷、经济基因克隆的技术,并很快将基因的研究安全地应用到实践中去。
[1]李子银,陈受宜.植物的功能—基因组学研究进展[J].遗传,2000,22(1):57-60.
[2]解 涛,梁卫平,丁达夫.后基因组时代的基因组功能注释[J].生物化学与生物物理进展,2000,27(2):166-170.
[3]Jo Seph Sambrook.Molecular Cloning[M].Cold Spring Harbor Laboratory Press,2001.
[4]Funkenstein B,Chen T T,PowersD A,et al.Molecular cloning and sequencing of the glithead seabream(Sparus aurata)growth hor mone encoding Cdna[J].Gene,1991,103:243-247.
[5]Almuly R,CavariB,Fersthman H,et al.Genomic structure and sequence of the glithead seabream (Sparus aurata)growth hormone encoding gene:identification of minisatellite polymorphis m in intron I[J].Genome,2000,43:836-845.
[6]Huynh T V,Young R A,Davis R W.et al.Constructing and screening cDNA libraries inλgt11 in GloverDMed[J].DNA cloning:a practicalapproach.Oxford:IRL,1988.
[7]Hedrick SM,CohenD I,Nielsen EA,et al.Isolation of cDNA clones encoding T cell2specific menbrane2associated proteins[J].Nature,1984,308:149-153.
[8]Duguid J R,Rohwer R G,Seed B.Isolation of cDNAs of scrapiemodulated RNAs by subtractive hybridization of a cDNA library[J].Proc NatlAcad SciUSA,1988,85:5 738-5 742.
[9]Sive H L,John T S.A simple subtractive hybridization technique employing photoactivable biotin and phenol extraction[J].Nucleic Acids Res,1988,16(22):10 937-10 938.
[10]Liang P,ParadeeA B.Differential displayof eukaryoticmessenger RNA by means of the polymerase chain reaction[J].Science,1992,257:967-971.
[11]Stein O D,ThiesW G,HofmannM.A high throughout screening for rarely transcribed differentially expressed genes.Nucleic Acids Res,1997,25(13):2 598-2 602.
[12]KangD C,France R L,Su Z Z,et al.Reciprocal subtraction differential RNA display:an efficient rapid procedure for isolation differentially expressed gene sequences[J]. Proc Natl Acad Sci USA,1998,95(23):13 788-13 793.
[13]FladungM,Deutsch F,et al.T2 DNA and transposon tagging in aspen[J].Plant Bio l(Stuttg).2004,Jan,Feb;6(1):5-11.
[责任编校:李宜培]
Q 785
B
1008-9276(2010)06-0753-04
2010-06-10
刘心伟 (1983-),男,河南省驻马店市人,学士,研究实习员,从事运动员基因选材和运动训练生理生化监控研究。