康晓龙,李新海,冯登侦
(宁夏大学农学院动物科学系,宁夏 银川750021)
生命有机体在不同发育时期不同部位的基因表达具有差异性,其按照时间和空间顺序有序地进行复杂而精细的网络调控过程。基因的这种差异表达决定着每一个生命体的生长发育、分化、细胞周期调控、衰老及死亡等生命过程。比较不同细胞或不同基因型在基因表达上的差异,分离并克隆不同组织或同一组织不同发育阶段差异表达的基因,不仅是研究生命过程分子机制的基础,也是进行功能基因组学领域研究的前提。因此,寻找差异表达基因成为目前基因研究的一个非常重要的内容。
目前,筛选差异表达基因的方法主要有差别筛选技术、消减杂交技术、mRNA差异显示技术、基因表达系列分析、抑制性消减杂交、基因芯片技术、Gene Calling技术等。各种方法广泛应用于动植物差异表达基因的分离与克隆。这些方法各有优劣,对某项具体研究而言,选择合适的方法是十分重要的。本文就此对目前差异表达筛选基因中几种主要方法进行了归纳概述。
消减杂交(Subtractive Hybridization,SH)是一种富集差异表达基因的有效方法。这种方法最初在20世纪60年代中期由Bautz等[1]用于纯化噬菌体T4 mRNA。20世纪80年代中期,Lamar和Palmer[2]经过对前人技术的不断完善,建立了新的消减杂交技术。消减杂交利用细胞基因表达的差异性,并结合分子杂交技术去除共同序列、保留差异序列,从而达到分离出两类同源分子间差异表达的基因。
消减杂交原理及过程为:从来源相似而功能有异的两种样品获得mRNA,含有目的基因的样品为检测方(Tester),不含目的基因的样品称为驱动方(Driver)。以Oligo-dT为引物,从Tester中制备放射性标记的单链cDNA文库。然后将这些cDNA探针与过量的来自Driver的 mRNA(其poly-A尾已与生物素耦联)杂交,经两轮充分杂交后,大部分单链cDNA探针和Driver中的mRNA形成异源双链,通过羟基磷灰石柱层除去cDNA-mRNA杂交体,以此富集Tester中特异的cDNA,其本质是将共同拥有的序列消减掉,以富集目的基因序列,提高分离的敏感性。
消减杂交适用于未被克隆的基因组片段,并且特别适于寻找那些由于缺失造成突变的基因。优化后的消减杂交可明显提高富集效率。Duguid和Dinauer[3]通过优化在cDNA后加接头进行选择性PCR扩增;Zhu等[4]采用LD-PCR及旋转柱层析法对其进行改进;Low等[5]通过建立基于外切核酸酶的消减杂交法克服了消减杂交对起始材料的需要及杂交过程中RNase的污染等问题。但消减杂交的弊端也较显著,首先对起始材料对照组mRNA的质和量要求高,很难获得低丰度的差异基因;同时经羟基磷灰石柱层析后回收得到的cDNA量也很低;操作步骤复杂、耗资费时、重复性差;如果基因组过大,则会导致野生基因组和变异基因组间的杂交复杂化。
mRNA差异显示技术(Differential Display of mRNA Reverse Transcription Polymerase Chain Reaction,DDRT-PCR )是由 Liang和 Pardee[6]于1992年建立的以PCR技术和聚丙烯凝胶电泳技术为基础,结合银染或放射性自显影等显色技术进行差异基因筛选的方法。
这一方法的原理及流程为真核细胞mRNA 3′端有一个由30~300个腺苷酸连成的多聚苷酸(poly-A)尾巴,3′末端与poly A相邻的2个碱基只有12种组合。根据这一特点在3′端设计12种锚定引物,通式为5′-T12MN-3′(M=A,C,G;N=A,C,G,T),5′端有20种10bp长的随机引物。每组引物锚定总mRNA的1/12。锚定引物与 mRNA 3′端锚定后,在逆转录酶作用下,逆转录合成cDNA的第一链;而后加入任意引物,经变性后以cDNA第一链为模板,经过低温复性造成任意引物与cDNA第一链错配,之后加入Taq DNA聚合酶,dNTP,5′端和3′端引物进行PCR扩增。因不同 mRNA扩增产物大小不同,经聚丙烯酰胺凝胶电泳分离,通过自显影或荧光显色检测,获得平行材料间的差异cDNA片段;最后回收差异片段、扩增、克隆并测序、用Northern-blot检测差异cDNA片段是否为阳性片段。
mRNA差异显示技术最大的优势是它的简便。它将3种常用分子生物学技术(poly-A RNA逆转录,多聚酶链式反应及聚丙烯酰胺凝胶电泳)结合使用,可以进行两个或两个以上样本之间的差异基因表达比较;其次该技术反应灵敏,其周期短,对起始材料要求也少。
从已发表的相关报道来看,mRNA差异显示技术尚存在不少问题。首先就是假阳性率较高(70%)[7];对高拷贝的 mRNA 有很强的倾向性;同位素放射自显影安全系数低,易造成污染等;引物组合数多,检测工作量很大;只能扩增 mRNA 3′端不大于600bp的片段,使上游的差异达信息得不到检测,不能代表真正差异表达的基因。随着mRNA差异显示技术的推广应用,上述缺点也不断得到改进。如将3′端引物由12条改进为3条,即T12dA、T12dC、T12dG,简化试验操作[8];通过对两端引物增加碱基CGGAATTCGG使得两端都带上EcoRⅠ酶切位点从而增强其重复性、敏感性并便于差异PCR产物克隆[9]。通过改进并与其他技术结合也产生了一系列衍生技术,如 ODD(Ordered DD)[10]、GDD(Genomic DD)[11],这些技术在克服 DD-PCR不足的同时提高了筛选效率。
代表性差示分析技术(Representational Difference Analysis,RDA)是在基因组消减杂交方法的基础上,由Lisitsyn等[12]提出的一种基因克隆新策略。通过引入cDNA消减杂交技术,1994年Hubank等[13]建立了cDNA代表性差示分析技术 (cDNA Representational Difference Analysis,cDNARDA),并得到推广应用。
cDNA-RDA技术基本原理为,通过特异设计的接头和引物,利用PCR技术对两个基因组进行消减杂交,扣除共有序列,而以指数级扩增仅在待测组(Tester)中存在,而对照组或驱动组中没有的特异双链cDNA,并有效富集的差异片段。即由处理组和对照组mRNA反转录出cDNA,采用识别4个碱基的限制性内切酶进行消化待检测样本(Tester)和对照样本(Driver)cDNA,产生两端带有可识别和处理末端的片段,在5′末端接上寡核苷酸接头(Adaptor),然后与过量的Driver混合杂交。杂交形成3种杂交体,即 Tester/Tester,Tester/Driver,Drive/Driver 3种杂交体中只有Tester/Tester杂交体两个5′端都带有新接头,补平3′端后,两条链均能与PCR扩增引物配对从而进行指数扩增,其他杂交体呈线性扩增或无法进行扩增,最后通过电泳分析将富集的差异分子克隆到载体等方法获得差异表达基因。
cDNA-RDA兼有RDA和差减杂交的优点,实现了对靶序列的消减杂交富集和动力学富集,可以使靶序列在三轮杂交后被富集百万倍以上,仅占Tester中0.0005%的靶序列也可以得到分离与富集,同时长引物(24mer)及高退火温度(70℃/72℃)避免了引物错配问题[14];此外,其对起始材料要求低、周期短、敏感、省事,非常适合小型实验室开展。cDNA-RDA也存在明显不足,如当Tester靶序列浓度较低时低丰度的分子富集受抑制;酶切连接步骤多,cDNA会损失,可能漏掉关键基因等。
基因表达系列分析技术(Serial Analysis of Gene Expression,SAGE)是由美国霍普金斯大学医学院Velculescu等[15]在1995年建立的一种新的基因表达转录组(transcriptomes)分析技术。这是一个以测序为基础的定量分析全基因组表达模式的技术。
其主要原理是:根据转录体特定位置一个9~13bp的核苷酸短序列(即标签)特异地代表该转录体;其次,分离自不同转录体的标签可被串联成一定长度的多联体(concatemers),克隆入载体并测序;根据测序结果计算某一标签重复次数来确定相应转录体的表达水平,结合生物信息学方法进一步确定表达的基因种类和基因的表达丰度。
SAGE方法的基本步骤为:(1)提取mRNA并将其与生物素标记的Oligo(dT)经逆转录反应合成双链cDNA。(2)用一种特异性的限制性内切酶-锚定酶(anchoring enzyme,AE)进行消化。(3)用磁珠将带poly(A)尾的cDNA 3′端分离出来,每个3′片段代表一个cDNA。(4)把cDNA分成两份并连上接头A和B,接头3′端包含特定的标签内切酶识别位点(该酶属ⅡS类限制酶,能在距识别位点20碱基位置切割双链DNA,产生平末端);再用标签酶TE消化,产生单侧平末端cDNA;(5)利用DNA聚合酶补平标签的黏性末端,由连接酶将含有接头的cDNA连接形成双标签。(6)根据A和B接头序列设计引物,进行PCR扩增,利用酶消化切除接头后的双标签靠其平末端首尾串联成长短不一的多联体。(7)经PAGE电泳回收目的条带,并克隆到高拷贝载体中,构建SAGE文库;随机挑选并测序,利用专门的SAGE软件对标签进行统计归类,结合GenBank、SAGE map等数据库进行比对,比较SAGE文库标签的类型及丰度,并分析其生物学意义。
SAGE不仅可以全面提供生物体基因表达谱信息,还可用来定量比较不同状态下的组织或细胞的所有差异表达基因。SAGE对低丰度表达基因有较好检测效果,具有假阳性率低、可重复性强、试验周期相对较短、大量数据可用于多重比较等诸多优点。该方法的不足之处在于产生双标签时接头会降低双标签的连接效率;而且要求克隆所含的标签数尽可能的多;另外,SAGE的费用昂贵,操作烦琐,结果分析数据庞大,也是限制其应用范围的一个重要因素。
随着对SAGE技术的不断引用,对其不足之处有人进行了相应改进。如利用生物素化的PCR引物产生生物素化连接子,通过与相应的抗链霉素蛋白包被的磁珠结合除去不需要的连接子,增加双标签数目及单克隆的平均长度[16];利用凝胶电泳前加热来排除串联形成的较短的多聚体[17];针对传统SAGE技术中14个碱基(10bp特异序列+4bp酶切位点)的标签较短不能覆盖人类等大基因组内所有的基因序列,以及在进行BLAST时多个基因序列的匹配现象,又相继衍生建立了Long SAGE技术[18]、Super SAGE技术[19]。
cDNA微阵列(cDNA microarray)又称基因芯片(gene chips)或DNA芯片,是将已知序列的基因探针固定在固相支持物表面,集成的探针阵列与被测生物组织或细胞中标记的核酸序列进行杂交,通过检测相应位置的杂交探针,进而快速高效的检测基因的生物学信息[20-21]。
cDNA微阵列采用光刻合成或高速打印技术在硅片、玻璃或尼龙膜上制造DNA微阵列,以荧光标记的DNA探针,借助碱基互补杂交原理进行杂交,然后用放射自显影或双色荧光成像技术显示杂交结果,利用阵列扫描仪及相应软件进行全自动检测和分析。通过一次杂交,在大于1 000个cDNA/cm2点阵密度的芯片可定量检测成千上万个基因表达活性。它是将生命科学、计算机科学、光电化学和微电子学融为一体,在原来核酸杂交的基础上发展而来的一项新的生物学技术[22],也是目前基因分离鉴定的最有效的方法之一。
cDNA微阵列技术的优点很显著:大规模、高通量、快速高效、高平行性、高度自动化及高灵敏度等,从而使其在差异表达基因筛选中得到了广泛的应用。但该技术也存在着一些问题,首先对基因序列信息的依赖使该方法只能用于研究较深入的少数物种,对于基因组研究相对薄弱,没有足够的已知序列制备探针,就无法使用该技术筛选差异表达基因;其次,费用昂贵,小型实验室无力购买使用;玻片上的微阵列不能重复使用以及信号捕获系统的敏感性等造成假阴性等问题也是目前限制该方法广泛应用的主要因素。此外,DNA芯片不能很好的分析低丰度转录体,要确保某种低丰度转录体包含于DNA芯片上,需要挑选许多的克隆进行扩增点样。
目前,将cDNA微阵列技术与其他方法相结合在差别表达基因筛选中取得了显著效果。例如,Yang等[23]将SSH与cDNA芯片联合使用,通过微阵列技术快速分析经SSH得到的差异基因,取得了很好的结果
高等真核生物约含有10余万个不同基因,但在生物体的发育过程中只有15% 的基因得以表达。除了上述介绍的几种方法外,其他如Gene Calling技术、抑制性消减杂交技术也都具有自己独特的优势。总的来说,随着技术的不断进步,筛选差异表达基因已从既费时又费力的方法(如聚丙酰胺凝胶为基础的差异显示)发展到自动高通量检测(DNA微阵列),每项技术都在实际应用中不断改进和发展,还没有哪项技术占据统治地位,因此,只有根据研究目的及试验条件选择合适的试验方法才能事半功倍,取得优良的试验结果。但可以肯定的是随着现代科技的不断发展与进步,分子生物学领域的研究方法也会往更快,更高效,更灵敏,更准确的方向发展。
[1]Bautz E K,Reilly E.Gene-specific messenger RNA:isolation by the deletion method[J].Science,1966,151:328-330.
[2]Lamar E E,Palmer E.Y-encoded,species-specific DNA in mice:Evidence that the Y chromosome exists in two polymorphic forms in inbred strains[J].Cell,1984,37(1):171-177.
[3]Duguid J R,Dinauer M C.Library subtraction of in vitro cDNA libraries to identify differentially expressed genes in scrapieinfection[J].Nucleic Acids Research,1990,18:2789-2792.
[4]Zhu F,Yan W,Zhao Z L,et al.Improved PCR-based subtractive hybridization strategy for cloning differentially expressed genes[J].Biotechniques,2000,29:310-313.
[5]Low R K W,Prakash A P,Swarup S,et al.λExonuclease-Based Subtractive Hybridization Approach to Isolate Differentially Expressed Genes from Leaf Cultures of Paulownia kawakamii[J].Analytical Biochemistry,2001,295:240-247.
[6]Liang P,Pardee A B.Differential display of eukaryotic messenger RNA by means of the polymerase chain reaction[J].Science,1992,257(5027):967-971.
[7]Sun Y,Hegamyer G,Colburn N H.Molecular cloning of five messenger RNAs differentially expressed in preneoplasmic or neoplasmic JB6mouse epidermal cells:one is homologous to human tissue inhibitor of metalloproteinases-3[J].Cancer Research,1994,54(5):1139-1144.
[8]Ito T,Kito K,Adati N,et al.Fluorescent differential display:Arbitrarily primed RT-PCR fingerprinting on an automated DNA sequencer[J].FEBS Letters,1994,351(2):231-236.
[9]Ayala M,Balint R F,Fernández de Cossio M E,et al.Variable region sequence modulates periplasmic export of a single chain Fv antibody fragment in E.coli[J].Biology Techniques,1995,18(5):832-842.
[10]Matz M,Usman N,Shagin D,et al.Ordered differential display:a simple method for systematic comparison of gene expression profiles[J].Nucleic Acids Research,1997,25(12):2541-2542.
[11]Broude N E,Chandra A,Smith C L.Differential display of genome subsets containing specific interspersed repeats[J].Proceeding National Academy Sciences USA,1997,94:4548-4553.
[12]Lisitsyn N,Lisitsyn N,Wigler M.Cloning the differences between two complex genomes[J].Science,1993,259:946-951.
[13]Hubank M,Schatz D G.Identifying differences inmRNA expression by representational difference analysis of cDNA[J].Nucleic Acids Research,1994,22:5640-5648.
[14]Hubank M,Schatz D G.cDNA representational difference analysis:a sensitive and flexible method for identification of differentially expressed genes[J].Methods Enzymol,1999,303:325-349.
[15]Velculescu V E,Zhang L,Vogelstein B,et al.Serial analysis of gene expression[J].Science,1995,270(5235):484-487.
[16]Powell J.Enhanced concatemer cloning-a modification to the SAGE(Serial Analysis of ene Expression)technique[J].Nucleic Acids Research,1998,26:3445-3446.
[17]Kenzelmann M,Muhlemann K.Substantially enhanced cloning efficiency of SAGE(Serial Analysis of Gene Expression by adding a heating step to the original protocol[J].Nucleic Acids Research,1999,27(3):917-918.
[18]Dyhrman S T,Haley S T,Birkeland S R,et al.Long serial analysis of gene expression for gene discovery and transcriptome profiling in the widespread marine coccolithophore Emiliania huxleyi[J].Applied Environment Microbiology,2006,72(1):252-260.
[19]Matsumura H,Ito A,Saitoh H,et al.Super SAGE[J].Cell Microbiol,2005,7(1):11-18.
[20]Suzuki T,Tazoe H,Semura M.DNA microarray analysis of changes in gene expression induced by 1,25-dihydroxyvitamin D3in human promyelocytic leukemia HL-60cells[J].Biomed Research,2006,27(3):99-109.
[21]Andersson H,Hartmanova B.A microarray analysis of the murine macrophage response to infection with Francisella tularensis LVS[J].Medicine Microbiology,2006,55(8):1023-1033.
[22]Hacia J G.Resequencing and mutational analysis using oligonucleotide microarrays[J].Nature Genetics,1999,21(1):42-47.
[23]Yang G P,Kuang W W,Weigel R J.Combining SSH and cDNA microarrays for rapid identification of differentially expressed genes[J].Nucleic Acids Research,1999,27 (6):1517-1523.