陈宝花, 邹婷婷, 龙中儿, 黄运红
(江西师范大学 生命科学学院,江西 南昌 330022)
微生物体形微小,结构简单,但在食品发酵、医药卫生、工农业生产和环境保护等诸多领域都发挥着极其重要的作用。为了揭示微生物的生命活动规律及其作用机制,提高微生物的利用率,1994年美国DOE启动了微生物基因组计划(Microbial Genome Program,MGP),越来越多的科学家开始了对微生物基因组的研究,至今可从NCBI数据库中搜寻到超过4万种微生物的基因组序列,促使微生物基因组学研究进入了后基因组时代,即微生物基因功能的研究。当前,微生物基因功能研究的常用方法有生物信息学预测、基因表达谱分析、基因敲除技术、基因敲入技术、基因沉默技术和基因编辑技术等。在实际的研究工作中,研究者可根据实际情况,依照微生物目标基因(组)功能研究的前提条件,制定出针对性的研究方案(如图1所示),并选用合适的微生物基因功能研究方法,有时还需要综合利用两种或两种以上方法相互印证。本文就微生物基因功能研究的方法与策略作一综述。
生物信息学(Bioinformatics)是一门通过计算来实现对生命系统科学理解的学科,它将生物的分子描述符与生物过程联系起来,促进知识的发现和数据的挖掘。生物信息学是支撑微生物生物技术和基因组研究的关键平台。研究者在获得微生物基因或其产物蛋白质的氨基酸序列信息后,可通过分析比较工具(如BLASTn、BLASTx)对微生物的基因或蛋白质氨基酸序列的各类信息进行识别、比较,确定基因或蛋白质氨基酸序列之间的同源性,从而获得基因序列之间的进化关系,在此基础上预测基因的功能、基因产物蛋白质的结构及其结构与功能之间的关系等。
图1 微生物基因功能的研究策略
微生物基因在微生物生长发育的不同阶段、不同条件下的表达量均不相同。因此,对不同条件下微生物基因的时空表达谱进行分析,可以用来研究微生物基因的功能。基因的表达谱分析包括mRNA和蛋白质两个水平。
mRNA水平的基因表达谱分析方法有原位杂交技术、RT-PCR和Northern Blot等。原位杂交技术是利用核酸分子单链之间有互补的碱基序列,将探针与组织、细胞或染色体内待测的mRNA互补配对,结合形成专一的杂交分子,并通过一定的检测手段将其位置显示出来,主要分为基因组原位杂交技术、荧光原位杂交技术、多彩色荧光原位杂交技术和原位PCR技术。原位杂交技术因其高度的敏感性和准确性被广泛应用于微生物基因功能的研究。RT-PCR是将RNA反转录产物与cDNA聚合酶链式扩增相结合的技术,主要有半定量RT-PCR、实时定量RT-PCR和竞争性定量RT-PCR。半定量RT-PCR操作相对简单,但精度不高,只能测定mRNA 的相对含量,多用于微生物基因表达水平的初步分析;实时定量RT-PCR操作简便、快速高效,降低了操作过程中PCR受污染的可能性,但无法避免扩增出基因组DNA和消除样品处理、仪器差异带来的误差[1];竞争性定量RT-PCR是将与目的基因相同的引物序列的DNA片段作为竞争模板与目的基因一起扩增,一同竞争与引物的结合,其重复率高,并可解决几对引物在同一PCR管扩增不同基因发生干扰的问题。Northern Blot技术多应用于特定基因在mRNA水平上动态表达的研究,可对基因进行特异的定量检测,但测定效率和灵敏度不高,无法检测出微小的基因表达量。
蛋白质水平的基因表达谱分析方法有免疫组织化学、Western Blot等。免疫组织化学是能够准确地定位微生物细胞内蛋白质的位置并对其进行定量分析的重要方法。Western Blot不仅可以对蛋白质进行定量分析,还能检测到蛋白质的聚体形式和分子质量大小。该技术已被广泛应用于检测微生物蛋白质水平的表达。
基因敲除是一种使目标基因失活或去除的方法、手段或途径,为微生物的定向改造提供重要的技术支撑,不仅可克服传统诱变方法的盲目性,还能使改造之后的基因稳定地复制和遗传,是微生物基因功能研究的最有效方法之一。
基因敲除技术主要应用DNA同源重组的原理,利用设计的DNA同源片段替代目标基因片段,达到基因敲除的目的。微生物内源基因功能片段的敲除,引起内源基因结构或组成突变,基因功能丧失,微生物表现出特定的表型效应,可以反映出目标基因的功能。
Red同源重组系统是一种基于K噬菌体Red重组酶的原核中断系统,由传统的同源重组技术逐步发展而来。Red同源重组技术的敲除策略是将一段携带靶基因上下游各有40~60 bp同源序列的PCR片段导入宿主细胞,在Red重组酶的作用下,将导入宿主细胞中的线性DNA片段与载体特定的同源靶序列重组,从而替换靶基因。Red重组酶由K噬菌体的3个基因exo、bet、gam所编码[2]。Exo蛋白结合在双链DNA的末端,从5′端到3′端降解DNA,产生3′突出末端。Beta蛋白自发地与3′突出末端紧密结合,防止其被降解,同时还介导互补单链DNA的退火。Gam蛋白与宿主所表达的核酸外切酶结合抑制其降解体内的外源DNA[3]。当Beta蛋白与3′突出末端结合形成丝状体之后,重组机制有链退火(single strand annealing)和链侵入(strand invasion)两种模型。Red同源重组技术是一个独立的重组系统,在同源重组时利用线性打靶DNA,不需要体外构建重组质粒,具有实验周期短,重组效率高的特点,主要应用于大肠埃希菌[4]、痢疾杆菌[5]、鼠伤寒沙门氏菌[6]、绿脓杆菌[7]、铜绿假单胞菌[8]和杆状病毒[9]。Red同源重组技术在其他微生物基因功能研究中存在同源臂过长或重组效率较低的问题,在一定的实验条件下,如构建新型质粒pKD46[10]、与Rac噬菌体系统重组为Red/ET重组系统[11]可能会使该技术更广泛地应用于其他微生物中。
Cre/loxP位点特异性重组系统由Cre重组酶和loxP位点组成。Cre重组酶最初是由Steinberg等[12]在大肠埃希菌噬菌体P1内发现的,它不仅能够催化位点特异性重排反应,还能识别特异的loxP位点并介导2个loxP位点之间的DNA进行特异性重组。loxP是由两侧13 bp的反向重复序列和中间间隔的非对称的8 bp序列共同构成的回文序列结构。13 bp的反向重复序列是Cre重组酶特异性结合位点,而8 bp的间隔序列不仅能够确定loxP的方向,还是DNA分裂和发生链交换的部位。Cre/loxP位点特异性重组系统共有三种工作方式:①两个loxP位点位于同一分子中且方向相同时,两个位点之间的DNA片段重组后被剔除;②两个loxP位点位于同一分子中且方向相反时,两个位点之间的DNA片段重组之后发生倒位;③两个loxP位点位于不同的分子上时,可使DNA发生交换或易位[13]。Cre/loxP系统作用专一,无需其他辅助因子,能特异性地敲除基因,且不携带抗性标志物,但仅适用标记基因的删除和外源基因的定点整合,使该技术的发展受到了很大的局限。目前,Cre/loxP系统已成功应用于乳酸链球菌的基因组重排[14]、炭疽杆菌[15]和伤寒杆菌[16]的基因组编辑、变异链球菌[17]和肺炎链球菌[18]的无标记基因缺失、T嗜热杆菌[19]基因无标记断裂新系统开发和丝状真菌的标志物回收[20],以及定向克隆真菌基因组DNA大基因簇,解决额外克隆缺失片段和多次PCR易发生突变的问题[21]。
基因敲入技术(Gene knock-in)也是微生物基因功能研究的一种有效手段,它利用基因同源重组的原理,将外源有功能基因(基因组内原先不存在或已经失活的基因)转入细胞基因组中的特定位点后,与基因组中的同源序列进行重组,插入到基因组中,并在细胞内获得表达的技术。通过长同源臂和微同源序列两种途径介导的同源修复可实现精的确靶向敲入,非同源末端连接途径可介导非精确的靶向敲入。同时,基因敲入有两种方式,一种是原位敲入,即在原基因敲除的位点插入新基因,它是基因敲除的逆过程;另一种是定点敲入,即无论敲除基因的位点在哪里,敲入的基因是在特定启动子下,以转移载体的形式转座进去,插入的位点是固定的。目前,基因敲入技术已成功应用于果蝇炭疽菌核荧光标记菌株的构建[22]、假单胞菌尿黑素降解基因的克隆[23]、龟裂链霉菌合成土霉素初级代谢路径的调控[24]等,但因该技术靶点的切割效率普遍不高,敲入的分子机制尚不完全了解,使该技术的进一步推广受到了限制。
基因沉默(Gene silencing)是指由外源基因导入引起的生物体内特定基因不表达或抑制表达的现象。通过观察、比较基因沉默前后生物表型的变化,可以确定目标基因的功能。目前,最常用的基因沉默技术有RNA干扰和反义寡核苷酸技术。
RNA干扰(RNA interference,RNAi)是双链RNA(double stranded RNA,dsRNA)分子在mRNA水平上启动的序列特异的转录后基因沉默现象[25],该现象最初于1998年由Guo等[26]在研究线虫Caenorhabditiselegans时发现。RNAi的作用过程分为起始阶段和效应阶段等。在起始阶段,dsRNA在核酸内切酶Dicer酶和RNAase Ⅲ的作用下被切割为长度21~23 bp的siRNA(small interference RNA)[27];在效应阶段,siRNA分子、核酸酶和螺旋酶等结合形成RNA诱导沉默复合物(RNA-induced silencing complex,RISC)。RISC以消耗ATP的方式催化双链siRNA解旋,同时RISC内部的单链siRNA以碱基互补配对的方式识别并切割互补的靶RNA,并用RNA酶将切割的靶DNA降解,从而使目的基因表达沉默[28]。RNAi普遍存在于真核生物中,可用于研究单个基因、基因家族和整个基因组基因的表达,与传统的基因敲除技术相比较,具有操作简单、周期短、特异性强、投入少和穿透性强等优势,但对于一些特定的细胞类型(如神经元)和低水平表达的基因,RNAi技术的作用并不明显。目前,RNAi技术主要应用于筛选药物靶向基因、确定基因功能和基因治疗等方面,在微生物方面主要应用于真菌[29](如担子菌)以及作为抑制病毒增值的理想工具[30],如艾滋病病毒和乙型肝炎病毒等。
反义寡核苷酸(Antisense oligonucleotide,ASON)技术是指长度为19~23个碱基修饰的RNA寡核苷酸与靶mRNA杂交形成双链的过程,该双链分子能够阻止靶mRNA正常工作翻译蛋白质[31]。反义寡核苷酸引发基因沉默的机制可能是与靶mRNA互补结合后以位阻效应抑制靶基因的翻译,或者是与双链DNA结合形成三股螺旋而抑制转录,也不排除通过激活细胞内的Dicer酶进入RNA干扰途径而降解靶mRNA[32]。1978年,反义寡核苷酸技术成功应用于抑制Rous肉瘤病毒的产生[33]。目前,反义寡核苷酸作为一种新的工具已广泛应用于微生物进化机制的研究,作为一种新型药物用于病毒感染等疾病的治疗[34]等。
基因编辑是指通过核酸酶对靶基因进行定点改造,实现特定DNA的定点敲除、敲入以及突变等,最终下调或上调基因的表达,使细胞获得新表型的一种新型技术[35]。近年来,基于多种高效靶向核酸酶的发现,发展了许多高效的靶向基因编辑技术,如锌指核酸酶技术(Zinc fingernuclease,ZFNs)、转录激活因子样效应物核酸酶技术(Transcription activator-like effector nuclease,TALENs)和成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats,CRISPR)/CRISPR相关蛋白(CRISPR associated proteins,Cas)系统等。
锌指核酸酶是能够在复杂基因组中切割预先设定的靶DNA的人工合成酶,最早由Kim等[36]在1996年合成。ZFNs由特异性的锌指蛋白DNA结合域和非特异性的核酸内切酶Fok I结构域组成。锌指蛋白DNA结合域能够识别特定的DNA序列,通常由3到4个专门设计的Cys2-His2锌指结构域(Zinc finger domain,ZFD)串联重复组成,每个ZFD识别靶DNA的3个连续的核苷酸碱基。由于Fok I核酸酶只有在二聚体状态下才有内切酶活性,2个ZFN亚基必须以正确的方向和间距结合DNA。2个Fok I二聚体化后,在靶位点切割DNA并激活细胞DNA损伤反应,通过精确同源重组和易出错的非同源末端连接修复断裂的双链。ZFNs在基因修饰时有特异性强和高效性等特点,但是由于氨基酸残基和目标序列碱基对之间复杂的相互作用,使多锌指模块的设计具有一定的挑战性[37],同时ZFNs技术还存在着敲除率低、脱靶率高和细胞毒性大等问题。ZFNs技术针对抗生素抗性细菌(ARB)[38]可敲除细菌内源性的抗性基因,从而缓解细菌的耐药性。同时,ZFNs还可以在潜在感染和感染的细胞模型中介导整合完整的前病毒基因组切除[39],这表明ZFNs技术具有抗逆转录病毒的活性。
TALENs是近几年发展起来的一种对基因组进行定点改造的新技术,它是由植物病原菌黄单胞菌分泌的一种类转录激活效应因子(Transcription activator-like effectors,TALEs)和Fok I核酸内切酶组合而成的融合蛋白[40],其中TALEs特异性结合宿主细胞基因机制是由Moscou[41]和Boch[42]所揭示。TALENs由高度保守的N端、C端和中间部分的重复区构成,其中中间部位的重复区由13~29重复氨基酸单元组成,每个重复的氨基酸单元由34个序列几乎一致的氨基酸串联排列构成,其中第12、13号位点的氨基酸(合称为RVD)高度可变,是特异性识别核苷酸的关键部件。TALENs通过N端的核定位信号进入细胞,并特异性地识别靶位点之后,Fok I切割靶基因的DNA双链,使双链断裂,随后启动两种修复机制。重复单元与核苷酸碱基一对一的识别模式使TALENs技术具有靶向效率更高[43]的优势,但该技术依然存在着载体构建较繁琐、编辑效率不高和难以同时对多个基因进行编辑等问题。目前,TALENs技术已经应用于获得高产的酿酒酵母[44]、稻瘟病菌的基因编辑[45]以及对CCR5进行特异性编辑从而抵抗HIV-1的感染[46]。
CRISPR/Cas系统是细菌和古生菌在长期进化过程中形成的RNA指导的降解入侵病毒或噬菌体DNA的适应性免疫系统,该系统最初由Ishino等[47]在大肠埃希菌K12中发现。CRISPR/Cas系统由Cas核酸酶和2个独立的RNA组分,即crRNA和tracrRNA组成。入侵的噬菌体基因组中的原型间隔序列(protospacer)可以被Cas蛋白复合物靶向裂解为间隔序列(spacers),接下来spacers被整合到宿主基因组CRISPR位点的5′端,随后这些短的掺入的spacers被转录成crRNA和一个互补的tracrRNA并形成双链二级结构,引导核酸酶Cas在与crRNA配对的序列靶位点剪切双链DNA。Protospacer的5′或3′端延伸的几个碱基序列很保守,所以被称为PAM(protospacer adjacent motifs)。PAM序列在Cas蛋白复合物识别和选择protospacer的过程中起着关键的作用,只有带有正确PAM序列的protospacer才能被整合到CRISPR阵列中[48]。CRISPR/Cas系统被分为I型、II型和Ⅲ型,与其他需要多个Cas蛋白的系统相比,II型CRISPR/Cas系统只需要一个Cas9蛋白便能参与crRNA的成熟和裂解入侵的噬菌体DNA或外源质粒[49]。crRNA和tracrRNA可嵌合形成具有引导作用的sgRNA (single guide RNA),在sgRNA的作用下,目的基因被Cas蛋白切割,从而造成DNA双链断裂,引发DNA修复机制,诱导基因的插入或缺失。CRISPR/Cas系统sgRNA设计简单[50],编辑效率高,可避免甲基化影响,同时也存在着脱靶效应[51]和编辑效率存在差异等问题。CRISPR/Cas9系统已成功应用于肺炎链球菌、大肠埃希菌基因组编辑[52]、酿酒酵母的高效定点突变和等位基因替换[53]、大病毒基因组编辑[54]、植物病毒干扰[55]以及地衣芽胞杆菌的工程改造[56]。
微生物基因功能的研究是现代生命科学研究的重要内容,其研究方法多样,研究技术各有优劣。目前来看,特异性不高、重组效率低、存在脱靶效应、分子机制尚不完全明确和通用性低等是制约微生物基因功能研究技术发展的主要瓶颈。要解决这些问题,需要多领域的研究者从不同的角度共同努力,在改进和优化现有研究技术的基础上,发展出更为高效、精确和普适的基因组编辑工具。当这些问题得到彻底解决,人们操作微生物基因组的能力将会极大提高,不仅能更为深入地推进微生物的致病机制、重要代谢及其调控机制等领域基础理论研究的发展,还能在此基础上发展出与生产、生活密切相关的基因工程产品,全面促进微生物工业时代的到来。