申子萌,王希,徐悦,陈丽
(1.黑龙江大学现代农业与生态环境学院/中国农业科学院甜菜研究所,哈尔滨 150080;2.黑龙江省普通高等学校甜菜遗传育种重点实验室,哈尔滨 150080;3.国家糖料改良中心,哈尔滨 150080;4.中国农业科学院北方糖料作物资源与利用重点开放实验室,哈尔滨 150080;5.黑龙江省甜菜技术创新中心,哈尔滨 150080)
基因是指最终用于形成蛋白质或各种功能性RNA 所必需的全部核苷酸序列,从而指导植物体的生长发育等代谢过程。对基因结构和功能进行研究,前提是通过基因克隆技术获得基因本身的片段。广义的基因克隆是借助酶切与连接形成重组质粒即克隆载体,将分离出所需要的目的DNA 片段转入到宿主细胞,从而鉴定、筛选、保存含有目的DNA 片段的个体[1]。整个过程可概括为:分、切、连、转、选[2]。一般而言,基因克隆包括4部分的工作:目标DNA 片段的获取(即“分”)、克隆载体的构建(“切、连”)、寄主细胞的转化(“转”)、重组体克隆的选择和鉴定(“选”)。除此之外,通常在提取目的基因后需要进行生物信息学分析来判断序列的结构与功能[3]。
本研究所综述的基因克隆实现方法,指广义的基因克隆所涉及的基因片段获取、早期分析与载体构建的实现方法。由于植物的生长发育在时间和空间上受到不同基因的影响,而不同的基因在植物体内行使的功能也不同,并且基因在表达上或存在形式上的时空差异性又可能影响基因克隆方案的选择,因此需要对植物中控制不同功能和性状的基因进行结构和功能方面的了解,以期确定某基因行使的功能,并在性状改良乃至产业发展中进行应用。
在基因克隆的过程中,目的片段的获取是至关重要的,目的基因获取,即狭义的基因克隆,又称基因分离,是通过克隆扩增,获得可进行研究或应用的某个基因,形式通常是DNA片段。而获得目的基因通常有4种方法:化学法直接合成基因、从基因组文库中钓取、从cDNA文库中钓取目的基因、通过PCR扩增出目的基因。
化学合成法要求已知目的基因的核苷酸序列或相对应的多肽链氨基酸序列,并且DNA 片段较短,具有专一性和定向性。其原理是通过缩合反应合成特定的寡核苷酸链。常用于合成PCR 引物、寡核苷酸探针、人工接头及较小的基因,用于基础生物学研究和生物科技应用领域等。至今,化学法直接合成基因可以利用PCR技术和基于非聚合酶循环反应(PCA)的策略来实现方便、快速地合成目的基因[4-5]。近年来,利用化学法合成基因的研究较多,如:使用化学方法对碱基修饰的核糖核酸-5'-O-三磷酸盐进行克级合成[6];细菌基因组的合成,开辟了化学法合成基因的前景[7]。此外,蛋白质的化学合成也已经成为一种普遍适用的技术,在体内外都可合成具有定制特性的蛋白质[8]。全化学合成蛋白质的方法更加方便、快捷[9]。
由于基因组文库内含有某一生物完整的基因组信息,可使用DNA 探针从基因组文库中获得目的基因。基因组文库构建通常包括两个部分:(1)染色体DNA 片段和载体DNA 片段的制备;(2)将染色体DNA 片段与载体连接。组建基因组文库的手段一直在更新,如:利用绕过限制甲基化DNA 的限制修饰系统高效构建异种基因组文库[10]。对高粱种子进行化学诱变建立系谱突变文库,在高粱改良中具有优势[11]。此外,利用图位克隆的方法已建立了谷子突变体基因组文库[12]。
由于cDNA文库能够快速扩增目的基因,并且不受内含子的干扰,操作较简单,工作量也较少,因此在建立真核生物基因文库时常常首选cDNA 文库。建立cDNA文库的主要步骤包括:总RNA 的提取和纯化、cD‐NA 的合成、cDNA 文库的构建[13]。关于cDNA 文库建立的报道一直在增加,如利用SMART 技术构建耳痒螨(Otodectes cynotis)全长cDNA 文库,为其进一步进行RNA 测序和功能基因研究奠定了基础[14];采用Mate &Plate™酵母双杂交文库方法,从猕猴桃幼叶信使RNA构建了猕猴桃cDNA文库[15]。
PCR技术自问世以来[16],已成为克隆研究最常用的方法[17-18]。例如,利用数字PCR技术对各种HIV基因组目标可进行总HIV DNA定量分析[17]。
当目的基因序列未知或不够准确时,则可通过不同的PCR 引物设计,实现目的基因的扩增。现有方法包括反向PCR、锚定引物PCR、随机引物PCR、RACE等。如,采用反向PCR 技术对质粒进行扩增[18],利用水稻基因组中的Bar基因设计锚定引物[19],使用任意引物的PCR,多次循环扩增,并通过计算选择获得一组序列标记,用于宏基因组比较的方法[20],利用RACE技术对花生的FAR1-5 转录因子进行克隆[21],等等。随着科学技术的发展,PCR 技术也在不断创新,从传统的PCR技术到RT-PCR[22]、qRT-PCR[23]、M-PCR[24]等技术,到仍然在不断创新的COLD-PCR[25]、SOE-PCR[26]、恒温热隔绝式PCR[27]等,PCR技术的种类和应用领域仍在不断扩大。
生物信息学分析是基因克隆在序列和功能分析方面的重要手段,通常是指在具有计算机和生物学等多方面知识的基础上,使用相关软件,对基因从序列水平进行分析的过程。在植物基因克隆方面,主要集中在核苷酸序列和氨基酸序列两方面进行分析[28-29]。在得到目的基因之后,通常会先对其进行基本特征的生物信息学分析,从序列结构、编码区完整性、序列相似性等角度评价基因克隆的效果,并对基因产物的基本特征进行预测[30]。利用的分析工具包括Blastn、Blastx、Dnaman、Clustal等单机或在线软件。此后则是对基因的编码产物进行进一步的分析,从蛋白质水平进行结构功能的预测。随着生物基因测序的不断完成和生物信息学分析手段的多元化,生物大分子的结构和功能不断被挖掘[31]。对于蛋白质的二级结构预测常采用nnPre‐dict、Predictprotein 等工具,三级结构常采用Swiss-Model、Phyre2 等分析工具,ExPASy、BLAST 在线网站可以对跨膜结构进行分析。在对基因进行生物信息学分析的研究上,朱晓林等[32]对Ty-6基因进行克隆和生物信息学分析,利用xPASy-ProtParam tool进行蛋白质的一级结构预测分析,用SOPMA 软件进行蛋白质的二级结构预测分析,用SWISSMODEL 平台进行蛋白质的三级结构预测分析,用MHMM Server v.2.0 平台对蛋白质跨膜结构进行预测分析等。杨欣蓉等[33]对菠萝蜜BRI1 家族成员利用预测网站SOPMA 和SWISS-MODEL 分析网站对蛋白二级结构、三级结构进行分析预测。
同时,生物信息学的发展也催生了一种新的基因克隆方法——电子克隆(In silico cloning)。它是通过生物信息学手段电子延伸获得目的基因的全长。大致过程是通过转录本库、基因库等不完整序列确定目的片段部分序列,再进行电子延伸以获得目的序列片段,最后进行试验验证,获得目的序列准确信息的过程[34]。在植物基因克隆方面最新报道有,采用电子克隆技术对木薯MeZnT11基因进行扩增[35],通过建立新的电子克隆方法对芒果LAR基因进行克隆[36]。甜菜基因电子克隆研究则较少,曾利用电子克隆技术对甜菜BvM14-glyoxalase I基因[37]和BvLRR-RPK2;1基因[38]进行了克隆。
在获得目的片段之后,我们需要将其连接在载体上,使其能够自主复制并导入寄主细胞,从而满足后续研究的要求。该步骤即为载体的构建。按不同来源划分,载体可分为质粒载体[39]、噬菌体载体、粘粒载体[40-41]、病毒载体[42]和人工染色体载体[43-45]等。按不同用途划分,载体可分为克隆载体和表达载体。
质粒载体是指能够连接目的基因进行自我复制的小型环状DNA 分子。从第一个质粒载体pSC101 于1973 由Cohen 等构建,越来越多的新型质粒被挖掘[46]。到目前为止,创建了有史以来最小的质粒载体pI‐COz[47],开发了两种耐药的质粒载体pBS2ndd和pBS3ndd来提高细菌宿主细胞大肠杆菌DNA 片段分子克隆的效率[48]。噬菌体由于克隆效率高、容量大等优势,也常常用作载体,常用的噬菌体有λ 噬菌体载体和M13 噬菌体[49]。近年来,利用一种ssRNA 噬菌体LeviOr01,可在铜绿假单胞菌中建立起载体状态[50]。人工染色体是指能够对大片段DNA 进行复制的复制子,人工染色体的构建则是从1983年第一个酵母人工染色体(YAC)载体的构建到第一个细菌人工染色体(BAC)载体和双元细菌人工染色体(BIBAC)的出现,人工染色体载体的容载和转化能力不断增强,在生物学领域应用的越来越多[43-45]。目前,已经可使用容载能力更强,细胞内表达充分的人类人工染色体(HAC)载体作为文库构建与基因克隆的工具[51]。
克隆载体是指能够与外源DNA片段重组,转入受体细胞可被快速扩增,且具有筛选标记的DNA分子,用于使目的基因能在受体细胞中得到复制,从而便于保存与操作。常用于外源基因克隆的载体有噬菌体或质粒[52]。随着对质粒研究的不断深入,克隆载体的种类和数量越来越多,日益成为基因工程技术的重要内容[53]。表达载体的功能是使目的基因在受体生物体内表达,从而获得其编码产物,进而分析其功能与作用机制,包括蛋白质基本结构、生理功能、调控机制等。表达载体除了要求与克隆载体一样拥有复制的起始、终止位点及有关复制的调控序列之外,还需要具有启动子、终止子等与转录相关的调控序列,保证目的基因能高效地表达。选用细菌质粒进行载体构建时,除具备克隆载体的标记基因外,载体还需要使所携带的片段可被识别,以检验片段是否成功整合到染色体DNA中,该功能可由筛选标记基因或表达报告基因来实现[54]。
载体构建的常规过程是通过酶切与连接完成,克隆载体还可通过T-A 克隆方案实现,虽然以上技术路线已比较成熟,但载体构建技术仍然在逐步发展之中。2007年,Gateway 技术作为克隆载体构建技术获得了成功[55],之后,利用重叠延伸PCR 技术,构建了带有潮霉素B 抗性基因作为选择性标记的单交换载体pBShygro[56],也进行了红球菌-大肠杆菌穿梭载体的构建[57]。
重组载体导入寄主细胞的方法比较成熟,近年来未见更新,但在此后的重组克隆/重组个体筛选方面,方法一直比较多样,且经常根据具体研究内容演化出适合的改良方法。例如,当用噬菌体DNA 作为载体导入到寄主细胞时,培养后理论上不需要筛选,所有正常的噬菌斑都是重组体;当使用pUC 系列载体进行转化后,可用经典的蓝白斑筛选法,出现的白色菌落一般都是重组体;如果质粒没有明显的特性,那么也可以采用DNA 酶切分析方法进行直接鉴定[58-59]。比较复杂的核酸杂交、免疫化学等方法也曾经被用于转化子筛选。在核酸杂交技术的应用方面,利用RNAscope 技术对植物组织中的病毒核酸进行双原位杂交,从而对其进行特异性和敏感性分析[60];利用荧光原位杂交技术,使用核酸探针检测目标微生物[61]。在免疫化学技术的应用方面,已对危险污染物喹氧灵进行了免疫化学快速测定,并首次制备了喹氧灵的免疫试剂,提供了利用免疫化学方法检测转化子及其蛋白质的新思路[62]。
国外甜菜基因克隆研究略领先于我国,性状上更有针对性,且研究连贯性更明显,能较快地完成对影响甜菜生长因子的克隆、分析及鉴定,直接面向生产问题,理论研究方面也相对深入。例如:GINDULLIS等[63]建立甜菜细菌人工染色体(BAC)库,为甜菜基因组分析提供了途径。之后,对甜菜细菌人工染色体中不同类型基因克隆的研究也开展起来[64]。MATSUHIRA 等[65]通过对甜菜新型生育恢复因子(Rf)进行克隆和转基因植株的构建,从而对其进行特征分析。DUNAJSKA-ORDAK 等[66]对从受盐胁迫的甜菜植物叶片中分离出来的全长cdna 编码过氧化物酶BvpAPX 进行了克隆与表达分析。LAUFER 等[67]对甜菜土传花叶病毒和甜菜坏死黄脉病毒cDNA 克隆体外等温重组,构建含有两种病毒所有基因组的载体,并对其进行生物学特性观察和分析。LI等[68]对甜菜根蛆基因调控的转录组进行分析,对SBRM基因在发育、调控、细胞过程、信号传导和应激条件下的功能进行了注释。SAMUELIAN 等[69]通过cDNA-AFLP、Real-time PCR 等技术对甜菜胞囊线虫感染表达上调基因进行克隆及功能分析,进而阐明其抗甜菜囊状线虫的作用,表明该基因可用于诱导植物的囊线虫抗性。PIERGIORGIO 等[70]对甜菜抗线虫基因HsBvm-1进行SNP标记的鉴定和验证,确定了与一个甜菜耐线虫性完全相关的标记(SNP192)。可知,国外对甜菜基因克隆研究大部分处于基因的表达模式和基因与性状的关系和分子机制两个层面上。MINIC 等[71]通过半定量RT-PCR、原位杂交和启动子-GUS 融合等技术对拟南芥中一个种子特异的阿拉伯多糖水解酶进行纯化、功能表征、克隆和突变体的鉴定。对拟南芥多糖水解的研究也有希望对将来甜菜多糖代谢的研究奠定有利的基础。
我国甜菜基因资源目前还相当缺乏,基因资源收集和序列分析的工作刚刚起步,此前的克隆方法以无参考序列的PCR技术为主。丁广洲等[72]通过RACE技术对nia基因进行克隆,揭示氮元素对nia基因的影响。张永丰[73]从丰产型甜菜品种中克隆出两个BvDof基因转入拟南芥中进行功能分析,发现甜菜块根生长速率与Dof转录因子家族基因的表达水平相关。曹国丽[74]对与甜菜块根发育相关的ERF基因及BvCPD进行了克隆,分析表明15 个家族成员与甜菜块根转入快速生长阶段有关。焦琦[75]通过克隆液泡膜Na+/H+逆向转运蛋白BvNHX基因对甜菜耐盐碱化程度进行分析。李宁宁等[76]采用同源克隆、qRT-PCR等技术和分析软件对甜菜液泡膜Na+/H+逆向转运蛋白BvNHX1基因进行了克隆和生物信息学分析。王宇光等[77-78]]利用5'-/3'-race法等技术对甜菜M14中提高植物耐盐性的胱抑素基因进行克隆;并对甜菜BvBHLH92基因进行序列分析,甜菜响应盐胁迫的组织表达分析,亚细胞定位等。吕笑言等[79]利用PCR反应、RT-PCR等技术对甜菜基因BvM14-CMO、BvM14-BADH进行克隆和生物信息学分析,以及盐胁迫下的表达分析。李国龙等[80]以干旱处理的强抗旱甜菜品种HI0466为材料,通过RT-PCR技术克隆到一个甜菜与抗旱相关的NAC类转录因子基因的cDNA序列,进行了序列分析和植物表达载体的构建。张皓等[81]对甜菜抗逆基因P5CS进行了克隆和盐胁迫下的表达分析。徐晓阳[82]利用RNA-seq、qRT-PCR等技术对甜菜抗旱性相关的AC转录因子进行克隆,表达分析及功能鉴定。王锦霞等[83]通过RT-PCR 方法,获得基因的全长序列,对甜菜重金属胁迫应答BvMTP11基因进行克隆及序列分析。鲁振强等[84]通过RT-PCR技术,对甜菜抗草甘膦除草剂AtEPSPs基因的功能域进行了克隆。JIANG等[85]对甜菜坏死黄脉病毒进行载体的开发,并将应用于基因组研究和多种蛋白质在甜菜和相关作物中的表达。李梦林等[86]对甜菜神秘病毒BCV基因组进行克隆和序列分析。乔芬[87]利用第二代测序技术、qRT-PCR技术、体外RNAi技术对甜菜抗线虫Hs1-2基因进行序列查找和生物信息学分析,选出抗孢囊线虫候选基因进行功能验证。鲁振强等[88]采用同源克隆和RACE等方法对甜菜与生殖相关的BvMARB基因进行了克隆。乌日汉[89]利用同源序列克隆、半定量PCR技术、qRT-PCR技术对甜菜细胞质雄性不育相关基因进行了克隆和生物信息学分析,以及在花蕾中相关基因表达量进行了分析。刘洪伟等[90]利用RACE-PCR技术对甜菜赤霉素合成途径中的树贝壳杉烯合酶基因进行了克隆和生物信息学分析。王飞等[91]也采用同源克隆技术和相关软件对甜菜素合成相关基因BvDDC1进行了克隆和分析。马冰雪等[92]对红甜菜UGT、TYR等基因进行了克隆并对不同光质对甜菜色素含量的影响进行了生物信息学分析。
通过以上论述不难发现,我国基因克隆研究近年不断增多,技术在不断更新,对甜菜基因结构和功能有了一定程度的了解。甜菜基因克隆研究主要处于序列的获取和结构分析及基因的表达模式两个层面上,在基因与性状的关系和分子机制方面的分析几乎没有。笔者认为甜菜基因资源并不够丰富,并且在对甜菜基因表达模式及其生物学功能上的研究几乎为空白,而获取基因资源则是这一切的前提,所以甜菜下一步研究应继续集中在甜菜基因资源收集方面,同时使用生物信息学分析对甜菜基因序列的结构和功能进行分析,可以为今后试验提供研究材料,并为将来田间实际应用做准备。
基因克隆是一切关于基因功能、调控机制等理论研究的必要前提,也是针对特定基因开展遗传改良工作的必要前提。为了使植物的应用符合人类的需求,开发更多植物潜在的使用功能,这要求我们对植物基因的序列、表达及作用机制有更多的了解和掌握。随着科学技术的发展,基因克隆技术也不断在创新,生物信息学分析的手段越来越多元化,我们对植物基因序列的结构和功能的了解也越来越多。我们可以通过基因克隆技术了解植物基因的序列,对比序列了解其大概的功能关系,通过构建载体进行表达分析,确定某基因行使的功能,通过多次试验使其能在性状改良乃至产业发展中进行应用。
在基因克隆研究的过程中,基因序列的信息越缺乏,基因克隆工作也会耗时越长、操作越繁琐。并且基因资源越缺乏,新基因资源的寻找难度越大。对于甜菜而言,基因克隆研究主要面临的问题有:(1)资源与序列信息均严重缺乏,甜菜序列信息不足、质量较低、更新偏慢;(2)基因克隆使用的方法陈旧,导致甜菜基因挖掘与克隆的效率不高;(3)生物信息学分析的手段不多,分析经验也比较缺乏,无法更深层次地了解和预测基因的结构和功能。尽管模式植物已经从基因资源挖掘时代转入了基因调控机制研究时代,但在针对甜菜的研究中,获得充足、可靠、有价值的基因资源仍然是现阶段的首要任务。所幸在现阶段序列信息不断增长、测序成本不断下降的大形势下,我们可以借助序列分析与序列收集,加速甜菜基因克隆与早期分析的进程,因此笔者预测,甜菜的基因克隆虽然起步晚于主粮作物和模式植物,但其发展速度将比其它作物的起步阶段更加迅速,与基因功能深入分析的对接也有希望更加顺畅。
不论是基因资源的获取,还是后续的理论或应用研究,我们目前进行的植物基因克隆并不算完成,基因克隆仅仅是基础性的工作,仅仅是为未来解决实际问题提供必要的材料。因此,基因资源获取得到一定程度的实现以后,研究方向将主要集中在对目的基因序列进行功能分析,主要体现在两个方面:(1)通过微生物表达系统去制备基因产物,分析这些蛋白质本身的功能;(2)通过在植物中的表达去分析基因对植物性状的影响,以及基因产物在代谢通路中的作用及相关的调控机制,直至对基因产物,从结构、功能、调控等多方面完成一定程度的分析,获得比较确切的注释。
不论何种形式与技术路线的基因克隆工作,最终都是以实际应用到种植和生产实践为目的,用来提高作物的产量和品质。在甜菜的具体研究中,也要根据研究目的,有针对性地进行方案设计。针对抗逆性、抗病性、抗抽薹性等由少数基因控制的性状,只要找到其中的关键基因,并将其导入目标种质中,或者以基因为目标进行种质的筛选,即有希望获得性状得到改良的种质;而针对产量、含糖率、形态结构、发育习性等由多基因控制或调控机制比较复杂的性状,则需要由关键基因入手,先对基因起作用的分子机制、与性状表现相关的代谢通路等展开基础理论研究,再针对具体的代谢机理,设计遗传改良方案,最终将基因应用于相应性状的改良。