银杏CONSTANS-LIKE基因的克隆与序列分析

2018-04-08 05:07:50蔡雨蒙何崇单董金金王俊燚王义强
中南林业科技大学学报 2018年12期
关键词:银杏叶银杏结构域

蔡雨蒙 ,何崇单 ,李 萌 ,董金金 ,刘 伟 ,王俊燚 ,王义强

(中南林业科技大学 a.林业生物技术湖南省重点实验室;b.经济林培育与保护教育部重点实验室,湖南 长沙 410004)

银杏Ginkgo BilobaL.,又名公孙树,属裸子植物门Gymnospemae,银杏科Ginkgoaceae银杏属GinkgoL.,单属单种,是原产于我国的一种古老的木本裸子植物。银杏是一种非常重要的经济林树种,具有极高的经济价值和研究价值[1]。银杏果实具有十分重要的药用和食用价值,其提取物对预防和治疗心脑血管疾病等多种疾病具有显著的作用,有望在保健和医药等领域形成新的产业[2-5]。但是,银杏的童期很长,实生树开花需要20年以上的时间。作为经济林木,其投资、育种、成林、果实收获等周期非常长,这种特性严重制约了目前银杏产业的发展。

随着遗传育种技术和分子生物学技术的不断进步和发展,植物开花调控的分子机制正在逐步被阐明,现已证明植物的开花时间是由内在因素和外在因素共同调控的[6-7]。内在因素是指激素[8]及控制植物发育阶段的各种调控基因[9-11],而外在因素包括光周期[12-13]、温度[14]和营养条件[15]等。目前已经确定的植物开花的调控途径包括光周期途径[16]、自主途径[17]、赤霉素途径[18-19]和春化途径[20-21]等4种途径,不同途径组成一个复杂的基因网络共同决定植物开花的启动和维持时间。

开花调控基因CONSTANS(以下简称CO)是光周期途径下游重要的调控基因[12]。在植物营养生长阶段,CO基因在植物的叶片中开始表达。当其转录的mRNA达到一定阶段时,CO基因会激活其下游的成花基因,如FT基因、SOC1基因等,使植物由营养生长向生殖生长转变,从而开始植物的花发育过程[22]。CO基因参与调控植物成花的早晚,并且对花发育有重要的促进作用[23]。

本研究根据转录组信息克隆得到了一个与银杏开花调控相关的CO基因。对该基因序列以及编码的蛋白质序列进行生物信息学分析,将为银杏基因工程育种提供候选基因,并为进一步探索研究银杏开花的分子调控机理提供理论依据。

1 材料与方法

1.1 材 料

银杏叶材料采自种植于中南林业科技大学(湖南长沙)、处于同等培养条件下的银杏成年树和幼年树,成年银杏为30年生,树高15 m,胸径30 cm左右;幼年银杏为10年生,树高5 m,胸径15 cm左右;树势良好,生长正常。采集4月(花芽未分化期)、5月(花芽分化初期)、9月(花芽分化盛期)的成年银杏叶片以及4月、9月的幼年银杏树叶片,经液氮处理后冻存于-80 ℃冰箱中用于RNA提取和转录组测序。载体pMD18-T、大肠杆菌DH5α均购自TAKARA公司。

1.2 方 法

1.2.1 CO基因表达量分析

根据本实验室前期获得的银杏转录组数据,筛选到12个CO家族相关基因,除去基因序列结构不完整、表达量过低的基因,对剩下的7个基 因 使 用 FPKM[24](Fragments Per Kilobase of transcript per Million fragments mapped)分析各CO基因的表达水平,然后对银杏CO基因的表达情况进行聚类分析。

1.2.2 银杏总RNA的提取

从-80 ℃冷冻冰箱中提取保存的银杏成年叶片样品,采用E.Z.N.A(Omega)Plant RNA Kit试剂盒提取银杏叶片总RNA,采用1%琼脂糖凝胶电泳检测总RNA的完整性,用紫外分光光度计检测总RNA的纯度。

1.2.3 GbCOL 基因CDS的克隆

根据转录组序列信息设计引物(下划线为酶切位点),上游引物为GbCOL-F:5′-GCGGGAT CCATGGTGAAGGAAGAGGACCGTAGTG-3′, 下游引物为GbCOL-R:5′-GCCAAGCTTCTAAAAA GTTGGAACGAGACCAAAC-3′。cDNA 第 1链合成采用FastQuant cDNA第一链合成试剂盒(天根,北京),按照试剂盒说明进行操作。再以cDNA为模板进行PCR扩增,其反应条件和反应体系如表1和表2所示。扩增完成后,采用PCR产物纯化试剂盒进行产物纯化(天根,北京)。将回收产物与pMD18-T连接后转化DH5α,通过蓝白斑筛选阳性菌斑,将阳性克隆送至上海生工生物工程股份有限公司测序。

表2 PCR反应条件Table2 PCR reaction program

1.2.4 生物信息学分析

利 用 NCBI(http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi)查找目标基因cDNA序列的开放阅读框(ORF);使用DNAMAN软件预测目标基因核苷酸序列编码的氨基酸序列;运用NCBI上的BLAST程 序(http://www.ncbi.nlm.nih.Gov/BLAST/)完成蛋白质和DNA同源性分析。在NCBI上 的 Conserved Domains(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)程序上完成保守结构域预测;然后通过MEGA 7.0软件构建CO基因的聚类分析。

2 结果与分析

2.1 银杏CO基因的表达分析

将7个CO家族基因的4月(花芽未分化期)成年银杏叶(1)、5月(花芽分化初期)成年银杏叶(2)、9月(花芽分化盛期)成年银杏叶(3)、4月幼年银杏叶(4)和9月幼年银杏叶(5)表达量数据进行整理,绘制成表达模式聚类热图(见图1)。图1中可以看出,在这7个CO家族基因中,Gb.41704在不同时期的表达量均高于其他CO基因。

图1 银杏CO基因表达模式聚类热Fig.1 Expression patterns of CO genes in Ginkgo biloba

将Gb.41704不同时期的表达量通过FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)作为衡量转录本或基因表达水平的指标(见表3),FPKM值越高则表示该基因在银杏组织中的表达量越高。将不同时期FPKM值绘制成Gb.41704基因在银杏不同时期叶片表达量图(图2),可以看出该基因表达量随着花芽的分化而显著上调;同时,该基因在成年期的表达量相对未开花的幼年期表达量有明显升高。因此筛选Gb.41704作为本研究的目标基因。

2.2 目标基因CDS的克隆及序列分析

以从9月成年银杏叶中提取的总RNA反转录银杏cDNA第1条链,再以合成的银杏cDNA第1条链为模板,利用设计的特异性引物GbCOL-F和GbCOL-R, 通过RT-PCR法(图3)克隆得到Gb.41704的完整CDS(图4)。测序表明,该片段长度为1 239 bp,GC含量为52%,编码412个氨基酸,将其命名为GbCOL。

表3 Gb.41704基因在银杏发育不同时期叶片中表达量Table3 Expression levels of Gb.41704 in different leave samples of developmental stages

图2 Gb.41704基因不同时期表达量Fig.2 Expression levels of Gb.41704 in different leave samples of developmental stages

根据核苷酸序列比对,该基因片段与其他植物CO基因序列很高。例如与甜菜Beta vulgaris COL1基因的同源性为87%,与洋葱Allium cepa COL3基因的同源性为86%,樟子松Pinus sylvestrisL.COL1基因的同源性为85%,与火炬松Pinus taedaCOL1的同源性为85%,与欧洲冷杉Abies alba COL1的基因部分序列的同源性为82%。由此表明,可以初步推测该片段为一个银杏的CO基因的cDNA片段。

图3 银杏总RNA提取及GbCOL基因PCR扩增Fig.3 Total RNA of Ginkgo Biloba L.and the results of PCR product of GbCOL gene

图4 GbCOL基因CDS序列及其推导的氨基酸序列Fig.4 CDS sequence and derived amino acid sequence of GbCOL gene

2.3 GbCOL基因蛋白质序列分析

利用DNAMAN对GbCOL 蛋白质序列与其他植物CO蛋白质序列进行多序列比对,发现GbCOL蛋白质序列与其他植物的CO蛋白的氨基酸序列之间有一定的相似性(图5)。GbCOL氨基酸序列与丽江云杉Picea likiangensisCO蛋白序列的一致性为62%、与挪威云杉Picea abiesCO蛋白序列的一致性为61%,与日本落叶松Larix kaempferiCO蛋白序列的一致性为60%;与北美云杉Picea sitchensisCO蛋白序列的一致性为55%,与陆地棉Gossypium hirsutum、可可Theobroma cacao、麻风树Jatropha curcasCO蛋白序列的一致性均为51%。与小立碗藓Physcomitrella patens、川桑Morus notabilis相应CO蛋白序列的一致性均为50%。可以推测,GbCOL是CO蛋白质家族成员之一;它与其他植物,特别是裸子植物中的CO蛋白质的序列较为相似。

图5 GbCOL与其他植物CO基因氨基酸序列多重比对Fig.5 Multiple alignment of deduced amino acid sequences of GbCOL and CO of other plants

利用ExPASy程序中的ProtParam工具对银杏GbCOL基因蛋白的长度、分子量、等电点等基本理化参数进行了分析。预测显示GbCOL蛋白质分子量大小约45 kDa,等电点(pI)为5.80,分子式为C1958H3090N560O613S26,不稳定系数为46.13,属于不稳定蛋白。总平均亲水性为-0.286,推测为亲水性蛋白。

2.4 GbCOL基因分子进化分析

运用 NCBI上的 Conserved Domains(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 程序在线预测GbCOL基因的蛋白质保守结构域(图6),发现GbCOL基因编码的氨基酸序列有2个高度保守的B-box结构域和CCT结构域,具有典型的植物CO家族结构特点。

图6 GbCOL 保守域分析Fig.6 Putative conserved domains analysis of GbCOL gene

CO基因家族根据保守序列B-box的数量可分为三类[25-26],第I类含有2个B-box;第II类只含有一个B-box;第III类含有一个类似B-box的结构和一个差异较大的锌指结构域[27-28]。本研究克隆得到的GbCOL基因推测蛋白含有2个完整的B-box,属于CO基因家族的第I类。其具有完整的植物CO蛋白的结构,含有B-box1、B-box2及CCT结构域三个高度保守的区域。

从GbCOL和其他物种的CO基因的聚类分析可以看出,GbCOL与樟子松Pinus sylvestris CO、挪威云杉Picea abiesCO和火炬松Pinus taedaL.CO等裸子植物CO基因可聚为一类,芒果Mangifera indicaCO、马铃薯Solanum tuberosum CO、拟南芥Arabidopsis thalianaCO、烟草Nicotiana tabacum CO、可可Theobroma cacao CO、陆地棉Gossypium hirsutumCO、和苹果Malus domesticaCO和牡丹Paeonia suffruticosa CO等被子植物CO基因聚为一类(图7)。由此可表明GbCOL与其他裸子植物CO基因同源性更高。

图7 GbCOL与其他物种CO基因系统进化树分析Fig.7 Phylogenetic analysis of GbCOL and CO gene of other species

3 结论与讨论

3.1 讨 论

银杏在我国拥有悠久的种植历史,被广泛应用于医药、食品、观赏、保健等领域,但由于其童期较长,一般需要生长20 a才能开花结果,这一生理特性严重制约了银杏的推广和应用。近年来,随着基因工程的发展和植物基因组学的深入研究,通过基因工程手段缩短植物童期,提前开花结果,已经成功的应用于白桦Betula platyphyllaSuk.[29]、柑橘Citrus reticulataBlanco.[30]等植物中。因此,有理由相信缩短银杏童期可以通过基因工程手段实现,而实现这一目标的关键在于挖掘功能强大的目标基因。

银杏开花与其他植物开花机制相似,由多种开花相关基因调控,一起组成一个复杂的开花调控网络[22,31]。光周期途径是影响植物开花调控网络中的重要环境因子,而CO基因是光周期途径中重要的开花时间调控基因[32-37],CO基因通过调控FT基因的表达来调控植物的开花时间[38-39],许多研究已证明CO基因对于植物开花时间影响很大。现阶段已经从黑麦草Lolium perenne[40]、番茄Solanum lycopersicum[41]、大豆Glycine max[42]、大麦Hordeum vulgare[43]、马铃薯[44]、牵牛花Pharbitis nil[45]、水稻Oryza sativa[46]等植物上克隆得到CO同源基因,但由于物种间CO基因的功能和结构差异,在不同物种和不同条件下其功能可能也有不同[47],如水稻的CO-LIKE基因在短日照条件下促进开花,而在长日照条件下反而抑制开花[48-51]。目前CO基因在银杏开花过程中的调控机理尚不明确,进一步研究不同物种中的CO同源基因功能,有望为阐明CO基因调控植物开花的分子机理提供新的理论依据。

在拟南芥中,CO基因在光周期调控方面发挥重要的作用,可在特定的光照强度和长度下,诱导和调控FT、SOC1等开花相关基因的表达,从而促进拟南芥开花[34]。本研究对银杏中的COLIKE基因进行了基因克隆及生物信息学分析,推测GbCOL也具有调控开花的功能,但该基因调节银杏开花的具体调控机制仍不明确,需要做进一步的功能验证。

3.2 结 论

本研究通过对不同时期银杏转录组测序和差异表达基因筛选得到7个CO相关基因,对这些CO相关基因开花前后表达量进行分析,筛选出1个可能与开花调控相关的CONSTANS-LIKE基因,使用RT-PCR技术从银杏叶片cDNA中克隆得到该基因的完整CDS(1 239 bp),将其命名为GbCOL,利用DNAMAN、MEGA7等软件对GbCOL的序列进行生物信息学分析。多重比较结果显示GbCOL与其他植物中的CO基因,尤其是和裸子植物中的CO基因同源性较高。分子进化分析表明GbCOL与裸子植物CO基因亲缘关系较近。蛋白保守性预测分析表明,GbCOL具有CO基因家族典型的B-box和CCT结构域,根据N末端B-box结构特征可将GbCOL归属于CO基因家族的第I类。

银杏GbCOL基因完整CDS序列的成功克隆,为银杏早花品种选育提供了目标基因,也为进一步研究CO基因家族基因的调控机制和银杏的开花机制提供了理论基础。

猜你喜欢
银杏叶银杏结构域
会跳舞的银杏叶
活化石——银杏
银杏叶(外一首)
鸭绿江(2021年35期)2021-11-11 15:25:02
银杏
银杏叶(外一首)
鸭绿江(2021年35期)2021-04-19 12:23:46
蛋白质结构域划分方法及在线服务综述
论银杏的栽植
现代园艺(2018年2期)2018-03-15 08:00:06
与银杏叶的约会
岁月(2018年2期)2018-02-28 20:51:50
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨