芒果MiCOL6基因的克隆及其生物信息学和表达分析

2020-08-06 14:57卢新喜罗聪张秀娟余海霞刘源何新华
热带作物学报 2020年4期
关键词:生物信息学分析基因克隆芒果

卢新喜 罗聪 张秀娟 余海霞 刘源 何新华

摘  要:CONSTANS(CO)是光周期途径的核心调控因子,其可以整合光质和生物钟输出的信号调控植物成花。在前期转录组研究的基础上,设计基因特异性引物,通过RT-PCR扩增得到芒果的1个CO基因的cDNA全长,序列长度为678 bp,根据与拟南芥CO家族基因的相似性,将其命名为MiCOL6。生物信息学分析显示,该基因编码226个氨基酸,分子量为26.88 kDa,等电点为4.85,属于亲水性的非分泌蛋白。保守结构域和进化树分析显示,该基因仅含1个CCT结构域,属于CO基因家族的第4组;二级结构分析表明,该蛋白主要以无规卷曲和α-螺旋为主;亚细胞定位预测显示该蛋白定位在细胞质膜上的概率最大;不同花发育时期表达模式分析表明,MiCOL6基因在杧果的花芽分化期表达量最高。本研究结果为进一步研究芒果MiCOL6基因在芒果中的功能提供理论基础。

关键词:芒果;CONSTANS;MiCOL6;基因克隆;生物信息学分析;表达模式分析

中图分类号:S667.7      文献标识码:A

Abstract: CONSTANS (CO) is a core regulator of the photoperiod pathway, which integrates light quality and clock output signals to regulate the floral transformation in plants. A full-length cDNA of MiCOL6 gene was obtained from transcriptome data analysis and then verified by RT-PCR amplification in mango. Sequences analysis showed that the open reading frame was 678 bp in length, coding 226 amino, the molecular weight and isoelectric point (pI) of MiCOL6 was 26.88 kDa and 4.85, respectively; and MiCOL6 was a non-secreted hydrophilic protein. Conserved domain and phylogenetic tree analysis showed that MiCOL6 contained only one CCT domain and belonged to the group IV of the CO gene family. The secondary structure analysis showed that the protein mainly consisted of random curl and α-helix. The subcellular localization prediction showed that MiCOL6 was likely to be localized in the cytoplasm membrane. Expression pattern analysis showed that the MiCOL6 was the highest expressed in leaves during the bud differentiation period. The results of the experiment would provide a theoretical basis for the further study on the function of MiCOL6 in mango.

Keywords: mango; CONSTANS; MiCOL6; gene cloning; bioinformatics analysis; expression pattern analysis

DOI: 10.3969/j.issn.1000-2561.2020.04.012

CO是光周期途径中调控植物开花的重要调控因子,属于B-box基因家族[1]。在光周期途径中CO通过整合生物钟末端输出的信号调节开花基因FLOWERING LOCUS T (FT) 的表达,进而调控开花时间[2]。Putterill等[3]首先在拟南芥中分离出CO基因。CONSTANS家族蛋白的特征是在N-末端存在1个或2个锌指B-box结构域和C-末端含有CCT(CO,CONSTANS-LIKE和TOC1)结构域[3]。系统发育分析将植物中的COL蛋白分为4大类[4]。第1組COL包含2个B-box结构域,1个CCT结构域和1个额外的VP基序(参与和COP1相互作用的缬氨酸-脯氨酸基序。第2组COL仅包含1个B-box结构域和1个CCT结构域。第3组COL有1个完整的B-box结构域,1个结构发生变异的B-box结构域和1个CCT域[4-6]。第4组COL不含B-box结构域仅有1个CCT结构域[4]。研究表明,单子叶和双子叶植物中的COL基因家族有许多成员。例如在拟南芥中有17个[4],水稻中有16个[4],大麦中有9个[4],陆地棉中有42个[7],梨中有15个[8],竹子中有15个[9],玉米中有19个[10],葡萄中有12个[11],韭菜中有17个[12],香蕉中有25个[13]。最近研究表明,CO家族基因在不同植物中的功能有所差异。

目前,在拟南芥中对CO基因家族有了深入的研究,但在多年生木本植物中的研究较少。芒果是重要的热带水果,具有重要的经济价值,其开花分子机理研究较少。本研究在该课题组前期研究的基础上,以‘四季蜜芒为实验材料,克隆得到MiCOL6基因,并进行生物信息学分析以期对进一步研究芒果MiCOL6基因的生物学功能提供理论基础。

1  材料与方法

1.1  材料

供试芒果材料种植于广西大学农学院果树标本园,克隆样品为‘四季蜜芒的嫩叶。不同花发育时期表达分析的材料为2016年11月1日、2016年12月1日、2016年12月30日、2017年2月1日、2017年3月11日的‘四季蜜芒的叶片,2016年11月1日—12月1日为‘四季蜜芒的营养生长期,2016年12月1—30日为‘四季蜜芒的成花诱导期,2016年12月30日—2017年2月1日为‘四季蜜芒的花芽分化期,2017年2月1日—3月11日‘四季蜜芒的花序伸长及开花期。样品采集后快速冷冻保存于?80 ℃。

DL2000 Marker购自南宁壹颗松;克隆所用超纯水、dNTP、酶、琼脂糖、氨苄青霉素、酵母粉、胰蛋白胨等药品购自广州擎科;多糖多酚植物RNA提取试剂盒、胶回收试剂盒、实时荧光定量试剂盒SYBR Premix Dimer Eraser购自广西天地杨有限公司;引物合成和测序为广州擎科生物有限公司;其他实验耗材购于大连宝生物公司。

1.2  方法

1.2.1  基因克隆  以提取芒果总RNA反转录得到的cDNA为模板。从芒果转录组测序中获取MiCOL6基因序列并了特异性引物MiCOL6u和MiCOLd(表1)进行扩增。25 ?L PCR系统。扩增程序为:95 ℃ 5 min;35个循环95 ℃ 40 s,55 ℃ 40 s,72 ℃ 1 min;最后在72 ℃延长10 min,用1.5%琼脂糖凝胶电泳检测PCR产物,根据检测结果用胶回收试剂盒,按照说明回收目标片段,然后将回收到的目标基因片段连接到pMD18-T载体上,转化大肠杆菌DH5α。涂板、挑选和培养单菌落。经筛选的阳性克隆被送往上海生工生物技术有限公司进行测序。

1.2.2  生物信息学分析  利用MEGA6软件,采用NJ方法构建了COL系统发育树;使用DN?A?MAN6.0 软件将MiCOL6的氨基酸序列其它物种的氨基酸序列进行比对;采用在线分析工具ExPASy-ProtParam(https://web.expasy.org/pro- ?tpar?am/)分析芒果MiCOL6氨基酸序列的理化性质;利用Conserved Domains(https://www.ncbi. nlm.nih.gov/Structure/cdd/wrpsb.cgi)工具预测Mi-C?OL6蛋白的保守结构域;使用SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)在线软件对MiCOL6进行信号肽预测;利用TM?H?MM Severv. 2.0(http://www.cbs.dtu.dk/ser?vices/ TMHMM-2.0/)在线软件分析MiCOL6蛋白跨膜结构域;使用NetPhos 3.1 Serve(http://www. cbs. dtu.dk/services/NetPhos/)在线工具对MiCOL6蛋白序列潜在磷酸化位点预测分析;通过Ex?PASy(http://web.expasy.org/prot-scale/)在线软件对MiCOL6氨基酸亲疏水性进行分析;使用SOPMA(https://npsa-prabi.ibcp.fr/cgibin/np??sa_au??t?o-mat.pl?page=npsa_sopma.htmL)在线软件分析MiCOL6蛋白二级结构;利用PSORT II Prediction在线工具(http://psort.hgc.jp/form2. html)对Mi?COL6蛋白进行亚细胞定位预测。

1.2.3  MiCOL6不同花发育时期的表达分析  根据基因序列设计荧光定量PCR引物qCOL6u和qCOL6d(表1),定量内参基因为芒果的Actin1。Actin的上游和下游引物见表1,实时荧光PCR扩增每个样重复3次,同时设空白对照和阴性对照。荧光定量仪器为ABI7500型PCR仪。扩增反应程序参照试剂盒SYBR Premix Dimer Eraser(TaKaRa)说明书进行。以50 ?g/L的cDNA为模板,反应体系20 ?L:cDNA 2 ?l,上下游引物0.4 ?L,SYBRⅡ 10 ?L,ROXⅡ 0.4 ?L,超纯水6.6 ?L。PCR程序如下:95 ℃ 30 s,Ⅱ95 ℃ 5 s和60 ℃ 34 s 40个循环,95 ℃ 15 s,60 ℃ 1 min,95 ℃ 15 s。qRT-PCR的数据分析采用2ΔΔCT法。

2  结果与分析

2.1  MiCOL6基因克隆

以逆转录产物cDNA为模板,用基因特异性引物通过RT-PCR法克隆‘四季蜜芒MiCOL6基因,電泳检测显示成功获得1条长度约为700 bp的条带(图1)。克隆结果送去测序,获得序列长度为678 bp,序列与转录组获得的序列一致。

2.2  MiCOL6基因生物信息学分析

2.2.1  同源性分析及进化树分析  根据CO基因家族的不同类群,从GenBank下载了拟南芥、毛果杨、可可树部分COL蛋白序列,利用MEGA6软件,采用NJ方法构建了COL系统发育树(图2),系统发育树表明,这些COL基因可分为4组。第1组有2个保守的B-Box 域和一个CCT域,如AtCOL、AtCOL1和AtCOL2。第2组有1个保守的B-Box域和1个CCT域,比如AtCOL6、AtCOL7和AtCOL16。第3组有1个保守的B-Box域、1个结构发生变异的锌指域和1个CCT域,如AtCOL9、AtCOL10、AtCOL11 和AtCOL13。第4组没有B-Box域,只有1个保守的CCT域,如PtCOL16、TaCOL8和MiCOL6。MiCOL6基因与PtCOL16和TaCOL8基因有密切的遗传关系,可聚集到CO基因家族的第4组。

2.2.2  氨基酸的序列比对分析  将芒果中MiC?OL6的氨基酸序列在NCBI上进行Blast分析,结果表明MiCOL6蛋白序列与其他植物的COL蛋白序列各基因编码氨基酸的GenBank登录号如下:拟南芥AtCOL (NM_121589),AtCOL1 (NM_1215?89),At COL2 (NM_111105),AtCOL6 (NM_1060?47),AtCOL7 (NM_103803),AtCOL9 (AB023039),AtCOL10 (NM_117613),AtCOL11 (NM_113084),AtCOL12 (NM_130356),AtCOL16 (NM_102355);毛果杨PtCOL16 (XP_024449388),可可树TaC?O?L8 (XP_007016977)。

具有较高的同源性,MiCOL6蛋白与其他COL蛋白的序列相似性如下:与亚洲棉(XP_017641001),西班牙栓皮栎(XP_023874898),毛果楊(XP_02444-9388)的同源性分别为60.34%、59.91%、58.77%。

使用DNAMAN 6.0软件分别将MiCOL6的氨基酸序列与上述物种的氨基酸序列进行对比,结果表明,MiCOL6氨基酸序列与其他植物的COL蛋白序列都具有保守的CCT结构域(图3)。

各基因编码氨基酸的GenBank登录号如下:毛果杨PtCOL16(XP_ 024449388),栓皮槠QsCOL7(XP_0238?74898),树棉GaCOL16(XP_017641001)。

2.2.3  一级结构及理化性质分析  通过在线Prot-Param程序(https://web.expasy.org/protparam/)对MiCOL6基因进行一级结构分析。结果显示该基因编码的蛋白由226个氨基酸组成(不含色氨酸和半光氨酸残基)。谷氨酰胺含量最高,共计35个,占氨基酸总数的15.5%。负电荷残基(Asp+ Glu)50个,占22.1%,正电荷残基(Arg+Lys)36个,占15.9%,分子量为26.89 kDa,等电点(pI)为4.85,分子式为 C1184H1835N323O377S8,总原子量为3727,不稳定指数为 63.279(不稳定系数<40 时稳定),被归类为不稳定蛋白,GRAVY系数为?1.077,为亲水性蛋白,脂肪族氨基酸指数为61.68。

2.2.4  氨基酸保守结构域分析  利用Conserved Domai(http://blast.ncbi.nlm.nih.gov/Blast.cgi)工具预测MiCOL6蛋白的保守结构域(图4),结果显示MiCOL6基因含有CC保守结构域,利用ScanProsit(http://prosite.expasy.org/)工具对MiCOL6蛋白进行分析,结果显示,MiCOL6氨基酸的第182~224位区域为CCT保守结构域。

2.2.5  氨基酸信号肽和跨膜结构域分析  分别使用SignalP 4.1 Server和TMHMM Severv.2.0在线软件对MiCOL6进行信号肽和跨膜结构域预测,结果(图5、图6)显示MiCOL6蛋白不是信号肽也不存在跨膜结构域。

2.2.6  磷酸化位点及疏水性分析  使用在线工具NetPhos 3.1 Serve (http://www.cbs.dtu.dk/services/ NetPhos/)对MiCOL6基因的蛋白序列潜在磷酸化位点预测分析(图7)。分析结果显示,此蛋白含有丝氨酸、苏氨酸和酪氨酸3种氨基酸的磷酸化位点,共18个,其中丝氨酸(Serine)的磷酸化位点11个,苏氨酸(Threonine)的磷酸化位点4个,酪氨酸(P-hydroxyphenylalanine)的磷酸化位点3个,其中最有可能是潜在磷酸化位点的是第60位丝氨酸,其值已经达到0.992,远远超过标准值0.5。

通过在线氨基酸疏水性分析工具(http://web. exp??asy.org/protscale/)对芒果MiCOL6蛋白氨基酸序列进行分析(图8)。预测结果显示,该蛋白为亲水性蛋白,大部分氨基酸表现为亲水性,其中第43个氨基酸表现出最大疏水性,为0.667,第93个氨基酸表现出最大亲水性,为3.611。

2.2.7  MiCOL6蛋白的二级结构及亚细胞定位预测  使用SOPMA在线软件预测MiCOL6蛋白二级结构。预测结果显示,该蛋白无规卷曲占43%,α-螺旋占52%,TM螺旋占14%。

利用PSORT II Prediction在线工具对MiCO?L6蛋白进行亚细胞定位预测。结果表明,该蛋白在质膜上的概率为69.6%,在细胞核上的概率为26.1%,在细胞骨架上的概率为4.3%。

2.3  MiCOL6不同花发育时期的表达分析

对MiCOL6基因在‘四季蜜芒中不同花发育时期进行表达模式分析,结果见图9。由图9可知:MiCOL6在成花诱导期表达量逐渐上升,在花芽分化初期的相对表达量最高,在花芽分化期的表达量逐步降低与营养生长期的表达量趋于一致,花序伸长及开花期的表达量逐略有升高,但与营养生长期的表达量相差不大,推测该基因在杧果花芽分化过程中起着重要作用。

3  讨论

近10年来,CO基因得到了广泛的研究。据报道,其参与了许多分子和遗传过程,包括控制光周期反应、开花时间和调节昼夜节律[14]、光转导[15]等。一些COL家族成员的功能在拟南芥中得到了验证。对现有拟南芥数据库的检查显示,AtCOL在调节开花时间,光形态发生,生物钟、根发育、生长素信号传导和花青素积累方面发挥作用[6, 16-19]。在其他植物中,COL家族成员具有不同的特征功能。CO或COL基因在土豆中也可以参与块茎的形成[20],梨中PbCOL8通过抑制开花信号因子FT和SOC1的表达进而达到延迟开花[8],竹子中的PvCO1是其开花的负调控因子[9],水稻中CONSTANS-Like 9(OsCOL9)与活化C-激酶1(OsRACK1)的受体相互作用,通过水杨酸和乙烯信号通路调节抗稻瘟病性[21]。但关于芒果中CO家族基因的研究,鲜有报道。

本研究首次克隆得到了芒果的MiCOL6基因,通过生物信息学方法预测分析,MiCOL6基因含有有CO家族成员的CCT保守结构域(图3),系统进化树分析表明,MiCOL6与PtCOL16和TaCOL8聚到一类,仅含有CCT保守结构域,这与Robson等[22]报道的CO家族结构特点不同,与徐趁等[23]报道的芒果MiCO基因的结构也不相同,但与Liu等[12]报道的韭菜的部分CO家族基因相同,与小麦中CO-like基因TaCO9[24]基因结构相同,说明芒果中CO家族基因在进化的过程中发生了进化,属于CO家族的第4类;氨基酸信号肽和跨膜结构域结果表明,MiCOL6蛋白没有信号肽和跨膜域,说明其不属于分泌蛋白;磷酸化位点分析结果显示,该蛋白共存在18个潜在的磷酸化位点,鉴于磷酸化是调控蛋白质活力与功能的重要途径[25],说明MiCOL6蛋白可能通过相应氨基酸位点的磷酸化来实现其功能的调控;亚细胞定位预测结果显示,該蛋白定位在质膜上的概率最大,与Wang等[8]报道梨的PbCOL8蛋白定位于细胞核的结果有所差异。不同花发育时期表达模式结果表明,MiCOL6基因在芒果的花芽分化期表达量最高,说明该基因可能在芒果花芽分化过程中发挥着重要作用。本研究有助于后续开展研究MiCOL6基因在芒果中的功能。

参考文献

[1] Yan J P, Mao D, Liu X M, et al. Isolation and functional characterization of a circadian-regulated CONSTANS homolog (GbCO) from Ginkgo biloba[J]. Plant Cell Reports, 2017, 36(9): 1387-1399.

[2] 陈东亮, 罗  昌, 程  曦, 等. 甘菊ClCOL5a基因的克隆与表达分析[J]. 北方园艺, 2016(18): 103-107.

[3] Putterill J, Robson F, Lee K, et al. The CONSTANS gene of Arabidopsis promotes flowering and encodes a protein showing similarities to zinc finger transcription factors[J]. Cell, 1995, 80(6): 847-857.

[4] Griffiths S, Dunford R P, Coupland G, et al. The evolution of CONSTANS-like gene families in barley, rice, and Arabidopsis[J]. Plant Physiology, 2003, 131(4): 1855-1867.

[5] Serrano G, Herrera-Palau R, Romero J M, et al. Chlamydomonas CONSTANS and the evolution of plant photoperiodic signaling[J]. Current Biology, 2009, 19(5): 359-368.

[6] Cai D, Liu H, Sang N, et al. Identification and characterization of CONSTANS-like (COL) gene family in upland cotton (Gossypium hirsutum L)[J]. Plos one, 2017, 12(6): e0179038.

[7] Gangappa S N, Botto J F. The BBX family of plant transcription factors[J]. Trends In Plant Science, 2014, 19(7): 460-470.

[8] Wang P, Liu Z, Cao P, et al. PbCOL8 is a clock-regulated flowering time repressor in pear, Tree Genet[J]. Tree Genetics & Genomes, 2017, 13(5): 107-121.

[9] Xiao G H, Li B J, Chen H J, et al. Overexpression of PvCO1, a bamboo CONSTANS-LIKE gene, delays flowering by reducing expression of the FT gene in transgenic Arabidopsis[J]. BMC Plant Biology, 2018, 18(1): 232-248.

[10] Song N N, Xu Z L, Wang J, et al. Genome-wide analysis of maize, CONSTANS-LIKE, gene family and expression profiling under light/dark and abscisic acid treatment[J]. Gene, 2018, 673: 1-11.

[11] Wang L, Xue J Y, Dai W N, et al. Genome wide identification, phylogenetic analysis, and expression profiling of CONSTANS-like (COL) genes in Vitis vinifera[J]. Journal of Plant Growth Regulation, 2019, 38(2): 631-643.

[12] Liu C, Tang Q, Cheng C, et al. Identification of putative CONSTANS-like genes from the denovo assembled transcriptome of leek[J]. Biologia Plantarum, 2018, 62 (2): 269-276.

[13] Chaurasia A K, Patil H B, Azeez A, et al. Molecular characterization of CONSTANS-Like (COL) genes in banana (Musa acuminata L. AAA Group, cv. Grand Nain)[J]. Physiology And Moleculay Biology of Plants, 2016, 22(1): 1-15.

[14] Peng D, Jiang Y, Liu X, et al. Molecular characterization of a CONSTANS gene from Sapium sebiferum (L) Rxob[J]. Gene, 2018, 654: 69-76.

[15] 王宏归, 黄  晨, 陈  鹏, 等. CONSTANS-LIKE 7基因对拟南芥开花的调控分析[J]. 湖南大学学报(自然科学版), 2015, 42(12): 88-94.

[16] 王宏归, 黄  晨, 姜  雅, 等. CONSTANS LIKE7参与调控拟南芥的向地性以及侧根、子叶的发育[J]. 江苏农业科学, 2015, 43(12): 48-50.

[17] Cheng X F. Overexpression of COL9, a CONSTANS-LIKE gene, delays flowering by reducing expression of CO and FT in Arabidopsis thaliana[J]. Plant Journal, 2010, 43(5): 758-768.

[18] Ledger S, Strayer C, Ashton F, et al. Analysis of the function of two circadian-regulated CONSTANS-LIKE genes[J]. Plant Journal, 2001, 26(1): 15-22.

[19] Zhang Z L, Jia R H, Lia H Y, et al. CONSTANS-LIKE 7 (COL7) is involved in phytochromeB (phyB)-mediated light-quality regulation of auxin homeostasis[J]. Molecular Plant, 2014, 7(9): 1429-1440.

[20] Abelenda J A, Cruz-Oró E, Franco-Zorrilla J M, et al. Potato StCONSTANS-like1 suppresses storage organ formation by directly activating the FT-like StSP5G repressor[J]. Current Biology 2016, 26: 872-881.

[21] Liu H, Dong S, Sun D, et al. CONSTANS-Like 9 (OsCOL9) interacts with receptor for Activated C-Kinase 1(OsRACK1) to regulate blast resistance through salicylic acid and ethylene signaling pathways[J]. PloS One, 2016, 11(11): e0166249.

[22] Robson F, Costa M M, Hepworth S R, et al. Functional importance of conserved domains in the flowering time gene CONSTANS demonstrated by analysis of mutant alleles and transgenic plants[J]. Plant Journal, 2001, 28: 619-631.

[23] 徐  趁, 羅  聪, 余海霞, 等. 杧果MiCO基因的克隆与表达模式分析[J]. 果树学报, 2017, 34(4): 418-426.

[24] 冉从福, 邵  慧, 余  静, 等. 小麦CO-like基因 TaCO9的克隆及分析[J]. 麦类作物学报, 2014, 34(10): 1319-1326.

[25] 李旭娟, 刘洪博, 林秀琴, 等. 甘蔗 KNOX 基因(Sckn1)的电子克隆及生物信息学分析[J]. 基因组学与应用生物学, 2015, 34(1): 136-142.

猜你喜欢
生物信息学分析基因克隆芒果
我才不要穿
小洞会“咬”人
小洞会“咬”人
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
三个小麦防御素基因的克隆及序列分析
羊种布氏杆菌3型Omp25基因序列及其表达蛋白生物信息学分析
西藏牦牛NGB基因克隆及生物信息学分析
地黄纤维素合酶基因的克隆与生物信息学分析