铁皮石斛纤维素合成酶超级基因家族生物信息学分析

2019-08-23 08:09兰晓天田英男和凤美
河南农业科学 2019年8期
关键词:进化树外显子铁皮

兰晓天,胡 淞,冯 磊,田英男,和凤美

(云南农业大学 园林园艺学院,云南 昆明 650601)

铁皮石斛(Dendrobiumcandidum),属兰科石斛属多年生附生草本植物,是石斛属药用植物中珍稀名贵的品种[1]。铁皮石斛多糖含量和纤维素含量的高低是判断其品质优良与否的关键,其中,纤维素含量越少品质越高[2]。研究铁皮石斛纤维素的合成过程,挖掘纤维素合成过程中的重要基因,进而通过植物基因工程方式减少纤维素含量,可为培养优良铁皮石斛品种提供重要理论支持。

纤维素是植物细胞壁的主要成分,植物纤维素的合成是多个基因共同作用的结果,主要包含纤维素合成酶基因(CESA)和类纤维素合成酶基因(CSL)2个基因家族成员[3-5]。纤维素合成酶的主要功能是负责在质膜上催化纤维素的生物合成;高尔基体体腔中的半纤维素合成则主要由类纤维素合成酶来完成。随着基因组学的发展,已有1 400多个[6]不同物种的CESA基因序列被克隆并报道出来。铁皮石斛中已有89个CESA基因被鉴定出来,此外,还发现DoCSLA6基因不仅直接参与铁皮石斛多糖合成的代谢途径,还与铁皮石斛的抗逆性有关[7]。近年来,人们对水稻、拟南芥、棉花、毛果杨和烟草等[8-11]植物的CESA基因家族进行了生物信息学分析和比较。虽然CESA一直是植物纤维素合成研究的一个热点,但相关研究主要集中在模式植物中,关于铁皮石斛CESA/CSL基因家族的研究尚未见报道。本研究利用铁皮石斛的转录组数据,挖掘在铁皮石斛茎中表达量高的纤维素合成酶家族基因,构建铁皮石斛CESA基因家族和CSL基因家族的系统进化树,并对它们的基因结构、保守结构域、亚细胞定位等进行分析,为铁皮石斛CESA/CSL蛋白的功能研究和铁皮石斛新品种的培育奠定基础。

1 材料和方法

1.1 基于转录组的铁皮石斛纤维素合成酶家族基因表达模式分析

铁皮石斛取于云南农业大学温室大棚内。在花朵初开时,取下整株铁皮石斛包括根、茎、叶和花进行转录组测序。从铁皮石斛转录组数据中获得CESA、CSL基因的表达数据,分析其根、茎、叶和花中表达量的差异。

1.2 拟南芥、水稻、铁皮石斛纤维素合成酶家族基因的获得

分别下载拟南芥(http://www.Arabidopsis.org/) 和水稻(http://rice.plantbiology.msu.edu/index.shtml)基因组中所有的CESA、CSL基因序列以及对应的蛋白质序列数据。从铁皮石斛转录组NR注释中获取铁皮石斛的纤维素合成酶家族基因,并选择在铁皮石斛茎中表达量高(FPKM>1)的基因序列。将获得的铁皮石斛CESA/CSL基因在Clustal W中进行比对,去除同源性高的基因。

1.3 纤维素合成酶家族基因多序列比对和系统进化树构建

将获得的铁皮石斛、拟南芥和水稻的CESA基因和CSL基因用软件ClustalX 进行氨基酸序列比对,去除同源性较高和距离远的基因,再用MEGA 5.0软件构建进化树。

1.4 纤维素合成酶家族基因结构分析

选取在铁皮石斛茎中表达量较高的CESA和CSL基因,通过在线分析工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/)对基因序列和CDS序列进行基因结构分析[12]。

1.5 纤维素合成酶的保守结构域、跨膜结构和亚细胞定位预测

利用在线分析系统SMART analysis service(http://smart.Emblheidelberg.de/)[13]对铁皮石斛CESA、CSL蛋白保守结构域进行分析;通过在线 TMHMM Server V.2.0分析系统(http://www.cbs.dtu.dk /services/TMHMM)[14]预测铁皮石斛CESA、CSL蛋白的跨膜结构;通过在线 WoLF PSORT系统(http://wolfpsort.org/)对蛋白质的亚细胞定位进行预测[15]。

2 结果与分析

2.1 纤维素合成酶基因在铁皮石斛根、茎、叶、花中的表达

从铁皮石斛转录组中鉴定出62个CESA/CSL基因,这些基因在根、茎、叶、花中表达量的FPKM值见图1。其中,有19个基因的FPKM值均小于1,说明这些基因在铁皮石斛中表达量较低或不表达。有36个基因在4个组织中均有表达。其中,De10015261、De10044519和De10126237基因只在铁皮石斛的根中表达,De10015633和De10018596仅在茎中表达,De10061728仅在叶片中表达;De10002879在根和茎2个部位进行表达,De10070863、De10045267和De10016931只在地上组织中表达。De10085680、De10044516在茎和花中表达,De10032436在根和花中表达,De10002966在茎中无表达而在根、叶、花中均有表达。

图1 铁皮石斛转录组中CESA、CSL基因的FPKM值Fig.1 FPKM of CESA and CSL genes in the transcription group of Dendrobium candidum

2.2 纤维素合成酶基因系统进化树的构建

在铁皮石斛转录组中选出在茎中表达量(FPKM值)>1的CESA/CSL基因,将获得的这些序列在Clustal W中进行比对,去除同源性高的基因,最终获得32个在茎中高表达量的CESA/CSL基因。采用MEGA 5.0对这些基因与水稻和拟南芥的CESA/CSL基因家族构建系统进化树(图2)。结果表明,铁皮石斛CESA/CSL基因主要聚为6个明显的分支。可将CESA/CSL基因分为CESA、CSL2类,而CSL基因又被细分为5亚族,分别命名为CSLA、CSLG、CSLD、CSLE与CSLH。其中,De10069041、De10040587、De10044972、De10083985、De10040239、De110044623属于CESA家族;De10085679、De10085680、De10085688、De10127097、De10127099属于CSLA家族;De10101415、De10101413、De10070864、De10070863、De10070859、De10070849、De10046345、De10012016聚类于CSLG家族;De10006938、De10013367、De10015166、De10016276聚类于CSLE家族;De10082462聚类于CSLH家族;De10005136、De10033113、De10013676、De10013675、De10032947、De10065574、De10105279、De10058146聚类于CSLD家族。

图2 铁皮石斛、水稻和拟南芥纤维素合成酶基因家族系统进化树Fig.2 Phylogenetic tree of CESA/CSL family genes in Oryza,Arabidopsis and Dendrobium

2.3 铁皮石斛CESA/CSL基因家族的基因结构分析

基因结构分析(图3)表明,铁皮石斛CESA基因家族中具有13、14个外显子的基因各2个,具有20、21个外显子的基因各1个。铁皮石斛CESA基因家族在外显子数目上的差异较大。通过对拟南芥CESA基因序列进行分析发现,基因之间的差异性在于某些区域是否存在内含子,铁皮石斛的6个CESA基因之间差别较大。在铁皮石斛26个CSL基因中,外显子数量为1~13个。在CSLA基因家族中含7个外显子和6个外显子的基因各有2个,5个外显子的基因有1个。在CSLG基因家族中外显子数目为1~7个,差异很大。在CSLE基因家族中,3个基因含有6个外显子,1个基因含有13个外显子。CSLH基因家族中De10082462含有9个外显子。CSLD家族中,除了De10105279有7个外显子,其余7个基因的外显子数为1~4个。

2.4 铁皮石斛CESA、CSL蛋白的保守结构域、跨膜结构和亚细胞定位预测

铁皮石斛CESA、CSL蛋白的保守结构域分析(表1)表明,铁皮石斛的CESA蛋白都含有该家族的保守结构域RING 和Cellulose synthase;CSL蛋白中除CSLA外,其余各组均含有保守结构域Cellulose synthase。根据蛋白质跨膜预测系统TMHMMServer V.2.0分析,铁皮石斛CESA/CSL蛋白大部分都含有跨膜结构,跨膜结构域数量0~12个。蛋白质亚细胞定位预测结果表明,铁皮石斛CESA/CSL蛋白大部分位于质膜上(24个);De10013676、De10070863、De10070864、De10070849和De10127099编码的蛋白质位于叶绿体上;De10005136、De10070859、De10012016编码的蛋白质位于细胞核。

图3 铁皮石斛CESA和CSL基因的结构分析 Fig.3 Structure analysis of CESA and CSL family genes in Dendrobium candidum

表1 铁皮石斛CESA和CSL蛋白特性 Tab.1 CESA and CSL characteristics of Dendrobium candidum

续表1 铁皮石斛CESA和CSL蛋白特性 Tab.1(Continued) CESA and CSL characteristics of Dendrobium candidum

3 结论与讨论

近年来,人们对于CESA/CSL基因家族的研究主要集中于CESA基因且集中于水稻、拟南芥、棉花、毛竹和烟草等经典植物上,而对于铁皮石斛CESA/CSL基因家族的研究鲜见报道。通过生物信息学分析可以预测纤维素合成酶基因的作用原理,推测基因家族的进化机制,减少试验的工作量和盲目性。通过构建系统发育树,利用进化树中已知功能的基因可以预测同一分支基因的功能。已知拟南芥中的纤维素合成酶基因ATCESA6、ATCESA1[16]参与初生细胞壁的纤维素合成,ATCESA4、ATCESA7、ATCESA8与次生细胞壁合成相关[17]。水稻中[18]纤维素合成酶基因OsCesA4、OsCesA7、OsCesA9与细胞次生壁纤维素合成有关。根据本研究结果可以推测,De10040587、De10044972、De10083985、De10040239基因与初生细胞壁的纤维素合成有关,De110044623、De10069041基因与次生细胞壁合成相关。CSL基因家族与CESA基因家族具有很高的相似性,但功能各不相同。其中,CSLA基因家族成员参与甘露聚糖和葡甘露聚糖的合成[19];CSLG基因家族[20]主要参与细胞壁内多糖合成;CSLD基因家族[21]影响细胞的延伸和扩张,细胞的扩增和分裂也与之有关系;葡聚糖的合成则与CSLH基因家族有关[22]。由此可以推测,De10085679、De10085680、De10085688、De10127097和De10127099可能与甘露聚糖和葡甘露聚糖的合成相关;De10101415、De10101413、De10070864、De10070863、De10070859、De10070849、De10046345、De10012016与细胞壁内多糖合成有关;De10005136、De10033113、De10013676、De10013675、De10032947、De10065574、De10105279、De10058146可能影响植株的高矮和分蘖;De10082462与细胞壁的延伸有关。

植物体内存在多种纤维素合成酶,不同的纤维素合成酶基因在植物不同部位表达,一种纤维素合成酶基因可能参与多个组织或多种细胞壁结构中纤维素的合成,也有可能只参与某一特定部位的合成,具有组织表达的特异性[23-24]。杨树[25]PtrCesA2和PtrCesA1基因都是在木质部次生壁形成期表达。阮维程等[26]对马尾松纤维素合成酶基因PmCesA1进行定量PCR分析,得出PmCesA1基因在马尾松的嫩枝、叶、根中均有表达,但表达量却各不相同,其在嫩枝中的相对表达量最高(2.53),在叶中的相对表达量最低(1.25),在根中的相对表达量居中(1.82)。本研究发现,从铁皮石斛转录组中鉴定出的62个纤维素合成酶基因在根、茎、叶、花中表达的个数不同,表达量也不相同。

本研究通过对铁皮石斛转录组中高表达量的CESA/CSL基因进行生物信息学分析,共鉴定出32个基因,可分为两大类,6个亚族。该基因家族各成员之间的外显子数目和基因全长具有很大差异,可能是因为不同成员之间的功能差别较大。对保守结构进行分析发现,铁皮石斛CSL家族蛋白质除CSLA外均含有保守结构域Cellulose synthase,而CESA家族蛋白质均含有保守结构域 RING。铁皮石斛CESA/CSL蛋白主要分布于质膜上,大部分具有跨膜结构域,跨膜结构域数量0~12个。

猜你喜欢
进化树外显子铁皮
外显子跳跃模式中组蛋白修饰的组合模式分析
基于心理旋转的小学生物进化树教学实验报告
外显子组测序助力产前诊断胎儿骨骼发育不良
铁皮侠的装备
铁皮园
非小细胞肺癌EGFR- TK非经典突变临床研究进展*
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
人类组成型和可变外显子的密码子偏性及聚类分析
我的爸爸(下)