苦荞GIS基因家族生物信息学分析

2019-10-08 09:01时小东向达兵
西南农业学报 2019年8期
关键词:苦荞拟南芥表皮

时小东,吴 琪,向达兵,万 燕,赵 钢*

(1.成都大学农业部杂粮加工重点实验室, 四川 成都 610106; 2. 成都大学药学与生物工程学院, 四川 成都 610106)

【研究意义】苦荞(Fagopyrumtataricum)为蓼科荞麦属一年生植物,营养丰富,富含黄酮类化合物等营养物质,是一种药食同源的杂粮作物[1-2]。此外,苦荞品种多样,抗逆性强,能够适应干旱、低温、紫外辐射、铝胁迫等恶劣环境[3-5],在我国主要分布在四川、云南、贵州等干旱高海拔地区生长。表皮毛作为植物表面凸起,能够增加植物表皮组织的厚度,形成一道天然屏障,保护植物抵御机械损伤、恶劣天气、紫外辐射、病虫害等胁迫[6-7]。具有腺体的表皮毛能够分泌多种次生代谢产物,如生物碱、类黄酮、萜类等,这些物质不仅能够产生经济效益,还能够起到驱逐昆虫的生物防御和抵抗非生物胁迫的作用[8]。因此,对苦荞表皮毛的形成及调控机理研究具有重要的理论意义和潜在的应用价值。【前人研究进展】表皮毛是一种覆盖于植物表面的特化细胞,是表皮细胞向外延伸形成的表皮附属结构[9]。植物表皮毛形态多样,可分为多种类型,如单细胞和多细胞、腺毛和非腺毛,以及分枝和不分枝,如拟南芥的表皮毛为典型的单细胞、分枝和非腺毛结构[10]。植物表皮毛对细胞分化机制研究、胁迫防御和经济效益具有重要意义。由于植物缺失表皮毛仍能正常生长,试验操作简单,表皮毛已经成为重要的细胞发育和分化机制研究的重要模型[6,11]。植物表皮毛发育相关基因的研究较多,尤其是在植物模式植物拟南芥。在拟南芥中GL1-GL3/EGL3-TTG1形成核心调控复合体,调控拟南芥单细胞表皮毛的发育[12]。同时,拟南芥表皮毛的形成、分枝和延伸等过程受到多种植物激素和转录因子的协同调控[13]。在拟南芥中已经挖掘得到多个转录因子对拟南芥单细胞表皮毛形成起着正调控的作用,如C2H2型锌指蛋白基因GIS家族(如GIS、GIS3、ZFP6、ZFP8等)[14-15]。同时,研究表明拟南芥表皮毛发育相关的GIS基因能够引起烟草多细胞表皮毛的增加,并促进腺毛代谢产物的生成[16]。Shi等研究也表明锌指蛋白基因JcZFP8(GIS家族基因)能够促进烟草多细胞表皮毛的形成[17]。在多细胞表皮毛植物番茄中,C2H2锌指蛋白基因能够调控番茄和烟草表皮毛的形成[18]。上述结果表明,GIS家族基因在不同类型表皮毛形成中均发挥这重要的作用,可能是所有植物表皮毛发育的关键保守基因。但已有的GIS家族基因调控表皮毛发育机制研究仅集中在拟南芥、番茄和烟草等少数植物,在其他植物中研究调控机制还不清楚。慕勤国对苦荞营养器官进行解剖学研究表明,苦荞叶柄有明显表皮毛,且叶片上下表皮细胞均有腺毛的表皮毛[19]。游亚丽等对金荞麦和荞麦形态结构研究也表明其茎叶等部位均具有表皮毛,对其干旱适应性起到促进作用[20]。【本研究切入点】苦荞表皮毛发育的调控机理研究还不深入。因而,开展苦荞表皮毛发育机制研究对于深入分析其抗逆性和高含量活性成分等具有重要意义。【拟解决的关键问题】本研究根据苦荞基因组数据,对GIS家族基因进行挖掘,并采用生物信息学方法对其理化性质、染色体定位、保守结构域,以及逆境下表达情况等进行分析,为苦荞基因组数据的深入挖掘及皮毛发育机理研究奠定了基础。

1 材料与方法

1.1 数据材料来源

通过NCBI(https://www.ncbi.nlm.nih.gov/)下载苦荞基因组数据和结构文件;拟南芥GIS家族基因序列下载于TAIR(https://www.arabidopsis.org/)。

1.2 苦荞基因组中GIS家族基因序列获得及分析

以提取的拟南芥GIS家族基因的蛋白序列作为查询序列信息,利用BLAST软件对苦荞全基因组数据进行同源搜索,筛选参数为E-value

1.3 FtZFP序列的基本性质分析

使用ExPaSy(https://web.expasy.org/protparam/)对筛选序列进行氨基酸数目、分子量、理论等电点等信息进行预测;使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/)对α螺旋、延伸链和β转角等二级结构进行预测。利用ProtComp(http://linux1.softberry.com/berry.phtml?group=programs & subgroup=proloc & topic=protcompan)和SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)进行亚细胞定位和信号肽分析。参数设置为默认值。利用SWISS-MODEL进行蛋白三维结构分析,选择最适三维结构模板。

1.4 FtZFP序列保守结构域和进化分析

使用ClustalX 2.1和MEGA 7.0进行系统进化树构建,采用邻接法(Neighbor-Joining,NJ),bootstrap值为1000。利用DNAMAN 5.0 对FtZFP蛋白序列进行多序列比对,用MEME(http://meme-suite.org/tools/meme)进行保守基序分析。

1.5 逆境胁迫下FtZFP的表达分析

根据Wu等报道的苦荞盐胁迫的转录组数据[21]和Zhuang等报道的铝胁迫的转录组数据[22],利用FPKM值,对挖掘得到的FtZFP基因的表达模式进行分析。

2 结果与分析

2.1 苦荞基因组中GIS家族基因信息

利用已报道的拟南芥中GIS家族基因的蛋白序列,BLAST对比结果显示,从苦荞基因组中对比得到了10个同源序列,分布于6条染色体上(图1)。FtZFP分布涉及染色体1、3、4、5、6和7,染色体2和8上没有分布。其中,定位于6号染色体上序列最多,为3条,且基因在染色体上的位置相对集中;其次是染色体7号,存在2条基因分布;其余染色体上分布数目各为1条,涉及染色体1、3、4和5。

图1 苦荞FtZFP基因染色体定位Fig.1 Chromosome mapping of F. tataricum FtZFP proteins

对10个FtZFP基因结构分析结果显示,发现10条基因序列中8条仅含有1个外显子,占总个数的80 %;FtZFP10含有外显子数目最多,为5个;FtZFP8含有外显子数目为2个(表1)。结果表明,苦荞GIS家族基因结构具有高度相似性。

2.2 FtZFP蛋白一级结构分析

利用生物信息学软件对得到的FtZFP序列的理化特性进行分析。由表1可知,10个FtZFP基因编码氨基酸数目介于115~270,FtZFP3编码氨基酸数目最少,FtZFP10编码氨基酸数目最多;其中氨基酸数目大于200和小于200的蛋白数量各为5个,FtZFP氨基酸跨度相对较小。蛋白质分子量介于12 750.14~28 977.52 kDa,蛋白质分子量与氨基酸数目相一致。理论等电点分析表明,其中FtZFP3编码蛋白的等电点最小,为5.77,表现为酸性;FtZFP5编码蛋白的等电点最大,为9.22,表现为碱性。在碱性和碱性范围内蛋白各为5个,说明苦荞FtZFP编码蛋白含有基本一致的碱性氨基酸和酸性氨基酸。

对FtZFP蛋白不稳定指数分析表明,10个蛋白的不稳定指数介于42.05~70.14,均大于40.0。从不稳定指数结果可知,苦荞基因组中挖掘得到的FtZFP均表现为不稳定蛋白。对脂肪指数和疏水性进行分析,FtZFP蛋白脂肪指数介于35.07~71.91,均小于100。氨基酸的疏水性数值介于(-1.063)~(-0.456),均为负值,说明得到的苦荞FtZFP均表现为疏水性。

2.3 FtZFP蛋白二级结构和亚细胞定位预测分析

蛋白质二级结构是衡量蛋白质稳定性的重要因素,α螺旋和β转角结构具有高度稳定性,为蛋白质的有序结构;而无规则卷曲为蛋白质的无序结构。对10个苦荞FtZFP编码蛋白的二级结构进行预测分析结果表明,FtZFP蛋白二级结构主要以无规则卷曲为主,其次是α螺旋,β转角二级结构最少(表2)。蛋白二级结构分析表明,苦荞中GIS家族基因的蛋白二级结构整体表现为不稳定性,这一结果与蛋白不稳定指数预测结果相一致。

对蛋白序列进行信号肽分析,10个FtZFP蛋白未发现信号肽序列。对10个FtZFP蛋白进行亚细胞定位分析,10个基因编码蛋白均定位于细胞核,符合作为转录因子的亚细胞定位特征,这为其发挥生物学功能奠定基础。

2.4 FtZFP保守结构域分析

利用MEME在线软件对蛋白序列进行保守基序绘制,得到1个高度保守的结构域,该结构域含有40个氨基酸序列,存在C2H2结构域(图2)。同时,该保守序列结构在10个FtZFP均有分布,有且仅有1个,表明苦荞10个FtZFP均为单一C2H2锌指结构。通过多序列对比发现,10个FtZFP蛋白都含有C-X2-C-X12-H-X3-H,即C2H2结构区域,这与MeMe分析结果相一致。8个FtZFP蛋白结构域中均含有QALGGH,该结构为植物所特有,此类锌指蛋白称为Q型。FtZFP1中第4为G变为D,FtZFP4中第3位L变为Y。前人研究表明,QALGGH结构与锌指蛋白结合DNA能力相关,任何一个氨基酸的突变都会导致DNA能力的降低或失去,表明FtZFP1和FtZFP4可能在进化过程中发生突变而失去相应功能。

表1 苦荞FtZFP外显子数目和蛋白一级结构

表2 苦荞FtZFP蛋白二级结构和亚细胞定位预测

FtZFP蛋白结构域中具有保守性的C2H2,中心位置Zn2+能够与2个His和Cys结合形成紧密的空间结构维持整个蛋白的稳定性(图2)。同时,FtZFP还含有QALGGH和其他保守氨基酸残基,能够更好地维持FtZFP的结构,从而与DNA分子进行结合而发挥功能。

2.5 FtZFP系统进化树分析

为揭示苦荞GIS家族基因成员之间的进化关系,基于氨基酸序列对10个FtZFP进行系统进化树构建(图3)。根据进化树分枝情况,可以将苦荞FtZFP蛋白成员分为2类家族,除FtZFP10单独为1类,其他9个FtZFP聚类为1类家族。FtZFP10基因含有5个外显子序列,其他9个FtZFP含有1-2个外显子序列。第1类家族进一步分为3个亚家族,第I亚家族含有5个成员,数量最多;第II和III亚家族含有成员数量相同,均为2个成员。利用MEME对苦荞FtZFP锌指蛋白进行结构域分析和绘制图谱,结果显示所有基因家族成员都含有1个C2H2锌指结构,多位于肽链的N端,在数量和分布上均具有一致性。

图2 苦荞FtZFP氨基酸序列对比和保守序列结构Fig.2 Amino acid alignments and conserved motif structure of F.tataricum FtZFP proteins

图3 苦荞FtZFP系统进化树和C2H2结构分布Fig.3 The phylogenetic analysis and C2H2 motif distribution of F.tataricum FtZFP proteins

2.6 FtZFP胁迫下表达分析

基于已报道苦荞盐胁迫和铝胁迫的RNA-seq测序数据,筛选涉及FtZFP的FPKM值。结果表明,在苦荞盐胁迫中,FtZFP8表现为上调表达,而FtZFP3表现为下调表达;在苦荞铝胁迫下,FtZFP7表现为上调表达,推测与其生物学作用具有一定的关联。

3 讨 论

随着高通量测序技术的发展,特别是三代测序技术的诞生,为植物全基因组数据的获得提供了基础。植物基因组测序工作的完成,为基因家族的挖掘和关键基因的深入分析提供了基础。杨明磊等运用BLASTp对普通烟草(Nicotianatabacum)基因组数据中C2H2锌指蛋白转录因子家族序列进行鉴定,最终获得了118条序列[23]。Muthamilarasan等在谷子(Setariaitalica)基因组中鉴定得到124个C2H2锌指蛋白基因,并对其非生物胁迫响应进行分析[24],表明基于基因组进行C2H2锌指蛋白基因家族深入挖掘的可行性。2017年,Zhang等运用二代、三代测序平台,并结合光学图谱和Hi-C技术,完成了苦荞基因组测序工作,获得了489.3 Mb的高质量染色体水平的参考基因组,预测得到了33 366个基因[22]。苦荞基因组测序工作的完成,为其功能基因的挖掘和途径分析提供了基础,有助于推动苦荞成为抗逆研究的模式植物。本研究基于报道的苦荞基因组数据,运用生物信息学手段,对苦荞关键基因家族进行挖掘。

表皮毛与植物生物胁迫和非生物胁迫等密切相关,GIS家族基因在表皮毛发育调控中起着重要的作用。从苦荞基因组数据中,挖掘得到了10条GIS家族基因序列。对10条FtZFP染色体定位分析发现,其分散定位于6条不同染色体上,这与其他C2H2基因家族成员染色体定位结果具有一致性[25],说明C2H2基因家族成员分布广泛,并可能存在功能互补性。亚细胞定位预测,10个FtZFP蛋白均定位于细胞核,这与其他表皮毛相关的C2H2锌指蛋白研究结果相同[26],符合其作为转录因子发挥调控功能的亚细胞定位特征。

在结构上,10个FtZFP均含有一个保守的C2H2结构域,这与拟南芥和番茄等植物中毛发育相关的C2H2锌指蛋白家族基因相一致[14-18],表明在植物中参与表皮毛发育调控的锌指蛋白基因均为单锌指结构。在C2H2结构域中存在QALGGH基序,为植物锌指蛋白所特有,对C2H2型锌指蛋白转录因子结合到特定的DNA序列具有重要的作用[27],说明FtZFP蛋白家族可能通过与其他因子相互作用从而调控植物表皮毛的发育。

基于报道的苦荞胁迫转录组数据,大部分FtZFP基因在盐胁迫和铝胁迫过程中表现为上调表达,说明FtZFP可能通过增加表皮毛的密度或形态,从而通过表皮毛物理防御或次生产物代谢形成增加苦荞的抗性。目前,对拟南芥调控表皮毛发育相关基因的研究较多,在番茄、烟草、水稻、黄瓜等植物中已经开展了部分研究[28]。苦荞作为高海拔作物,能够抵抗干旱、低温、紫外等恶劣环境,且富含黄酮类等次生代谢物质,其逆境适应性和高生物活性物质是否与苦荞表皮毛有关仍有待进行深入研究。

4 结 论

从苦荞全基因组中共鉴定得到了10条GIS家族基因序列,序列分析和保守结构域等分析结果表明,所有序列均含有保守的单一C2H2结构域。与其他植物一样,多数苦荞FtZFP含有植物C2H2锌指蛋白特有的QALGGH基序。对苦荞基因组中GIS家族基因进行挖掘将对苦荞抗逆性研究和资源开发具有实际意义和应用价值。

猜你喜欢
苦荞拟南芥表皮
科研人员揭示油桃果实表皮不长毛的奥秘
科学家揭示苦荞起源传播驯化路径
苦荞
建筑表皮中超薄基材的应用分析
拟南芥栽培关键技术研究
布拖县苦荞产业发展情况调研报告
人也会“蜕皮”,周期为一个月
水果
拟南芥
口水暴露了身份