辣椒超氧化物歧化酶基因家族的生物信息学分析

2021-01-14 08:50朱冉冉吉雪花张中荣李慧姬张海英
关键词:基序内含子结构域

朱冉冉,吉雪花,张中荣,李慧姬,张海英

(石河子大学农学院园艺系/特色果蔬栽培生理与种质资源利用兵团重点实验室,新疆 石河子,832003)

超氧化物歧化酶(SOD)广泛存在于真核细胞与原核细胞的细胞质、线粒体和叶绿体中[1]是活性氧清除系统中第一个发挥作用的抗氧化酶。胡景江等[2]对元宝枫进行模拟胁迫发现,干旱条件下SOD活性先下降后逐渐回升至正常水平;在NaCI和Na2SO4胁迫下阿月浑子叶片中的SOD活性显著升高[3]。

随着生物信息学的发展,对SOD家族的探索也逐渐深入。有关SOD的研究主要集中在拟南芥[4]、烟草[5]和水稻[6]上,而有关辣椒SOD基因功能的研究较少。本文研究利用生物信息学对辣椒 SOD基因家族成员进行分析,以期深入挖掘该基因家族在辣椒上的生物学功能,为深入阐明辣椒抗逆奠定理论基础。

1 材料与方法

1.1 辣椒SOD基因的获取及序列分析

从Pfam数据库(http://pfam.xfam.org/)下载辣椒SOD隐马尔科夫模型SOD-1(PF00080)、SOD-2(PF02777)和SOD-3(PF00081)作为种子序列,下载辣椒基因组数据库PGP(http://peppergenome.snu.ac.kr/,品种为 CM334 和Zunla-1中注释的蛋白序列。利用HMMER3.0搜索SOD蛋白数据库[7],设置E<1×10-5。搜索结果利用NCBI-CDD(http://www.ncbi.nlm.nih.g/Stuctu/ cdd/wrpsb.cgi)工具进行蛋白结构域鉴定,删除不含SOD结构域的基因,利用 ProtParam tool(http://web.expasy.org/protparam/)对辣椒SOD基因序列的分子量、氨基酸数量、等电点、稳定性系数、亲疏水性进行分析。

1.2 辣椒SOD基因序列结构分析

对鉴定出的辣椒SOD基因家族成员利用GSDS软件分析其基因结构,利用MEME(http://meme- suite.org/)在线软件分析SOD蛋白的保守域和结构元件(motif 数量设置为 10)。

1.3 辣椒SOD基因进化树分析

利用ClustalW 软件对辣椒和拟南芥的蛋白序列进行比对,使用MEGA5.0 软件用相邻连接法绘制进化树,重复次数设置为1 000,构建辣椒和拟南芥的系统进化树。

1.4 辣椒SOD基因家族在不同组织中的表达量

利用已经完整测序的CM334组织和发育阶段的数据,结合TBtools分析SOD基因在辣椒各发育时期和组织的表达情况。

1.5 辣椒SOD基因家族蛋白二、三级结构和信号肽分析

利用SOMPA、SWISS-MODEL对辣椒SOD蛋白序列进行二级结构、三级结构分析。

2 结果与分析

2.1 辣椒SOD主结构域鉴定

借助NCBI-CDD工具进行蛋白结构域鉴定,去除不含有SOD基因家族主结构域的成员,其他成员分属于5个基因超家族,如图1所示。

图1 辣椒SOD基因家族主结构域

2.2 辣椒SOD蛋白理化性质分析

蛋白质是生命活动的主要承担者,对植物表型的建成起着重要作用。利用ProtParam tool在线软件分析辣椒SOD蛋白理化性质,结果(表1)表明:氨基酸数目在55~326之间;分子量介于5 753.35~34 557.55;分子量与氨基酸数目成正比;理论等电点在4.80~9.84之间,多数为酸性蛋白。总平均疏水性结果显示,除CA01g03860、CA06g07250、Capana06g002288为疏水性蛋白外,其余均为亲水性蛋白。不稳定系数结果显示所有辣椒SOD家族成员均为稳定蛋白。

表1 辣椒SOD 基因家族蛋白理化性质

续表

2.3 辣椒SOD基因结构与蛋白基序分析

从辣椒PGP(http://peppergenome.snu.ac.kr/)数据库中下载SOD基因注释文件,利用GSDS软件绘制结构分布图,结果(图2)显示:辣椒SOD各基因所含内含子数目、长度均不相同。内含子数目在1~9之间,其中CA00g10900内含子数目最少仅1个,Capana06g001955内含子数目最多有9个。

利用MEME 在线软件对辣椒SOD基因蛋白序列进行保守基序分析,结果(图3)显示:位于同一亚族的SOD 基因都含有相似的保守基序,如CA01g03860、CA01g25550、CA05g14670、Capana10g000115、CA10g01740、Capana11g000173都含有motif3 基序,CA06g09510、Capana12g001441、Capana06g001955、CA06g07250、CA00g10900、Capana06g002288、Capana01g003728、CA12g06850、CA05g15860都含有motif2 基序。

图2 辣椒SOD家族基因结构

图3 辣椒SOD家族蛋白保守基序

2.4 辣椒SOD蛋白系统进化分析

借助MEGA 5.0 软件构建系统发育进化树,进化分析结果(图4)显示:辣椒SOD 基因家族可分为2个亚家族,其中GroupⅠ(图4 紫色部分)包括CA01g03860、CA01g25550、Capana10g00011、Capana11g000173、CA10g01740、CA05g14670,GroupⅡ(图4 绿色部分)包括Capana12g001441、CA06g09510、Capana06g001955、CA06g07250、Capana06g002288、Capana01g003728、CA05g15860、CA00g10900、CA12g06850。辣椒和拟南芥的系统进化树显示,辣椒SOD 基因家族成员在拟南芥中均有分枝。

2.5 辣椒SOD基因表达模式分析

根据辣椒各组织基因表达谱RNA-seq 的数据进行SOD 基因组织特异性表达分析[8]。本文研究利用已经完整测序的CM334 组织和发育阶段的数据分析SOD 基因在辣椒各发育时期和组织的表达情况,结果见图5。

图5中原始数据来自 CM334 各组织的 RNA-seq 数据,分析的组织有花后6、16、25 d 的根、茎、叶、果皮(PC)和胎座(PL),以及绿熟期(MG)、破色期(B)、破色期后 5 d(B5)和破色期后 10 d(B10)的 PC 和 PL;使用TBtools 绘制 8个辣椒 SOD 基因的热图,颜色从绿到红代表表达量由低到高,其他数据使用 log 2 校正。

由图5可知:CA01g03860、CA10g01740 基因在花后不同组织中和各发育时期的表达均高于其他基因。CA05g14670、CA12g06850 在花后根、茎、叶、绿熟期、花后胎的胎座表达相对较高,在其他组织表达量相对较低;CA06g09510、CA06g07250 在花后茎中的表达量高于根、叶等其他组织,花后CA01g25550 在各组织的表达均较低。

图5 辣椒SOD基因家族组织表达分析

2.6 辣椒SOD蛋白二级结构分析

借助SOMPA分析辣椒SOD基因家族的二级结构,结果(表2)表明:大多数SOD基因家族成员的结构比例由高到低依次是无规则卷曲、α-螺旋、延伸链、β-转角;无规则卷曲比例在26.32%~63.64%之间,β-转角绝大多数低于10%;预测无规则卷曲、α-螺旋在SOD蛋白二级结构中占主导。

表2 辣椒SOD蛋白二级结构分析

2.7 辣椒SOD蛋白三级结构预测

利用SWISS-MODEL对辣椒SOD蛋白序列进行三级结构预测发现辣椒SOD蛋白均有α-螺旋、β-折叠、无规则卷曲等空间构象,但结构上仍存在差异,不同的SOD蛋白含有不同数目的螺旋-转角-螺旋(HTH)结构。

图6 辣椒SOD蛋白三级结构分析

3 讨论

(1)SOD是植物体内清除ROS系统的重要组成部分,在保护细胞免受氧化损伤、持细胞膜结构和功能的稳定性、增强植物抗逆性等方面具有重要作用[9]。自玉米中获得第1个SOD 基因以来[10],在其他的植物中也克隆了该家族基因。学者们对高粱、棉花等SOD 基因家族进行了相关的生物信息学分析[11-12]。全基因组分析技术的发展以及辣椒全基因组测序工作的完成为阐明辣椒SOD 基因家族成员的生物学功能提供了重要的数据支持。

(2)SOD 蛋白分为三类,其中SOD1 包含一个桶状结构,由β螺旋形成,并具分子内二硫键,且在每个亚基中含一个双核的Cu/Zn 位点,此位点中含有的铜离子和锌离子能够促进超氧歧化反应[13]。编码SOD2 的基因包含4 个内含子和5 个外显子,能够在线粒体基质中编码同源四聚体蛋白[14]。SOD3 属于胞外超氧化物歧化酶,在胞外分泌并形成糖基化的同源四聚体,能够与细胞表面的硫酸乙酰肝素蛋白聚糖、胶原蛋白发生反应,完成催化作用[15]。已知SOD 的活性中心都有1 个金属离子,在植物体中根据金属的不同可分为Mn-SOD、Cu/Zn-SOD 和Fe-SOD 三种类型,在香蕉[16]、莴苣[17]、龙眼[18]等植物中已克隆到Fe-SOD 基因。研究表明Fe-SOD 基因广泛参与了植物对逆境胁迫的抵抗[19],如普通小麦幼苗对盐、ABA、低温和高温胁迫中Fe-SOD 基因起了重要调节作用[20]。烟草的Cu/Zn-SOD 基因可以响应盐碱胁迫[20]。Fe-SOD1 基因可以增强番茄对致病疫霉的抗性[21]。通过生物信息学分析发现,这三种类型的SOD 在辣椒中均有存在,说明辣椒的抗逆性强弱与SOD 活性密切相关。

(3)本研究利用生物信息学手段对辣椒SOD基因家族的结构与功能进行预测分析,为后期进一步研究该基因家族的生物学功能提供理论基础。

4 结论

(1)辣椒SOD蛋白的分子量与氨基酸数目成正比,多为酸性稳定亲水性蛋白;辣椒SOD各基因所含内含子数目介于1~9之间。

(2)辣椒SOD基因可粗分为2个亚家族,Group I 是出现最早的亚家族;位于同一亚族的SOD基因具有相似的保守基序。

(3)辣椒与拟南芥的SOD基因具有很强的结构相似性。

(4)CA01g03860、CA10g01740 在花后不同组织中和各发育时期的表达均高于其他基因。

(5)无规则卷曲、α-螺旋在辣椒SOD蛋白二级、三级结构中占主导地位。

猜你喜欢
基序内含子结构域
龙眼全基因组和转录本序列SSR位点的鉴定
细菌四类胞外感觉结构域的概述
带TRS基序突变的新型冠状病毒威胁更大
UBR5突变与淋巴瘤B细胞成熟
基因内含子遗传变异与鸭蛋壳品质关联性分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
苹果ANR基因沉默的原因分析
环状RNA及其生物学功能概述
结核分枝杆菌蛋白Rv0089的生物信息学分析
水稻DnaJ蛋白的生物信息学分析