摘要:研究基于镉胁迫下棉花幼苗根系的转录组测序数据,鉴定获得16个棉花SOD基因,并对其进行生物信息学分析。结果表明:16个棉花SOD基因编码的蛋白长度为127~333 aa,相对分子质量为13 048.69~35 974.31 Da,等电点为4.43~8.50,均为非分泌蛋白,且都无跨膜结构特征,表现为亲水性;其中75%属于酸性蛋白,69%属于稳定蛋白;大部分亚细胞定位在叶绿体;16个棉花SOD可分为Fe-SOD、Mn-SOD和Cu/Zn-SOD 3个亚家族,3个亚家族均含有各自的保守基序,其中Fe-SOD和Mn-SOD亚家族亲缘关系较近,推测两者功能更相似。棉花SOD家族基因的鉴定、分析对棉花SOD基因功能及镉响应机制研究具有借鉴意义,可为筛选耐镉棉花品种提供基因资源。
关键词:棉花;镉;转录组;SOD;生物信息学
中图分类号:S562 文献标识码:A 文章编号:1006-060X(2024)08-0001-05
Bioinformatics of the SOD Gene Family in Cotton
KUANG Zheng-cheng,YANG Chun-an,LI Yu-jun,LI Fei,HUANG Hui,CHEN Hao-dong,
GONG Yang-cang,XIAO Cai-sheng,FU Lin
(Hunan Cotton Science Institute, Changde 415101, PRC)
Abstract: From the transcriptome sequencing data of cotton seedling roots under cadmium (Cd) stress, 16 genes encoding superoxide dismutase (SOD) in cotton were identified and subjected to bioinformatics analysis. The results showed that the proteins encoded by the 16 SOD genes were non-secretory and hydrophilic and had the lengths of 127-333 aa, relative molecular weights of 13 048.69-35 974.31 Da, isoelectronic points of 4.43-8.50, and no transmembrane domain. Among the proteins, 75% were acidic proteins and 69% were stable proteins. Most of the subcells were located in chloroplasts. The 16 SOD belonged to three subfamilies, namely, Fe-SOD, Mn-SOD, and Cu/Zn-SOD, each of which had its own conserved motifs. The Mn-SOD and Fe-SOD subfamilies had close genetic relationship, which indicated that they had similar biological functions. The identification and characterization of the SOD family members in cotton lay a foundation for probing into the molecular mechanism of SOD genes in response to Cd stress and provide genetic resources for breeding the cotton cultivars with Cd tolerance.
Key words: cotton; cadmium; transcriptome; superoxide dismutase (SOD); bioinformatics
收稿日期:2024-03-02
基金项目:棉花生物育种与综合利用全国重点实验室项目(CB2023A10)
作者简介:匡政成(1988—),男,湖南祁东县人,副研究员,主要从事作物遗传育种研究。
通信作者:傅淋
植物受到非生物胁迫时会产生大量的活性氧(Reactive oxygen species,ROS),适当的ROS能提高植物对胁迫的抗性,但过量的ROS会损伤细胞膜,进而影响植物的生长发育[1]。超氧化物歧化酶(Superoxide dismutase,SOD)是一种活性氧代谢酶,在生物体内广泛存在,能够催化超氧阴离子自由基歧化生成氧气和过氧化氢,以维持生物体内活性氧平衡[1-2]。大量研究表明,SOD在植物响应镉胁迫中发挥着重要作用[3-4]。因此,研究基于镉胁迫下棉花幼苗根系的转录组数据,鉴定得到棉花SOD基因家族成员,并对其进行生物信息学分析,旨在为后期深入分析棉花SOD基因响应镉胁迫的分子机制奠定基础,为筛选耐镉棉花品种提供基因资源。
1 材料与方法
1.1 棉花SOD基因鉴定
C184幼苗由湖南省棉花科学研究所培育,基于镉胁迫下C184幼苗根系的转录组数据及注释结果,获得棉花SOD基因序列。其中,镉浓度分别为0 mmol/L(对照)和5 mmol/L。使用在线工具ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)和CD"Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)对序列进行检测确认。转录组测序及分析由深圳华大基因股份有限公司完成。
1.2 棉花SOD蛋白理化性质分析
使用在线工具ExPaSy ProtParam(https://web.expasy."org/protparam/)和TMHMM 2.0(https://services. healthtech."dtu. dk/services/TMHMM-2.0/)对棉花SOD基因编码的蛋白质进行理化性质分析和跨膜结构域预测。使用在线工具SignalP 5.0(https://services.healthtech.dtu.dk/services/SignalP-5.0/)和CELLO v2.5(http://cello.life.nctu.edu.tw/)进行信号肽预测和亚细胞定位。
1.3 棉花SOD蛋白系统进化树构建
从Phytozome数据库下载拟南芥的SOD家族蛋白序列数据,将其作为参考,使用MEGA 7.0软件采用邻接法构建棉花SOD系统进化树。
1.4 棉花SOD蛋白基序及结构分析
通过在线工具MEME(http://meme-suite.org/)分析棉花SOD蛋白的保守基序。使用在线工具SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma_f.html)和SWISS MODEL(https://swissmodel.expasy.org/)进行棉花SOD蛋白二级结构和三级结构分析。
2 结果与分析
2.1 棉花SOD基因家族序列信息
根据镉胁迫下C184幼苗根系的转录组数据,获得16个棉花SOD基因家族成员。由表1可知,16个棉花SOD基因分布于5个染色体上,其中染色体Chr.1、Chr.6、Chr.9、Chr.11和Chr.13上分别有2、2、2、2和4个。16个棉花SOD基因家族成员的基因长度为384~1 002 bp,平均长度为680.25 bp,其中最长的是CotAD25396,最短的是CotAD64359。对其特征结构域进行分析,发现CotAD10546、CotAD12067、CotAD38114、CotAD40102共4个基因属于Fe-SOD类,CotAD02550、CotAD16779、CotAD20136、CotAD64649共4个基因属于Mn-SOD类,其余8个基因属于Cu/Zn-SOD类。
2.2 棉花SOD家族蛋白理化性质分析
由表2可知,棉花SOD家族蛋白长度为127~333 aa,其中最短的是CotAD64359蛋白,最长的是CotAD25396蛋白;相对分子质量为13 048.69~35 974.31 Da,最小的是CotAD64359蛋白,最大的是CotAD40102蛋白;等电点为4.43~8.50,其中12个属于酸性蛋白,4个属于碱性蛋白;不稳定系数为9.20~45.30,其中CotAD02550、CotAD12067、CotAD16779、CotAD30229、CotAD38114、CotAD40102、CotAD51044、CotAD55839、CotAD55984、CotAD56310、CotAD64359这11个蛋白的不稳定系数小于40,属于稳定蛋白。利用CELLO v2.5进行亚细胞定位预测,发现棉花SOD家族蛋白成员的亚细胞定位较为广泛,其中CotAD10546定位于细胞核,CotAD02550、CotAD16779、CotAD20136、CotAD64649共4个蛋白定位于线粒体,CotAD51044、CotAD55839、CotAD55984、CotAD64359共4个蛋白定位于细胞质,其余7个蛋白定位于叶绿体。利用TMHMM 2.0进行跨膜结构分析,发现16个棉花SOD蛋白均无跨膜结构特征,均不具备跨膜功能;利用SignalP 5.0对16个棉花SOD蛋白进行信号肽预测分析,发现棉花SOD蛋白均不含信号肽,为非分泌蛋白。另外,棉花SOD蛋白的总平均亲水性均为负值,表明它们均具有亲水性。
2.3 棉花SOD家族蛋白系统进化分析
由图1可知,棉花SOD蛋白可以分为Fe-SOD亚家族蛋白、Mn-SOD亚家族蛋白和Cu/Zn-SOD亚家族蛋白3个分支。Fe-SOD亚家族蛋白可进一步细分为A-I和A-II 2个类型,其中CotAD40102和CotAD10546属于A-I分支,CotAD12067和CotAD38114属于A-II分支。Mn-SOD亚家族蛋白则可以分B-I和B-II 2个类型,其中B-I分支中均为拟南芥Mn-SOD蛋白,B-II分支中均为棉花Mn-SOD蛋白;Cu/Zn-SOD亚家族蛋白可以分C-I、C-II和C-III 3个类型,C-I和C-II分支中均为棉花Cu/Zn-SOD蛋白,C-III分支包含CotAD55984、CotAD51044、CotAD56310、CotAD30229这4个棉花Cu/Zn-SOD蛋白和5个拟南芥Cu/Zn-SOD蛋白。
2.4 棉花SOD家族保守基序分析
对16个棉花SOD的氨基酸序列进行Motif查找,设置查找Motif数目为10个,其余参数为默认值,结果如图2所示。16个棉花SOD蛋白含有2~7个保守基序,CotAD64359仅2个保守基序,CotAD02550、CotAD16779、CotAD20136和CotA64649保守基序相对较多,均有7个保守基序。10个基序在不同亚家族中的分布具有差异,其中Fe-SOD亚家族成员均具有Motif1、Motif2、Motif7和Motif9;Mn-SOD亚家族成员均具有Motif1、Motif2、Motif3、Motif5、Motif7、Motif9和Motif10;Cu/Zn-SOD亚家族成员均具有Motif2和Motif6。
2.5 棉花SOD蛋白二级结构和三级结构分析
由表3可知,棉花SOD蛋白二级结构均含有α-螺旋、β-转角、延伸链和无规则卷曲。其中,Fe-SOD亚家族蛋白中,α-螺旋、无规则卷曲、延伸链和β-转角分别占比44.59%、36.25%、14.71%和4.45%;Mn-SOD亚家族蛋白中,α-螺旋、无规则卷曲、延伸链和β-转角分别占比52.50%、29.60%、13.45%和4.45%;Cu/Zn-SOD亚家族蛋白中,无规则卷曲占比较大,平均为52.58%,β-转角占比较小,平均为6.56%。
从图3可以清楚地观察到16个棉花SOD蛋白的α-螺旋、β-转角、延伸链和无规则卷曲等空间结构。3个亚家族间以及同一亚族不同蛋白之间的α-螺旋、β-转角、延伸链和随机卷曲比例均不相同,从而导致16个棉花SOD蛋白出现空间结构差异和功能分化。同时,16个棉花SOD蛋白全球性模型质量估测(GMQE)值为0.75~0.96,都比较接近1,由此可以推测16个棉花SOD蛋白三级结构建模结果可靠性较高。
3 讨论与结论
棉花是我国重要的经济作物和纺织工业原材料,具有生物量大、吸收累积镉能力较强、主产品棉纤维不进入食物链等优势,是镉污染耕地安全利用最理想的农作物之一[5-6]。《“十四五”全国种植业发展规划》提出“引导滩涂地、盐碱地、重金属污染区适当扩种棉花”[7]。因此研究棉花耐镉胁迫的分子机制与培育耐镉棉花品种具有重要意义。
棉花响应镉胁迫与SOD活性密切相关。Chen等[8]发现相较未处理的棉花幼苗根系SOD而言,镉处理的棉花幼苗根系SOD的表达水平上调,SOD活性也显著提高;肖才升等[5]发现,10 μmol/L 镉胁迫下棉花幼苗根部干物质质量和SOD活性显著降低;陈悦等[9]发现低浓度镉胁迫初期,棉花SOD活性较高,但随着镉浓度提高,SOD活性明显下降,得到SOD的抗氧化能力是临时而有限的结论;陈浩东等[10]发现低浓度镉胁迫会使棉花SOD活性出现小幅度的上升,认为低浓度镉胁迫有助于激活棉花细胞体中抗氧化酶的活性。该研究从镉胁迫下棉花幼苗根系的转录组数据中鉴定得到16个SOD基因,说明SOD基因参与了棉花镉胁迫响应,这与前人研究结论基本一致。
根据结构域将16个棉花SOD基因划分为Fe-SOD、Mn-SOD和Cu/Zn-SOD 3个亚家族,进一步进行亚细胞定位预测发现,75%的棉花Fe-SOD成员分布在叶绿体,100%的Mn-SOD成员分布在线粒体,50%的Cu/Zn-SOD成员分布在叶绿体,50%的Cu/Zn-SOD成员分布在细胞质。这说明叶绿体是Fe-SOD发挥功能的主要场所,而Mn-SOD主要在线粒体中发挥作用,Cu/Zn-SOD主要在叶绿体和细胞质中发挥作用,这与前人研究结论基本相符[11-12]。对16个棉花SOD的氨基酸序列进行Motif查找发现,3个亚家族均含有各自的保守基序,推测同一亚家族的SOD基因具有相似的生物学功能。同时,蛋白质二级结构和三级结构预测表明,同一亚家族的SOD蛋白具有相似空间结构。其中,Fe-SOD和Mn-SOD亚家族蛋白中α-螺旋占比较大;Cu/Zn-SOD亚家族蛋白中无规则卷曲占比较大,结合系统发育分析可知,Fe-SOD和Mn-SOD亚家族亲缘关系较近,功能更为相似。
参考文献:
[1] QUAN L J,ZHANG B,SHI W W,et al. Hydrogen peroxide in plants:a versatile molecule of the reactive oxygen species network[J]. Journal of Integrative Plant Biology,2008,50(1):2-18.
[2] 王星,刘肖飞,周宜君,等. 植物SOD基因表达调控的分子机制[J]. 中国油料作物学报,2014,36(2):275-280.
[3] 俞萍,高凡,刘杰,等. 镉对植物生长的影响和植物耐镉机制研究进展[J]. 中国农学通报,2017,33(11):89-95.
[4] SHAH K,KUMAR R G,VERMA S,et al. Effect of cadmium on lipid peroxidation,superoxide anion generation and activities of antioxidant enzymes in growing rice seedlings[J]. Plant Science,2001,161(6):1135-1144.
[5] 肖才升,谢心,李锋,等. 锰处理下棉花幼苗根部对镉胁迫的生理响应[J]. 华北农学报,2023,38(6):55-61.
[6] 匡政成,郭利双,匡逢春,等. 湖南省棉田镉含量分析及污染评价[J]. 中国棉花,2021,48(6):29-30,40.
[7] 农业农村部关于印发《“十四五”全国种植业发展规划》的通知[EB/OL].(2021-12-29)[2024-01-26]. http://www.moa.gov.cn/govpublic/ZZYGLS/202201/t20220113_6386808.htm.
[8] CHEN H D,LI Y J,MA X F,et al. Analysis of potential strategies for cadmium stress tolerance revealed by transcriptome analysis of upland cotton[J]. Scientific Reports,2019,9:86.
[9] 陈悦,李玲,何秋伶,等. 镉胁迫对三个棉花品种(系)产量、纤维品质和生理特性的影响[J]. 棉花学报,2014,26(6):521-530.
[10] 陈浩东,贺云新,郭利双,等. 镉胁迫对3个棉花品种生理生化特征及农艺性状的影响[J]. 棉花学报,2018,30(1):62-70.
[11] 韩硕,韩晓文,胡义锋,等. 空心莲子草SOD基因家族鉴定和表达模式分析[J]. 草业学报,2024,33(1):102-116.
[12] HAN L M,HUA W P,CAO X Y,et al. Genome-wide identification and expression analysis of the superoxide dismutase(SOD)gene family in Salvia miltiorrhiza[J]. Gene,2020,742:144603.
(责任编辑:王婷)