马正宝 刘铭 杜泽光 祈乐 魏兵强
摘要:利用生物信息学分析方法对辣椒Exo-PG基因家族成员的数量、分子特征、亚细胞定位、基因结构、顺式作用元件及系統进化进行分析,以明确辣椒Exo-PG基因家族成员。结果表明,辣椒Exo-PG基因家族有49个成员,不均匀分布于13条染色体上,并分为3个亚族;辣椒Exo-PG基因家族成员编码的蛋白酸碱性各占一半,且均定位于细胞外;该家族成员在启动子序列中含有激素响应元件、低温响应元件、厌氧诱导元件等多种顺式作用元件。
关键词:辣椒;外切多聚半乳糖醛酸酶;基因家族;生物信息学
中图分类号:S641.3 文献标志码:A 文章编号:1001-1463(2021)10-0011-08
doi:10.3969/j.issn.1001-1463.2021.10.004
Bioinformatics Analysis of Exo-polygalacturonase Gene Family in Pepper
MA Zengbao, LIU Ming, DU Zeguang, QI Le, WEI Bingqiang
(College of Horticulture, Gansu Agriculture University, Lanzhou Gansu 730070, China)
Abstract:In order to identify the Exo-PG gene family members in pepper, the number, molecular characteristics, subcellular localization, gene structure, cis acting elements and phylogeny of Exo-PG gene family members in pepper were analyzed by bioinformatics. The results showed that pepper contains 49 Exo- PG gene family members, which were distributed unevenly on 13 chromosomes and divided into three subgroups. The Exo- PG gene family members in pepper encode half of the proteins with acid-base properties, and all of them are located extracell. There are many cis-acting elements in the promoter sequence of the family members, such as hormone response element, low temperature response element, anaerobic induction element and so on.
Key words:Pepper; Exo-polygalacturonase; Gene family; Bioinformatics
辣椒(Capsicum annuum L.)原产中南美洲,约于16世纪后期传入我国。它是重要的蔬菜及调味品,我国栽植面积在200万hm2以上,并且呈逐年增大的趋势,对保障我国蔬菜周年供应有着重要作用[1 ]。因此,保障辣椒的产量、品质与周年供应成为重大民生问题。
果胶或果胶物质普遍存在于初生细胞壁和幼小植物组织的中层[2 ],是细胞维持一定形态结构的重要物质。在花粉发育过程中,包被花粉母细胞、四分体的初生细胞壁主要由纤维素、半纤维素、果胶和糖蛋白等组成。花粉内壁是成熟花粉壁的组成部分,其主要成分与初生细胞壁相似。通常情况下,多糖代谢密切参与这些壁的形成和降解,从而参与花粉壁的正常发育[3 ]。在植物体内,广泛分布于果胶代谢相关的酶,根据其作用底物的不同,可以分为3 种类型,即断裂多聚半乳糖醛酸中α-1,4-糖苷键的解聚酶(PG)、对高甲酯化果胶发挥脱甲酯作用的果胶酯酶以及降解不溶性果胶类物质的原果胶酶[4 ],目前应用最为广泛的PG是解聚酶的一种。已有研究表明,PG基因家族的多个成员特异地存在于花粉中,它们可能在花粉成熟和花粉管伸长中发挥重要的作用[5 ]。 PG基因是一大基因家族,目前仍不明确在辣椒中有多少PG家族成员在花粉发育中起作用。根据对底物的酶促作用模式,多聚半乳糖醛酸酶分为两类,即随机切割型(内切多聚半乳糖醛酸酶)和末端切割型(外切多聚半乳糖醛酸酶),外切 PG 从多聚半乳糖醛酸链的非还原末端逐个水解, 内切 PG 则可从分子中间随机裂解多聚半乳糖醛酸[6 ]。我们在辣椒全基因组范围内鉴定和筛选出辣椒外切多聚半乳糖醛酸酶(Exo-PG)基因家族成员,并利用生物信息学方法分析了基因结构,以预测蛋白质理化性质及启动子区域的顺式作用元件,旨在为全面鉴定和认识辣椒Exo-PG基因家族,为后续研究辣椒Exo-PG基因家族成员的生物学功能奠定基础。
1 材料与方法
1.1 数据来源
在拟南芥综合数据库TAIR(https://www. arabidopsis.org)上进行搜索关键词“exo-polygalacturonase”,获取并下载拟南芥exo-poly-
galacturonase基因的蛋白序列。
1.2 方法
1.2.1 辣椒CaExo-PG基因家族鉴定 以下载的拟南芥exo-polygalacturonase基因蛋白序列作为搜索序列,在茄科基因网站(https://solgenomics.net /tools/blast)进行blastp比对,获取辣椒的exo-polygalacturonase基因家族蛋白候选序列[7 ]。将候选序列提交至Pfam(http://pfam.xfam.org/)和SMART进行结构域验证[8 ],最终确定CaExo-PG基因家族成员。利用在线软件ProtParam(http://web.expasy.org/protparam/)分析CaExo-PG家族成员的蛋白质序列长度、分子量及等电点等理化性质[9 ]。利用Euk- mPLoc 2.0(http://www. csbio.sjtu.edu.cn/bioinf/euk-multi-2/)进行亚细胞定位分析[10 ]。
1.2.2 进化树、染色体定位和保守基序分析 利用 MEGA-X构建辣椒系统进化树,构建方法为最大法(Maximum Likelihood,ML)。将Bootstrap 的重复次数设置为1 000,剩余设置选择默认选项[11 ]。染色体定位分析用MapChart软件进行。通过MEME网站对CaExo-PG蛋白的氨基酸序列中的保守基序进行分析,参数设置为模体基序长度最小为15 aa、最大为150 aa,保守序列数目最大为6,其他均采用默认参数。
1.2.3 基因结构和启动子顺式作用元件 通过GSDS网站(http://gsds.gao-lab.org/index.php)分析辣椒CaExo-PG基因的内含子-外显子结构及数目[12 ]。利用TBtool工具提取CaExo-PG编码序列(coding sequence,CDS)的起始密码子上游2000 bp序列作为启动子序列,并通过PlantCARE数据库进行启动子顺式作用元件分析[13 - 14 ]。
2 结果与分析
2.1 辣椒CaExo-PG基因家族的获取和鉴定
利用生物信息学的方法,从辣椒‘zunla-1全基因组中共鉴定到 49个 CaExo-PG家族成员(表1),根据在染色体的位置,将其名为CaExo-PG1~CaExo-PG49。该基因家族所有成员编码的蛋白质均含有一个“Glyco hydro 28”结构域,氨基酸数的变化范围在106~598个,分子量变化范围在11 415.82~63 472.85,其中CaExo-PG31基因编码的蛋白质分子量最大,CaExo-PG2最小。等电点介于4.73~9.80,其中有24个成员蛋白质呈碱性,25个成员蛋白质呈酸性。通过亚细胞定位分析,发现该基因家族成员编码的蛋白质均定位于细胞外。
2.2 辣椒CaExo-PG基因家族
2.2.1 辣椒CaExo-PG基因家族进化树分析
为了解辣椒Exo-PG基因家族和拟南芥(ATexo)之间的同源关系,构建辣椒、拟南芥 Exo-PG基因家族系统进化树(图1)。辣椒CaExo-PG基因家族可分为三个亚家族(Group1、Group2和Group3)。其中第一亚家族有成员21个;第二亚家族有成员19个,第三亚家族有成员9个,ATexo-PG1与CaExo-PG47位于同一亚家族,且具有较高的同源性,说明这两个基因具有相似的生理学功能。
2.2.2 染色体定位分析 对辣椒CaExo-PG基因家族成员进行染色体定位分析,结果显示,49个基因分散于辣椒的所有染色体上(图2)。其中2号、4号、6号、7号、8号、11号染色体上有2个基因;1号染色体上有4个基因;5号、9号、12号、0号染色体上有6个基因;3号染色体上有7个基因。其中0号染色体最长,3号、9号、12号染色体出现基因簇且都分布于染色体上端,3号染色体分布的基因最多。大多数染色体上有2个基因。
2.2.3 保守基序分析 对辣椒CaExo-PG基因家族的蛋白质保守基序进行分析(图3),共获得6个保守基序(Motif1、Motif2、Motif3、Motif4、Motif5、Motif6),其中CaExo- PG24和CaExo-PG25没有保守基序。绝大多数基因中有Motif1、Motif5分布,说明Motif1与Motif5在该家族基因中发挥重要的作用。Motif2、Motif3、Motif4、Motif6也广泛分布于该基因家族。
2.3 基因结构和启动子顺式作用元件分析
2.3.1 基因結构 通过GSDS网站分析辣椒CaExo-PG基因的内含子-外显子结构及数目(图4)。从基因内含子数目分析,该基因家族成员的内含子数目为1~13个之间,大多数成员具有3~5个内含子,其中CaExo- PG10具有的内含子数目最多,数量为13个。从基因的长度进行分析,CaExo-PG4的长度最长,大于12 kb,CaExo-PG2长度最短,小于1 kb。有3个成员(CaExo-PG12、CaExo-PG35、CaExo-PG9)含有非翻译区。
2.3.2 启动子顺式作用元件分析 利用PlantCARE数据库分析了启动子区域的顺式作用元件(图5)。CaExo-PG家族基因的启动子顺式作用元件可以分为9大类,分别为auxin(生长素)、defense and stress(防御与胁迫)、gibberellin(赤霉素)、low-temperature(低温响应)、salicylic acid(水杨酸)、anaerobic induction(厌氧诱导)、MeJA(茉莉酸甲酯)、meristem expression(分生组织表达)、endosperm expression(胚乳表达)。其中CaExo-PG9只有厌氧诱导响应元件,CaExo- PG29只有水杨酸响应元件。多数基因含有水杨酸、茉莉酸甲酯和分生组织表达的作用元件。
3 结论与讨论
本研究从辣椒全基因组范围内共鉴定出 49个CaExo-PG 基因,分散排布在辣椒的全部染色体上,其中大多数染色体上有2个基因,3号、5号、9号、12号染色体上端有明显的基因簇出现。该基因家族的蛋白质分子量为11 415.82~63 472.85,差异较大;等电点介于4.73~9.80,其中有24个基因编码的蛋白质呈酸性,25个基因编码的蛋白质呈碱性;亚细胞定位分析发现该基因家族蛋白全定位于细胞外,说明在细胞外发挥重要功能。
利用1个拟南芥和49个辣椒CaExo-PG蛋白序列构建系统进化树,根据进化树结果将辣椒CaExo-PG家族成员分为3个亚家族,分别为第一亚家族(Group1)、第二亚家族(Group2)及第三亚家族(Group3)。对CaExo- PG基因家族进行了蛋白保守结构域分析,发现多数蛋白具有Motif1、Motif5,说明Motif1、Motif5在该家族基因中发挥重要功能。结合进化树分析发现,同一亚族的基因基本含有相似的保守基序。对CaExo-PG基因结构分析,大多数基因具有3~5个内含子,CaExo-PG10含有内含子最多(13个);在该家族成员中,有3个成员含有非翻译区,其中基因CaExo-PG12非翻译区长度最短,CaExo-PG35长度次之,CaExo-PG9最长。
研究发现,多数辣椒CaExo-PG基因含有激素和逆境响应相关顺式调控元件(水杨酸、茉莉酸甲酯和分生组织表达),其中CaExo-PG9只有厌氧诱导、CaExo-PG29只有水杨酸响应。基因CaExo-PG4和CaExo-PG49只含有2个作用元件,即水杨酸响应和厌氧诱导;基因CaExo-PG21和基因CaExo-PG43含有作用元件最多,有7个。
参考文献:
[1] ZHENG J Y,LI X F,LIU F,et al. The research progresses on pepper in 2018[J]. Journal of China Capsicum,2019,17(1):1-9;17.
[2] KOTINO H,YAMASAKI Y,KATOH K. Degradation of pectic polysaccharides,extracted from suspension cultures of carrot by purified exo-polygalacturonase[J]. Physiol. Plant.,1984,61:20-26.
[3] 魏兵强. 辣椒胞质雄性不育育性恢复的遗传与候选基因鉴定[D]. 兰州:甘肃农业大学,2017.
[4] SINGH J R,SAXENA S,GUPTA R. Microbial pectinolytic enzymes:A review[J]. Process Biochem.,2005,40(9):2931-2944.
[5] 张豫超,叶意群,黄 鹂,等. 花粉发育相关基因BjMF6的分子克隆及其生物信息学分析[J]. 细胞生物学杂志,2007,29(1):158-162.
[6] 佟兆国,王 飞,高志红,等. 果胶降解相关酶与果实成熟软化[J]. 果树学报,2011,
28(2): 305-312.
[7] 李洪有,霍冬敖,蔡 芳,等. 荞麦ARF基因家族的鉴定及生物信息学分析[J]. 浙江农业学报,2018,30(1):7-13.
[8] 孟文静,张家琦,赵康路,等. 谷子Dof转录因子家族分析及功能预测[J]. 分子植物育种,2019,17(4):1080-1089.
[9] 朱冉冉,吉雪花,张中荣,等. 辣椒超氧化物歧化酶基因家族的生物信息学分析[J]. 石河子大学学报(自然科学版),2020,38(6):712-717.
[10] HOONDAL G S,TIWARI R P,TEWARI R,et al. Microbial alkaline pectinases and their industrial applications:A review[J]. Appl. Microbiol. Biotechnol.,2002,59(4-5):409-418.
[11] 齐晨辉,赵先炎,韩朋良,等. 苹果Plant U-Box型E3泛素连接酶MdPUB24的耐盐性和ABA敏感性鉴定[J]. 园艺学报,2017,
44(12):2255-2264.
[12] 郑忠凡,张亚利,胡 灿,等. 辣椒全基因组中LBD转录因子的鉴定与表达分析[J]. 园艺学报,2016,43(4):683-694.
[13] 毛佳昊,熊晓辉,卢一辰. 茉莉酸调控植物应对逆境胁迫作用的研究进展[J]. 生物加工过程,2021,19(1):413-419;462.
[14] 张 茹,王兰兰,陈灵芝. 耐低温辣椒种质资源的快速筛选[J]. 甘肃农业科技,2020(4):24-27.
(本文责编:杨 杰)
收稿日期:2021 - 06 - 15
基金项目:甘肃农业大学省级大学生创新创业训练计划项目(S202010733089);甘肃农业大学科研训练计划(SRTP)项目(202012012)。
作者简介:马正宝(1998 — ),男,甘肃兰州人,硕士在读,研究方向为蔬菜学。Email:2372128737@qq.com。
通信作者:魏兵强(1980 — ),男,甘肃天水人,副研究员,博士,主要从事蔬菜遗传与分子育种。联系电话:(0931)7632155。Email:bqwei@gsau.edu.cn。
執 笔 人:刘 铭。