蓖麻MYB转录因子家族的鉴定和生物信息学分析

2024-02-05 05:57莫海英李智昊蔡国磊吉巧琳曹亚璞杨海英
关键词:蓖麻基序拟南芥

莫海英,李智昊,蔡国磊,陈 鑫,吉巧琳,曹亚璞,杨海英,杜 刚

(1.云南民族大学 民族医药学院,云南 昆明 650000;2.云南民族大学 化学与环境学院,云南 昆明 650000)

转录因子(transcription factors,TFs)又称反式作用因子,是与真核生物基因的顺式作用元件结合并调控下游基因表达的一类蛋白分子,以响应内源性或外源性的刺激,激活或抑制靶基因的表达,从而控制生化和生理过程;依据转录因子的DNA结合域的差异,转录因子又分为许多基因家族[1].其中MYB转录因子家族是真核生物中最通用的 TF家族之一;癌基因v-MYB是在禽成髓细胞病毒中发现的第一个MYB转录因子[2].MYB转录因子是包含53个氨基酸残基的保守结构域,其中的3个色氨酸残基通过空间位置的排布,形成一个螺旋-转角-螺旋(helix-turn-helix,HTH)折叠[3],可在特异识别位点与DNA的大沟结合[4];依据MYB结合域数量的差异,MYB家族被分为四个亚家族,分别是1R-MYB、R2R3-MYB、3R-MYB和4R-MYB[5].1R-MYB是一类调控染色体结构稳定性与细胞形态建成的端粒结合蛋白[6].R2R3-MYB蛋白是植物中分布最广泛的一类MYB转录因子,在植物生长发育的各个过程发挥重要作用,例如调控次生代谢物质的生物合成、参与各种逆境胁迫响应、响应植物的激素应答等[7].3R-MYB蛋白广泛分布于动物以及真菌细胞中,在植物细胞中的含量相对较少,主要参与细胞周期和细胞分化,同时也参与部分逆境胁迫响应[8].4R-MYB目前仅在拟南芥、杨树、葡萄中有少量的发现,但其功能尚不明确[9].MYB蛋白广泛分布于植物体内,参与植物初级和次级代谢、生长发育、生理时钟调控、细胞周期发育、生物和非生物胁迫应答、植物防御等生物学过程的调控[10],例如之前的研究从金鱼草、棉花、大豆、拟南芥、苹果和白菜等植物中鉴定得到功能各异的 MYB转录因子[11],金鱼草中AmMYB308L 可抑制植物次生代谢途径中重要可溶性酚酸的合成[12];红沙梨中 PyMYB10 和 PyMYB10.1 通过与PybHLH形成三元复合体调控花青素的生物合成[13].

蓖麻(RicinuscommunisL.),别名有蓖麻籽、大麻子、红蓖、老麻子、红麻等,为被子植物门大戟科蓖麻属一年生或多年生草本植物[14],其经济价值主要体现在蓖麻籽油在生物能源、聚合物、精细化工产业中的利用,此外蓖麻还具有其他经济价值如蓖麻毒素提取用于医药农药、饼粨用于饲料化肥、叶片养蚕等[15].蓖麻的生长适应性极强,从热带到温带地区均有分布,耐盐碱、耐瘠薄,在耕作粗放、自然条件差、污染较严重的条件下也能正常生长,蓖麻在环境绿化、防风固沙、防治水土流失、修复重金属污染土壤方面展现出其生态效益.蓖麻基因组测序于 2010年初步完成,全基因组序列大约 350 Mb[16],但关于蓖麻MYB 转录因子家族功能研究少部分文献报道了在蓖麻的耐盐胁迫中MYB转录因子表达下调[17],尚未对蓖麻植物的MYB转录因子进行系统分析,因此本研究通过蓖麻MYB基因家族的全基因组和转录组分析,以此与模式植物拟南芥的MYB蛋白进行基序、聚类分析、功能注释分析、系统进化以及理化性质分析,并对不同逆境胁迫下蓖麻中MYB表达量差异进行研究,该研究为蓖麻植物MYB基因的功能研究提供了新的思路.

1 材料与方法

1.1 材料

采用的蓖麻基因组数据来源于JGI官网(Joint GenomeInstitute,https://phytozome.jgi.doe.gov/pz/portal.html,美国能源部联合基因组研究所的植物比较基因组学门户网站),MYB蛋白的预测基于蓖麻基因组数据库,水稻、玉米和拟南芥的MYB 转录因子家族氨基酸序列分别来源于NCBI数据库(National Center for Biotechnology Information,http://www.biosino.org/pages/ncbi-1.htm,美国国家生物技术信息中心),和拟南芥信息资源数据库(PlantTFDB,http://planttfdb.gao-lab.org/).

1.2 蓖麻MYB转录因子的鉴定

玉米、水稻和拟南芥的MYB转录因子序列通过软件clustalw)进行比对,依据clustalw的比对结果采用hmmer软件(可以快速确定两组序列之间的相似程度)构建MYB转录因子的hmm模型,结合蓖麻基因组数据库检索结果,筛选evalue小于1x10-3的基因片段,提取相对应的氨基酸序列,最后取三大数据库CDD(Conserved Domain Database,https://www.ncbi.nlm.nih.gov/cdd/,保守结构域数据库)、PFAM(Protein families,http://pfam.xfam.org/,蛋白结构域数据库)、SMART(Simple Modular Architecture Research Tool,http://smart.embl.de/,识别蛋白保守结构域)进行结构域确认,作为蓖麻MYB转录因子.

1.3 蓖麻 MYB 转录因子蛋白基序分析鉴定

通过The MEME Suite5.3.3(https://meme-suite.org/meme/,用于研究Motif的组合工具套,Motif是指在一组序列中重复出现的相似的序列模式)程序对蓖麻MYB家族蛋白的基序进行分析,设定基序宽度的最大值为 50、最小值为6,基序数量为10,其余参数均为默认值,提取所选转录因子于基因组的位置信息,使用软件TBtools(批量序列处理和交互式数据可视化)绘制图像.

1.4 蓖麻MYB 转录因子蛋白的结构分析

通过bioperl对提取出筛选好的蓖麻MYB转录因子家族蛋白序列进行理化性质分析.同时利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html,蛋白质二级结构预测软件)对蛋白二级结构特征进行预测.

1.5 蓖麻 MYB 转录因子的GO注释分析

通过软件PANNZER2(http://ekhidna2.biocenter.helsinki.fi/sanspanz/,预测功能描述(DE)和GO类),对已筛选确定的蓖麻MYB转录因子进行功能注释.

1.6 蓖麻 MYB 转录因子与拟南芥 MYB 转录因子系统进化树的构建

对来源于PlantTFDB数据库的完整拟南芥MYB转录因子蛋白序列进行进化分析;采用MEGA7软件内置的ClustalW程序对蓖麻MYB家族蛋白序列以及下载的拟南芥MYB转录因子蛋白序列进行比对分析,采用邻接法(重复次数为1000次)构建系统发育树.

1.7 蓖麻MYB转录因子蛋白的转录组表达差异分析

从NCBI数据库中下载蓖麻的转录组数据,热胁迫转录组数据(HS-1:SRR17894243,HS-2:SRR17894242,HS-3:SRR17894241,CK-1:SRR17894246,CK-2:SRR17894245,CK-3:SRR17894244),盐胁迫转录组数据(USZ-1:SRR17069850,USZ-2:SRR17069859,USZ-3:SRR17069858,SSZ-1:SRR17069856,SSZ-2:SRR17069855,SSZ-1:SRR17069854).

使用trim_galore v0.6.7去除3′端接头和过滤平均质量分数低于碱基质量值30(quality score of 30,Q30)的读长(reads);使用STAR version=2.7.10a软件与蓖麻参考基因组(https://phytozome-next.jgi.doe.gov/info/Rcommunis_v0_1)进行比对.使用featureCounts 2.0.1进行定量.

2 结果与分析

2.1 蓖麻MYB 家族成员的获得

从蓖麻基因组数据中共挖掘出32条MYB基因序列,基因片段大小为164~676 bp.片段最短 164 bp(29701.m000580),编码54个氨基酸,最长 676 bp(29737.m001227),编码225个氨基酸,片段平均长度为 378 bp(见附件表2).

2.2 蓖麻 MYB 转录因子基序分析

32个蓖麻MYB转录因子家族的10个基序,研究发现32个蓖麻转录因子蛋白均具有基序1和2结构,结合MEME和smart结构域在线分析,发现在32个MYB转录因子中同时存在基序1、2和3时蛋白质中具有2个MYB结构域,不具有基序3时只有1个MYB结构域,基序3可能是一种典型的MYB基因结构域(图1).

图1 蓖麻MYB转录因子基序分析

即预测的32个蓖麻MYB基因家族主要是1R-MYB和2R-MYB基因亚家族.即在32个蓖麻转录因子蛋白中具有1R-MYB结构域(图2)的分别为28582.m000318、29701.m000580、30170.m013948、29780.m001368、29842.m003572、27757.m000022、29814.m000747、30174.m008957、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29790.m000831、28883.m000751、29807.m000474、29676.m001636、29780.m001324、30226.m001993、27973.m000086、30068.m002645,具有2R-MYB结构域的分别为28582.m000317、28582.m000316、29805.m001544、30169.m006598、29637.m000753、29680.m001711、29813.m001501、29950.m001149、29827.m002675、29805.m001543、29904.m002952、30017.m0003(表1).

图2 蓖麻中MYB基因在smart里的结构域

表1 蓖麻中MYB基因在smart里鉴定的结构域

2.3 蓖麻MYB家族蛋白理化性质分析

理化性质结果(见附件表2),此次研究中32个MYB家族蛋白平均相对分子质量为 42 132,最小值为29701.m000580编码蛋白的18734.7,最大值为29737.m001227编码蛋白的74390.5.等电点(pI)平均值为7.39,最小值为30174.m008957编码蛋白的4.8,最大值为30226.m001993编码蛋白的9.88,其中pI大于7的MYB家族蛋白有18个,大于pI小于7的14个,证明大部分蓖麻MYB家族蛋白表现为偏碱性.依据MYB家族蛋白结构特征预测结果,32个MYB蛋白主要由无规卷曲(58.0%)、α螺旋(29.9%)、延伸链(8.4%)和β转角(3.4%)组成.

2.4 蓖麻MYB转录因子的GO注释分析

GO注释结果表明,蓖麻32条MYB转录因子序列中有31条均被注释到生物过程、分子功能和细胞组分,并被进一步富集为26个功能类别(图3).其中生物过程主要富集在生物过程调节,生物调节,细胞过程和代谢过程;分子功能集中富集在结合调控上,细胞组分主要富集在细胞,细胞部分和细胞器调控上.可推测,蓖麻MYB 转录因子通过结合到 DNA 区域发挥相应的调控功能,主要涉及植物的细胞过程、发育过程和物质代谢等过程(图3).

图3 蓖麻转录因子功能注释

2.5 蓖麻MYB蛋白进化分析

在PlantTFDB数据库中下载拟南芥所有的MYB家族蛋白氨基酸序列(共168个),将上述筛选出的蓖麻MYB家族蛋白和下载到的拟南芥MYB家族蛋白利用软件MEGA7构建进化树.根据聚类结果(图4),可将蓖麻MYB转录因子分为2个亚家族,其中绿色标记的一类亚家族成员22个(28582.m000317—30017.m000317:28582.m000317、28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、29780.m001324、28883.m000751、29807.m000474、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29950.m001149、29827.m002675、29813.m001501、29904.m002952、30017.m000317),第二类亚家族成员10个结果(30068.m002645—29780.m001368:29780.m001368、30174.m008975、30226.m001993、29805.m001543、29790.m000831、27973.m000086、28582.m000316、29701.m000580、30170.m013948、30068.m002646),并且被聚类到相同分支的蛋白具有相似的功能,根据表3可以看出,第一类亚家族中拟南芥的MYB蛋白AT1G49010.1、AT5G08520.1、AT5G04760.1基因与脱落酸介导的盐胁迫耐受的重要调节因子,是脱落酸(ABA)信号转导所必需的,因此蓖麻中的MYB转录因子(28582.m000317-30017.m000317分支)可能是盐胁迫耐受的重要调节因子.

图4 蓖麻MYB家族蛋白与拟南芥MYB家族蛋白进化树

表3 蓖麻MYB转录因子与拟南芥MYB蛋白同源性功能比较

2.6 不同胁迫下MYB基因的转录组分析

2.6.1 盐胁迫下MYB基因的转录组分析

根据蛋白表达热图结果,32 个MYB蛋白的转录组在盐胁迫和正常情况下的表达量存在明显的差异;从图中可以看出23个MYB蛋白(占全部MYB蛋白的71.88%)在盐胁迫的处理下表达上调;其中有16个属于第一类亚家族成员(占第一类亚家族蛋白72.73%),分别为28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、28883.m000751、29807.m000474、29848.m004559、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29827.m002675、29813.m001501、29904.m002952、30017.m000317,表明蓖麻在盐胁迫下MYB蛋白表达上调,因此蓖麻中的MYB转录因子可能是盐胁迫耐受的重要调节因子(图5).

2.6.2 热胁迫下 MYB基因的转录组分析

根据蛋白表达热图结果,在热胁迫下,19个MYB基因表达量下调,13个MYB基因表达量上调,其中4个MYB蛋白表达上调(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相关性,这4个上调基因被聚类到一起,表明它们具有相似的表达模式,而3个MYB蛋白表达下调(29813.m001501、29950.m001149和30169.m006598)具有相似的表达模式,因此MYB基因在热胁迫下对蓖麻的生长有影响(图11).

CK代表正常情况下的蓖麻,HS代表热胁迫下的蓖麻,进行了3次重复实验;颜色键位于右上角,表示MYB基因表达情况图6 MYB基因在热胁迫和正常情况下的表达热图

3 结语

MYB是目前研究植物中数量最多的转录因子家族之一,现已在多种植物中被鉴定出来,例如:拟南芥、水稻、玉米和大豆[25].本研究在基因组水平上利用PlantTFbcat和BLAST在线软件对蓖麻MYB转录因子进行了鉴定和筛选.

本研究从蓖麻的基因组数据中共鉴定到32个MYB转录因子,在MEME分析中发现所有的MYB转录因子中都具有基序1和基序2结构,当序列中只含有基序1和2时发现只有一个MYB结构域,当同时含有1、2和3时具有2个结构域,说明基序1和2是与1R-MYB亚基因家族的保守性相关的,也与2R-MYB亚基因家族的保守性有关,基序3只与2R-MYB亚基因家族的保守性有关,极有可能基序3就是蓖麻MYB转录因子中R3的保守结构域,因此具有2个保守结构域MYB转录因子可能是R2R3-MYB转录因子.此外,根据MYB转录因子理化性质分析,MYB转录蛋白大多偏碱性,大部分是无规则卷曲和α螺旋.

蓖麻MYB蛋白进化分析,蓖麻的MYB蛋白主要和拟南芥的MYB蛋白家族聚在2个大的分支上,因此蓖麻中MYB蛋白主要分为2个亚家族,值得注意的是,第一类亚家族中28582.m000317-30017.m317000蛋白(22个)的功能可能是盐胁迫耐受的重要调节因子;并且第一类亚家族的MYB蛋白具有2个保守结构域,因此为R2R3-MYB结构域,R2R3-MYB转录因子可能对药用植物的次生代谢过程起到调控转录的作用.

盐胁迫下蓖麻MYB蛋白的转录组分析,前人研究了不同的盐反应基因和组蛋白甲基化开关位点,并发现关键盐反应调控因子RADIALIS-LIKE SANT (RSM1)的转录可能受到双价H3K4me3-H3K27me3修饰的调控[26],本研究蓖麻在盐胁迫下大部分MYB蛋白表达上调,因此蓖麻中的MYB转录因子可能是盐胁迫耐受的重要调节因子;在热胁迫处理下,前人研究针对热胁迫下和恢复过程中蓖麻幼苗的脂质组学和转录组学进行了综合分析,并鉴定了大量热响应脂质分子和基因,发现三酰基甘油(TAGs)的合成可以显着地被热应激诱导并储存在细胞质中,但在恢复过程中它们会减少[27],本文对其转录组公共数据再分析发现,在热胁迫下,13个MYB基因表达量上调,其中4个MYB蛋白表达上调(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相关性,这4个上调基因被聚类到一起,表明它们具有相似的表达模式,因此MYB基因在热胁迫下对蓖麻的生长有影响.

因此,通过对蓖麻不同逆境胁迫下的响应,MYB基因对蓖麻的生长有调节作用.本研究首次系统的进行蓖麻基因组和转录组的MYB基因挖掘,并且首次对蓖麻在干旱,冷胁迫下,盐胁迫下和热胁迫下MYB蛋白的表达量进行转录组分析,为今后进一步解析蓖麻MYB转录因子的结构和功能奠定基础.

猜你喜欢
蓖麻基序拟南芥
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
拟南芥:活得粗糙,才让我有了上太空的资格
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
两种LED光源作为拟南芥生长光源的应用探究
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
巧嘴绕口令
蓖麻蒴果剥壳过程中的力学性能有限元仿真
基于金钗石斛EST的短串联重复序列的挖掘