小麦MYB转录因子家族的生物信息学分析

2021-10-25 04:26黄建国张超群卞云迪刘晓颖范宝莉王振英
关键词:共线性元件基因组

黄建国,张超群,张 驰,卞云迪,刘晓颖,范宝莉,王振英

(1.天津师范大学生命科学学院,天津300387;2.天津师范大学天津市动植物抗性重点实验室,天津300387)

MYB(v-myb avian myeloblastosis viral oncogene homolog)家族是植物中最大的转录因子家族之一,根据其蛋白重复结构域数量可分为1R-MYB、R2R3-MYB、3R-MYB、4R-MYB等4类,其中大多以R2R3-MYB类存在[1].Dubos等[2]最早在玉米中发现了MYB转录因子ZmC1,该因子参与调控玉米中花青素的合成.与动物和酵母中的转录因子相比,植物中MYB转录因子在结构和功能上的保守性更高[3-5].MYB转录因子家族成员很多,具有非常复杂的功能,如参与信号转导[6-7]、抵御病原菌[8]、参与木质部发生和木质素合成[9-11]等生物过程,同时也参与调控植物的生理代谢,尤其是次生代谢物如花青素、类黄酮等物质的合成[12].在植物应对干旱胁迫、盐胁迫等非生物胁迫的调控中MYB转录因子亦具有重要作用[13-16].除拟南芥外,MYB转录因子家族的全基因组特性在水稻、玉米、谷子、大豆、橙子和苹果中均已完成[17].小麦(Triticum aestivum)是全球最重要的农作物之一,由于小麦基因组庞大,目前对小麦MYB家族基因的研究仍相对较少.基因组测序的完成极大促进了小麦功能基因的研究.如Zhang等[18]发现一个1R-MYB转录因子TaLHY在小麦叶、穗、茎中表达量较高,而在根中表达量较低.因此对小麦MYB转录因子家族开展生物信息学分析,对进一步了解MYB的功能具有重要意义.

本研究采用生物信息学方法,对小麦MYB家族基因进行全基因组鉴定,并用鉴定到的小麦、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)MYB基因家族成员,对基因结构、保守结构域、顺式作用元件及物种共线性等进行分析,为深入研究小麦MYB转录因子家族以及小麦品质改良提供参考.

1 材料与方法

1.1 小麦MYB基因家族成员鉴定与序列特征分析

从Ensembl Plants数据库(http://plants.ensembl.org/index.html)中下载小麦的全基因组序列.在Pfam(http://pfam.xfam.org)中下载MYB基因特有的保守结构域模型(PF00249),利用该模型在小麦蛋白数据库中进行Blast p比对,得到候选基因,再次将这些候选基因提交到Hmmer、NCBI-CDD等在线网站进行保守域的结构验证,最终得到小麦MYB基因.利用在线工具ExPASy(http://web.expasy.org/protparam/)预测小麦MYB转录因子家族成员的等电点(pI)、蛋白相对分子质量(pW)、氨基酸长度和染色体定位信息等属性,使用CELLO V.2.5(http://cello.life.nctu.edu.tw/)在线网站进行亚细胞定位.

1.2 预测保守motif和基因结构

通过在线数据库MEME(http://meme-suite.org/)预测小麦MYB基因家族成员的保守结构域.使用WebLogo(http://weblogo.berkeley.edu/)默认设置获取序列标识进行基因结构分析.

1.3 绘制顺式作用元件

利用TBtools工具截取小麦MYB基因家族成员上游1 500 bp基因序列,并通过PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对顺式作用元件进行分析.

1.4 小麦MYB基因家族物种共线性

将小麦基因组、二穗短柄草基因组、大麦基因组通过MCScanX进行物种间共线性分析.并利用TBtools绘制小麦、二穗短柄草、大麦基因组物种间MYB基因家族成员的共线性图谱.

2 结果与分析

2.1 小麦MYB基因家族成员理化性质的预测

通过2次比对搜索,最终得到了76个小麦MYB转录因子基因,并根据基因的同源关系将其重命名.对小麦MYB基因编码的蛋白质的理化性质分析结果如表1所示.

表1 小麦MYB基因家族的基本信息Tab.1 Basic information of MYB gene family in wheat

续表

由表1可以看出,氨基酸个数最多的是1号,有856个氨基酸残基,最少的是24号,有204个氨基酸残基;相对分子质量为23.15×103~94.90×103;理论等电点(pI)介于4.75(56号基因蛋白)~11.39(24号基因蛋白)之间.利用CELLO在线网站进行亚细胞定位分析发现,小麦MYB转录因子家族成员的基因均能定位于细胞核,其中7个基因可同时定位于其他细胞器上(14、15、29、30、51、59和70号基因).

2.2 保守motif和基因结构分析

对小麦的76条MYB转录因子的氨基酸序列进行多序列比对并构建系统进化树,结果如图1(a)所示.利用在线软件MEME对TaMYBs蛋白进行保守基序搜索,并利用TBtools软件结合进化树进行可视化分析,结果如图1(b)和图1(c)所示.通过MEME程序共获得了9个保守结构域,亲缘关系近的不同亚类蛋白较为保守,组成motif较为相似;同一分枝的TaMYBs蛋白具有相似的motif组成,不同进化分枝的motif组成存在差异,而保守基序的差异可能是基因之间存在功能分化的重要原因.本研究鉴定出的TaMYBs蛋白都具有MYB家族的保守结构域,且大多数的保守结构域位于MYB蛋白的N端,表明这些motif对MYB蛋白行使其功能特别重要.总之,聚在同一组的蛋白成员其motif的组成是相同的,预示同一组的不同成员其功能有可能相同.

图1 小麦MYB基因的分析Fig.1 Analysis on MYB genes in wheat

小麦MYBs基因家族大多数成员都有内含子,数目由0到11个.其中MYB118-like基因结构最复杂,外显子数目最多为11个,内含子数目为11个,而MYB56-like基因结构简单,均只含有1个外显子和0个内含子.进化树上聚在一起、亲缘关系较近的MYB基因家族成员具有相同的基因结构,内含子的数目、位置和外显子长度相同.如MYB4和OsMYB1-like、MYB33和MYB30-like这2对同源基因对,外显子数分别为1个和2个,内含子数分别为1个和0个,其同源基因的外显子、内含子的长度和位置都相同.MYB27-like、MYB102-like、MYB80-like和MYB80在进化树上聚到一起,都具有3个外显子和2个内含子.由此可见,小麦MYBs内含子长度、外显子位置和数目在不同成员之间都存在差异,说明小麦MYB家族在进化过程中产生了较强分化.

2.3 对小麦MYB基因家族成员顺式元件的分析

为了探究小麦MYB基因家族成员对激素、生物和非生物胁迫相关的调控作用,利用小麦MYB基因上游1 500 bp的基因组序列分析MYB基因顺式作用元件.在MYB基因家族中鉴定到多种响应环境和激素信号的顺式作用元件,如图2所示.

由图2可以看出,小麦MYB基因家族的表达调控机制较为复杂,其中,90.79%家族成员均具有脱落酸响应的相关调控元件,55.26%家族成员具有赤霉素响应的相关调控元件,48.68%家族成员具有生长素响应的相关调控元件(如MYB108受到生长素反应因子调控使得花药开裂),53.94%的家族成员具有水杨酸响应元件,72%的家族成员含有MeJA响应的结合位点,61.84%的家族成员具有参与DNA光响应的元件,50%以上的成员具有光模块调控元件,51.31%的家族成员具有厌氧诱导响应元件(如MYB44的显性抑制可引起氧化损伤和对非生物胁迫的超敏反应),36.84%的家族成员含有响应干旱诱导的MYB转录子结合位点(如MYB1与干旱响应诱导相关),34.21%基因家族成员含有低温响应的相关调控元件.除鉴定到参与干旱、低温等逆境损伤外,还鉴定到参与伤口响应元件MYB120-like.参与细胞周期调控的只有7个相关元件,包括MYB109-like、PHL7-like、SM153-1like、APL-like、PHR33x1-like、MYB69-like和MYB75-like.参与昼夜节律控制的顺式作用调控元件只有MYB108-like.以上分析表明,小麦MYB基因家族成员在激素调控、逆境响应和光响应过程中发挥着重要作用.

2.4 物种共线性分析

对大麦、小麦、二穗短柄草的共线性进行分析,结果如图3所示.由图3可以看出,大麦与小麦之间共线性有44对,小麦与二穗短柄草之间共线性有46对,有28个基因在三者之间存在共线性,说明这些基因可能在进化上更保守.分析基因结构,28个基因中有20个R2R3-MYB类型基因和8个1R-MYB类型基因.

图3 大麦、小麦、二穗短柄草的共线性Fig.3 Collinearity of barley,wheat and two-spike short-stalk grass

对小麦转录因子家族内基因的共线性进行分析,结果如图4所示.由图4可以看出,有53个基因家族成员呈现出共线性,其中3B上最多的有5个成员,5B上则没有分布,说明小麦MYB转录因子家族基因在染色体进化中呈现不均匀分布,不断地进行串联复制,从而扩大了小麦基因组.

图4 小麦MYB家族物种内的共线性Fig.4 Collinearity within the MYB family of wheat

对存在共线性的28个共有基因(表2)进行顺式作用元件分析(图2).其中,26个基因参与光响应元件,19个基因参与厌氧诱导响应元件,7个基因参与干旱诱导结合位点的元件,4个基因参与种子特异性调控元件,1个基因参与昼夜节律控制的顺式作用调控元件,1个基因参与细胞周期调节的顺式作用元件.另外,还有参与激素响应的相关元件,包括有24个基因参与茉莉酸响应元件,23个基因参与脱落酸响应元件,16个基因参与赤霉素响应的元件,15个基因参与水杨酸响应元件,10个基因参与生长素响应元件.这说明每个基因都有自己的主要功能,同时又对其他元件起着辅助作用.

表2 小麦28个MYB基因家族成员信息Tab.2 Information of 28 MYB gene family members in wheat

3 讨论与结论

本研究利用生物信息学技术对小麦基因组中的MYB转录因子进行了全基因组鉴定,并对所有家族成员进行了系统的生物信息学分析.经鉴定得到了76个小麦MYB转录因子基因,分布在1~7染色体上.小麦MYB转录因子家族的蛋白长度为204~856个氨基酸残基,相对分子质量为23.14×103~94.91×103,等电点范围为4.75~11.39.蛋白亚细胞定位分析表明,TaMYBs蛋白均可以定位在细胞核中.亲缘关系相近的转录因子通常有相似的基因结构组成,如MYB4和OsMYB1-like、MYB33和MYB30-like.小麦MYBs转录因子家族保守基序较多且较为复杂,具有多种多样的生物学功能.小麦MYB转录因子家族成员基因启动子顺式作用元件种类较多,包括与小麦光响应相关的顺式作用元件和与激素应答相关的顺式作用元件[19].所有的小麦MYB基因家族成员均含有光响应顺式作用元件,并含有不同的激素响应顺式作用元件,如脱落酸、茉莉酸、水杨酸、赤霉素和生长素顺式作用元件[20-22].同样,TaMYBs基因启动子序列也包含了其他大量与逆境胁迫响应相关的顺式作用元件[23-25].意味着该家族成员参与信号通路的能力及生物学功能可能不同,这也有利于奠定抗性育种的资源基础.通过对大麦、小麦、二穗短柄草三者之间的共线性分析可知,有28个基因在三者之间存在共线性,说明这28个基因在进化上更为保守,其中R2R3-MYB类型的基因有20个,说明R2R3-MYB保守性较强,这与在多种植物中的研究结果较接近[26].

植物中MYB转录因子家族的功能多样,不同成员的功能及作用方式不尽相同.因此,开展MYB转录因子功能和作用机制的研究十分重要.植物中部分MYB转录因子家族成员已经有了较为广泛的研究,接下来可以利用基因克隆、蛋白质功能分析的相关技术,进一步研究MYB转录因子在小麦的遗传进化、生长发育和胁迫应答过程中的调控机制.本研究系统分析了小麦MYB基因家族的定位、基因结构及顺式作用元件等,为今后研究该家族提供了参考.

猜你喜欢
共线性元件基因组
“植物界大熊猫”完整基因组图谱首次发布
承压类特种设备受压元件壁厚测定问题的探讨
牛参考基因组中发现被忽视基因
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
如何读懂色环电阻