蒋宇佳, 于元平, 孙向一, 周 敏, 吴春妍, 李玉华, 刘明稀*
(1.湖南农业大学农学院草业科学系, 湖南 长沙 410128; 2. 湖南省草地研究中心, 湖南 长沙 410128)
转录因子是基因表达的重要调节因子,至少包括4个离散结构域,即DNA结合区、转录调控区、核定位信号区和寡聚化位点,这些结构域共同调节许多生理生化过程,并响应内源性和外源性刺激激活和/或抑制转录[1]。根据不同的DNA结构域,转录因子被分为多个不同的基因家族,常见的转录因子有MYB,WRKY,NAC,bHLH,bZIP等,其中MYB转录因子是植物中最大的转录因子家族之一。
MYB转录因子具有保守的MYB DNA结合结构域,该结构域通常含有1~4个约51~52个氨基酸的不完全重复序列(R1,R2,R3),每个不完全重复序列由3个α-螺旋编码,第2和第3个螺旋之间形成螺旋-转角-螺旋(HTH)结构[2-4]。根据MYB结构域的数量和分布位置,一般分为4个亚类,分别为1R-MYB,R2R3-MYB,3R-MYB和4R-MYB,其中2R-MYB数量居多。1982年从禽类骨髓母细胞瘤病毒中发现的原癌基因v-MYB是最早的MYB转录因子[5],之后在各种真核生物中发现了MYB相关基因家族的存在[2,6]。MYBC1是第一个在植物——玉米(Zeamays)中发现的MYB转录因子,其功能与花青素的合成密切相关[7]。随后,越来越多的MYB基因在不同植物物种中被鉴定,包括拟南芥(Arabidopsisthaliana)[8]、水稻(Oryzasativa)[9]、大豆(Glycinemax)[10]、柑橘(Citrus)[11]、油桐(Verniciafordii)[12]、辣椒(Capsicumannuum)[13]等。
R2R3-MYB蛋白是植物MYB转录因子中存在最为广泛的一类,被证明与调节异丙醇和类黄酮途径[14-15],植物组织生长发育[16],激素信号转导[17],以及响应生物和非生物胁迫[18-20]等的反应相关。例如,在Mehrtens等[21]的研究中发现,AtMYB12通过转录激活CHS和FLS对黄酮醇生物合成发挥调节作用;AtMYB96介导的ABA信号通过诱导水杨酸(SA)的生物合成来增强植物对丁香假单胞菌的抗性[22];在拟南芥中过表达AtMYB15可能通过提高参与ABA生物合成和信号传导的基因以及编码应激保护蛋白的基因的表达水平来提高其抗旱性和耐盐性[23]。PtoMYB170正向调控杨树(Populustomentosa)成木过程中木质素沉积,还可以通过气孔的关闭来提高植物的抗旱能力[24];PtoMYB142可直接与蜡生物合成基因(如CER4和KCS6)的启动子结合并诱导其表达,导致杨树叶片中蜡积累量增加,增强抗旱性[25]。同样,OsMYB60通过促进叶表面角质层蜡的生物合成来增强水稻对干旱胁迫的适应能力[26]。
假俭草[Eremochloaophiuroides(Munro.)]是一种多年生暖季型草坪草,是禾本科蜈蚣草属中唯一可以用作草坪草的种,被称为“中国草坪草”[27-28],广泛分布于美国南部和东部、东南亚以及澳大利亚北部和东部热带地区[29]。有植株低矮、生长缓慢、耐贫瘠、抗病虫性强、耐粗放管理的特点,能以低成本的养护管理获得较高质量的草坪,是绿化建设的优良材料[30-32]。假俭草的抗旱能力在暖季型草中属于中等[31],提高假俭草的抗旱性可进一步扩大该草种的使用范围。MYB基因家族广泛存在于高等植物中,但目前,假俭草MYB转录因子基因家族鉴定及生物学功能尚未见报道。因此本研究基于假俭草在不同程度干旱胁迫下的转录组数据,通过生物信息学方法系统鉴定了假俭草R2R3-MYB基因家族成员,并对其进行蛋白理化性质分析、蛋白高级结构分析、染色体定位、系统进化树构建、保守基序及基因结构分析和顺式作用元件分析,为深入研究R2R3-MYB基因在假俭草抗旱方面所发挥的作用提供参考依据。
从已发表的文献中获取假俭草基因组数据[33],同时在planttfdb数据库(http://planttfdb.gao-lab.org/)下载拟南芥MYB基因家族蛋白序列。以隐马尔可夫模型(HMM)为基础,在Pfam数据库下载MYB DNA结构域PF00249。利用HMM软件,以PF00249为模型,初步筛选假俭草基因组的MYB候选基因;将拟南芥MYB基因蛋白序列作为查询序列,进行本地blast,再次鉴定假俭草基因组的MYB候选基因。然后将两次筛选获得的候选基因提交到NCBI中的Batch CD-search中,删除不含整个MYB保守结构域的蛋白序列,最终得到假俭草MYB基因家族成员。
利用TBtools中Protein Paramter Calc(ProtParam-based)预测R2R3-MYB基因编码蛋白理化性质;利用在线工具WoLF PSORT(https://wolfpsort.hgc.jp/)进行亚细胞定位的预测;通过TMHMM Server v2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)网站分析蛋白跨膜结构。
利用PSIPRED (http://bioinf.cs.ucl.ac.uk/psipred/)网站预测假俭草R2R3-MYB家族蛋白的二级结构;利用SWISS-MODEL(https://swissmodel.expasy.org/)软件预测并建构出候选蛋白的三级结构。
从假俭草基因组数据库注释文件中获取假俭草MYB转录因子在染色体上的位置信息,并进行统计整理。然后将假俭草MYB转录因子上的起始和终止位置信息以及假俭草染色体全长信息提交到在线分析工具MG2C(http://mg2c.iask.in/mg2c_v2.1/)绘制染色体定位模式图。
利用MEGA7.0中的ClustalW工具,将鉴定出的假俭草以及拟南芥R2R3-MYB类转录因子进行多重序列比对后,然后用MEGA7.0中的Neighbor-Joining(NJ)法构建系统进化树,选择Bootstrap method进行1000次重复,并利用在线工具EvolView(https://www.evolgenius.info/evolview-v2/#login)对进化树美化。此外,按照拟南芥MYB家族成员亚组分类对系统进化树进行分组。
将假俭草R2R3-MYB转录因子的氨基酸序列提交到在线软件MEME(https://meme-suite.org/meme/tools/meme),得到MYB蛋白序列的保守基序结果图,将motif的最大数值设为10,最后用TBtools(Gene structure view)进行可视化。
利用假俭草MYB转录因子的基因注释信息gtf文件,分析MYB家族的基因结构,并利用TBtools(Gene structure view)进行可视化。
利用TBtools(gtf/gff3 Sequences Extract)工具截取假俭草R2R3-MYB基因家族成员上游2000bp序列,并上传到PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)网站对顺式作用元件进行分析,最后将分析结果用TBtools(Simple Biosequence View)进行可视化。
本研究在课题组前期获得的假俭草野生型和突变体的转录组数据的基础上,分析了EoMYBs基因在假俭草野生型和突变体的不同组织(根、叶)的不同处理时间,分别为干旱处理后第 0(干旱前期)、7(干旱中期)、15(干旱后期)天的转录表达数据(干旱取样时间点的设置依据详情见文献[34]),并以|Log2(fold change)|≥1,FDR<0.01作为筛选条件,筛选差异表达的EoMYBs基因,获取代表EoMYBs基因表达水平的Log2-transform(FPKM)值,然后利用Tbtools(heatmap)软件,根据FPKM值绘制了EoMYBs基因在干旱前期、干旱中期和干旱后期处理下的表达模式热图。
从假俭草基因组中得到211个MYB成员,将这些序列根据结构域类型进行分类,其中1R-MYB类型94个,R2R3-MYB类型113个,3R-MYB类型4个。鉴于R2R3-MYB在植物转录因子功能研究中的重要作用,本研究以113个2R-MYB转录因子作为研究对象,参考染色体定位结果,分别编号为EoMYB1~EoMYB113。
通过TBtools软件分析得到的假俭草R2R3-MYB转录因子蛋白基因信息分析见表1。由表1可知,假俭草R2R3-MYB转录因子编码蛋白的大小和氨基酸数目差异很大,其长度为206(EoMYB34)~984 aa(EoMYB41),平均长度为337 aa;蛋白相对分子质量为22.46 kD(EoMYB34)~110.32 kD(EoMYB41),平均相对分子质量为36.61 kD;等电点为4.6(EoMYB32)~11.63(EoMYB66),其中等电点大于7的假俭草R2R3-MYB蛋白有52个,偏碱性,其余的61个小于7,偏酸性;有111个R2R3-MYB蛋白不稳定系数大于40,为不稳定蛋白,2个R2R3-MYB蛋白不稳定系数小于40,为稳定蛋白;70个R2R3-MYB蛋白疏水值小于-0.5,为疏水蛋白,其余43个大于-0.5,为亲水蛋白。所有的R2R3-MYB蛋白都定位在细胞核中,表明它们在细胞核中发挥调控作用功能;所有的R2R3-MYB蛋白都没有跨膜结构。
表1 假俭草R2R3-MYB蛋白特征
对假俭草R2R3-MYB转录因子家族蛋白二级结构进行预测分析(表2),结果发现EoMYBs蛋白二级结构均含有ɑ-螺旋、β-转角、延伸链和无规则卷曲,大部分无规则卷曲所占比例最高,介于29.51%(EoMYB58)~69.89%(EoMYB67)之间,说明无规则卷曲是这些EoMYBs蛋白结构的主要构成部分,其次是ɑ-螺旋,介于17.53%(EoMYB41)~55.89%(EoMYB100)之间,延伸链结构(2.80%~15.84%)和β-转角(2.44%~16.20%)相对较低;其中17个EoMYBs蛋白结构的ɑ-螺旋所占比例最高,其次是无规则卷曲、延伸链结构和β-转角。综合分析来看,各R2R3-MYB蛋白的ɑ-螺旋和无规则卷曲在二级结构中占比相对较高。
MYB蛋白的三级结构与其二级结构有一定联系,可以通过三级结构的结果来判断二级结构结果的准确性。通过SWISS-MODEL对假俭草R2R3-MYB家族蛋白进行三级结构预测发现(图1),R2R3-MYB蛋白都具有ɑ-螺旋、β-转角、延伸链和无规则卷曲空间结构,ɑ-螺旋和无规则卷曲是EoMYBs蛋白的主要结构元件,与二级结构预测吻合,且都含有螺旋-转角-螺旋(HTH)结构。
根据假俭草基因组GFF文件定位113个R2R3-MYB基因,结果如图2所示,113个R2R3-MYB基因在9条染色体中均有分布,在各个染色体上分布的数量不等,在4号染色体上最少,分布8个基因,占整个R2R3-MYB家族的7.08%;在5号染色体上最多,分布19个基因,占整个R2R3-MYB家族的16.81%。此外,发现在chr4以外的8条染色体上部分基因分布密集,推断这可能与R2R3-MYB转录因子基因的串联复制有关。
图2 假俭草R2R3-MYB基因的染色体定位
R2R3-MYB是植物MYB家族中最大的转录因子之一,对R2R3-MYB基因的研究最多。构建假俭草R2R3-MYB和拟南芥R2R3-MYB基因的系统进化树,如图3所示。根据拟南芥R2R3-MYB家族转录因子的分组方法[3],将假俭草R2R3-MYB基因划分为34个亚组,用E1-E34表示。假俭草中有28个亚家族与目前已分类的拟南芥亚家族一致;另有E3和E21亚组是假俭草特有的MYB类型,而E13(S6),E16(S15),E32(S10)和E34(S12)这四个亚组中没有EoMYBs。系统进化分析表明,属于同一亚家族的R2R3-MYB成员可能具有相同的保守功能。本研究中,假俭草E27亚组(EoMYB11,EoMYB58)与拟南芥S7亚组(AtMYB11,AtMYB12,AtMYB111)成员聚为一类,有研究表明S7亚组成员能够特异性地调控黄酮醇生物合成[35],表明假俭草E27亚组成员也可能参与黄酮醇的生物合成。假俭草E5亚组(EoMYB15,EoMYB40,EoMYB73,EoMYB89)和拟南芥S22亚组(AtMYB44,AtMYB70,AtMYB73,AtMYB77)聚为一类,S22亚组成员参与调控拟南芥的生长和发育过程[36],表明假俭草E5亚组成员可能也具有相同功能。目前,MYB在假俭草中发挥的功能尚不清楚,是否具有与拟南芥相应的功能和作用,还有待深入研究。
图3 假俭草与拟南芥R2R3-MYB家族系统进化树
通过在线网站MEME预测113个R2R3-MYB家族成员蛋白保守基序,结果如图4A所示。定义了10个特异性基序,命名为基序1~10。大多数motif基序分布在蛋白序列N端,部分分布在序列中间,更有少数分布于序列C端。其中,motif3,motif2是假俭草R2R3-MYB家族中最保守的基序,所有成员均含有该保守基序,其次保守的基序motif1,除EoMYB41外,其他112个成员均含有该基序,表明motif1,motif2和motif3是R2R3-MYB蛋白序列的重要组成部分。在该家族进化中,motif1,motif2和motif3的结构最为原始,可能具有最保守的功能,推测在此基础上逐步进化出其他基序,形成了功能上的多样化。
图4 基于假俭草R2R3-MYB基因结构的系统发育分析图
假俭草R2R3-MYB基因家族成员进行基因结构分析(图4C),各成员之间的非编码区UTR,CDS以及内含子存在差异。其中仅28个成员含有UTR区,EoMYB20仅含有3’端UTR;内含子数量在0~13之间,其中有11个成员没有内含子结构,大多数成员具有3个内含子,EoMYB13含有11个内含子,EoMYB23含有13个内含子。
启动子是基因表达调控的重要元件,为了分析假俭草R2R3-MYB基因家族成员启动子区上游2 000 bp的序列,利用plantcare在线软件进行分析,预测的顺式作用元件如图4B所示,可看出假俭草R2R3-MYB基因家族的表达调控机制复杂,启动子类型主要包括光响应、植物激素响应元件(脱落酸、茉莉酸甲酯、生长素、赤霉素、水杨酸)、胁迫响应元件(干旱、低温、防御与应激、创伤)、器官特异性表达(种子、胚乳、腭状中叶、根)以及分生组织表达、厌氧诱导、昼夜节律、细胞周期调节、黄酮类生物合成基因的调控元件。
其中,所有基因家族成员的启动子都存在光响应元件,101个家族成员具有脱落酸响应元件,100个家族成员具有茉莉酸甲酯响应元件,75个家族成员具有生长素响应元件,66个家族成员具有赤霉素响应元件,32个家族成员具有水杨酸响应元件;63个家族成员具有干旱响应元件,51个家族成员具有低温响应元件,32个家族成员具有防御与应激响应元件;88个家族成员具有厌氧诱导响应元件。在这些基因家族成员中,最少的含有5个类型顺式作用元件,包括EoMYB26,EoMYB43,EoMYB58,EoMYB98;最多的含有14个类型顺式作用元件,包括EoMYB25,EoMYB30,EoMYB59,EoMYB60,EoMYB70,EoMYB71,多数家族成员含有8~12个类型的顺式作用元件。这些结果表明,假俭草R2R3-MYB基因家族成员调控机制复杂,在光响应、植物激素调控、逆境胁迫响应以及氧化损伤响应,尤其在光响应过程中起重要作用。
利用假俭草野生型和抗旱突变体的叶片和根系在干旱前期、中期和后期3个时期的转录组数据,提取113个R2R3-MYB基因对应的FPKM值,绘制热图(图5)。结果表明,随着干旱程度的增加,假俭草R2R3-MYB基因的表达模式出现差异化。在对叶片进行干旱胁迫后得到的转录组数据中,有9个基因在野生型和抗旱突变体中均未表达;与假俭草野生型相比,有39个基因在抗旱突变体的一个或多个干旱时期中的表达量提高,30个基因主要在干旱中期表达,10个基因主要在干旱前期表达,10个基因主要在干旱后期表达,2个基因在干旱前、中期表达,4个基因在干旱前、后期表达,2个基因在干旱中、后期表达,1个基因(EoMYB107)在干旱前、中、后期均进行表达。其中在干旱中期表达的基因,其基因表达量都较高。
图5 EoMYBs基因在叶片(左图)和根系(右图)干旱前期、干旱中期、干旱后期表达模式热图
在对根系进行干旱胁迫后得到的转录组数据中,有3个基因在野生型和抗旱突变体中均未表达;与假俭草野生型相比,有58个基因在抗旱突变体的一个或多个干旱时期中的表达量提高,36个基因主要在干旱后期表达,34个基因主要在干旱中期表达,16个基因主要在干旱前期表达,其中8个基因在干旱前、中期表达,12个基因在干旱中、后期表达,4个基因在干旱前、中、后期均表达。与假俭草野生型相比,在对抗旱突变体的叶片和根系处理中,有2个基因(EoMYB3,EoMYB27)在干旱前期表达量都增高,7个基因(EoMYB3,EoMYB9,EoMYB26,EoMYB43,EoMYB58,EoMYB94,EoMYB-109)在干旱中期表达量都增高,3个基因(EoMYB26,EoMYB37,EoMYB38)在干旱后期表达量都增高。推测这些R2R3-MYB基因在假俭草抗旱突变体响应干旱胁迫过程中发挥着重要作用。
本研究通过生物信息学技术首次对假俭草R2R3-MYB基因家族进行系统分析,共鉴定出113个R2R3-MYB家族成员,在9条染色体上均有分布,且大多分布在染色体两端,在番茄(Solanumlycopersicum)、辣椒(Capsicumannuum)中也有类似的分布[13,37]。基因复制在生物进化中很常见,本研究中发现在chr4以外的其他染色体上分布着关系紧密的基因簇,推测可能是通过基因串联复制事件扩大假俭草R2R3-MYB基因家族成员的数量从而使其功能更丰富,这种扩张可能与紫花苜蓿(Medicagosativa)[38]一样。假俭草R2R3-MYB基因家族成员氨基酸大小、分子量、等电点等差异较大,均定位于细胞核且无跨膜结构。
本研究参照拟南芥R2R3-MYB转录因子的分组方式,将假俭草R2R3-MYB转录因子归入34个亚家族,其中28个亚家族成员可归类到已知的拟南芥亚家族中,假俭草R2R3-MYB转录因子未分布于S6,S10,S12和S15四个亚组。其中一些假俭草R2R3-MYB转录因子与拟南芥在同一分枝中,说明这两个物种基因家族成员可能具有部分相同的功能,如居利香等[13]研究发现CaMYB10,CaMYB46与拟南芥S1亚组中的AtMYB30,AtMYB96聚为一类,认为CaMYB10,CaMYB46与AtMYB30,AtMYB96功能相似,都可通过参与应激响应而影响辣椒素的合成。本研究中,假俭草的E1亚组(EoMYB6,EoMYB62,EoMYB81,EoMYB97,EoMYB-98,EoMYB99和EoMYB202)与拟南芥S21亚组成员聚为一类,已有研究表明拟南芥该亚组成员与次生细胞壁生物合成、木质素生物合成有关[39],其中AtMYB52还与耐盐抗旱相关[40],推测假俭草E1亚组成员也可能发挥相同的功能,在植物次生生长过程、非生物胁迫中发挥作用。此外,拟南芥中亚组S1,S2,S18,S20和S22成员响应非生物胁迫[3],推测这些与拟南芥相同分组的假俭草R2R3-MYB家族成员(亚组E23,E26,E8,E9和E5)也可能与非生物胁迫相关。但是,有4个亚组中仅包含拟南芥成员,推测假俭草中没有MYB基因能行使这些功能,这与Aoyagid等[41]的研究结果相似。然而,MYB基因在假俭草中发挥的功能尚不清楚,是否具有与拟南芥相应的功能和作用,还有待深入研究。
对R2R3-MYB基因家族蛋白保守基序、基因结构以及顺式作用元件分析可知,该家族成员几乎都含有motif3,motif4或motif9,motif2和motif1,且多含有3个内含子;在所有的R2R3-MYB转录因子中,MYB结构域均分布在基因的N端,这些都说明R2R3-MYB蛋白并非随机分布,是相对保守的。通过对顺式作用元件分析可知,R2R3-MYB蛋白表达调控机制复杂,主要与光响应、植物激素响应、胁迫响应等相关,说明假俭草R2R3-MYB基因广泛参与了植物的生命过程。
基因表达模式与基因功能关系密切,通过研究假俭草根系和叶片受不同干旱胁迫时期中R2R3-MYB基因表达情况的变化,发现在干旱胁迫各阶段发挥作用的功能基因。已有研究证明R2R3-MYB转录因子广泛响应植物非生物胁迫,比如,AtMYB41受干旱诱导,在干旱胁迫期间通过调节细胞扩张和角质层沉积以响应非生物胁迫[42];由干旱胁迫诱导的AtMYB96和AtMYB2通过激活脱水反应基因(如RD22)正调节植物的耐旱性[17,22]。基于转录组数据,本研究发现部分R2R3-MYB基因在假俭草野生型和突变体的根系和叶片受干旱胁迫的不同时期特异性表达。例如与假俭草野生型相比,在对突变体的叶片和根系处理中,EoMYB3和EoMYB27在干旱前期表达量高,EoMYB3,EoMYB9,EoMYB26,EoMYB43,EoMYB58,EoMYB94和EoMYB109在干旱中期表达量高,EoMYB26,EoMYB37,EoMYB38在干旱后期表达量高,推测这些基因是差异表达基因,并特定时期下高表达丰度的基因可能参与假俭草突变体干旱胁迫响应过程。
本研究在假俭草中共鉴定到113个R2R3-MYB转录因子家族基因,并通过生物信息学分析了其理化性质、蛋白结构、系统进化、染色体定位、基因结构、顺式作用元件。同时,通过分析假俭草在不同干旱处理下的根系和叶片表达特性,发现与假俭草野生型相比,抗旱突变体叶片中有39个基因在一个或多个干旱时期中的表达量提高,抗旱突变体根系中有58个基因在一个或多个干旱时期中的表达量提高,推测这些R2R3-MYB基因在响应干旱胁迫过程中发挥着重要作用。这些结果为进一步研究假俭草R2R3-MYB基因家族成员的功能提供了理论依据和参考。