安爽, 刘金莲, 占晓慧, 李永强,2, 宗宇,2*
(1.浙江师范大学 化学与生命科学学院,浙江 金华 321004; 2.浙江省特色经济植物生物技术研究重点实验室,浙江 金华 321004)
蓝莓(Vacciniumspp.)是杜鹃花科越橘属植物,富含花青素及其他营养成分,具有多种功效,被世界粮农组织推荐为五大健康水果之一,因此,在国内也有大量种植,在研究利用方面也越来越受科学家的关注,各种关于蓝莓的性状标记、基因克隆及系谱分析等也得到广泛研究。
蓝莓适应性强,喜弱酸性土壤,一般要求土壤pH值为4.5~5.5,但国内土壤性质差异较大,蓝莓在种植过程中易受到土壤酸碱性的影响[1],这也是蓝莓得不到广泛种植的原因之一。为了加快我国蓝莓产业的发展,扩大蓝莓的栽培地域,了解蓝莓在生长发育过程中能够响应土壤pH胁迫的相关基因是至关重要的,可以为进一步研究蓝莓相关基因奠定基础,提高蓝莓对土壤pH胁迫的适应能力,从而可以利用国内盐碱地、酸性土壤等进行蓝莓栽培,进而提高我国的蓝莓经济效益。
转录因子基因家族中,碱性亮氨酸拉链(basic region/leucine zipper motif,bZIP)类转录因子广泛存在于所有真核生物。bZIP类转录因子参与植物生长、发育、成熟、衰老、损伤、防御以及对各种环境胁迫的响应过程,因此,bZIP转录因子基因在植物生长过程中对抗寒性、耐盐性、耐pH胁迫等都具有较重要的调控抗逆作用[2-3]。蓝莓的种植普遍受土壤pH的影响,因此,研究蓝莓bZIP转录因子基因以及其在根系pH胁迫条件下的表达模式,对蓝莓在中国不同酸碱度土壤成功并高效率培育种植具有重要意义。
拟南芥数据库中下载氨基酸序列,在北京大学转录因子数据库,从家族列表中选择要找的家族名,使用makeblastdb建立蓝莓氨基酸序列blastp本地数据库,利用拟南芥的氨基酸序列对蓝莓氨基酸本地数据库进行blastp比对,同时利用HMMER进行模块化检索。
从Pfam蛋白家族数据库(http://pfam. sanger.ac.uk/)下载bZIP转录因子家族相关结构域bZIP_1(PF00170)、bZIP_2(PF07716)、bZIP_Maf(PF03131)的HMMER索引文件[4],执行hmmsearch利用索引文件从蓝莓氨基酸序列中进行搜索,调取blastp和hmmsearch检索到的序列ID,根据ID利用Excel脚本去除重复序列;从蓝莓氨基酸序列中调取出来进行CDD(conserve domain database)分析。将调取出来的gff文件上传到http://gsds.cbi.pku.edu.cn/进行基因结构分析,经过鉴别之后获取最终的氨基酸序列ID,进一步筛选调取出蓝莓bZIP家族氨基酸序列,再根据人工去冗余得到最终的序列。
下载鉴定到的蓝莓bZIP蛋白质序列,利用ExPASy提供的在线工具ProtParam (http://web.expasy.org/protparam/)对得到的蓝莓bZIP蛋白质序列进行氨基酸数目、理论分子量、理论等电点、脂肪指数、亲水性的平均值等理化性质基本参数的分析,亚细胞定位则采用CELLO服务器V2.5进行鉴定[5]。了解蓝莓bZIP转录因子基因的一些理化性质,为之后的基因家族分类等提供重要依据。
利用生物学软件MEGA 7.0中的Clustal W程序将鉴定到的bZIP氨基酸序列进行多重序列比对,生成.meg格式文件,用邻近法(neighbor-joining)进行聚类分析并将所得到的比对结果构建系统发育进化树,具体参数为:Model为p-distance,Bootstrap值为1 000,其余参数为默认[6-11]。将北大基因库下载的拟南芥序列与得到的序列进行整合,利用MEGA软件中的Clustal W程序对合并序列进行alignment处理,进行序列联配操作,最后利用IQ-tree进行建树。将IQ-tree得到的结果利用Fig-Tree软件打开,在Fig-Tree中对得到的进化树进行分枝粗细、样本名大小及颜色调整等处理,同时对比mega和Fig-Tree生成的进化树,选择能够更直观地展现基因进化趋势及特点的进化树。根据拟南芥的分类标准[12]对结果进行分类,分析蓝莓转录因子和拟南芥转录因子之间的同源进化关系。
将调取出来的氨基酸序列上传到http://meme-suite.org/tools/meme,使用MEME在线分析工具对蛋白质序列进行motif保守结构域分析(具体参数默认)[13],预测蓝莓bZIP蛋白的保守基序序列。利用MEGA将蓝莓氨基酸序列以nwk文件形式导出,同时利用TB-tools(TB-tools:https://github.com/CJ-Chen/TBtools)软件,导入之前所得到的MEGA构建进化树的nwk文件、相关基因的gff或者gff3文件、MEME的分析结果文件:meme.xml,绘制三图合一,并进行位置、颜色、距离等的调整,得到一张合适的进化树、基因结构与motif结合的图片,观察分析转录因子序列的保守结构域、基因结构等。
下载蓝莓不同组织各个基因的表达量FPKM(fragments per kilobase per million)以及蓝莓根系在不同pH下不同基因的表达量FPKM[14]。通过linux系统将鉴定到的蓝莓bZIP转录因子家族基因与2个测序数据分别进行比对,得到不同组织bZIP转录因子基因的表达Reads数据以及蓝莓根系在不同pH下bZIP转录因子基因的表达数据。下载安装R软件和RStudio软件,利用RStudio软件绘制各组织器官以及不同pH下根系的表达热图。
利用bZIP相关结构域的HMM文件,通过HMMER软件对蓝莓基因组序列进行比对搜索后,共得到131个含bZIP结构域的bZIP转录因子。由序列ID可知,131个蓝莓bZIP家族基因分散在蓝莓的多条染色体上。因蓝莓是四倍体植物,为方便之后与拟南芥转录因子一同构建系统进化树,并进行同源序列比对,对得到的131个蓝莓bZIP转录因子基因进行人工去冗余,最后得到31个bZIP转录因子基因,分别命名为VcbZIP1-VcbZIP31。根据序列ID对应的染色体位置进行分组编号,发现在2号染色体以及12号染色体上的基因序列最多,有6条,在5号、8号以及10号染色体上的基因序列最少,只有一条。
将蓝莓中bZIP基因家族成员按照其所在的染色体位置进行排序,将每条序列通过ExPASy处理进行理化性质分析,分析结果如表1。由理化参数分析结果可知,蓝莓bZIP转录因子家族基因中最长的bZIP蛋白(VcbZIP10)有916个氨基酸,最短的bZIP蛋白(VcbZIP5)有197个氨基酸,分子量从22 325.03(VcbZIP5)到100 534.47(VcbZIP10)不等,等电点从5.19(VcbZIP28)到9.70(VcbZIP30)不等,脂肪指数从52.48(VcbZIP18)到90.83(VcbZIP24)不等,亲水性的平均值在-0.941(VcbZIP20)到-0.199(VcbZIP10)不等。根据CELLO的预测显示,蓝莓bZIP基因大部分位于细胞外(extracellular)及细胞外膜(outer membrane),少部分定位于细胞质(浆)(cytoplasmic)以及内膜周质(periplasmic)。由于ExPASy在线工具上的蓝莓基因组数据并不完善,因此,目前尚存在一些转录因子(VcbZIP15)的相对分子质量、等电点等基本参数信息还不明确。
表1 蓝莓bZIP家族基因基本参数
蓝莓bZIP转录因子家族成员的基因比对拟南芥基因组数据库,得到拟南芥中同源性最高的基因和E值,这为研究蓝莓bZIP基因家族提供了参考。为更深入地了解蓝莓bZIP转录因子与拟南芥bZIP转录因子的同源进化关系,构建了蓝莓与拟南芥的系统进化树。由图1以及根据Jakoby等[15-16]对拟南芥bZIP基因家族的分类标准,再依据基因的聚类特点及bZIP结构域的一些特性,可以将蓝莓bZIP基因家族分为A组(9个)、B组(3个)、C组(1个)、D组(6个)、E组(3个)、F组(0个)、G组(3个)、H组(0个)、I组(4个)、J组(0个)、K组(1个)、M组(0个)及S(1个),共13组。其中A组所含有的成员最多,有9个;C组、K组和S组成员中所含的蓝莓bZIP基因成员数目最少,只有1个;F组、H组、J组、M组成员中虽然有拟南芥bZIP转录因子,但是没有蓝莓bZIP转录因子家族成员,因此,忽略这4组,只保留9个组(表2)。其余B组、D组、E组、G组、I组所含成员在3、4、6个数目不等。
表2 蓝莓bZIP家族的分类
图1 蓝莓bZIP与拟南芥bZIP转录因子系统进化树比较
图2所示,每个基因的基因结构、氨基酸长度特别是内含子、外显子等的数量和分布,都与进化有密切关系。VcbZIP25蛋白序列最长,一些蛋白序列很短,大部分基因都存在于5′-UTR和3′-UTR区域;另外,从图中可知每条蛋白序列所含有的保守基序的数量以及类型都存在差异,其在分布上的差异,可能表明每个基序的功能有所差异。VcbZIP29保守域最多,有4个保守域,VcbZIP31、VcbZIP13、VcbZIP4、VcbZIP27有3个保守域,分别是motif1、motif2、motif3,这5个家族基因都属于D组,其余序列都只含一个保守域(motif1)。motif1基序分布较广泛,在植物的生长发育或者逆境胁迫下发挥着巨大的作用。总体而言,大部分保守域位于3′端,少部分位于5′端。
图2 蓝莓bZIP转录因子构建树、基因结构和保守域三合一图
由图3可看出,大部分基因在植物各个组织在一天不同时间段以及果实发育的不同时期都有一定量的表达,并且不同bZIP转录基因在同一组织中的表达量不同,同一转录基因在不同组织器官中的表达量也有所不同,位于系统进化树中同一组的不同转录基因其表达模式相似,这说明该组成员中的基因在蓝莓的某个组织器官或者是在某个特定时期发挥着重要作用。VcbZIP27在蓝莓根部发育过程或是根部受到盐胁迫时其表达量明显高于其他基因,说明该组基因有可能参与蓝莓生长发育过程中根部的发育以及在非生物胁迫尤其是盐胁迫中发挥巨大作用,能够增强根部对盐的耐受性;VcbZIP20在蓝莓花期时的花、处于花瓣掉落期的花以及不同时期果实中表达量相对较高,而在根、叶等部位表达量相对较低;VcbZIP21、VcbZIP10、VcbZIP19在不同温度处理下的蓝莓、不同时间段的叶片、茉莉酸甲酯处理后1 h、茉莉酸处理后8 h表达量相对较高,而在根、叶、不同时期果实中表达量相对较少;VcbZIP28除了在根部表达量相对较低,在其他阶段表达量都相对较高,说明这些基因在蓝莓发育过程中参与多种生理生化的转录调控,发挥重要作用。VcbZIP6、VcbZIP30在茉莉酸甲酯处理后24 h的蓝莓、花瓣掉落时期的花、不同时期的果实中表达量相对于其他时期较高,说明这些基因在果实生长发育方面发挥着一定的作用;VcbZIP1、VcbZIP24、VcbZIP22、VcbZIP25、VcbZIP7、VcbZIP5、VcbZIP31、VcbZIP17、VcbZIP14、VcbZIP16、VcbZIP15、VcbZIP13、VcbZIP18、VcbZIP11、VcbZIP26、VcbZIP23、VcbZIP8、VcbZIP29基因相对其他基因表达量较低,在蓝莓全生长发育过程表达量相差不大;VcbZIP2、VcbZIP12、VcbZIP3基因在蓝莓生长发育过程中几乎不表达,推测其在蓝莓生长发育阶段没有参与一些生理生化过程,也可能是这些基因的转录活性太低;VcbZIP9、VcbZIP4在蓝莓花芽期表达量相对较高,而在其他时期几乎不表达,说明这些基因对蓝莓的开花具有一定的作用。
图3 bZIP转录因子在蓝莓不同组织的表达量
蓝莓bZIP转录因子基因在根系pH 4.5和pH 6.5下表达量存在差异(图4),VcbZIP10在pH 4.5和pH 6.5表达量都很高,说明蓝莓根系在受到pH胁迫时,VcbZIP10的表达不受影响;VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13在受到pH 6.5的胁迫下相对于其他基因表达量较高;其余的bZIP转录因子基因在抗酸碱性过程中几乎不表达,可能是在抗逆过程中没有参与相关的生理生化过程,也可能是因为其活性较低。
图4 蓝莓bZIP转录因子基因在根系不同pH胁迫下的表达量
蓝莓bZIP转录因子基因预测已经完成,但关于蓝莓转录因子的研究仍较少,本研究主要运用生物信息学的方法,从蓝莓中鉴定出131个bZIP转录因子基因,经过人工去冗余得到31个转录因子基因,这些基因分布在10条染色体上。根据构建蓝莓与拟南芥bZIP转录因子基因的同源进化关系,将31个转录因子基因分为9组,分别是A组(9个)、B组(3个)、C组(1个)、D组(6个)、E组(3个)、G组(3个)、I组(4个)、K组(1个)及S组(1个),不同组内成员具有不同的功能。
据文献报道,一些基因家族成员的功能特征已在拟南芥中得到验证,如:A组bZIP转录因子基因的信号传递主要是依赖于ABA信号,在非生物胁迫(如寒冷、盐度或干旱等)下发挥激活作用,比如拟南芥A亚族中的ABA响应元件ABRE(ABA response element)、脱落酸应答元件结合因子ABFs(ABA-responsive element binding proteins)等;B组和K组成员主要是作为进化保守内质网(ER)应力响应的重要调控因子,增强对盐处理的耐受性;C组和S组成员形成一种C/S1-bZIP网络,作为信号中枢,以促进能量、营养饥饿导致的新陈代谢适应与生存;D组包括TGA因子(TGAs),受水杨酸(SA)诱导,NPR1是其转录共激活因子,在遇到生物营养病原体时依赖于SA的防御,激素茉莉酸(JA)和乙烯(ET)则协调对坏死因子的防御。除了参与防御反应外,也参与控制解毒阳离子过程,因此,大多数D组bZIP提高了植物存活病原体和异生物胁迫的能力;E组成员与花粉萌发和花粉管生长有一定的联系;G组成员中GBF1是蓝光依赖性下胚轴扩张的负调节因子,对HY5和HYH具有拮抗作用,此外还能促进侧根发育和自然衰老;I组成员中VIP1作为T-DNA转移的宿主因子,具有低硫耐受性、感受信号等功能。在bZIP转录因子基因家族中,A、B、H及S亚族bZIP基因主要参与植物非生物胁迫响应及激素信号转导过程,根据同源进化关系,推测与拟南芥同一组的蓝莓直系同源基因也可能参与蓝莓生长发育的生理生化作用。
根据RStudio软件制作热图,发现相同转录因子基因在蓝莓不同组织器官中表达量有所差异,不同基因在蓝莓同一部位表达量也存在差异。研究结果表明,bZIP转录因子在蓝莓生长发育过程中表现出组织特异性表达,但VcbZIP2、VcbZIP12、VcbZIP3等在蓝莓生长发育过程中几乎不表达,其余基因在蓝莓不同组织器官的表达量几乎无差异。
研究发现,在蓝莓bZIP转录因子基因中,VcbZIP10、VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13、VcbZIP12在蓝莓受到pH胁迫条件下的表达量相对于正常pH时较高,推测上述基因所在的B组、C组、D组、E组等基因在植物抗pH胁迫条件下参与调控作用。