孙颖琦, 孟亚轩, 赵心月, 王凤霞, 瓮巧云, 赵治海, 刘颖慧, 袁进成
(1.河北北方学院农林科技学院, 河北 张家口 075000;2.张家口市农业科学院, 河北 张家口 075000)
bHLH(basic/Helix-Loop-Helix)家族具有碱性-螺旋-环-螺旋结构,广泛存在于动植物及微生物中[1],在植物生长发育过程中起重要调控作用。bHLH转录因子因含有bHLH结构域而被命名,Murre等[2]1989年首次在动物中发现。Ludwig 等[3]最先从玉米R基因中发现bHLH转录因子,玉米bHLH转录因子对花青素合成起重要作用。有研究表明,拟南芥MfbHLH38通过提高保水能力,调节渗透压平衡,减少胁迫诱导的氧化损伤,参与ABA依赖的胁迫响应途径,提高拟南芥对干旱和盐碱胁迫的耐受性[4];大麻bHLH基因参与了次生代谢物质的合成[5];在甜橙中多个bHLH转录因子相互作用调控开花、光形态建成和花色苷合成过程;在叶、花、果实和愈伤组织中大多数CsbHLH基因均有表达[6]。
谷子(SetariaitalicaL.)具有抗旱、耐瘠薄特性[7],因其含有丰富的蛋白质、维生素和氨基酸等营养物质,食用价值高[8],谷子秸秆中含有丰富的营养成分,易于被家畜吸收利用,因此谷子是重要的粮饲兼用型作物[9]。谷子全基因组测序已经完成,为后续生物信息学挖掘谷子功能基因提供重要支撑[10-11]。近年来,bHLH基因家族在玉米、拟南芥、番茄多种植物中得到鉴定[12-13],但关于谷子bHLH基因家族研究还较少。本研究通过对谷子bHLH基因家族进行生物信息学鉴定分析,为进一步探索谷子bHLH转录因子的功能奠定基础。
从Pfam数据库查找下载bHLH转录因子蛋白结构域的隐马模型文件(Pfam号码:PF 00010)[14],通过Gramene网站里plant Genes基因组获取Gene stable ID和Transcript stable ID,利用SMART和InterPro软件对获取序列进行筛选鉴定并去除冗余,共得到151个bHLH蛋白序列。通过Ensemble Plants网站查询得到染色体位置,开放阅读长度和外显子数量等基因信息[15]。bHLH转录因子蛋白质氨基酸数量、分子量和理论等电点等理化性质用在线软件ExPASy中ProtParam模块进行分析[16]。
利用MapChart软件,将在Ensemble Plants查询的谷子染色体长度和谷子bHLH转录因子位置信息,绘制成bHLH转录因子染色体定位图。
使用Clustal W和ProSite在线软件对谷子bHLH蛋白结构域位置进行序列比对。利用MEGA 6.0软件中邻比法构建系统进化树(Bootstrap=1 000)[17]。通过上述方法对短柄樱桃(PrunuspseudocerasusL.)和水稻(OryzasativaL.)bHLH转录因子家族构建系统发育树,参数设定为默认值。
通过MEME软件对谷子bHLH转录因子进行蛋白基序预测(最小宽度为44,最大宽度为200),利用Welogo 3软件分析得出谷子bHLH DNA结合结构域Motif(Stacks per Line设置为63)[18],利用各基因位点出现频率最高基因组成的保守序列,在SWISS-MODEL网站里预测三维模型并获取螺旋结构,根据上述方法对二穗短柄草(BrachypodiumdistachyonL.)、绿豆(VignaradiataL.)和水稻(OryzasativaL.)等蛋白结构进行预测,用SuperPose Version 1.0软件对各物种进行比较[19],分析各物种间蛋白结构差异。
Phytozome数据库中获取谷子151个bHLH转录因子在不同诱导下RNA-seq数据,包括强光诱导两周后的叶片、蓝光诱导的地上组织、干旱诱导的根、尿素诱导的根、硝酸诱导的根、正常光诱导的根、黑暗诱导的地上组织、强光诱导一周的芽以及红光诱导的地上组织,利用TBtools软件绘制谷子bHLH基因家族表达模式热图[20]。
通过SMART和InterPro在线软件对从Gramene网站里plant Genes 63基因组获取的Gene stable ID及Transcript stable ID进行检测鉴定,去除冗余后获取谷子具有bHLH结构域的基因序列。在谷子基因组数据库中共鉴定出151个bHLH转录因子,分别命名为SibHLH1~SibHLH151(表1)。151个bHLH蛋白序列差异较大,氨基酸长度从85~776 aa变化,分子量从9.61~80.09 kD变化,开放阅读框长度为449~6 920 bp,含有1~13个外显子,理论等电点介于4.56~10.09之间。在筛选出来的151个bHLH蛋白中,有46个蛋白的等电点大于7,占30.5%呈弱碱性,只有1个蛋白(SibHLH 136)为中性,占0.7%,68.9%的bHLH蛋白等电点小于7,大部分呈弱酸性。
表1 谷子bHLH基因家族信息
根据提供的151个SibHLH转录因子在染色体上的起始位置信息,绘制出SibHLH基因染色体定位模式图(图1),结果发现,在谷子9条染色体上,SibHLH1~SibHLH151在9条染色体上都有分布,SibHLH转录因子呈不均匀分布,其中5号染色体分布数量最多为28个,9号染色体上分布最少为4个。
利用MEGA 6.0软件构建谷子bHLH基因家族的进化树,可将bHLH家族划分成 18个亚家族(图2)。其中,第18亚家族中包含bHLH成员数量最多,含有15个,第15亚家族中bHLH转录因子的成员最少,仅有3个。根据谷子bHLH转录因子系统发育树可以得出,序列长度和结构域的位置相似的bHLH蛋白聚集在一起。
为更好研究谷子bHLH基因家族进化规律,利用MEGA 6.0软件对鉴定谷子bHLH家族的151个成员、双子叶植物纲短柄樱桃bHLH家族的111个成员和单子叶植物纲水稻的bHLH家族的121个成员进行系统发育进化树比对(图3)。进化分析结果表明,383个bHLH蛋白划分为26个亚家族,其中谷子bHLH蛋白存在于24个亚家族中。发现大部分谷子bHLH蛋白与短柄樱桃、水稻不同亚家族的bHLH蛋白聚集在一起,说明不同物种间bHLH具有较高的保守性。有2个亚家族中不含有谷子bHLH蛋白,这种情况可能是谷子bHLH家族在基因演变过程中发生扩增或缺失导致的。几乎所有的谷子bHLH蛋白与水稻bHLH蛋白都聚集在不同的亚家族中,与短柄樱桃相比,谷子bHLH蛋白与水稻同源性更高。
利用ProSite在线软件对谷子bHLH蛋白结构域分析,绘制成结构域示意图(图4)。发现所有谷子bHLH蛋白均含有保守的bHLH DNA结合结构域,SibHLH 23、SibHLH 42、SibHLH 78、SibHLH 90、SibHLH 105、SibHLH 109以及SibHLH 142还具有MYC/MYB结构域。MYC结构域具有一个亮氨酸拉链结构,对植物根或花的发育有重要作用[21],MYC和MYB在拟南芥基因的脱水和脱落酸诱导表达中都起转录激活作用[22]。研究还发现,SibHLH 16含有bHLH蛋白和MYC/MYB蛋白结构域,SibHLH 16的氨基酸序列最长,可能具有更多的遗传物质。
使用Clustal X软件对151个谷子bHLH基因家族成员保守结构域进行分析,利用在线软件Weblogo 3绘制bHLH蛋白的保守结构域氨基酸位点分布图(图5)。结果显示,谷子bHLH结构域由60个左右的氨基酸组成,含有2个α-螺旋结构,大部分bHLH保守域氨基酸成员在碱性氨基酸区含有典型的H 5-E 9-R 13序列,少数含有R 8-E 9 序列,这序列对靶基因与植物bHLH蛋白特异结合起至关重要的作用。2个α-螺旋区内的22位点和48位点的亮氨酸(Leu)高度保守,27位点上的保守结构为脯氨酸(Pro),对同源或异源二聚体的形成起一定作用。
利用MEME Suite在线工具对谷子151个bHLH家族成员进行基序(motif)预测,预测结果用TBtools可视化(图6),发现谷子bHLH家族鉴定出10种motifs,用10个不同颜色来表示不同的motif,其中 motif 1和 motif 2是谷子bHLH蛋白的保守基序,大部分谷子bHLH家族成员同时含有motif 1和motif 2,序列SibHLH 105、SibHLH 109和SibHLH 142家族成员的motif最为复杂,含有4个不同的motif。
通过SWISS-MODEL在线软件分析不同物种各基因位点出现频率最高的保守基序,预测不同物种bHLH蛋白的三级结构(图7),发现谷子bHLH蛋白的bHLH 3 D DNA结构域含有2个α-螺旋结构,其他物种bHLH蛋白三级结构主要由α-螺旋构成。利用在线软件Superpose Version 1.0将不同物种间bHLH蛋白3 D结构域进行对比[23],可以得出谷子与樱桃(0.79)、拟南芥(1.08)、二穗短柄草(0.72)、绿豆(1.09)三级结构差异值,谷子与水稻的三级结构域差值最小(0.08),与多物种进化树分支的聚集情况相似,证明谷子bHLH转录因子与水稻更同源,二者之间具有最高的亲缘关系,而谷子与大麦的比值(1.78)差距最大。通过不同物种蛋白3 D结构可以发现,谷子bHLH蛋白的三级结构与水稻、樱桃、拟南芥和二穗短柄草更保守,绿豆和大麦之间的三级结构较为相似。
从Phytozome数据库中获取151个谷子bHLH家族基因在不同诱导条件下和不同组织的RNA-seq数据,TBtools将结果可视化,绘制基因表达热图(图8)。结果发现,所有的bHLH转录因子在谷子中组成型表达,SibHLH 3、SibHLH 10、SibHLH 31、SibHLH 35、SibHLH 37、SibHLH 44、SibHLH 78、SibHLH 80、SibHLH 111、SibHLH 115以及SibHLH 122在强光诱导两周后的第1片叶至第6片叶、光诱导的根、干旱诱导的根、硝酸诱导的根、尿素诱导的根、强光诱导一周的芽、蓝光诱导的地上组织、黑暗诱导的地上组织以及红光诱导的地上组织中的表达量均明显高于其他基因的表达量,SibHLH68在干旱诱导的根、光诱导的根、硝酸诱导的根及黑暗诱导的地上组织中高效表达,其他基因几乎不表达(小于1)。SibHLH44在强光诱导两周后的第1片叶上的表达量最大,SibHLH31在强光诱导两周后的第2片叶和第5片叶中表达量最大,SibHLH80在正常光诱导的根和强光诱导的第1片叶中表达量最大。受胁迫调控诱导表达表明SibHLH基因执行更多的功能。
bHLH转录因子家族是真核生物中一个大家族,在植物生长发育、新陈代谢及低温胁迫等生命过程中发挥重要调节作用。苜蓿中鉴定出168个bHLH基因,苹果中获得175个bHLH转录因子,茶树已经发现120个bHLH家族成员,拟南芥中鉴定出162个bHLH基因[24-27],本研究中谷子获得151个bHLH转录因子,与以上物种数量相近,说明该基因家族在进化中没有出现大幅度扩增现象。染色体定位发现,谷子bHLH转录因子呈簇状分布,大麦、马铃薯和绿豆中bHLH转录因子同样存在簇状分布现象[28-29],bHLH转录因子在染色体上位置分布不均匀,呈现出2个或多个基因聚集在一起形成基因簇。理化性质分析得出大部分谷子bHLH转录因子呈弱酸性,与水稻和拟南芥的结果相似。
根据系统发育进化树的拓扑结构分析,大豆bHLH转录因子分为24个亚家族,芒果bHLH蛋白分17个亚家族,白菜bHLH蛋白分为24个亚家族[30]。本研究鉴定谷子151个bHLH蛋白分为18个亚家族,这与西洋参bHLH蛋白报道数量相一致。由系统发育树可以得出,单子叶植物水稻与谷子bHLH转录因子同源性更高。bHLH转录因子保守结构域中含有典型的H 5-E 9-R13序列,研究者发现,大豆、黑果枸杞、白菜和桑树等植物的bHLH转录因子保守结构域中均含有保守的H 5-E 9-R 13序列,与靶基因的结合有密切关系,而HLH区保守氨基酸残基对二聚体的形成具有一定影响。
bHLH转录因子在植物生长发育的各个阶段中发挥重要作用。bHLH表达模式研究发现,所有bHLH转录因子在谷子不同发育时期的各组织中均有表达,与水稻、大豆、白菜的报道一致。以上结果揭示了bHLH转录因子在植物生长发育过程中起调控作用,以及进化关系相近的成员可能发挥相似的生理功能以调控植物生长发育。表明这些基因可能具有不同生物学功能。近年来,bHLH转录因子的研究逐渐成为热点,但在谷子中研究还不深入。本研究对谷子中bHLH转录因子的理化性质、保守结构域、3 D蛋白结构及表达模式等进行生物信息学分析,为bHLH转录因子在谷子上的表达调控和功能的研究提供参考。