紫花苜蓿bZIP基因家族的鉴定、进化及表达分析

2017-09-08 03:40张正社闵学阳孙启忠刘文献
草业科学 2017年8期
关键词:蒺藜密码子苜蓿

齐 晓,张正社,闵学阳,孙启忠,刘文献

(1.中国农业科学院草原研究所,内蒙古 呼和浩特 010010;2.全国畜牧总站 全国草品种审定委员会办公室,北京 100125;3.草地农业生态系统国家重点实验室 兰州大学草地农业科技学院,甘肃 兰州 730020)

紫花苜蓿bZIP基因家族的鉴定、进化及表达分析

齐 晓1,2,张正社3,闵学阳3,孙启忠1,刘文献3

(1.中国农业科学院草原研究所,内蒙古 呼和浩特 010010;2.全国畜牧总站 全国草品种审定委员会办公室,北京 100125;3.草地农业生态系统国家重点实验室 兰州大学草地农业科技学院,甘肃 兰州 730020)

碱性亮氨酸拉链(bZIP)转录因子是真核生物转录因子中分布最广泛、最保守的一类蛋白。目前在许多植物中已发现大量的bZIP转录因子,这些bZIP转录因子成员广泛参与种子贮藏基因的表达、植物的生长发育、光信号传导、病害防御、生物和非生物胁迫应答以及ABA的敏感性等各种信号的反应。本研究首次从紫花苜蓿(Medicagosativa)全转录组水平鉴定出bZIP转录因子家族共包含138个基因,根据bZIP蛋白序列进行系统进化分析可以将其分为10类;对MsbZIP基因的系统进化分析表明该基因家族在分类上有很高的保守性。该转录因子家族的基因密码子偏好性分析表明,MsbZIP基因密码子偏好使用A/T碱基。此外,MsbZIP基因GO功能注释分析结果显示,138个MsbZIP基因最终分为23个GO分类,总体包括分子功能和生物学过程两类。相关性分析结果表明,共有372对基因表达相关性极显著(P<0.01)。本研究可为紫花苜蓿bZIP转录因子功能特性、进化历程和生物功能的深入研究奠定基础。

bZIP转录因子;紫花苜蓿;系统进化分析;密码子偏好性

转录因子对植物众多重要的生物学过程起关键性调控作用[1-2]。研究转录因子的转录调控网络及其生物学过程是了解转录因子功能特性的本质。截至目前,植物中至少有64个转录因子家族被鉴定[3]。作为植物中最大的转录因子家族之一,碱式亮氨酸拉链有多个不同的分类[4]。bZIP蛋白具有一个40~60个氨基酸组成的保守结构域,其包含1个碱性DNA结合域,可通过一个固定的N-x7-R/K结构与特异DNA序列结合;还包含一个亮氨酸拉链二聚体结构域与碱性区紧密结合,每7个氨基酸的第7位有一个亮氨酸以及其它疏水性残基位第3和第4位,亮氨酸拉链形成一个两亲性的α螺旋,可影响bZIP蛋白与DNA结合之前的二聚化[5]。该转录因子家族除了bZIP结构域外还包含其它具有转录活化功能的结构域,例如,R/KxxS/T和S/TxxD/E结构域,分别是Ca+独立蛋白激酶和酪蛋白激酶Ⅱ的磷酸化位点[6]。此外,脯氨酸富集区、谷氨酰胺富集区以及酸性结构域在bZIP基因的转录活化过程中也具有重要作用[7]。

截至目前,bZIP基因家族在多种植物全基因组水平得到了综合鉴定和预测。例如,在拟南芥(Arabidopsisthalianna)中鉴定出75个基因[5],葡萄(Vitisvinifera)中55个[8],水稻(Oryzasativa)中89个[9],大豆(Glycinemax)中131个[7],高粱(Sorghumvulgare)中92个[10],玉米(Zeamays)中125个[11],蒺藜苜蓿(Medicagotruncatula)中75个[12]。研究证明,bZIP可以通过与启动子区域的顺式作用元件相互作用,抑制或激活多个下游基因表达,从而参与转录调控过程。bZIP转录因子参与多个生物学过程,包括种子萌发与成熟、植物衰老、光形态建成、糖代谢等,特别是在非生物胁迫的抗逆反应中起重要作用,例如盐胁迫、干旱胁迫、低温胁迫、热激反应和生物胁迫等[13-16]。

豆科植物是第三大开花植物,包含了大约650属18 000种。就经济价值而言,豆科作物仅次于禾本科作物,排行第二,占世界作物总产值的27%[17]。紫花苜蓿(M.sativa)是全球栽培面积最大的牧草,大约有3 000万hm2[18]。近年来,由于高通量测序技术及生物信息学的快速发展,可以高效率、低成本的获取大量紫花苜蓿转录组数据[19-20],从而使得在转录组水平对紫花苜蓿基因家族进行分析成为可能,弥补了紫花苜蓿全基因组测序尚未完成这一实际问题。尽管bZIP蛋白的功能其它植物中已经有相关报道,但在紫花苜蓿中尚未见报道。本研究在紫花苜蓿全转录组范围内鉴定出bZIP转录因子家族共包含138个基因,并对该基因家族的系统进化、蛋白结构、表达谱进行了系统分析,通过CodonW等软件分析MsbZIP的CDS序列及其密码子偏好性规律,以期为紫花苜蓿bZIP基因功能的深入研究奠定基础。

1 材料与方法

1.1 紫花苜蓿bZIP转录因子的鉴定

112 262条紫花苜蓿unigene序列获取自AGED数据库(http://plantgrn.noble.org/AGED/)[20]。利用已鉴定出的75条蒺藜苜蓿bZIP转录因子cDNA序列同紫花苜蓿unigene序列进行BLAST(E-value=1e-005),搜索潜在的包含bZIP转录因子的紫花苜蓿unigene[12]。利用NCBI-CDD在线工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)对搜索出的unigene进行保守蛋白结构域鉴定。利用ORF Finder在线工具(http://www.ncbi.nlm.nih.gov/orffinder/)从unigene中获取CDS序列。经过去冗余后,最终共鉴定出138个假定的MsbZIP转录因子基因。

1.2 多序列比对,保守结构域鉴定及进化分析

利用MUSCLE在线工具(http://www.ebi.ac.uk/Tools/msa/muscle/)进行多序列比对,系统进化树利用MEGA 7.0(http://www.megasoftware.net/)邻接法构建,并对构建的进化树进行自举评估(Boot-strap),迭代次数为1 000,其它参数使用系统默认值。利用蒺藜苜蓿和紫花苜蓿的bZIP蛋白序列进行聚类分析。MsbZIP蛋白结构域通过MEME在线工具(http://meme-suite.org/tools/meme)查询。

1.3 密码子使用偏好性分析

利用CodonW软件计算有效密码子数(Enc)、CDS区的GC含量、密码子中第3位碱基的GC含量(GC3s)和相对同义密码子使用度RSCU(Relative synonymous codon usage)。

1.4 基因表达谱数据分析

紫花苜蓿基因表达谱数据下载自AGED数据库(http://plantgrn.noble.org/AGED/index.jsp)。利用WEGO在线工具(http://wego.genomics.org.cn/cgi-bin/wego/index.pl)进行GO分类。MsbZIP基因组织表达相关性利用R语言包分析作图。

2 结果与分析

2.1 蒺藜苜蓿bZIP转录因子的鉴定和命名

bZIP保守结构域有两个特征结构(碱性区域和亮氨酸拉链),这在拟南芥[5]、水稻[9]、葡萄[8]、高粱[10]、玉米[11]和蒺藜苜蓿[12]中都已得到系统的分析。本研究通过构建本地BLAST数据库,与蒺藜苜蓿bZIP蛋白序列进行tblastn比对,共鉴定出138个非冗余bZIP基因。通常bZIP基因按照每个基因在染色体上的位置顺序命名[5],但由于紫花苜蓿缺乏染色体数据,因此利用blast得到的contig先后顺序将紫花苜蓿bZIP基因命名为MsbZIP1-MsbZIP138(表1)。利用在线工具ExPASy对紫花苜蓿bZIP蛋白质大小、分子量、理论等电点及平均亲水性等理化性质进行分析发现,最长的蒺藜苜蓿bZIP蛋白(MsbZIP93)包含766个氨基酸残基,最短的蒺藜苜蓿bZIP蛋白(MsbZIP138)仅有76个氨基酸残基;分子量在8 789.3(MsbZIP138)~84 011.8 D(MsbZIP93);其理论等电点范围为4.67(MsbZIP126)~11.34(MsbZIP44);所有bZIP蛋白均表现为亲水性(表1)。

2.2 紫花苜蓿bZIP转录因子系统进化分析

为了研究bZIP转录因子在紫花苜蓿和蒺藜苜蓿中的系统进化关系,利用紫花苜蓿中的138条蛋白序列和蒺藜苜蓿中的75条蛋白序列用于系统进化树的构建。基于分析,将进化树分为10个分支(A-J)(图1)。在这10个分类中,A类中所包含的紫花苜蓿bZIP基因数目最多,有31个;J类仅包含3个紫花苜蓿bZIP基因,在所有分类中最少。本研究的分类结果同以前在蒺藜苜蓿中的研究有所不同[12]。例如,MsbZIP56、MsbZIP60、MsbZIP68和MsbZIP20、MsbZIP39、MsbZIP48、MsbZIP52在以前的研究中都在同一分类,本研究中被分到A类和I类。

2.3 MsbZIP转录因子其它保守结构域分析

bZIP结构域是bZIP转录因子家族的核心结构域,它可以优先地结合特异性顺式作用元件来调控基因的表达。然而,bZIP基因家族的功能多样性也由bZIP蛋白的其它保守结构域所影响[21]。本研究运用MEME在线分析工具对MsbZIP转录因子家族中其它保守结构域进行了搜索。如图2所示,结构域a和b拥有R/KxxS/T和S/TxxD/E位点,已有研究表明,这两个位点分别是Ca2+独立蛋白激酶和酪蛋白激酶Ⅱ的磷酸化关键位点[6,22]。拥有这两种结构域的MsbZIP蛋白分别有42和10个。结构域c中富含脯氨酸,是个典型的脯氨酸富集结构域。类似的结构域在拟南芥bZIP转录因子中已被鉴定,并且研究表明其具有转录激活的潜能[23]。

2.4 有效密码子数(ENc)和GC含量分析

ENc值(effective number of codons)为基因的密码子偏好性程度提供了一个客观的评判标准,代表特定基因中同义密码子非均衡使用的偏好程度。该值在20(每个氨基酸只使用1个密码子的极端情况)到61(各个密码子均被平均使用)之间,越靠近20偏好性越强。GC3s则表示密码子的第3位碱基中G+C的含量在第3位碱基总量中所占的比率[24]。本研究应用CodonW程序计算紫花苜蓿bZIP基因的ENc值、GC含量和GC3s值分别为50.71、0.438和0.340,ENc值大于50,表明紫花苜蓿bZIP基因各密码子在编码氨基酸时出现的频率比较一致;紫花苜蓿bZIP基因编码区GC含量较低,而GC3s值则更低,表明紫花苜蓿偏好使用以A、T结尾的密码子,且在整个编码区序列中A+T含量大于G+C。

表1 紫花苜蓿bZIP转录因子家族信息Table 1 Information of bZIP transcription factor family in Medicago sativa

续表1(1)

Contig名Contigname基因名Gene蛋白长度Proteinlength分子量Molecularweight/D理论等电点Isoelectricpoint亲水性GRAVYcontig_37902/contig_92921MsbZIP4626728998.56.32-0.676contig_10672MsbZIP4752057438.46.40-0.931contig_39771/contig_93602MsbZIP4825528538.65.49-0.646contig_37917/contig_43971/contig_9341MsbZIP4915617791.96.12-0.682contig_40634MsbZIP5016619031.49.56-1.035contig_44720MsbZIP512302529.68.88-0.774contig_44856MsbZIP5240043153.46.15-0.946contig_44857MsbZIP5340343104.46.28-0.890contig_100487MsbZIP5446651703.56.82-0.644contig_46814MsbZIP5566273152.55.35-0.663contig_4516MsbZIP5625227731.49.95-0.706contig_47473MsbZIP5733637342.56.77-0.691contig_47102/contig_93945MsbZIP5846851778.26.72-0.484contig_4843MsbZIP5924727567.05.21-0.747contig_44719MsbZIP6014516639.510.24-0.786contig_52156MsbZIP6139542344.66.47-0.898contig_52224MsbZIP6232235902.46.93-0.768contig_5187MsbZIP6332335440.86.28-1.068contig_525MsbZIP6443247444.66.33-0.797contig_524MsbZIP6543247461.76.33-0.792contig_54258MsbZIP6635939931.18.25-1.086contig_55177MsbZIP6717119464.47.91-1.249contig_51512MsbZIP6835240039.15.55-1.058contig_56382MsbZIP6914517063.39.29-0.821contig_56231MsbZIP7034837309.38.48-0.820contig_56702MsbZIP7115617389.59.39-0.571contig_58014MsbZIP7243046799.65.96-0.877contig_54246/contig_83980MsbZIP7336040517.85.88-0.813contig_58458MsbZIP74778899.59.52-0.064contig_109831MsbZIP7519222223.75.78-0.904contig_57604MsbZIP7633936991.75.23-0.581contig_60077MsbZIP7749955934.07.39-0.661contig_6033MsbZIP7831234775.55.78-0.727contig_56701MsbZIP7915617347.49.04-0.565contig_60073MsbZIP8031436294.68.87-0.520contig_60411MsbZIP8134438445.45.44-0.802contig_61320MsbZIP8236940210.35.84-0.737contig_62358MsbZIP8315016948.15.94-0.673contig_6004MsbZIP8415117379.59.45-1.032contig_63247MsbZIP8524428281.98.50-0.759contig_63540MsbZIP8612914830.69.57-0.847contig_65298MsbZIP8716418834.29.56-1.002contig_60352MsbZIP8834739611.15.84-0.388contig_65372/contig_83801MsbZIP8920121918.69.51-0.708contig_65299MsbZIP9016619039.59.17-0.916contig_65715MsbZIP9126729034.56.15-0.702

续表1(2)

Contig名Contigname基因名Gene蛋白长度Proteinlength分子量Molecularweight/D理论等电点Isoelectricpoint亲水性GRAVYcontig_66497MsbZIP9249655028.96.45-0.486contig_62304MsbZIP9376684011.85.48-0.642contig_66599MsbZIP9445350077.06.70-0.608contig_66878MsbZIP95469531557.89-0.701contig_69119MsbZIP9632035575.66.85-0.86contig_69861/contig_65646/contig_81601MsbZIP9715417563.76.12-0.645contig_70814MsbZIP9835240035.15.55-1.061contig_70815MsbZIP9933137900.85.64-1.119contig_740MsbZIP10031534894.08.65-0.788contig_75506MsbZIP10121323402.16.50-0.827contig_75507MsbZIP10234837239.28.48-0.841contig_71488MsbZIP10332236061.66.94-0.769contig_78410MsbZIP10425227681.39.91-0.696contig_785MsbZIP10515517200.45.49-0.801contig_7875MsbZIP10642145366.28.42-0.864contig_79144MsbZIP10738542572.19.47-0.638contig_80132MsbZIP10832434921.65.39-0.823contig_81598MsbZIP10913415810.86.41-0.785contig_17510MsbZIP11043046813.75.96-0.877contig_8344MsbZIP11131034956.17.91-0.866contig_82666MsbZIP11226429432.65.51-0.640contig_83802MsbZIP11337440047.48.99-0.836contig_84103MsbZIP11419022010.55.91-0.891contig_884MsbZIP11515117035.25.94-0.674contig_89122MsbZIP11623125131.96.76-0.773contig_9156MsbZIP11742245102.75.99-0.849contig_20780MsbZIP11839242468.16.94-0.737contig_92255MsbZIP11926930652.05.04-0.375contig_91658/contig_99266MsbZIP12043547583.49.26-0.768contig_93527MsbZIP12132535962.18.65-0.790contig_937MsbZIP12226929736.48.96-0.657contig_93936MsbZIP12337641550.99.47-0.689contig_9494MsbZIP12435840986.65.91-0.424contig_92447MsbZIP12514116040.28.82-0.494contig_95175MsbZIP12624526035.84.67-0.678contig_95174MsbZIP12721122790.49.01-0.883contig_96886MsbZIP12830432688.19.28-0.935contig_9793MsbZIP1292362792.29.16-0.779contig_9775MsbZIP13015718441.89.81-0.916contig_99960MsbZIP13157665547.76.10-0.350contig_95173MsbZIP13211312150.95.00-0.263contig_8996MsbZIP13336341229.86.57-0.508contig_63119MsbZIP13434939621.36.56-0.310contig_59936MsbZIP13546352009.36.52-0.552contig_6681MsbZIP13643146699.88.90-0.735contig_13727/contig_57971MsbZIP13737742550.97.87-1.020contig_99993MsbZIP138768789.39.39-0.032

图1 紫花苜蓿和蒺藜苜蓿bZIP基因的系统进化树Fig. 1 The phylogenetic tree of bZIP genes of Medicago sativa and Medicago truncatula

2.5 紫花苜蓿基因相对同义密码子使用度分析

相对同义密码子使用度(relative synonymous codon usage,RSCU)是指对于某一特定的密码子在编码对应氨基酸的同义密码子中的相对概率。RSCU值与氨基酸的使用及密码子的丰度无关,它能直观地反映出密码子使用的偏好性程度[25]。如果密码子的使用没有偏好,则该密码子的RSCU=1。当某一密码子的RSCU值大于1,则表明该密码子的使用频率相对较高,反之亦然。CodonW程序计算结果(表2)表明,在紫花苜蓿bZIP基因的密码子中,有偏好性(RSCU>1)的密码子共计27个,其中以G/C结尾的2个,以A/T结尾的25个。各氨基酸RSCU值最高的密码子分别是:TTT(Phe)、TTG(Leu)、ATT(Ile)、GTT(Val)、TCA(Ser)、CCT(Pro)、ACT(Thr)、GCT(Ala)、TAT(Tyr)、CAT(His)、CAA(Gln)、AAT(Asn)、AAA(Lys)、GAT(Asp)、GAA(Glu)、TGT(Cys)、AGA(Arg)、GGT/GGA(Gly)、TGA(终止密码子)。这20个密码子以G/C结尾的1个,以A/T结尾的19个。以上结果同样表明,紫花苜蓿偏好于以A/T结尾的密码子。

2.6 紫花苜蓿bZIP基因的功能分类

为了预测MsbZIP基因潜在的功能,利用MsbZIP基因的GO数据通过WEGO在线程序对紫花苜蓿bZIP基因进行功能注释(图3)。MsbZIP基因总体包括分子功能和生物学过程两类。138个MsbZIP基因最终分为23个GO分类。在分子功能分类中,具有分子结合功能的基因最多,有127个,占92%。其次是具有转录调节活性的基因,有119个,占86.2%。仅有1个基因具有分子结构功能,所占比例最少。基于生物过程,这些基因共分为18类。其中有129个基因具有代谢过程和细胞过程功能,所占比例最高,为93.5%;具有生长功能的基因仅有1个,所占比例最少,为0.7%。

2.7MsbZIP基因组织表达相关性分析

为了研究MsbZIP基因间的共表达关系,基于MsbZIP基因的转录组数据计算了皮尔逊相关系数(PCC)。结果表明,共有372对基因表达相关性极显著(P<0.01,双尾检验),其中有355对(95.43%)基因表达极显著正相关(r>0.9),17对(4.57%)基因表达极显著负相关(r<-0.9)。这表明这些基因可能参与同一生物过程的调控。进一步对40对同源基因(MsbZIP56/MsbZIP104,MsbZIP106/MsbZIP113,MsbZIP25/MsbZIP89,MsbZIP16/MsbZIP19,MsbZIP117/MsbZIP11,MsbZIP126/MsbZIP41,MsbZIP28/MsbZIP108,MsbZIP42/MsbZIP52,MsbZIP32/MsbZIP61,MsbZIP75/MsbZIP114,MsbZIP35/MsbZIP85,MsbZIP118/MsbZIP116,MsbZIP14/MsbZIP22,MsbZIP76/MsbZIP112,MsbZIP48/MsbZIP08,MsbZIP09/MsbZIP129,MsbZIP10/MsbZIP34,MsbZIP49/MsbZI-P97,MsbZIP71/MsbZIP79,MsbZIP62/MsbZIP103,MsbZIP83/MsbZIP115,MsbZIP36/MsbZIP46,MsbZIP107/MsbZIP123,MsbZIP68/MsbZIP98,MsbZIP73/MsbZIP81,MsbZIP04/MsbZIP23,MsbZIP50/MsbZIP47,MsbZIP72/MsbZIP110,MsbZIP40/MsbZIP119,MsbZIP63/MsbZIP66,MsbZIP55/MsbZIP93,MsbZIP31/MsbZIP77,MsbZIP26/MsbZIP54,MsbZIP58/MsbZIP92,MsbZIP06/MsbZIP86,MsbZIP88/MsbZIP124,MsbZIP34/MsbZIP18,MsbZIP64/MsbZIP65,MsbZIP100/MsbZIP121,MsbZIP59/MsbZIP105)进行了相关性分析,如图4所示。从对角线的方块区域可以看出这40个同源基因对可以分为6组。除了旁系同源基因对MsbZIP56/104,MsbZIP49/97,MsbZIP36/46,MsbZIP63/66,MsbZIP31/77,MsbZIP26/54,MsbZIP58/92和MsbZIP134/18分布在不同的组,其它旁系同源基因对均在同一组中(图4)。相关性分析表明,分布在同一组的旁系同源基因对同样也具有很高的相关性。例如,MsbZIP106与MsbZIP113(r=0.991,P<0.01)正相关,MsbZIP25与MsbZIP89(r=0.979,P<0.01)正相关。相反,非旁系同源基因之间也有相关性很高的情况。例如,MsbZIP88与MsbZIP16(r=-0.898,P<0.05)负相关,MsbZIP92与MsbZIP19(r=-0.831,P<0.05)负相关,MsbZIP28与MsbZIP41(r=0.815,P<0.05)负相关。

图2 紫花苜蓿bZIP蛋白的保守结构域Fig. 2 The conserved domain logo of Medicago sativa bZIP proteins

表2 紫花苜蓿bZIP基因的密码子用法Table 2 Codon usage of Medicago sativa coding sequences

Note: SRCU, relative synonymous codon usage.

图3 紫花苜蓿bZIP基因的GO分类Fig. 3 GO classifications of MsbZIP genes

3 讨论

bZIP蛋白家族广泛存在于真核生物中,响应多种生物和非生物胁迫反应,能调控生物的生长发育过程。bZIP基因在植物中分布广泛,通过多种植物研究发现,该类蛋白种类及数量在物种间存在差异[26]。随着大量紫花苜蓿转录组测序结果的公布,利用生物信息学技术可对紫花苜蓿bZIP蛋白家族进行全面系统地分析[27-29]。

本研究首次通过生物信息学手段对紫花苜蓿的转录组数据进行比对分析,从中鉴定出138个紫花苜蓿bZIP基因,比蒺藜苜蓿所鉴定的bZIP基因(75个)多一倍,这可能是紫花苜蓿基因组发生加倍所造成的。通过聚类分析与蒺藜苜蓿bZIP基因家族相比较,可将紫花苜蓿bZIP基因分为10个亚类。在这些亚类中,A和I类所拥有基因数目最多,分别有31个和25个基因,J组仅有3个基因,分别是MsbZIP55、MsbZIP93和MsbZIP128。在所有分类中,都包含了蒺藜苜蓿基因,说明紫花苜蓿和蒺藜苜蓿具有较高的同源性。同源性较高的基因,其功能也可能具有相似性。例如MsbZIP61与MsbZIP137具有较高同源性,而MsbZIP61基因与盐胁迫相关,推测MsbZIP137基因也可能与盐胁迫相关。MsbZIP23与MsbZIP38同源性较高,而MsbZIP47与MsbZIP132同源性较高,MsbZIP23和MsbZIP47基因受干旱胁迫诱导,推测MsbZIP38和MsbZIP132也可能与干旱胁迫相关[12]。

通过motif比对分析发现,在bZIP蛋白家族中除了主要结构域外还含有其它一些结构域。这些结构域中,最典型的R/KxxS/T和S/TxxD/E与磷酸化相关。本研究中发现紫花苜蓿有42个bZIP蛋白包含R/KxxS/T,有10个蛋白包含S/TxxD/E。结合前人研究结果可知,ABA的调控与磷酸化密切相关,从而推测具有这些结构域的基因可能与植物的抗逆性有关。在蒺藜苜蓿bZIP基因家族的研究中也发现类似结果[12]。 密码子偏好性在蛋白质的结构功能、生物信息学等研究中具有重要意义,受到了广泛的关注。研究发现,密码子使用偏好性受多种因素影响,例如基因碱基组成、表达水平等[30]。前人研究表明,禾本科植物少用或避免使用以A或T结尾的密码子,偏好于使用以G或C结尾的密码子,而双子叶植物则相反[31-32]。这与紫花苜蓿bZIP基因的密码子偏好性结果相一致(表2)。

图4 紫花苜蓿bZIP基因的相关性分析Fig. 4 Correlation analysis of MsbZIP genes

GO功能分类是在某一功能层次上统计蛋白或基因数目及其组成的方法。通过GO分类发现,共有138个MsbZIP基因与23个GO分类匹配。其中生物学过程的GO分类数多于分子功能的,共有18个分类。说明紫花苜蓿bZIP转录因子在参与多个生物学过程调控中起着较为重要的作用。

表达具有正相关的基因在生物学过程中相互之间可能具有相互促进作用,而负相关则预示着基因间可能相互抑制[33]。MsbZIP基因的转录组数据相关性分析表明,这些相关性很高的基因可能共同参与调控相关的生物过程,类似结果在葡萄bZIP转录因子中也曾被报道[8]。紫花苜蓿40对同源基因组织相关性结果表明,大多数同源基因的功能具有相似性,可能主要是因为这些旁系同源基因对之间具有很高的相关性,但有少数同源基因的功能也表现出不同。

4 结论

本研究首次在全转录组水平对MsbZIP基因的系统进化、蛋白保守结构域、密码子偏好性及基因表达等方面进行了系统分析,这也是首次对紫花苜蓿基因家族进行系统分析。研究结果显示,该转录因子家族可被划分为10类,序列相对保守的基因分到同一类。蛋白保守结构域分析表明,特定的结构域具有特定的功能。密码子偏好性分析表明MsbZIP基因密码子更偏向于使用A/T碱基。基因的转录组数据分析表明,MsbZIP基因在功能上具有较高的相关性。本研究结果可对紫花苜蓿bZIP基因家族基因功能的深入研究奠定一定基础。

References:

[1] 贾喜涛,刘文献,谢文刚,刘志鹏,刘志敏,王彦荣.蒺藜苜蓿LBD转录因子基因家族全基因组分析.西北植物学报,2014,34(10):2176-2187. Jia X T,Liu W X,Xie W G,Liu Z P,Liu Z M,Wang Y R.Genome-wide analysis of the LBD transcription factor family inMedicagotruncatula.Acta Botanica Boreali-occidentalia Sinica,2014,34(10):2176-2187.(in Chinese)

[2] 刘志敏,刘文献,贾喜涛,张正社,王彦荣.蒺藜苜蓿LEA基因家族全基因组分析.草业科学,2015,32(3):382-391. Liu Z M,Liu W X,Jia X T,Zhang Z S,Wang Y R.Genome-wide analysis ofLEAgene family inMedicagotruncatula.Pratacultural Science,2015,32(3):382-391.(in Chinese)

[3] Perez-Rodriguez P,Riano-Pachon D M,Correa L G G,Rensing S A,Kersten B,Mueller-Roeber B.PInTFDB:Updated content and new features of the plant transcription factor database.Nucleic Acids Research,2010,381:822-827.

[4] 张计育,渠慎春,郭忠仁,杜小丽,都贝贝,章镇.植物bZIP转录因子的生物学功能.西北植物学报,2011,31(5):1066-1075. Zhang J Y,Qu S C,Guo Z R,Du X L,Du B B,Zhang Z.Biology function of bZIP transcription factors in plants.Acta Botanica Boreali-occidentalia Sinica,2011,31(5):1066-1075.(in Chinese)

[5] Jakoby M,Weisshaar B,Droge-Laser W,Vicente-Carbajosa J,Tiedemann J,Kroj T,Parcy F.bZIP transcription factors inArabidopsis.Trends in Plant Science,2002,7(3):106-111.

[6] Furihata T,Maruyama K,Fujita Y,Umezawa T,Yoshida R,Shinozaki K,Yamaguchi-Shinozaki K.Abscisic acid-dependent multisite phosphorylation regulates the activity of a transcription activator AREB1.Proceedings of the National Academy of Sciences of the United States of America,2006,103(6):1988-1993.

[7] Liao Y,Zou H,Wei W,Hao Y,Tian A,Huang J,Liu Y,Zhang J,Chen S.SoybeanGmbZIP44,GmbZIP62 andGmbZIP78 genes function as negative regulator of ABA signaling and confer salt and freezing tolerance in transgenic Arabidopsis.Planta,2008,228(2):225-240.

[8] Liu J,Chen N,Chen F,Cai B,Dal Santo S D,Tornielli G B,Pezzotti M,Cheng Z M.Genome-wide analysis and expression profile of the bZIP transcription factor gene family in grapevine (Vitisvinifera).BMC Genomics,2014,15(281):1-18.

[9] Nijhawan A,Jain M,Tyagi A K,Khurana J P.Genomic survey and gene expression analysis of the basic leucine zipper transcription factor family in rice.Plant Physiology,2008,146(2):333-350.

[10] Wang J,Zhou J,Zhang B,Vanitha J,Ramachandran S,Jiang S.Genome-wide expansion and expression divergence of the basic leucine zipper transcription factors in higher plants with an emphasis on sorghum.Journal of Integrative Plant Biology,2011,53(3):212-231.

[11] Wei K,Chen J,Wang Y,Chen Y,Chen S,Lin Y,Pan S,Zhong X,Xie D.Genome-wide analysis ofbZIP-encoding genes in maize.DNA Research,2012,19(6):463-476.

[12] Zhang Z S,Liu W X,Qi X,Liu Z P,Xie W G,Wang Y R.Genome-wide identification,expression profiling,and SSR marker development of the bZIP transcription factor family inMedicagotruncatula.Biochemical Systematics and Ecology,2015,61:218-228.

[13] Huang X,Ouyang X,Yang P,Lau O S,Li G,Li J,Chen H,Deng X W.ArabidopsisFHY3 and HY5 positively mediate induction ofCOP1 transcription in response to photomorphogenic UV-B light.Plant Cell,2012,24(11):4590-4606.

[14] Abe M,Kobayashi Y,Yamamoto S,Daimon Y,Yamaguchi A,Ikeda Y,Ichinoki H,Notaguchi M,Goto K,Araki T.FD,a bZIP protein mediating signals from the floral pathway integrator FT at the shoot apex.Science,2005,309:1052-1056.

[15] Guan Y,Ren H,Xie H,Ma Z,Chen F.Identification and characterization of bZIP-type transcription factors involved in carrot (DaucuscarotaL.) somatic embryogenesis.Plant Journal,2009,60(2):207-217.

[16] Izawa T,Foster R,Nakajima M,Shimamoto K,Chua N H.The rice bZIP transcriptional activator RITA-1 is highly expressed during seed development.Plant Cell,1994,6(9):1277-1287.

[17] Graham P H,Vance C P.Legumes:Importance and constraints to greater use.Plant Physiology,2003,131(3):872-877.

[18] Mouttet R,Escobar-Gutiérrez A,Esquibet M,Gentzbittel L,Mugniéry D,Reignault P,Sarniguet C,Castagnone-Sereno P.Banning of methyl bromide for seed treatment:Could Ditylenchus dipsaci again become a major threat to alfalfa production in Europe.Pest Management Science,2014,70(7):1017-1022.

[19] Liu W X,Zhang Z S,Chen S Y,Ma L C,Wang H C,Dong R,Wang Y R,Liu Z P.Global transcriptome profiling analysis reveals insight into saliva-responsive genes in alfalfa.Plant Cell Reports,2016,35(3):561-571.

[20] O’Rourke J A,Fu F,Bucciarelli B,Yang S S,Samac D A,Lamb J F S,Monteros M J,Graham M A,Gronwald J W,Krom N,Li J,Dai X,Zhao P X,Vance C P.TheMedicagosativagene index 1.2:A web-accessible gene expression atlas for investigating expression differences betweenMedicagosativasubspecies.BMC Genomics,2015,16:1-17.

[21] Fujita Y,Yoshida T,Yamaguchi-Shinozaki K.Pivotal role of the AREB/ABF-SnRK2 pathway in ABRE-mediated transcription in response to osmotic stress in plants.Physiologia Plantarum,2013,147(1):15-27.

[22] Choi H I,Hong J H,Ha J O,Kang J Y,Kim S Y.ABFs,a family of ABA-responsive element binding factors.Journal of Biological Chemistry,2000,275(3):1723-1730.

[23] Tamai H,Iwabuchi M,Meshi T.ArabidopsisGARP transcriptional activators interact with the pro-rich activation domain shared by G-box-binding bZIP factors.Plant and Cell Physiology,2002,43(1):99-107.

[24] 李平,白云凤,冯瑞云,王原媛,张维锋.籽粒苋苹果酸酶(NAD-ME)基因密码子偏好性分析.应用与环境生物学报,2011,17(1):12-17. Li P,Bai Y F,Feng R Y,Wang Y Y,Zhang W F.Analysis of codon bias ofNAD-MEgene inAmaranthushypochondriacus.Chinese Journal of Applied & Environmental Biology,2011,17(1):12-17.(in Chinese)

[25] Sharp P M,Li W H.An evolutionary perspective on synonymous codon usage in unicellular organisms.Journal of Molecular Evolution,1986,24(1-2):28-38.

[26] 张珍珠,陈秀玲,王沛文,戚飞,谢莹,王傲雪.番茄bZIP基因家族的系统进化分析.东北农业大学学报,2014,45(9):47-55. Zhang Z Z,Chen X L,Wang P W,Qi F,Xie Y,Wang A X.Phyletic evolution analysis ofbZIPfamily in tomato.Journal of Northeast Agricultural University,2014,45(9):47-55.(in Chinese)

[27] Tu M X,Wang X H,Huang L,Guo R R,Zhang H J,Cai J S,Wang X P.Expression of a grape bZIP transcription factor,VqbZIP39,in transgenicArabidopsisthalianaconfers tolerance of multiple abiotic stresses.Plant Cell Tissue and Organ Culture,2016,125(3):537-551.

[28] 秦玉海,张小红,冯露,李微微,徐兆师,李连城,周永斌,马有志,刁现民,贾冠清,陈明,闵东红.谷子转录因子基因SibZIP42在拟南芥中对高盐和ABA的响应.中国农业科学,2016,49(17):3276-3286. Qin Y H,Zhang X H,Feng L,Li W W,Xu Z S,Li L C,Zhou Y B,Ma Y Z,Diao X M,Jia G Q,Chen M,Min D H.Response of millet transcription factor geneSibZIP42 to high salt and ABA treatment in transgenicArabidopsis.Scientia Agricultura Sinica,2016,49(17):3276-3286.(in Chinese)

[29] 李月,许朋斐,陈全家,代培红,刘超,曲延英,刘晓东.棉花bZIP转录因子基因GhbZIP15的克隆与表达分析.棉花学报,2015,27(6):515-523. Li Y,Xu P F,Chen Q J,Dai P H,Liu C,Qu Y Y,Liu X D.Molecular cloning and expression of a bZIP transcription factor geneGhbZIP15 on cotton (GossypiumhirsutumL.).Cotton Science,2015,27(6):515-523.(in Chinese)

[30] Karlin S,Campbell A M,Mrazek J.Comparative DNA analysis across diverse genomes.Annual Review of Genetics,1998,32:185-225.

[31] 刘庆坡,冯英,董辉.20个物种同义密码子偏性的比较分析.西北农林科技大学学报:自然科学版,2004,32(7):67-71. Liu Q P,Feng Y,Dong H.Comparative studies on synonymous codon usage bias in twenty species.Journal of Northwest A & F University:Natural Science Edition,2004,32(7):67-71.(in Chinese)

[32] Wang L,Roossinck M J.Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants.Plant Molecular Biology,2006,61(4-5):699-710.

[33] 王俞程,何瑞萍,彭献军,沈世华.WOX转录因子家族研究进展.草业科学,2015,32(5):760-769. Wang Y C,He R P,Peng X J,Shen S H.The research progress of WOX transcription factor family.Pratacultural Science,2015,32(5):760-769.(in Chinese)

(责任编辑 王芳)

The identification, evolutionary characterization and expression analysis of thebZIPtranscription factor family inMedicagosativa

Qi Xiao1,2, Zhang Zheng-she3, Min Xue-yang3, Sun Qi-zhong1, Liu Wen-xian3

(1.Institute of Grassland Research of Chinese Academy of Agricultural Sciences, Huhhot 010010, China;2.National Animal Husbandry Service, Office of the Chinese Herbage Cultivar Registration Board, Beijing 100125, China;3.State Key Laboratory of Grassland Argo-ecosystems, College of Pastoral Agriculture Science and Technology, Lanzhou University, Lanzhou 730020, China)

Basic leucine zipper transcription factors are one of the most extensive and conserved transcription factors in the eukaryote proteins. Currently, several bZIP transcription factors have been identified in many plants. bZIP transcription factors participate extensively in the regulation of seed storage gene expression, development, photomorphogenesis, pathogen defense, biotic and abiotic stress responses, ABA signalling, and more. In this study, 138 bZIP transcription factor-encoding genes were identified by a comprehensive computational analysis of theMedicagosativatranscriptome databases. Phylogenetic analysis of the bZIP protein sequences permits classification of the genes into 10 groups inM.sativa. The codon bias results showed that the alfalfaMsbZIPgene was biased toward the synonymous codons with A and T. Moreover, the gene ontology (GO) term annotations of the 138MsbZIPwere annotated and classified into 23 categories according to biological processes and molecular function. The co-expression relationship betweenMsbZIPgenes showed that significant correlations existed between 372 pairs ofMsbZIPgenes at the 0.01 level. These results will be important for the functional characterization of bZIP transcription factors inM.sativa, and facilitate further research on thebZIPgene family regarding their evolutionary history and biological functions.

bZIP transcription factors;Medicagosativa; phylogenetic analysis; codon bias

Sun Qi-zhong E-mail:sunqz@126.com Liu Wen-xian E-mail:liuwx@lzu.edu.cn

10.11829/j.issn.1001-0629.2016-0520

2016-10-17 接受日期:2016-11-29

现代农业产业技术体系建设专项资金国家牧草产业技术体系项目(CARS-35);中国农业科学院科技创新工程牧草栽培与加工利用团队项目(CAAS-ASTIP-IGR 2015-02);国家自然科学基金青年科学基金(31502000);兰州大学中央高校基本科研业务费专项资金(lzujbky-2016-8);国家草品种区域试验项目(21301060001);巴彦淖尔肉羊优质饲草高效生产关键技术集成与研究应用

齐晓(1982-),男,河北泊头人,农艺师,在读博士生,主要从事草品种管理和推广工作。E-mail:tq07mms@sina.com共同第一作者:张正社(1990-),男,甘肃靖远人,在读博士生,主要从事牧草育种及牧草种子分子生物学研究。E-mail:zhangzhsh16@lzu.edu.cn

孙启忠(1959-),男,内蒙古五原人,研究员,博士,主要从事饲草栽培利用研究。E-mail:sunqz@126.com 刘文献(1981-),男,河南开封人,副教授,博士,主要从事牧草育种与分子生物学研究。E-mail:liuwx@lzu.edu.cn

S541+.1;Q786

A

1001-0629(2017)08-1635-14

齐晓,张正社,闵学阳,孙启忠,刘文献.紫花苜蓿bZIP基因家族的鉴定、进化及表达分析.草业科学,2017,34(8):1635-1648.

Qi X,Zhang Z S,Min X Y,Sun Q Z,Liu W X.The identification, evolutionary characterization and expression analysis of thebZIPtranscription factor family inMedicagosativa.Pratacultural Science,2017,34(8):1635-1648.

植物生产层

猜你喜欢
蒺藜密码子苜蓿
蒺藜的本草学考证
苜蓿的种植及田间管理技术
苜蓿的种植技术
又被蒺藜扎了
密码子与反密码子的本质与拓展
新型密码子、反密码子、氨基酸对应盘
10种藏药材ccmFN基因片段密码子偏好性分析
苜蓿:天马的食粮
要造就一片草原……