黑麦GIF基因家族全基因组鉴定及其表达分析

2023-06-20 00:56杨赟杰杨燕萍车永和
麦类作物学报 2023年6期
关键词:黑麦共线性基序

杨赟杰,苗 涵,魏 莱,杨燕萍,车永和

(河北省作物逆境生物学重点实验室/河北科技师范学院农学与生物科技学院,河北秦皇岛 066600)

生长调节互作因子(GRF-interacting factor,GIF)属于SSXT超家族的一类转录共激活因子[1],生长调节因子(growth-regulated factor,GRF)蛋白N端的QLQ结构域特异识别GIF,并结合形成互作复合物,通过调控细胞周期来控制细胞的增殖,在茎尖分生组织发育及逆境胁迫响应过程中发挥重要作用[2-5]。

GIF基因家族最先在拟南芥中被鉴定出来,随后在水稻[6-7]、小麦[8-9]等植物中也相继被鉴定出来。拟南芥GIF家族由AtGIF1、AtGIF2和AtGIF3三个成员构成,主要通过促进或维持细胞的分裂能力来调节拟南芥植物器官的大小[3],并且在生殖器官发育和配子细胞生成中有重要作用[10]。研究发现,AtGIF1基因缺失后会导致叶片细胞数目减少,叶片变小,相反过表达AtGIF1则使叶片变大;AtGIF2和AtGIF3基因与AtGIF1基因的生物学功能类似,在细胞增殖和侧生器官形成中均发挥着重要的调控作用[5]。水稻中OsGIF1基因对多个主要器官(叶、茎和籽粒)也具有正向调控作用[6-7,11-13]。

黑麦(SecaleL., 2n=2x=14)属于禾本科小麦族,可适应极端气候与环境,在小麦品种改良中应用广泛,拥有杂交育种所需的全部基因库[14]。黑麦基因组测序的完成[14-15],有助于在全基因组水平上对黑麦基因资源进行挖掘并利用。本研究利用最新发布的威宁黑麦基因组数据[15],对黑麦GIF基因家族成员进行鉴定,并对黑麦等6种禾本科植物及模式植物拟南芥GIF基因的结构、系统进化以及共线性关系等方面进行分析,同时探讨GIF基因家族成员在黑麦不同组织中的时空表达模式,以期为后续分析黑麦GIF基因的潜在功能提供参考。

1 材料与方法

1.1 GIF基因家族成员的鉴定

从TAIR 数据库 (http://www.arabidopsis.org) 下载拟南芥GIF基因家族成员的蛋白序列,从RAP数据库 (http://rapdb.dna.affrc.go.jp/) 下载水稻GIF基因家族成员的蛋白序列,通过Ensembl Plants网站 (http://plants.ensembl.org/index.html) 获取小麦、大麦、谷子、高粱和玉米的基因组注释文件(GFF格式),从NGDC数据库 (https://ngdc.cncb.ac.cn/) 下载黑麦 (威宁) 基因组数据。通过Pfam 网站(http://pfam.sanger.ac.uk/) 下载GIF家族蛋白SSXT (PF05030) 结构域的HMM模型,利用HMMER v3.0软件搜索GIF蛋白 (e-value<1e-5)。同时,将拟南芥GIF蛋白作为参考序列,采用NCBI网站的BLASTP进行比对,检索同源蛋白。综合HMMER和BLASTP的结果,用NCBI Conserve Domain 网站(https://www.ncbi.nlm.nih.gov/cdd/)[16]和SMART用 (http://smart.embl.de/)[17]对筛选到的GIF蛋白进行保守结构域验证,删除不含SSXT结构域的蛋白。用ExPASy 网站(https://www.expasy.org/)[18]分析黑麦GIF蛋白的分子量、等电点等理化性质。

1.2 系统发育分析

利用MEGA 7.0软件内置的Clustal_W工具[19]对黑麦、水稻、小麦、大麦、谷子、高粱、玉米及拟南芥的GIF蛋白序列进行比对分析,并采用邻近法构建系统进化树,bootstrap参数设置为1 000,用iTOL网站(https://itol.embl.de/)对进化树进行美化。

1.3 基因结构分析

从基因组注释文件中获得黑麦GIF基因家族成员的内含子、外显子等信息,用GENE Structure Display Serve 2.0网站(http://gsds.cbi.pku.edu.cn/)[20]将外显子-内含子结构可视化。用MEME网站(http://meme-suite.org/tools/meme)[21]分析黑麦GIF基因家族成员编码蛋白的保守基序,采用默认参数,最大基序数量设置为10。

1.4 染色体定位和共线性分析

根据下载的基因组和基因注释文件信息,通过共线性扫描工具MCScan X对黑麦及其他7种植物进行基因重复事件分析,用TBtools软件[22]将黑麦GIF家族成员定位到染色体上,使用该软件内置的Dual Synteny Plot 程序绘制物种间共线图。用KaKs Calculator 2.0软件[23]计算同源基因对的Ka/Ks比值(Ka为非同义替换率,Ks为同义替换率)。

1.5 黑麦GIF基因顺式作用元件分析

从黑麦基因组中获取每个GIF基因CDS序列5’端上游2 000 bp的DNA序列,用PlantCARE数据库 (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[24]分析黑麦GIF基因的顺式作用元件,手动整理,用GENE Structure Display Serve 2.0进行可视化。

1.6 黑麦GIF基因的表达模式分析

从小麦多组学网站 WheatOmics数据库 (http://wheatomics.sdau.edu.cn/)[25]下载黑麦不同组织在不同发育时期的表达量数据,以TPM (transcript per million)为表达水平单位,利用Graphpad Prism 9软件绘制黑麦GIF基因的表达热图。

1.7 黑麦GIF蛋白的潜在磷酸化位点分析

用NetPhos 3.1 Server软件 (http://services.healthtech.dtu.dk/service.php?NetPhos-3.1)[26-27]预测黑麦GIF蛋白潜在的磷酸化位点,参数设置均为默认。

2 结果与分析

2.1 黑麦和其他7个代表性植物GIF基因家族成员的鉴定结果

根据拟南芥GIF蛋白序列,结合HMMER和BLASTP方法,结果共鉴定出3个黑麦GIF基因(表1),分布在4号和5号染色体上。根据这3个基因在基因座上的位置,分别命名为ScGIF1、ScGIF2和ScGIF3。理化性质分析发现,3个黑麦GIF蛋白的氨基酸序列长度为184~226 aa,分子量为19 337.76~24 032.56 Da,等电点为4.83~5.22。

表1 黑麦GIF基因及其编码蛋白的理化特征Table 1 Characteristics of ScGIF genes and their encoded proteins

在水稻、拟南芥、大麦、谷子、高粱和黑麦中均鉴定到3个GIF基因家族成员,而在玉米中鉴定到4个,在小麦中鉴定到8个。

2.2 黑麦和其他7个代表性植物GIF基因家族的系统发育分析

利用MEGA 7.0软件构建黑麦和其他7个代表性植物GIF蛋白的系统进化树(图1)。根据黑麦GIF家族成员在系统进化树中的分布,将30个GIF基因家族成员划分为Group A、Group B和Group C三大类,分别包含8、10和12个家族成员。在三个大类中均包含黑麦、小麦、水稻、玉米、高粱、大麦和谷子GIF基因,且黑麦、小麦和大麦的GIF基因聚在一个小分支中,说明黑麦与小麦、大麦的GIF基因家族亲缘关系更近。拟南芥的GIF基因只存在于Group C中,说明GIF基因的分化是在双子叶植物和单子叶植物分化之后。

At:拟南芥;Os:水稻;Ta:小麦;Hv:大麦;Si:谷子;Sb:高粱;Zm:玉米;Sc:黑麦。At: Arabidopsis thaliana; Os: Oryza sativa L.; Ta:Triticum aestivum L.; Hv: Hordeum vulgare L.; Si: Setaria italica L.; Sb: Sorghum bicolor L.; Zm:Zea mays L.; Sc: Secale cereale L..图1 黑麦和其他7个代表性植物GIF蛋白的系统发育树Fig.1 Phylogenetic tree of GIF proteins in rye and other seven representative plants

2.3 GIF基因结构和蛋白保守基序分析

用MEME工具分析黑麦和其他7个代表性植物GIF蛋白的保守基序,结果(图2)表明,30个GIF家族成员均包含基序1,Group A中的GIF蛋白均包含基序1、2、3、4和6,Group B中均包含基序1、2、3、4和7,而Group C中均只包含基序1。说明同类GIF蛋白含有的基序相对保守,推测不同类GIF蛋白基序种类的差异是物种进化的结果。

图2 黑麦和其他7个代表性植物GIF蛋白的保守基序分析Fig.2 Conserved motif analysis of GIF proteins in rye and other seven representative plants

基因结构是决定基因功能的重要因素[28]。基因结构分析表明,禾本科植物中GIF基因家族成员的外显子数目相对稳定,均含有4个;而拟南芥中AtGIF1、AtGIF2和AtGIF3基因分别含有4、6和5个(图3)。拟南芥中AtGIF1与禾本科植物聚为一类,而AtGIF2和AtGIF3则单独聚为一类,推测AtGIF1可能与禾本科植物中GIF基因家族成员在功能上具有相似性。

图3 黑麦和其他7个代表性植物GIF基因家族成员的基因结构分析Fig.3 Gene structure analysis of GIF gene family members in rye and other seven representative plants

2.4 黑麦和其他7个代表性植株的共线性分析

对黑麦和其他7个代表性植物进行共线性分析,结果(图4)表明,黑麦和拟南芥GIF基因不存在共线性关系,但和小麦有6个共线性基因对,和大麦有2个共线性基因对,和水稻、玉米、高粱和谷子均只有1个共线性基因对。

灰色线条为两个物种间所有的共线基因对,红色线条为黑麦GIF和对应物种的共线基因对。Gray lines indicate the collinear gene pairs between two species, and red lines indicate the collinear gene pairs of GIF between rye and other species.图4 黑麦和其他7个代表性植物GIF因家族成员的共线性分析Fig.4 Collinearity analysis of GIF genes between rye and other seven representative plants

根据黑麦和其他物种GIF基因的共线性分析结果,共发现12个黑麦GIF基因的直系同源基因。Ka/Ks分析结果(表2)表明,这些GIF基因的Ka/Ks值均小于0.5,说明GIF基因在进化过程中经历了强烈的纯化选择,在功能上较为保守。

表2 黑麦与其他7个代表性植物间GIF基因的Ka、Ks和Ka/Ks值Table 2 Ka, Ks and Ka/Ks values of GIF genes between rye and other seven representative plants

2.5 黑麦GIF基因顺式作用元件分析

用PlantCARE数据库分析3个黑麦GIF基因上游2 000 bp启动子区的顺式作用元件。结果(图5)共发现53个与激素和胁迫响应相关的顺式作用元件,其中与激素响应相关的顺式作用元件有8种,包括ABRE、TGA-element、ERE、GARE-motif、P-box、CGTCA-motif、TGACG-motif和TCA-element;与胁迫响应相关的顺式作用元件有5种,包括TC-rich repeats、MBS、W box、ARE和WUN-motif。在3个黑麦GIF基因中,检测到的ABA响应元件ABRE的数目最多,ScGIF1、ScGIF2和ScGIF3基因中分别含有3、8和4个,推测黑麦GIF基因可能参与ABA代谢调控过程。

图5 黑麦GIF基因启动子区域顺式作用元件的分布Fig.5 Distribution of cis-acting elements in the promoters of rye GIF genes

2.6 黑麦GIF基因在不同组织中的表达模式

为了解GIF基因在调节黑麦生长发育中的作用,通过RNA-seq数据分析这些基因在不同组织中的表达模式,以log2(TPM+1)值作图(图6),可以看出,ScGIF1基因在穗中表达量较高(TPM>40),而在根、茎、叶和籽粒中表达量较低(TPM<10)或不表达;ScGIF2基因在茎中表达量最高,其次是根和茎,均达到了高表达水平(TPM>40),而在其他组织中为中表达水平(40>TPM>10);ScGIF3基因只在穗中达到了高表达水平(TPM>40),在其他组织中为中表达水平(40>TPM>10)。这表明黑麦GIF基因在不同组织中均有表达,其中ScGIF1基因表达表现出明显的组织特异性,推测3个基因可能具有不同的功能。

Root:根;Leaf :叶片;Stem:茎;Spikelet:穗;Leaf.5DAS:播种后5 d的叶片;Leaf.10DAS:播种后10 d的叶片;Leaf.15DAS:播种后15 d的叶片;Seed.10DAF:花后10 d的籽粒;Seed.20DAF:花后20 d的籽粒;Seed.30DAF:花后30 d的籽粒;Seed.40DAF:花后40 d的籽粒。Leaf.5DAS: Leaf at 5 d after sowing; Leaf.10DAS: Leaf at 10 d after sowing; Leaf.15DAS: Leaf at 15 d after sowing; Seed.10DAF: Seed at 10 d after flowering; Seed.20DAF: Seed at 20 d after flowering; Seed.30DAF: Seed at 30 d after flowering; Seed.40DAF: Seed at 40 d after flowering.图6 基于RNA-seq对黑麦不同组织GIF基因的表达谱分析Fig.6 Expression pattern analysis of GIF genes in different tissues of rye based on RNA-seq

2.7 黑麦GIF蛋白磷酸化位点分析

对黑麦GIF蛋白潜在的磷酸化位点分析发现,黑麦所有GIF蛋白中均含有磷酸化位点,其中磷酸化位点为丝氨酸数目最多,苏氨酸次之,酪氨酸最少,且酪氨酸仅存在于ScGIF1和ScGIF3蛋白中。总体来看,ScGIF1蛋白含有的磷酸化位点最多,达29个;ScGIF2最少,仅有12个(表3)。

表3 黑麦GIF蛋白潜在的磷酸化位点数目Table 3 Number of potential phosphorylation sites in GIF proteins of rye

3 讨论

测序技术的发展促进了在基因组水平上对植物基因家族的研究[28-30]。GIF基因家族已经在多个物种中被鉴定出来,本研究首次在黑麦全基因组范围内搜索到3个GIF基因,在数量上与水稻、高粱、大麦、拟南芥和谷子大致相同,而在普通小麦中鉴定到8个,原因可能是普通小麦在形成异源六倍体基因组过程中,GIF基因经历了更长的进化时间。

在系统发育树中,同一分支中大部分GIF基因具有相似的基因结构和保守基序,表明这些GIF基因的功能相似[31-32]。共线性分析发现,黑麦GIF基因和拟南芥基因组中未发现共线性对,而与禾本科作物中均存在共线性基因对,说明禾本科作物之间亲缘关系更近,GIF基因的分化开始于单子叶植物和双子叶植物分化完成之后。共线性基因对的Ka/Ks分析发现,GIF基因在进化过程中经历了强烈的纯化选择,推测其在功能上具有相似性。

位于基因上游的顺式作用元件可以响应不同的外部环境信号,进而在植物体内调节相关基因的表达,影响植物的生长发育[28,33]。本研究发现,在黑麦GIF基因上游启动子区域有53个顺式作用元件,与激素和胁迫响应相关的顺式作用元件分别有8种和5种。其中,ABA响应元件ABRE数目最多,推测GIF基因在调节植物组织生长和发育过程中受ABA代谢的影响。

黑麦GIF基因在不同组织中广泛表达,说明它们可能参与多种生理反应。其中,ScGIF1的基因表达表现出组织特异性,其在穗中的表达量远高于其他组织。系统进化分析表明,ScGIF1与水稻OsGIF1均属于Group C,推测ScGIF1的功能与OsGIF1相似。He等[11]研究发现,水稻OsGIF1与OsGRF4相互作用形成转录复合体,调节下游基因表达来影响水稻的粒型。推测黑麦ScGIF1基因也可能通过调控穗的发育来影响粒型,可作为进一步研究黑麦穗发育和影响粒型的候选基因。Lu等[7]研究也发现,水稻OsGIF1与OsGRF1协同作用,共同调节水稻叶的生长。而本研究中黑麦ScGIF1在叶中不表达,推测GIF1基因在不同物种中功能有所差异。

蛋白质可以通过磷酸化调节自身的结构和功能[34]。本研究发现,黑麦GIF蛋白存在潜在的磷酸化位点,且在ScGIF1蛋白中磷酸化位点最多,推测ScGIF1蛋白可能通过磷酸化来调节生物学功能。下一步将对ScGIF1蛋白进行脱磷酸化试验,来验证其对黑麦穗发育和粒型的影响。黑麦GIF基因家族的具体功能及作用机制还需要进一步的研究。

猜你喜欢
黑麦共线性基序
黑小麦光合特性的变化及对产量的影响
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
银行不良贷款额影响因素分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
不完全多重共线性定义存在的问题及其修正建议
黑麦的历史
意大利美食地图
诊断复共线性的特征分析法及其在GEO定轨中的应用