李晓旭 ,郭存,蒲文宣,刘万峰,张银霞,孙楠,何鑫玺,刘成,许良涛,高军平*
1 湖南中烟工业有限责任公司技术中心,长沙市劳动中路386号 410007;2 中国农业科学院烟草研究所,青岛市崂山区科苑经四路11号 266101;3 曲靖市烟草公司,曲靖市麒麟区官坡巷51号 655000
WOX(WUSCHEL-related homeobox,WOX)转录因子家族是植物所特有的转录因子家族[1]。WOX转录因子家族是同源异型盒超家族的一个亚家族,其成员均含有一段 60~66个氨基酸组成的典型同源异型结构域(homeodomain),其同源异型结构域具有典型的helix-loop-helix-turn-helix的结构[1-2]。研究发现,从50个物种中鉴定出350多个具有典型同源异型结构域的WOX转录因子,进化分析发现这些WOX转录因子家族成员形成了三个分支(clade)[3]。其中现代进化分支(modern clade)又称为 WUS进化支(WUS clade),其成员仅来自高等的种子植物;中间进化分支(intermediate clade)中仅含有来自维管植物中的WOX成员;而在古代进化分支(ancient clade)中含有包括古老藻类在内的所有物种的WOX家族成员[3]。
在植物中,WOX 转录因子家族成员参与植物的组织器官的起始、形态建成和分生组织中干细胞稳态等多种生物学过程调控[1,4]。在拟南芥中,鉴定了AtWUS 和AtWOX5 等15 个WOX 转录因子家族成员[5]。值得注意的是,AtWUS 基因的缺失突变体wus-1 因种子萌发后相当长时间内没有真叶出现而被首次鉴定到[6]。同时,wus-1 突变体在其整个生命周期中表现为生长点消失,走走停停(stop-and-go),花器官数量减少且异常[6]。进一步研究表明WUS 基因在茎顶端分生组织(shoot apical meristem,SAM)的组织中心(Organizing Center, OC)特异性表达,而在wus-1 突变体中,干细胞加速分化进而导致生长点消失[6]。因此,在拟南芥中,转录因子AtWUS 的功能是维持茎顶端分生组织中干细胞的数目和特性,抑制干细胞的分化[6-8]。同时,AtWOX5 基因在根顶端分生组织(root apical meristem,RAM)中的静止中心(Quiescent Centre,QC)中表达,研究表明WOX5 功能与WUS 类似,在RAM 中维持干细胞的数目和特性,抑制干细胞的分化[9-11]。此外,AtWOX4/AtWOX14 在拟南芥维管干细胞分化中起重要作用[12-13]。研究表明,在胚胎发育过程中AtWOX2/AtWOX8 共同调节顶端基轴的形成[14]。研究发现,AtWOX8 和AtWOX9 能够促进胚胎细胞分裂[14-16]。此外报道 AtWOX13 在果实的发育和形成中发挥作用[17]。
烟草是一种经济作物,其生长发育过程对烟草株型和产量起重要作用,同时烟草顶端分生组织和侧生分生组织发育分子调控的研究具有重要的理论意义和实践价值。在烟草中,B3、SBP、RLP、KNOX 和Aux/IAA 等与生长发育调控密切相关的基因家族已经被分析鉴定[18-22]。本研究利用比较基因组学和生物信息学的方法,对烟草基因组的WOX 转录因子家族成员进行鉴定、系统进化分析、共线性分析、保守基序分析、基因表达分析和GO 注释分析。本研究为烟草分生组织发育的分子调控和WOX 转录因子家族成员的功能解析提供基础。
栽培烟草K326 保存并种植于烟草行业烟草基因资源利用重点实验室,在现蕾期采集烟草茎尖、茎、根尖、根、叶片5 个组织,液氮迅速冷冻后放置于-80℃冰箱保存备用。
RNAiso Plus 提取试剂盒、PrimeScript 反转录试剂盒、SYBR Ex Taq 荧光定量试剂盒均购自大连宝生物公司。荧光定量PCR 仪ABI 7500 购自ABI 公司。
1.2.1 烟草WOX 转录因子家族成员的鉴定及序列分析
根据文献报道[5,23,24],利用拟南芥TAIR 数据库(http://www.arabidopsis.org/)和茄科基因组数据库(http://solgenomics.net/),下载拟南芥、番茄和马铃薯WOX 转录因子家族成员的蛋白序列。使用MAFFT,在默认参数下对下载的序列进行多序列比对。基于序列比对结果,使用HMMER v3.0 建立HMM 检索谱(HMM profile)。在茄科植物数据库下载普通烟草K326 蛋白序列数据库,使用所建立的HMM 检索谱对烟草蛋白序列数据库在默认参数下进行检索,获得候选序列。利用Pfam(http://pfam.sanger.ac.uk/)对候选序列蛋白结构域进行分析,去除不含同源异型结构域的候选序列。利用ProtParam(http://expasy.org/)对所鉴定的WOX 家族成员蛋白序列进行分子量和等电点分析。
1.2.2 多序列比对及系统发育分析
参考文献[23],提取拟南芥和鉴定的烟草WOX家族成员的蛋白全长序列,使用MAFFT 在默认参数下进行多序列比对。选取同源异型结构域,使用Texshade 将多序列结果进行可视化展示。基于拟南芥、番茄、马铃薯和普通烟草WOX 蛋白多序列比对的结果,使用MGEA v6.06 重构邻接树(Neighbor-Joining, NJ tree),参数设置为:Poisson Model 和Pairwise Deletion 进行分析,Bootstrap 检验设为1000 次。利用Tree View v1.4.2 对构建的系统发生树进行可视化展示。
1.2.3 染色体定位及复制事件分析
利用茄科植物数据库(http://solgenomics.net/),提取所鉴定的烟草WOX 转录因子编码基因的染色体定位信息。参考文献[25],对烟草WOX 基因串联重复事件进行进行鉴定,利用Circos 对染色体定位信息和串联重复事件进行可视化展示。参考文献[26],利用McScan X 对烟草基因组进行分析,对烟草WOX 基因全基因组复制重复事件进行鉴定,利用Circos 将其进行可视化展示。
1.2.4 共线性分析
在拟南芥基因组数据库和茄科基因组数据库分别下载拟南芥和普通烟草K326 基因组注释信息。参考文献[26],利用McScan X 在默认参数下进行拟南芥和普通烟草基因组的共线性分析,使用TBtools 将共线性分析结果进行可视化展示。
1.2.5 保守基序分析
使用Multiple Expectation Maximization for Motif Elicitation(MEME)对WOX 转录因子家族成员的蛋白序列的保守基序(motif)进行分析,参数设置为:maximum number of motifs 设定为10,motif width 设定为≥6 and ≤100,并且选择zero or one per sequence 模式。
1.2.6 转录组数据的处理与结果分析
参考文献[19],利用NCBI SRA 数据库(http://www.ncbi.nlm.nih.gov/sra/)下载转录组测序数据(SRP029183),利用Tophat 和Cuラink 等程序分析转录组测序数据并进行表达量计算,提取NtWOX 基因家族成员编码基因的表达数据,将表达数据标准化后,使用R 语言pheatmap 程序绘制热图(Heatmap),将表达数据可视化。
1.2.7 烟草RNA 提取及反转录
将采集的普通烟草各组织样品从-80℃冰箱取出,在液氮中研磨成粉末。使用RNAiso 试剂盒提取总RNA 并去除基因组DNA,使用PrimeScript 反转录试剂盒进行反转录,将反转录的cDNA 稀释至25 ng/μL待用。
1.2.8 表达模式分析
根据NtWUSa 和NtWOX5a 基因的CDS 序列,利用Primer premier 5 设计特异性荧光定量检测引物。NtWUSa 基因上游特异性引物序列:5'- GTCCATCA GCTTCTTCTCATGGTGTA -3',下游特异性引物序列:5'- AGCAGAGGCTCTTTGGTAATTTTCTT -3'。NtWOX5a 基因上游特异性引物序列:5'- GAATGT CAGGGTTTTCGGTGAGGGCA -3',下游特异性引物序列:5'- AGCTAAGTTGGGAAGATATTTTTTGT -3'。参考文献[27],采用普通烟草26S rRNA 基因作为管家基因。各个组织进行3 次生物学重复,每组生物学重复为独立样本并单独提取 RNA,同时荧光定量实验设置3 次技术性重复。基于2-ΔΔCt法计算基因的相对表达量。
1.2.9 基因本体论注释分析
参考文献[23],基于拟南芥和所鉴定的普通烟草WOX 转录因子家族的蛋白全长序列,利用Blast2GO在默认参数下进行比对,并完成基因本体论(Gene Ontology,GO)注释。通过WEGO 工具分析注释结果并完成可视化展示。
根据已报道的拟南芥、番茄和马铃薯中WOX 转录因子家族成员的蛋白序列,构建隐马尔可夫模型序列谱并检索烟草蛋白数据库。通过Pfam 对候选序列进行结构域分析,去除不含同源异型结构域的候选序列,最终在烟草基因组中鉴定得到23 个烟草WOX转录因子编码基因。
参考文献[5],对新鉴定的WOX 转录因子进行命名。基于普通烟草和拟南芥WOX 转录因子蛋白全长多序列比对结果,重建邻接树。基于染色体定位信息和邻接树的进化关系,对新鉴定的番茄WOX 转录因子家族成员进行命名(表1)。理化性质分析发现,新鉴定的烟草WOX 转录因子家族成员之间理化性质存在一定的差异,氨基酸的长度在87~380 aa 之间,蛋白分子量则介于10.48~41.86 kDa 之间,蛋白理论等电点在5.15~10.04 之间(表1)。
表1 普通烟草WOX 转录家族成员鉴定及理化性质分析Tab. 1 Identification and physicochemical properties analysis of the WOX transcription factor family in tobacco
续表1
图1 普通烟草WOX 转录因子同源异型结构域分析Fig. 1 The homeodomain domain analysis of WOX family members in tobacco
基于已报道拟南芥WOX 转录因子家族成员和新鉴定的烟草WOX 转录因子家族成员的蛋白全长序列,在默认参数下,使用MAFFT 完成多序列比对,利用Texshade 将结果可视化,紫色代表完全保守的氨基酸,红色/蓝色代表高度保守的氨基酸(图1)。结果表明,普通烟草WOX 家族成员和拟南芥WOX家族成员的同源异型结构域高度相似且较为保守,均为60 个或者61 个氨基酸残基所构成的螺旋-环- 螺 旋- 转 角- 螺 旋(helix-loop-helix-turn-helix)结构。研究报道了WOX 家族成员同源异型结构域中保守的位点,包括helix1 中的Q8、L12 以及helix3 中V47、W50、F51、Q52、N53、和R57 等。研究发现,在普通烟草WOX 转录因子家族成员中,这8 个位点同样高度保守。值得注意的是,AtWUS、NtWUSa和NtWUSb 同源异型结构域由61 个氨基酸残基组成,并且在其同源异型结构域中多出了一个Y 残基(Y16),说明该残基可能对WUS 类转录因子功能起着重要的作用。
为了研究普通烟草WOX 转录因子家族的进化关系,对烟草、番茄、马铃薯和拟南芥WOX 转录因子蛋白全长序列进行多序列比对。基于比对结果,利用MEGA 构建邻接树(图2)。进化分析结果表明,普通烟草、番茄、马铃薯和拟南芥WOX转录因子家族成员形成了3 个进化支(Clade)和9个亚家族(Subgroup)。现代进化支中有WUS 和WOX1-5 共6 个亚家族,中间进化支包含了WOX9和WOX11 两个亚家族,而古老进化支(Ancient clade)包含了WOX13 亚家族。值得注意的是,除了WOX4 亚家族,其余亚家族中均含有拟南芥和烟草中的成员,这表明了烟草和拟南芥的物种分化时间要晚于WOX 家族成员的分化时间。同时,在不同亚家族中,拟南芥和番茄WOX 家族成员的数目差异较大。在WOX3 亚家族中,烟草有NtWOX3a-NtWOX3h 共计8 个WOX 家族成员,而拟南芥只有一个成员AtWOX3 位于该亚家族中。另外,在WOX13 亚家族中,拟南芥AtWOX13、AtWOX10 和AtWOX14 位于该亚家族中,而烟草有NtWOX13a-NtWOX13d 共计4 个成员。以上结果表明,在普通烟草和拟南芥物种分化后,WOX3 和WOX13 等亚家族经历了不同的进化事件。
图2 普通烟草WOX 转录因子家族的系统进化分析Fig .2 The phylogenetic analysis of WOX family genes in tobacco
图3 普通烟草和拟南芥WOX 基因的共线性分析Fig. 3 The syntenic analysis of WOX genes between tobacco and Arabidopsis
为了进一步解析NtWOX 家族的进化关系,利用McScan X 在默认参数下对拟南芥基因组和普通烟草K326 基因组进行共线性分析(图3)。Chr1-Chr5分别代表拟南芥5 条染色体,Nt01-Nt24 代表普通烟草24 条染色体。结果表明,普通烟草NtWOX2a 基因与拟南芥AtWOX2 基因,普通烟草NtWOX5a 基因与拟南芥AtWOX5 基因,普通烟草NtWOX3b、NtWOX3e、NtWOX3f 基因与拟南芥AtWOX3 基因,普通烟草NtWOX13a、NtWOX13c 基因与拟南芥AtWOX3 基因,均在拟南芥和普通烟草基因组的共线性区块中,存在共线性关系,进一步说明所鉴定的相关普通烟草NtWOX 基因与拟南芥相关AtWOX 基因直系同源。
为了进一步分析普通烟草WOX 家族的进化关系,基于烟草基因组的注释信息,进行了烟草NtWOX 基因的染色体定位分析(图4)。结果表明,15 个NtWOX 基因锚定在10 条普通烟草染色体上。NtWOX 基因在染色体上呈不均匀分布,3、4、6、8、9、14、17、18、21 和22 号染色体有NtWOX 基因分布。值得注意的是,9 号染色体上NtWOX3b 基因和NtWOX3c 基因串联分布,且高度同源。串联重复事件分析结果表明,普通烟草NtWOX3b 基因和NtWOX3c 基因来源于一次串联重复事件。
图4 普通烟草WOX 家族编码基因的染色体定位及串联重复分析Fig. 4 The chromosomal assignment and tandem duplication of NtWOX family genes in tobacco
为了进一步解析NtWOX 家族的进化关系,利用McScan X 进行了普通烟草NtWOX 基因的全基因组复制分析(whole genome duplication,图5)。结果表明,NtWOX13a、NtWOX13c 和NtWOX13d 基因形成了全基因组复制对,而NtWOX3b、NtWOX3d、NtWOX3e和NtWOX3f 基因形成了全基因组复制对。结果表明,这些普通烟草NtWOX 基因来源于一次或多次的复制事件。
图5 普通烟草NtWOX 基因全基因组复制分析Fig. 5 The whole-genome duplication analysis of NtWOX genes in tobacco
利用保守基序识别程序MEME,对新鉴定的普通烟草WOX 转录因子进行保守基序分析(图6)。结果发现,WOX 转录因子在同一亚家族内的成员保守基序的组织形式具有高度的一致性,表明同亚一家族内的WOX 成员可能承担类似的生物学功能,也从侧面反映了系统进化分析的可靠性。值得注意的是,所有WOX 转录因子家族成员都含有Motif 1 和Motif 2,进一步分析表明,Motif 1 和Motif 2 组成了同源异型结构域。同时,不同亚家族内存在特异性分布的保守基序。在现代进化支内,除了AtWOX7 和NtWOX3d,拟南芥和烟草的WOX 转录因子均含有Motif 4,进一步的分析发现其和WUS box 的序列一致。而串联的Motif 5 和Motif 6 只分布于中间进化支WOX 成员的蛋白序列C 端。
图6 烟草WOX 转录因子家族蛋白保守结构域分析Fig. 6 The conserved motifs analysis of WOX family members in tobacco
提取并分析普通烟草转录组数据,使用R 包pheatmap 将NtWOX 转录因子家族成员的编码基因表达数据进行可视化展示(图7)。结果表明,烟草NtWOX 家族编码基因在测试组织中均有表达且具有组织特异性。进一步的分析发现,烟草WOX13 亚家族的成员在5 个组织中有较高的表达量,而另外一些WOX 亚家族成员的编码基因表达特异性较为明显。WUS 亚家族的NtWUSa 和NtWUSb,WOX1 亚家族的NtWOX1a 和NtWOX1b 以及NtWOX9 基因特异性地在花器官中表达;同时WOX5 亚家族的NtWOX5b基因在根中表达量较高。进一步的分析发现,同一亚家族内NtWOX 基因组织特异性也存在差异,在WOX3 亚家族内,NtWOX3a 基因在根中表达量较高,NtWOX3b和NtWOX3c基因在幼嫩叶片中表达量较高,而NtWOX3f 和NtWOX3g 基因在茎中特异性的表达。
为了进一步明确烟草NtWOX 基因的表达模式,选取NtWUSa 和NtWOX5a 基因进行表达验证分析。普通烟草测试组织平行收集3 组样本独立提取RNA并反转录,每组样本设3 次技术重复,根据2-ΔΔCt法计算基因的相对表达量(图8)。结果表明,针对NtWUSa 基因,以茎的相对表达量设定为单位1,基因NtWUSa 特异性的在茎和茎尖表达,而且在茎尖的表达量较高;针对NtWOX5a 基因,以根的相对表达量设定为单位1,基因NtWOX5a 在根尖和根特异性表达,且在根尖的表达量较高。
图7 烟草NtWOX 基因家族成员表达模式分析Fig. 7 The expression patterns of the NtWOX genes in tobacco
通过Blast2GO 在默认参数下对普通烟草和拟南芥WOX 家族成员进行基因的本体论(Gene Ontology, GO)注释,并利用WEGO 进行可视化展示(图9)。分析发现,普通烟草WOX 转录因子家族成员与拟南芥的相关成员在分子功能(Molecular Function)、生物学过程(Biological Process)等方面注释结果相似,表明其可能承担相似的功能。进一步分析结果表明,所有普通烟草WOX 转录因子家族成员定位在细胞核中(nucleus),并发挥DNA 结合(DNA binding)的相关功能,这与WOX 转录因子的功能相一致。此外,所有烟草WOX 蛋白均被注释为参与组织器官发育过程(multicellular organismal development)。很多烟草WOX 家族成员还参与细胞间通讯(cell communication)、胁迫响应(response to stress)等信号转导过程中。
图8 烟草NtWUSa(A)和NtWOX5a(B)基因表达模式Fig. 8 The expression patterns of the NtWUSa (A) and NtWOX5a (B) genes
WOX 转录家族是植物特异的转录因子家族,其成员含有保守的同源异型结构域,被报道广泛参与植物生长发育、组织器官的发生和形成、干细胞的稳态调控等重要的生命过程[28,29]。本研究利用比较基因组学和生物信息学方法,从普通烟草K326 基因组中鉴定出23 个WOX 转录因子编码基因。所有普通烟草WOX 转录因子均含60 或者61 个氨基酸残基组成的高度保守的同源异型结构域。基于普通烟草和已报道的拟南芥、番茄以及马铃薯WOX 转录因子家族成员的蛋白全长序列,通过邻接法重建系统发育树。系统发育分析表明,普通烟草和已报道的WOX 转录因子被分成了3 个亚支和9 个亚家族。除了WOX4 以外所有亚家族都包含了至少一个的拟南芥和烟草WOX转录因子,表明WOX 转录因子亚家族的分化形成的时间早于烟草和拟南芥的物种分化;保守基序分析发现,亚家族内的普通烟草和拟南芥WOX 转录因子的保守基序的组织形式高度一致,表明其可能承担类似的生物学功能。GO 注释表明,普通烟草WOX 家族成员定位到细胞核中,参与组织器官发育、细胞间通讯过程和胁迫响应等生物学过程。
图9 普通烟草WOX 家族成员GO 注释分析Fig. 9 The GO analysis of WOX family members in tobacco
在WOX13 亚家族, 拟南芥AtWOX13 与NtWOX13a - NtWOX13d 聚在一起。共线性分析发现,普通烟草NtWOX13a、NtWOX13c 基因与拟南芥AtWOX13 基因存在共线性关系,证明其直系同源;全基因组复制分析发现,NtWOX13a、NtWOX13c 和NtWOX13d 基因形成了全基因组复制对。因此,在拟南芥与烟草分化后,WOX13 亚家族成员经历了一次或者多次的全基因组复制事件,使WOX13 亚家族成员发生扩张。
此外,在WOX3 亚家族中,烟草有NtWOX3a -NtWOX3h 共计8 个WOX 家族成员,与拟南芥AtWOX3 聚在一起。此外,普通烟草NtWOX3b、NtWOX3e、NtWOX3f 基因与拟南芥AtWOX3 基因存在共线性关系,说明其直系同源。复制事件分析表明,普通烟草NtWOX3b 基因和NtWOX3c 基因来源于一次串联重复事件,而NtWOX3b、NtWOX3d、NtWOX3e和NtWOX3f 基因形成了全基因组复制对,这些基因来自一次或者多次的基因组复制事件。有意思的是,这些复制后形成的NtWOX 基因在表达模式上出现分化。NtWOX3b 和NtWOX3c 基因在幼嫩叶片中表达量较高,而NtWOX3f 基因在茎中特异性的表达。这表明来源于复制事件的NtWOX 基因在生物学功能上可能发生了变化。
值得注意的是,拟南芥中AtWOX5 基因在根尖中特异性表达,调控根顶端分生组织稳态。进化分析和保守基序分析发现NtWOX5a 与AtWOX5 聚在WOX5 亚家族中,二者有着相似的保守基序的组织形式。共线性分析发现,AtWOX5 与NtWOX5a 基因存在于烟草和拟南芥的共线性区段中。此外,表达模式分析发现,NtWOX5a 基因同样也在根尖、根中高表达。因此,与AtWOX5 直系同源的NtWOX5a 很可能在普通烟草的根尖中参与根顶端分生组织干细胞动态平衡调控。
本研究利用比较基因组和生物信息学的方法,从普通烟草基因组中鉴定出23 个NtWOX 转录因子编码基因,所鉴定的NtWOX 转录因子均包含典型的同源异型结构域。同时新鉴定的烟草NtWOX 成员被分为3 个亚支和9 个亚家族。串联重复和全基因组重复分析发现,NtWOX3 和NtWOX13 亚家族因为复制事件发生从而出现扩张。表达分析发现NtWOX 基因表达存在特异性。GO 注释分析发现,所鉴定的普通烟草NtWOX 转录因子在细胞核中结合DNA,并参与组织器官发育以及细胞间通讯和胁迫响应等信号转导过程。