李朝睿
马铃薯基因家族的鉴定与分析
李朝睿
上海交通大学农业与生物学院, 上海 200240
为了进一步研究基因家族在马铃薯中作用,本研究利用各类基因家族分析软件对马铃薯家族成员进行全基因组鉴定与分析。结果表明,马铃薯家族共包含20个成员,大部分基因都只含有2个内含子。19个马铃薯成员分布于6条染色体上,有三对重复基因,其中两对为重复串联基因,另一对为片段重复基因。根据进化关系和保守结构域分布可以分为ZHD和MIF和UN三个亚家族,同一亚家族成员之间motifs特征相似。组织差异表达表明,几乎所有的在马铃薯中都在叶片中表达。在非生物胁迫中,在干旱(利用甘露醇模拟)和高盐胁迫下马铃薯基因均高表达。本研究进一步揭示了-在马铃薯中的保守性和参与马铃薯生长与抗逆的潜在功能,为后续研究奠定基础。
马铃薯; ZF-HD; 基因家族; 生物信息学
ZF-HD转录因子(zinc finger homeodomain)是广泛存在于植物中,进化上相对保守的转录调控因子,其命名是因其氨基酸序列中有C2H2型锌指结构(C2H2-type zinc finger motif)和保守的HD结构域(Homeodomain)[1]。大量研究表明,ZF-HD转录因子主要参与了植物生长发育过程以及响应非生物胁迫,比如拟南芥AtZHD1蛋白能特异性结合ERD1启动子,对盐和干旱胁迫产生反应[2]。大多数番茄基因在花芽部位表达,其中多个对如高盐、高温等非生物胁迫响应[3]。值得注意的是,有一类蛋白MIF (mini zinc finger)拥有与ZF-HD蛋白高度相似的ZF结构域序列但缺乏HD结构域,有研究推测MIF蛋白由ZF-HD蛋白丢失HD结构域而形成的[4]。国内外有对马铃薯的研究都较为深入,但对马铃薯基因家族的研究目前还没有相关文献报道。马铃薯基因组测序完成于2011年,为马铃薯的遗传学研究及分子育种提供了非常有价值的资源[5]。本研究利用生物信息学方法,对马铃薯基因家族进行鉴定,对其基因结构、蛋白基本理化特征、与其他植物基因共线性和自身差异表达等进行分析,揭示了马铃薯基因家族潜在的生物学功能。
拟南芥(L.),番茄(L.)和马铃薯基因组序列、蛋白质序列、CDS序列及其注释信息均来自Ensamble plant数据库。基因的隐马尔科夫模型PF04770下载自Pfam[6]。使用Hmmsearch工具分别搜索马铃薯的蛋白质数据库获得候选基因。在线网站ExPasy估计得到蛋白基本信息[7]。使用geneDoc绘制蛋白序列比对图以确定保守结构域。
利用在线软件MEME对马铃薯ZF-HD蛋白的motif进行预测和分析[8],用TBtools软件展示motif的分布[9]。最后通过GSDS工具分析的基因内含子与外显子结构[10]
基因在染色体上的分布图绘制于Mapchart。利用BLAST序列比对后找到串联重复的基因(相似度>70%的基因)。MEGA 7.0用于拟南芥和马铃薯的系统进化分析,MCScanX软件对马铃薯、拟南芥和马铃薯、番茄进行物种间的共线性分析。
通过马铃薯数据库PGSC上下载马铃薯转录组数据(单位为TPM)。筛选出10个马铃薯基因在各个组织表达量数据并标准化,以及胁迫下表达数据,利用R语言进行绘制图。
通过上述方法搜索与鉴定最终在马铃薯基因组中鉴定到20个基因。根据其搜索顺序依次命名为-~-。蛋白多序列比对图显示所有的ST-ZHD蛋白都有ZF结构(C2H2型)[11],而鉴定出-,-,-缺少HD结构域当属于MIF亚家族,剩余的-均拥有HD结构域属于ZHD亚家族[11](图1)。
图1 马铃薯ZF-HD家族ZF结构域与HD结构域
研究显示所有成员都有motif3,对比后得到motif3为ZF结构域(图2D);而MIF亚家族缺少motif5,对比得到motid5为MIF亚家族中所没有的HD结构域(图2E);UN亚家族有独特的motif4。总之,相同亚家族的motif分布模式基本相似,不同亚家族成员之间存在差异,可能与亚家族功能趋异有关(图2B)。从基因结构的角度进一步分析基因家族发现,-基因家族中有8个不含有内含子,剩余的只含有2个内含子(图2C)。
图2 马铃薯ZF-HD基因家族保守原件与基因结构分析图
图3 ZF-HD基因染色体分布和染色体间关系
注:红色和黄色分别表示两对串联重复基因,蓝线一对片段重复基因。Red and yellow represent two pairs of repeatgene, and blue lines repeat thegene.
染色体定位显示,只有位于细胞器中,其余的位置明确(图3)。基因复制在新功能的发生和基因扩增中起着重要的作用。基因有三对是重复基因,其中有两对是来源于串联重复,它们均来自ZHD亚家族,而剩下的一对来源于片段重复且属于MIF亚家族。
系统发育分布表明,基因家族可分为3个亚家族,分别为ZHD、MIF和UN。其中大部分的属于ZHD亚家族和MIF亚家族,它们在进化树中与拟南芥ZF-HD蛋白交叉分布,说明之间进化关系紧密。但是有3个被归为UN亚家族中,它们没有与拟南芥聚类,说明这是马铃薯所特有的,需要进一步研究(图4)。
图4 马铃薯、拟南芥系统进化树
图5 马铃薯、拟南芥、番茄共线性分析
为了进一步推断马铃薯与同科的番茄和模式植物拟南芥的系统发育关系,建立共线性分析图。
矩形长条表示染色体,其中绿色为拟南芥,红色为马铃薯,蓝色为番茄,红色线条强调基因。结果表明,6个基因与拟南芥基因共线,14个基因与番茄共线。一些基因与拟南芥的两对同源基因相关。所有的基因与同科的番茄共线基因均为1:1同源,它们之间可能具有相似功能(图5)。
为了研究基因的生理功能,通过对10个在马铃薯根、茎、叶、花、块茎等组织中特异性表达分析发现(图6),在除在块茎中,根、茎、叶、花均有表达,而且大多数基因在叶中高度表达,表明家族成员在控制马铃薯叶片生长发育方面可能具有独特的功能。
图6 组织间差异表达图
图7 高盐或干旱处理表达量柱状图
利用甘露醇260 μmol·L-1处理24 h模拟干旱胁迫处理后,除了有所下降外,其它所有马铃薯基因在高盐胁迫下表达量上调,特别是表达量显著(图7)。浓度为150 mmol·L-1的NaCl溶液处理24 h模拟的高盐胁迫处理的转录产物的积累结果柱状图显示,除、和外其余的表达量上调,且表达量显著(图7)。
广泛的研究表明,基因已经在许多陆生植物中被发现,但在藻类中没有被发现[12],这类基因可能在在陆生植物间相对保守。本研究在马铃薯中鉴定到20个基因进行了分类,蛋白结构域、基因结构、位置分布等进行了分析,验证了马铃薯种内-相对保守且存在重要功能。
通过与模式植物拟南芥和同科植物番茄进行共线性分析发现之间存在同源基因说明了-的种间保守性,推测具有相似功能。基因参加植物生长发育,例如拟南芥家族成员均主要在拟南芥花卉组织中表达,表明在花发育期间可能起到调控作用[13]。而在本研究中,而且大多数基因在叶中高度表达,这是与拟南芥不相同的,需要进一步研究。在研究的10个中,基因在盐或干旱胁迫下显示出相对较高的表达水平,它与的同源性较高。而的过度表达可以增强耐旱性[2],该结果说明了在植物间功能保守,均有调节生长发育与抗逆的重要作用。
本研究对马铃薯中进行了全面分析,为未来马铃薯抗胁迫性研究提供了基础。
[1] WindhÖvel A, Hein I, Dabrowa RCharacterization of a novel class of plant homeodomain proteins that bind to the C4 phosphoenolpyruvate carboxylase gene of Flaveria trinervia [J]. Plant Molecular Biology, 2001,45(2):201-14
[2] Tran L, Nakashima K, Sakuma YCo‐expression of the stress‐inducible zinc finger homeodomain ZFHD1 and NAC transcription factors enhances expression of the ERD1 gene in Arabidopsis [J]. The Plant Journal, 2007,49(1):46-63
[3] Khatun K, Nath UK, Robin AHKGenome-wide analysis and expression profiling of zinc finger homeodomain ( ZHD ) family genes reveal likely roles in organ development and stress responses in tomato [J]. BMC Genomics, 2017,18(1):1-16
[4] Wei H, Depamphilis CW, Hong MPhylogenetic Analysis of the Plant-specific Zinc Finger-Homeobox and Mini Zinc Finger Gene Families [J]. Journal of Integrative Plant Biology, 2008,50(8):1031-1045
[5] Xu X, Pan S, Cheng SGenome sequence and analysis of the tuber crop potato [J]. Nature, 2011,475(7355):189-195
[6] Finn RD, Penelope C, Eberhardt RYThe Pfam protein families database: towards a more sustainable future [J]. Nucleic Acids Research, 2016(D1):D279-D85
[7] Appel RD,Bairoch A, Hochstrasser DF,A new generation of information retrieval tools for biologists: the example of the ExPASy WWW server [J]. Trends in Biochemical Sciences, 1994,19(6):258-260
[8] Bailey TL, Boden M, Buske FAMEME Suite: tools for motif discovery and searching [J]. Nucleic Acids Research, 2009, 37(Web Server issue):W202-W208.
[9] Chen CJ, Xia R, Chen HTBtools, a Toolkit for Biologists integrating various HTS-data handling tools with a user-friendly interface [J/OL]. Molecular Plant. doi:10.1016/j.molp.2020.06.009
[10] Hu B, Jin J, Guo AYGSDS 2.0: an upgraded gene feature visualization server [J]. Bioinformatics, 2015,31(8):1296-1297
[11] Krishna SS, Majumdar I, Grishin NVStructural classification of zinc fingers: survey and summary [J]. Nucleic Acids Research, 2003,31(2):532-550
[12] Wang WL, Wu P, Li Y,Genome-wide analysis and expression patterns of ZF-HD transcription factors under different developmental tissues and abiotic stresses in Chinese cabbage [J/OL]. Molecular Genetics & Genomics. doi:10.1007/s00438-015-0036-1
[13] Tan QKG, Irish VF. The Arabidopsis zinc finger-homeodomain genes encode proteins with unique biochemical properties that are coordinately expressed during floral development [J]. Plant Physiology, 2006,140(3):1095-1108
Identification and Analysis ofGene Family in Potato
LI Chao-rui
200240,
For further investigation ofgene family in potato, genome-wide identification and analysis of potatofamily members were done by all kinds of gene family analysis software. It turns that there are 20 members of the potatofamily, in which most of genes contain only two introns. 19 members of the potatogene are found on 6 chromosomes and there are three pairs of repeat genes. Two of them are repeat tandem genes and the other is fragment repeat genes. Three subfamilies can be divided into ZHD, MIF and UN according to evolutionary relationship and conserved domain distribution and the members among the same subfamily have similar motifs. Organizational difference expression indicates that most of the potatoesgenes are expressed in leafs. In abiotic stress, High expression ofgenes under drought (mannitol simulation) and high salt stress. This study further reveals the conservatism of-in potatoes and the potential function of participating in potato growth and inversion resistance, laying the foundation for subsequent research.
Potato; ZF-HD; gene family; bioinformatics
S662.1
A
1000-2324(2021)03-0384-04
2020-10-14
2020-11-23
李朝睿(2000-),男,本科,主要研究方向为植物科学与技术. E-mail:lichaorui30@163.com