基于转录组的荔枝ARF基因家族的鉴定及表达分析

2017-05-30 05:55董晨魏永赞王弋郑雪文李伟才
热带作物学报 2017年8期
关键词:表达分析荔枝

董晨 魏永赞 王弋 郑雪文 李伟才

摘 要 生长素反应因子(Auxin Response Factors,ARFs)是调节生长素表达的转录因子响应基因,ARF基因在植物中大多由多基因家族组成。基于转录组数据,通过生物信息学方法对荔枝ARF基因进行鉴定,并分析其理化性质、亚细胞定位、保守基序、系统进化以及基因的表达模式。在荔枝中鉴定出21个ARF基因,其编码的蛋白质含有53~1 117个氨基酸,分子量约为6.112~123.872 ku,等电点为4.21~9.45。亚细胞定位预测结果显示21个ARF均定位于细胞核。LcARFs基因家族具有相对保守的结构,即包含1个保守的B3 DNA结构域、ARF结构域和Aux/IAA结构域。进化树分析表明荔枝ARF蛋白分为5个亚家族。21个荔枝ARF基因在花穗发育过程中有明显不同的表达规律。该结果为进一步深入研究荔枝ARF基因家族的功能奠定了基础。

关键词 荔枝;生长素反应因子;基因家族;生物信息分析;表达分析

中图分类号 S667.1 文献标识码 A

Transcriptome-wide Identification and Expression Profiling of the Auxin Response Factor(ARF)Gene Family in Litchi chinensis Sonn.

DONG Chen, WEI Yongzan, WANG Yi, ZHENG Xuewen, LI Weicai*

Institute of South Subtropical Corp Research, Chinese Academy of Tropical Agricultural Sciences / Key Laboratory

of Tropical Fruit Biology, Ministry of Agriculture, Zhanjiang, Guangdong 524091, China

Abstract Auxin Response Factors(ARFs)are the transcription factors that regulate the expression of auxin responsive genes. The ARF genes are composed by a large multigene family in plants. The study was based on the data of litchi transcriptome data, the basic physical and chemical characters, subcellular location, protein conserved domain, evolutionary relationship and expression patterns of litchi ARF genes family were analyzed by the bioinformatics methods. Twenty-one ARF genes were identified in litchi. The predicted litchi ARF gene family members encode proteins ranged from 53 to 1 117 amino acid residues (aa)in length, and relative molecular weight varied from 6.112 to 123.872 ku, isoelectric point(pI)in the range of 4.21 to 9.45.In addition, subcellular localization analysis showed that all of the LcARF proteins were located in the nucleus. Sequence analysis based on the sequence of litchi ARF indicates that it contains 3 relatively conservative domains(B3 domain, Auxin-resp domain and Aux-IAA domain). Phylogenetic analysis revealed that LcARF gene family was divided into five groups(group I~group V). The expression patterns of ARF gene were different in different developmental stages. The results laid a foundation for further study of the function of the litchi ARF gene family.

Key words Litchi chinensis Sonn.; ARF; gene family; bioinformation analysis; expression analysis

doi 10.3969/j.issn.1000-2561.2017.08.018

生长素在植物的生长发育过程中发挥着重要的作用,例如侧根形成、顶端优势、向性反应、植物叶芽和果实发育[1]。生长素反应因子(Auxin response factor, ARF)是生长素信号通路中的重要转录因子,通过直接与生长素反应元件(AuxRE,TGTCTC)直接结合来调节生长素反应基因的转录。通常ARF 蛋白包含3个独特的保守结构域:保守的N-末端的B3 DNA结合结构域(B3 domain),可变中間结构域为激活结构域(AD)或抑制结构域(RD),C-末端是二聚作用结构域CTD[2]。N-末端的B3 DNA结合结构域可以特异性地靶向生长素反应基因的启动子中的AuxRE元件,可变中间结构域基于其氨基酸残基的组成,决定ARF是发挥转录激活作用还是抑制作用,C-末端结构域参与蛋白质-蛋白质相互作用,介导ARFs之间的同二聚化及ARF和Aux/IAA之间的蛋白的异二聚化。ARF基因家族参与调节植物生长发育以及植物对多重信号的反应转导通路,在叶片的衰老、维管组织形成、子叶发育、花发育及果实成熟等植物生长发育过程中具有重要作用。自从第1个ARF(AtARF1)基因从拟南芥中克隆以来,近年来越来越多的ARF基因在多种不同的植物中被预测或鉴定出来,包括拟南芥[3]、水稻[4]、玉米[5]、谷子[6]、大豆[7]、番茄[8]、黄瓜[9]、菜心[10]、香蕉[11]、葡萄[12]、甜橙[13]、苜蓿[14]、毛果杨[15]、巨桉[16]等。但目前关于荔枝ARF研究鲜见报道,刘兴地等[17]成功克隆了1个与无核荔枝胚珠败育相关的生长素反应因子基因(ARF),而在转录组层面分析荔枝ARF基因家族则未见报道。

本研究基于课题组妃子笑荔枝不同花穗发育时期的转录组测序数据,在转录组水平上对ARF基因家族进行鉴定和生物信息学分析,分析烯效唑处理花穗和对照花穗21个LcARF在花穗发育不同时期的表达规律,为日后进一步研究荔枝ARF基因功能提供一定的理论依据。

1 材料与方法

1.1 材料

妃子笑荔枝种植于中国热带农业科学院南亚热带作物研究所荔枝龙眼示范果园,选择树龄及长势相近的妃子笑6株,在花穗长18 cm时用50 μg/mL的5%烯效唑处理花穗,CK不做任何处理,3个生物学重复,分别在初花期、盛花期、谢花期采集对照和处理的妃子笑花穗,用于转录组测序。

1.2 方法

1.2.1 数据来源、基因鉴定与分析 荔枝转录组数据由本课题组测序获得(数据未发表),在对照和烯效唑处理不同花穗发育时期共拼接组装了48 844个unigenes。模式植物拟南芥、水稻的ARF基因序列下载于植物转录因子数据库(http://planttfdb.cbi.pku.edu.cn)和Phytozome11基因组数据库(https://phytozome.jgi.doe.gov/pz/portal.html),将其作为探针序列,利用本地Blast软件在荔枝转录组数据中进行blast搜索比对。同时,利用关键词“auxin response factor”和“ARF”进行直接检索。去除重复序列后,利用SMART对序列保守结构域进行鉴定,并删除不含ARF基因家族特征结构域的基因。

1.2.2 基本理化性质及保守结构域分析 利用在线软件ProtParam(http://web.expasy.org/protparam/)分析预测荔枝ARF的蛋白序列的分子量、等电点、不稳定系数、脂肪指数和疏水性等基本的理化性质。利用在线软件Plant-mPLoc Server(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#)分析荔枝ARF蛋白亚细胞定位。

利用MEME4.0(http://meme.nbcr.net/meme/)分析荔枝ARF家族蛋白的保守基序, 基序的大数目设置为20, 基序长度设为6~200个氨基酸。运用在线软件SMART(http://smart.embl-heidelberg.de/)对得到的保守基序进行功能注释,并且参照拟南芥和水稻的命名模式进行命名。

1.2.3 系统进化关系分析 利用多重序列比对软件Clustal X 1.83对荔枝、拟南芥和水稻的所有ARF蛋白序列进行序列比对计算,比对结果进一步通过 MEGA6.0软件构建系统进化树,系统发育进化树生成采用邻接法(neighbor joining,NJ),参数设置: 使用neighbor-joining法则的P-距离(P-distance)模型构建, 选择了成对删除(pairwise deletion)空位(gap)的选项,Bootstrap method取值1 000。

1.2.4 基因家族在花穗调控下的表达特征分析

利用荔枝转錄组测序数据分析ARF基因的表达特征。转录组数据包含妃子笑荔枝烯效唑处理和对照花穗发育过程中的3个时期(初花期,盛花期,谢花期)的基因表达数据。以FPKM值表示转录本丰度,通过对数据均一化处理,利用Heml工具做热图。

2 结果与分析

2.1 荔枝ARF基因家族的鉴定

通过对转录组数据库的本地blast比对检索和关键词搜素,共获得40条ARF序列,通过SMART对保守结构域的筛选最终得到21条荔枝ARF蛋白序列。为了方便研究,按照转录组中的基因ID大小前后顺序统一为荔枝ARF编号(LcARF1~21),见表1。可以看出从转录组分离的到的21个ARF基因大小从162 bp(LcARF21)~3 354 bp(LcARF1),对应所编码的氨基酸数分布在53~1 117 aa。预测的理论分子量大小范围在6.112~123.871 ku之间;等电点大小范围在4.21~9.45之间,其中15个LcARF等电点小于7,显酸性,6个LcARF等电点大于7,显碱性,LcARF蛋白平均等电点小于7,表明ARF为弱酸性,在酸性的亚细胞环境中发挥作用。不稳定指数分析发现3个LcARF蛋白(7, 19,21)不稳定指数小于40,为稳定蛋白,其余均为不稳定蛋白。亚细胞定位分析表明所有的LcARF蛋白均定位于细胞核。以上结果分析ARF蛋白的基本理化特性可见LcARF蛋白无论从氨基酸序列的长度还是蛋白的特性变化都有很大的差异,表明ARF基因家族蛋白具有不同特性。

利用SMART软件对LcARF基因家族B3 domain、Auxin-resp domain、AUX-IAA domain进行分析,结果发现,LcARF基因家族中LcARF1/2/10/14/15/16/17/20同时含有3个结构域,占基因家族总数的38.1%;LcARF3/4/5/6/11/12/18含有B3 domain、Auxin-resp domain 2个结构域,占基因家族总数的33.3%;而LcARF7/9/10仅含有B3 domain,LcARF19仅含有AUX-IAA domain(图1)。荔枝ARF基因家族不同保守结构域的位置信息见表1。

2.2 LcARF蛋白的保守基序分析

通过在线软件MEME分析LcARF蛋白中的保守基序,结果如图2、3所示。LcARF基因家族中预测含有20个保守基序,ARF基因家族成员之间所包含的保守基序数目及种类存在一定的差异。除了AtARF23、LcARF7/8/19/21不含保守Motif 1外,其他均含有motif 1。相比Motif 1,Motif 2在LcARF基因家族中有8个成员不含该基序,Motif 3在LcARF基因家族中有5个成员不含该基序。Motif 4 出现15次,motif 5 17次;motif 6 16次;motif 7 17次;motif 8 16次;motif 9 11次;motif 10 12次;motif 11 14次;motif 12 9次;motif 13 15次;motif 14 12次;motif 15 1次;motif 16 1次;motif 17 10次;motif 18 4次;motif 19 8次;motif 20 4次。结果表明出现频率较高的motif为ARF结构域中非常重要的保守基序。对于出现频率较低的motif保守基序,通过Smart在线分析关于其功能的相关信息目前未知,有待日后进一步深入研究。

2.3 ARF蛋白的进化关系分析

为了进一步了解荔枝ARF基因家族各成员之间的进化关系以及生物学功能的相关性,对鉴定的21个荔枝ARF基因家族成员及模式植物拟南芥、水稻ARF基因家族成员构建系统发育树(图4)。系统发育分析结果表明:21个荔枝ARF可以划分为5个亚家族,其中GroupⅠ含有LcARF基因家族成员6个,占基因家族总数的28.57%;GroupⅡ含有LcARF基因家族成员10个,占基因家族总数的47.62%;GroupⅢ~Ⅴ分别含有1、2、2个。进化关系较进的LcARF在氨基酸长度和蛋白结构组成相似,如LcARF2和LcARF10。荔枝ARF和拟南芥ARF在进化上亲缘较关系较近,和水稻关系较远。

2.4 荔枝ARF基因家族的表达分析

利用妃子笑荔枝(对照和烯效唑处理花穗发育的不同时期)的RNA-Seq转录组数据库(数据未发表),找到候选的21个ARF基因对应转录本的RPKM值,通过对RPKM值取对数值转换,利用Heml热图软件作热图(图5)。结果显示,在对照和处理花穗中至少在花期的某1个检测到21个LcARF基因的表达,但表达丰度不同;其中LcARF2和LcARF10在对照及处理花穗不同发育时期表达量均较强,而LcARF6、LcARF7、LcARF13、LcARF19和LcARF21表达量较低。进化关系较近的例如LcARF2和LcARF10以及LcARF19和LcARF21表达量也相似,表明这些基因间具有相似的生物学功能。在花穗发育的不同阶段,LcARF基因在对照和处理中大部分表达量下调,其中对照LcARF有9个基因下调(LcARF1/2/3/4/9/10/13/14/20),烯效唑处理有14个基因下调(LcARF1/2/3/4/7/8/9/10/11/14/15/16/18/20),对照下调的基因在烯效唑处理后表达量也下调。对照和处理中LcARF17表达特征为升-降的趋势,在第2个阶段盛花期表达量较高,推测在盛花期发挥重要作用。花穗发育的3个不同时期大多数LcARFs表达趋势为逐渐下调,与前人研究荔枝花期内源激素IAA含量逐渐下降一致。其中LcARF2和LcARF10表达量较高,推测其在生长素合成途径中发挥重要的生物学作用。

3 讨论

荔枝是起源于我国南方的亚热带名贵水果,我国荔枝栽培历史悠久,种质资源极其丰富,栽培面积和产量均居世界首位。‘妃子笑具有花穗长、花量大、花期长的特点,导致因花穗发育和开放消耗大量营养而导致坐果率低甚至不结实的问题。荔枝花穗发育与内源激素关系密切,生长素作为最早发现的植物激素,其生理作用广泛,影响细胞的分裂、伸长和分化。

近年来,随着测序技术的飞速发展,越来越多物种全基因组测序完成。目前ARF转录因子已在多个物种的基因组水平上得以鉴定,ARF基因家族成员在不同的物种中存在很大的差异。其中,大豆中ARF基因家族成员最多, 为51个[7];香蕉[11]、毛果楊[15]、玉米[5]、菜心[10]、水稻[4]、蒺藜苜蓿[14]、拟南芥[3]、番茄[8]、葡萄[18]、甜橙[13]、黄瓜[9]和巨桉[16]基因家族成员分别为47、39、31、31、25、24、23、21、19、19、18和17个。本研究基于荔枝转录组数据,共鉴定了21个ARF基因。通过分析荔枝ARF基因家族蛋白保守结构域发现,荔枝ARF基因家族包含典型的保守结构域B3 domain、Auxin-resp domain、AUX-IAA domain,这与拟南芥[3]、水稻[4]、玉米[5]、香蕉[11]等ARF基因家族关于蛋白保守结构域的研究结果相似。通过对荔枝ARF基因家族的系统进化分析发现,LcARF基因家族的21个家族成员划分为5个不同的亚家族,进化分组与前人对ARF家族分组的研究结果一致[3,19]。同一亚家族中,不同ARF蛋白成员间在氨基酸序列的大小相似、蛋白结构相近、表达趋势也相似;说明进化关系较进的具有相似的生物学功能。

本研究基于妃子笑荔枝花穗不同发育时期转录组数据库鉴定分析了LcARF基因家族,并对其蛋白的基本理化性质、亚细胞定位、蛋白保守结构域、保守基序、系统进化,以及转录组基因表达特征进行了全面的分析,为进一步研究荔枝ARF的生物学功能奠定坚实的基础。

参考文献

[1] Davies P J. Plant hormones: physiology, biotechnology and molecular biology[Z]. London: Kluwer Academic Publishers, 2004.

[2] 刘振华,于延冲, 向凤宁. 生长素响应因子与植物的生长发育[J]. 遗传, 2011, 33(12): 1 335-1 346.

[3] Okushima Y, Overvoorde P J, Arima K, et al. Functional genomic analysis of the AUXIN RESPONSE FACTOR gene family members in Arabidopsis thaliana: unique and overlapping functions of ARF7 and ARF19[J]. Plant Cell, 2005, 17(2): 444-463.

[4] Wang D, Pei K, Fu Y, et al. Genome-wide analysis of the auxin response factors (ARF) gene family in rice (Oryza sativa)[J]. Gene, 2007, 394(1-2): 13-24.

[5] Xing H, Pudake R N, Guo G, et al. Genome-wide identification and expression profiling of auxin response factor(ARF) gene family in maize[J]. BMC Genomics, 2011, 12(1): 178.

[6] 赵 艳, 瓮巧云, 马海莲, 等. 谷子ARF基因家族的鉴定与生物信息学分析[J]. 植物遗传资源学报, 2016, 17(3): 547-554.

[7] Ha C V, Le D T, Nishiyama R, et al. The auxin response factor transcription factor family in soybean: genome-wide identification and expression analyses during development and water stress[J]. Dna Research, 2013, 20(5): 511-524.

[8] Wu J, Wang F, Cheng L, et al. Identification, isolation and expression analysis of auxin response factor(ARF) genes in Solanum lycopersicum[J]. Plant Cell Reports, 2011, 30(11): 2 059-2 073.

[9] 盛 慧, 秦智伟, 李文滨, 等. 黄瓜生长素反应基因(ARF) 家族鉴定及表达特异性分析[J]. 中国农业科学, 2014, 47(10): 1 985-1 994.

[10] Lawrie J M. Auxin response factor gene family in Brassica rapa: genomic organization, divergence, expression, and evolution[J]. Molecular Genetics and Genomics, 2012, 287(10): 765-784.

[11] Hu W, Jiao Z, Hou X, et al. The auxin response factor gene family in banana: genome-wide identification and expression analyses during development, ripening, and abiotic stress[J]. Frontiers in Plant Science, 2015, 6: 742.

[12] 袁华招, 赵密珍, 吴伟民, 等. 葡萄生长素响应基因家族生物信息学鉴定和表达分析[J]. 遗传, 2015, 37(7): 720-730.

[13] Li S B, Ouyang W Z, Hou X J, et al. Genome-wide identification, isolation and expression analysis of auxin response fact (ARF) gene family in sweet orange (Citrus sinensis)[J]. Frontiers in Plant Science, 2015, 6: 119.

[14] Shen C, Yue R, Sun T, et al. Genome-wide identification and expression analysis of auxin response factor gene family in Medicago truncatula[J]. Frontiers in Plant Science, 2015, 6(11): 3 932-3 935.

[15] Kalluri U C, Difazio S P, Brunner A M, et al. Genome-wide analysis of Aux/IAA and ARF gene families in Populus trichocarpa[J]. BMC Plant Biology, 2007, 7(1): 1-14.

[16] Yu H, Soler M, Mila I, et al. Genome-wide characterization and expression profiling of the AUXIN RESPONSE FACTOR (ARF) gene family in Eucalyptus grandis[J]. Plos One, 2013, 9(9): 1 382-1 389.

[17] 劉兴地, 莫坤联, 郑 楷, 等. 无核荔枝生长素反应因子基因克隆及序列分析[J]. 中国农学通报, 2013, 29(7): 111-116.

[18] Wan S, Li W, Zhu Y, et al. Genome-wide identification, characterization and expression analysis of the auxin response factor gene family in Vitis vinifera[J]. Plant Cell Reports, 2014, 33(8): 1 365-1 375.

[19] 李慧峰, 冉 昆, 何 平, 等. 苹果生长素响应因子(ARF)基因家族全基因组鉴定及表达分析[J]. 植物生理学报, 2015, 51(7): 1 045-1 054.

猜你喜欢
表达分析荔枝
日啖荔枝三百颗,会上火吗
ЛИЧИ: ЭКЗОТИЧЕСКИЙ ТРОПИЧЕСКИЙ ФРУКТ
千里采荔枝的鹤
“阿义”和荔枝
荔枝熟了
荔枝
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
红花生育酚环化酶基因的克隆及表达分析
胶孢炭疽菌漆酶基因Lac2的序列特征与表达分析
玉米纹枯病病菌y—谷氨酰转肽酶基因克隆与表达分析