巨桉FLA基因家族成员的鉴定与分析

2024-11-11 00:00于茹恩曾炳山范春节
中南林业科技大学学报 2024年9期

摘 要:【目的】含有束状蛋白(fasiclin)结构域的类成束状阿拉伯半乳糖蛋白(fasciclin-like arabinogalactan proteins,FLAs)在巨桉细胞壁的次生生长和合成中起着重要作用。为了获得更多有价值的信息并探索其功能,对巨桉FLA基因家族的全基因组进行分析。【方法】以巨桉全基因组数据和转录组数据为基础,通过Expasy、MEME、MEGA7.0、TBtools等生物信息学工具对EgrFLAs基因家族的核酸序列的特征、基因结构、蛋白质理化性质、蛋白保守结构域、家族系统进化关系和表达量等进行分析和预测。【结果】巨桉共有21个EgrFLAs基因,其中包括3个新发现的EgrFLAs基因,这些基因不均匀地分布在巨桉11条染色体中的9条上。所有鉴定到的EgrFLAs基因均含有束状蛋白结构域,聚为4个群组,其中D组包含最多的基因成员。在EgrFLAs基因启动子中发现了大量的顺式元件,包括发育相关、水杨酸、茉莉酸甲酯等相关响应元件。不同组织的表达谱分析表明除EgrFLA1、EgrFLA2和EgrFLA3外,聚在A组的EgrFLA5和EgrFLA7也参与了次生生长。在巨桉不定根形成过程中,EgrFLA1和EgrFLA3通过表达量逐渐增加的方式参与诱导不定根形成。经SA和MeJA处理后,EgrFLA1和EgrFLA2的表达量发生显著变化,表明EgrFLA1和EgrFLA2在巨桉的发育和胁迫反应中可能具有多种作用。【结论】在巨桉中鉴定FLA基因21个,包括新发现的3个基因。在EgrFLAs基因启动子中发现了大量发育和激素相关的顺式元件。EgrFLA1、EgrFLA2、EgrFLA3、EgrFLA5和EgrFLA7作为巨桉次生生长发育中的候选基因,将为进一步的巨桉分子育种提供宝贵的资源。

关键词:巨桉;类成束状阿拉伯半乳糖蛋白;次生生长;基因家族;基因表达;发育

中图分类号:S792.39;S718.46 文献标志码:A 文章编号:1673-923X(2024)09-0127-11

基金项目:中国林业科学研究院基本科研业务费专项资金项目(CAFYBB2020ZB004);“十四五”重点研发计划项目(2021YFD2200102-05)。

Identification and analysis of FLA gene family members in Eucalyptus grandis

YU Ruen1, ZENG Bingshan2, FAN Chunjie2

(1. College of Biological Science and Technology, Beijing Forestry University, Beijing 100083, China; 2. Key Laboratory of State Forestry Administration on Tropical Forestry, Research Institute of Tropical Forestry, Chinese Academy of Forestry, Guangzhou 510520, Guangdong, China)

Abstract:【Objective】The fasciclin-like arabinogalactan proteins (FLAs) known as containing fasciclin (FAS) domains, were identified as important roles in secondary growth and synthesis of the cell wall in eucalyptus. A whole genome study of the FLA gene family of Eucalyptus grandis was performed in this study to gain more valuable information and explore their function.【Method】Basing on the whole genome data of eucalyptus, the characteristics of nucleic acid sequence, gene structure, physicochemical properties of protein, conserved domain of protein, phylogenetic relation of family and expression quantity of FLA gene family were analyzed and predicted by Expasy, MEME, MEGA7.0, TBtools and other bioinformatics software.【Result】21 EgrFLAs genes including 3 newly identified EgrFLA genes were presented in eucalyptus, which unevenly distributed in 9 of 11 chromosomes. All identified FLAs contained fasciclin domain, which were clustered into 4 subgroups, with group D including the most gene members. A large number of cis-elements including development elements, salicylic acid, methyl jasmonate related elements were identified in promoters of EgrFLAs genes. Expression profiles in various tissues, adventitious root formation and different stress treatments were also performed. The expression profiles of different tissues showed that except for EgrFLA1, EgrFLA2 and EgrFLA3, EgrFLA5 and EgrFLA7 clustered into group A were also identified to be involved in secondary growth. The expression of EgrFLA1 and EgrFLA3 gradually increased during adventitious root formation in vitro of eucalyptus. The EgrFLA1 and EgrFLA3 were mainly involved in adventitious rootinducing process. The expression of EgrFLA1 and EgrFLA2 significantly altered after SA and MeJA treatments, which meant EgrFLA1 and EgrFLA2 were potentially versatile roles in development and response to stress in eucalyptus.【Conclusion】21 EgrFLAs genes including 3 newly identified EgrFLA genes were presented in Eucalyptus. A large number of cis-elements including development element, phytohormone related elements were identified in promoters of FLAs genes. EgrFLA1, EgrFLA2, EgrFLA3, EgrFLA5 and EgrFLA7 were used as candidate genes in secondary growth and development of eucalyptus, which will provide valuable resources for further molecular breeding in eucalyptus.

Keywords: Eucalyptus grandis, fasciclin-like arabinogalactan proteins, secondary growth, gene family, gene expression, development

类成束状阿拉伯半乳糖蛋白(fasciclin-like arabinogalactan proteins,FLAs)是阿拉伯半乳聚糖蛋白(arabinogalactan-proteins, AGPs)的一个亚类,其特征是由AGP结构域和束状蛋白结构域组成,这些结构域最先在果蝇中发现,之后在包括细菌、酵母、动物和植物在内的各种生物中发现。在植物中,FLAs通常包含一个或两个束状蛋白结构域,包括一个保守的中心YH基序和两个高度保守且长度约为10个氨基酸的H1和H2基序[1]。此外,一个N端信号肽和一个C端糖基磷脂酰肌醇(glycosylphosphatidylinositol,GPI)膜锚蛋白主要附着在细胞表面,在植物的大多数FLAs中总是同时出现[2]。

对植物中FLAs的研究表明,它们可能参与离体根和茎的再生、花的发育以及对生物和非生物胁迫的响应。拟南芥Arabidopsis thaliana中FLA1和FLA2可能参与了离体不定根的诱导和发育[3],FLA3主要在花药中表达,进一步研究证实其参与了小孢子和雄性配子体的发育[4]。此外,AtFLA4被发现参与细胞扩增和干旱相关的胁迫信号反应。FLA9还与种子发育和胁迫反应有关。近年来,大量的研究发现FLAs在植物次生细胞壁形成和特性中发挥重要作用。如FLA11、FLA12在维管组织中高表达,影响细胞壁的结构和组成,进而调控茎的抗拉强度和生物力学。在棉花中,过表达GhFLA1可以显著增加纤维长度并改变细胞壁的组成[5]。而在亚麻中,一些FLAs显示出具有调节纤维伸长和细胞壁增厚的潜在功能[6-7]。在木本植物中,PtFLA6参与木质部中木质素和纤维素的生物合成,进一步影响杨树的次生细胞壁组成[8-9]。同样,作为AtFLA11和AtFLA12的同源基因,EgrFLA1和EgrFLA2主要在茎中表达,影响巨桉的纤维素沉积和纤维素微纤维角度,甚至影响茎秆力学。另一树种亮果桉Eucalyptus nitens中的EniFLA1、EniFLA2和EniFLA3与EgrFLA1和EgrFLA2高度相似,也证实了它们可以影响次生细胞壁结构和茎的生物力学[10]。

由于其重要性,FLA基因已在拟南芥中被发现[11]。随后在水稻Oryza sativa[12-13]、小麦Triticum aestivum[13]、烟草Nicotiana benthamiana[14]、棉花Gossypium raimondii[15]和白菜Brassica rapa[16]中的FLAs基因逐渐被鉴定出来。在木本植物中,杨树Populus trichocarpa的FLA的全基因组也被鉴定。巨桉具有速生、优质、丰产、适应性强等特点[17],相关研究也进行了巨桉FLA基因的鉴定,共鉴定出18个FLAs基因。然而,对其理化特性、基因结构和基序及其在各组织或发育阶段的相关表达仍未进行详细分析。同时,在以往的研究中,有几个FLAs基因缺失。本研究进行了一个全面的巨桉FLAs全基因组分析,构建了多种植物FLAs基因家族的系统发育树,研究了FLAs基因在不同组织和茎节间的表达模式、不定根诱导过程和胁迫反应,为进一步开展桉树分子育种提供有价值的候选基因。

1 材料与方法

1.1 巨桉FLA基因家族的鉴定

首先,从Phytozome网站(https://phytozomenext.jgi.doe.gov/)下载巨桉的全基因组数据。然后从TAIR数据库(https:// www.arabidopsis.org/)下载所有的AtFLAs的蛋白序列。同时,从Pfam数据库(http://pfam.xfam.org/)中获取FLA蛋白的Pfam序列(PF02469),利用HMMER 3.0软件的hmmsearch程序对FLA保守结构域的氨基酸序列进行鉴定(E<0.000 1)[18]。同时,去除无AGP糖基化区域的基因。将所有获得的巨桉FLA氨基酸序列通过Pfam(https://pfam.xfam.org/)、Smart(https: //smart.embl-heidelberg.de/)及NCBI网站CDD(https://www.ncbi.nlm.nih.gov/Structure/ bwrpsb/bwrps)数据库进一步进行保守结构域确认。最后,将同时含有FAS结构域和AGP糖基化区域的序列鉴定为FLA蛋白。此外,为确保获得巨桉所有FALs,对结构缺陷明显的基因再次进行基因模型预测,并通过在线软件Softberry(https:// www.softberry.com/berry.phtml?topic =fgenesh & group=programs&su-bgroup=gfind)对结构域进行校准推测[19]。

1.2 巨桉FLA家族蛋白理化性质的鉴定

对所有鉴定的EgrFLA蛋白,通过在线软件ExPASy(https://web.expasy.org/protparam/)分析基因家族成员的分子量、等电点、蛋白长度等。通过TMHMM Server v.2.0(https://services.healthtech. dtu.dk/service.php?TMHMM-2.0)进行跨膜结构域鉴定。此外,SignalP 4.1 Server(http://www.cbs. dtu.dk/services/SignalP/)[20]和big-PI Plant Predictor(http://mendel.imp.ac.at/gpi/plant_server.html)分别用于预测信号肽和GPI修饰位点[21]。

1.3 巨桉FLA家族蛋白进化树的构建

利用MEGA7软件中的Muscle对巨桉、水稻、杨树和拟南芥的FLAs进行多序列比对。然后,采用极大似然法(maximum likelihood estimation, MLE)构建系统发育树。Bootstrap的值设置为1 000[22]。此外,通过在线软件iTOL(https://itol. embl.de/)进行系统发育树的可视化。

1.4 巨桉FLA家族蛋白染色体定位及共线性分析

从巨桉参考基因组中提取各染色体上的FLAs基因位置。应用MCScanX软件检测物种内的复制基因对[23]。使用TBtools绘制染色体位置图和共线性分析图[24]。采用KaKs_CalculatorL 3.0软件计算FLA基因对的非同义突变率(nonsynonymous mutation rate,Ka)、同义突变率(synonymous mutation rate,Ks)和Ka/Ks值[25]。

1.5 巨桉FLA家族蛋白基因结构和保守基序分析

从巨桉基因组中提取内含子和外显子的长度和位置,然后通过MEME (https://meme-suite.org/ meme/tools/meme)分析保守基序,Motif数量设为10。利用TBtools v1.105软件对巨桉FLA基因的基因结构和基序位置进行可视化分析。同时,利用GSDS2.0 (https://gsds.gao-lab.org/)软件绘制保守域的位置图。用Clustal X软件进行多序列比对来鉴定保守FLS结构域,用Jalview2.10.3软件绘制相应的图[26]。

1.6 巨桉FLA家族蛋白顺式作用元件分析

为了获得上游潜在的调控基因或转录因子,检测了FLA基因启动子的顺式作用元件。提取巨桉FLA基因的所有上游2 000 bp DNA序列,并将所有序列提交到PlantCARE网站(https://bioinformatics. psb.ugent.be/webtools/plantcare/html/)进行顺式作用元件的预测[27]。

1.7 转录组数据分析基因表达特性

在各组织中,根、叶、木质部、韧皮部、先端和茎节间取自6月龄1 m的苗木,花取自3年生巨桉。2月龄嫩枝分别进行200 mmol NaCl、100 μmol茉莉酸甲酯(Methyl Jasmonate,MeJA)和100 μmol水杨酸(Salicylic acid,SA)处理。处理后0、1、6、24、168 h采集叶片。以培养20 d的离体繁殖植株为不定根诱导样品。在不定根诱导培养基上培养0、1、6、24、48、72、96、168 h和20 d后收集茎基部材料。所有试验均进行3次重复。从前期的研究[28](https://bar.utoronto.ca/~asher/eplant_eucalyptus/)中收集转录组数据,使用Tbtools生成热图。

2 结果与分析

2.1 巨桉FLA基因的全基因组鉴定

为了鉴定巨桉中的EgrFLAs成员,对21个AtFLAs家族成员进行BLAST搜索,保留了含有FAS结构域和AGP糖基化区域的序列,在巨桉基因组中鉴定出21个FLAs基因家族成员,命名为EgrFLA1~EgrFLA21(表1)。该结果比之前报道的多了3个成员,分别命名为EgrFLA19(Eucgr. H00590.1)、EgrFLA20(Eucgr.K00086.1)和EgrFLA21(Eucgr.L03441.1)[19]。理化性质分析表明,蛋白质长度为117~481 aa。其中EgrFLA21分子量最低,为13 241.24 kDa;EgrFLA9分子量最高,为72 623.31 kDa。21个EgrFLAs家族成员的蛋白等电点(pI)为5.04(EgrFLA4)~9.75(EgrFLA1)。21个EgrFLAs的大多数成员的亲水性平均系数(Grand average of hydropathicity,GRAVY)值大于零,表明这些基因为疏水性基因。

2.2 巨桉FLA基因结构、蛋白结构、顺式作用元件及系统发育分析

为了进一步研究EgrFLAs家族成员的基因和蛋白质结构,利用MEGA、MEME和TBtools获得了EgrFLAs家族成员的系统发育树、蛋白质保守基序组成和结构域。得到的10个Motif用不同的颜色表示。Motif 1、Motif 2、Motif 3和Motif 5在EgrFLAs中广泛存在(图1)。然而,EgrFLA18只包含Motif 2,EgrFLA21只包含Motif 8。巨桉EgrFLAs的所有成员都具有束状蛋白结构域。此外在EgrFLA13中单独鉴定到rad23超家族结构域。

基因启动子中的顺式作用元件对于研究EgrFLAs家族成员的生物学功能和调控模式具有重要意义。在19个顺式调控元件中,光响应性顺式调控元件所占比例最大(40.72%),激素相关元件(生长素、脱落酸、赤霉素、水杨酸、茉莉酸甲酯)所占比例次之(37.29%)。其他类别如胁迫相关元件、发育元件、分生组织表达元件等,占总数的21.99%。有6个基因参与对刺激的防御和反应,包括EgrFLA2、EgrFLA5、EgrFLA9、EgrFLA14、EgrFLA16和EgrFLA18。可以看出,9个基因的启动子区域都有低温响应元件。顺式作用元件的结果表明,EgrFLAs可以响应多种激素和胁迫进一步参与植物的多种生理生化过程(图2)。

为了揭示EgrFLAs家族成员之间的进化关系,利用包括21个EgrFLAs、21个AtFLAs、35个PtrFLAs和27个OsFLAs在内的104个FLA蛋白序列构建了系统发育树。将21个EgrFLAs基因家族成员分为4个亚组,分别为A、B、C、D组。其中分布在A组的基因最多,拟南芥和杨树所占比例最大。EgrFLAs家族成员中只有两个基因分布在B组,分别为EgrFLA5和EgrFLA9。与单子叶植物水稻相比,巨桉中的EgrFLAs基因与杨树和拟南芥中的FLA基因亲缘关系更近,它们在系统发育树上总是紧密聚集在一起(图3)。

2.3 巨桉FLA基因的染色体定位及共线分析

为了更好地了解EgrFLAs在巨桉染色体上的基因组分布机制,基于巨桉的基因组序列构建了EgrFLAs的染色体定位图谱。结果(图4)表明,21个EgrFLAs家族成员位于染色体1、2、3、6、7、8、10、11号和scaffold_3184上,主要集中在染色体1和7号上。然而,在染色体3、10号和scaffold_3184上只有一个成员。

为了进一步分析EgrFLAs的起源和系统发育关系,分析了巨桉与拟南芥(图5a)和杨树(图5b)的共线性关系。在巨桉和杨树之间的EgrFLAs基因对数高于巨桉和拟南芥之间的基因对数。一些EgrFLAs与至少两对同源基因相关,这表明这些基因在进化过程中发挥了重要作用。同时,一些EgrFLAs与这2个物种没有形成同型基因对,这表明这些基因可能是EgrFLAs所特有的。

2.4 与巨桉二次生长发育相关的FLA候选基因的鉴定

为了进一步确定EgrFLAs在巨桉中的功能,对其在不同组织中的表达谱进行分析。所有EgrFLAs根据其表达模式分为三类(图6a)。FLA10、FLA13、FLA14、FLA17、FLA18、FLA19和FLA20在各组织中表达量较低或均匀不表达。其他组的FLAs基因至少在一个器官中高表达。EgrFLA6在巨桉根中特异表达。同时,先前研究中FLA1、FLA2、FLA3参与木质部导管和纤维发育[19],本研究结果发现其主要表达在木质部。这表明这些基因的功能在一定程度上与其表达谱相关。值得注意的是,FLA7和FLA12在根中表达量较高,它们可能参与了巨桉根系的形成和发育。

为了鉴定更多参与木质部发育的FLA基因,还从茎上顶端向下分别代表初生到次生生长的不同节间进行了差异表达分析。与FLA1、FLA2、FLA3相似,EgrFLA5和EgrFLA7表达量也是从茎尖向下逐渐增加。而EgrFLA8、EgrFLA9和EgrFLA11表现出完全相反的表达模式。这些结果表明,这些基因可能通过正调控或负调控的方式参与木质部的次生生长和发育。此外,还发现不同组织中表达最低的基因被归为同一簇(图6b)。这表明这些基因很少调控次生生长或木质部发育。

2.5 巨桉离体不定根诱导相关FLA候选基因的鉴定

在巨桉组培繁殖过程中,不定根诱导对获得健壮的芽苗具有重要意义。因此,有必要确定参与不定根诱导的候选基因。FLA13、FLA14、FLA17、FLA19和FLA20在不定根诱导的不同阶段很少表达。FLA1、FLA2、FLA3、FLA8的表达量随着持续时间的增加而逐渐增加,表明它们在巨桉不定根诱导中起着关键作用。同时,FLA6、FLA7、FLA10和FLA12在诱导168 h和20 d表现出明显的上调,主要作用于不定根伸长或主要在根中表达(图7)。这将为FLA基因在不定根的形成和发育中发挥重要作用提供线索,其具体功能鉴定有待进一步探索。

2.6 巨桉胁迫反应相关FLA候选基因的鉴定

为了验证EgrFLA在逆境下的潜在功能,还研究了盐、MeJA和SA处理下FLA基因的表达谱(图8)。在NaCl处理下,除了不表达的FLAs外,几乎所有EgrFLAs都表现出明显的下调。值得注意的是,FLA1、FLA4、FLA5和FLA12在处理168 h时下调,而FLA3、FLA6、FLA7、FLA8、FLA9和FLA11在处理1 h立即下调,接着随着处理时间的增加不断下降,在处理168 h达到最低。在MeJA处理下,FLA1和FLA2的表达量随处理次数的增加而增加,在处理168 h达到最高点。相反,随着处理时间的延长,FLA6和FLA8呈下降趋势。同时,FLA5、FLA7、FLA9和FLA12的表达量在MeJA处理1、6和24 h的短时间内呈上升趋势,在处理168 h后呈下降趋势。与MeJA处理不同的是, EgrFLA5、FLA7和FLA9在168 h处理下表达量达到最高,而其他FLA基因在SA处理下几乎无明显差异。

3 讨 论

FLA基因几乎是巨桉中最早被发现的基因。在应拉木中的基因表达表明,两种密切相关的束状蛋白样阿拉伯半乳聚糖蛋白EniFLA1和EniFLA2的表达参与巨桉木质部对重力应力的响应,与纤维木质部的微纤维角度有关[29]。随后对拟南芥的功能分析表明,与EniFLA1、EniFLA2和EniFLA3关系更为密切的AtFLA11和AtFLA12主要通过影响纤维素沉积和细胞壁基质的完整性来影响植物茎的强度和弹性[10]。在巨桉中的功能验证表明,EgrFLA1、EgrFLA2和EgrFLA3参与了巨桉木质部导管和纤维的发育,尤其是木质部纤维中纤维素微纤维角的发育,并进一步调节次生细胞壁的生长和性能[19]。同时,在巨桉中鉴定出18个FLA基因,并对其进行了简单的表征。然而,基因组序列的不完善和延迟导致FLA基因缺失。在这项研究中,EucgrH00590(EgrFLA15)、EucgrK00086(EgrFLA18)和L03441(EgrFLA21)是通过全基因组搜索和进一步验证新发现的FLA基因。同时,还发现特异性表达的EgrFLA15、EgrFLA18和EgrFLA21在少数组织或处理中均不表达。这可能是他们在之前的研究中没有被发现的另一个原因。

早期研究中发现EgrFLA1、EgrFLA2和EgrFLA3在木质部纤维发育和次生细胞壁生长中起着重要的作用。在本研究中也出现了类似的结果。例如,EgrFLA1、EgrFLA2和EgrFLA3在木质部中高表达。在巨桉中,它们的表达量从茎顶部向下随着次生生长的增加而逐渐增加,进一步表明它们可能主要参与巨桉的次生生长。同样,与EgrFLA1、EgrFLA2和EgrFLA3密切相关的基因CsaFLA9和CsaFLA11在大麻中也表现出从顶端向下的表达增加模式[30]。而在柳树S. suchowensis和杨树P. deltoides中,它们的高同源性基因PdeFLA9和FLA29、SsuFLA7的表达水平并没有从顶端向下部分呈正增加[31]。推测FLA基因在杨树中的扩增(35个FLA基因)导致了FLA基因的多样性。同时EgrFLA5和EgrFLA7在木质部高表达,在茎中从上到下依次增加,也是潜在的候选基因,可能与巨桉次生生长有关。

此外,EgrFLA1、EgrFLA2和EgrFLA3在离体不定根形成过程中被明显诱导表达,这在以往的研究中未见报道。虽然在组织培养中AtFLA1在侧根发育和芽发育的早期事件中起作用[11],但与EgrFLA1、EgrFLA2和EgrFLA3密切相关的AtFLA11和EgrFLA12没有报道类似的功能。同时,在168 h盐处理下,EgrFLA1表达下调,而在MeJA处理下,EgrFLA1和EgrFLA2的表达逐渐升高。此外,MeJA反应元件存在于EgrFLA1、EgrFLA2和EgrFLA3的启动子区域,水杨酸反应元件也存在于EgrFLA1和EgrFLA2的启动子区域。这些结果表明,EgrFLA1、EgrFLA2和EgrFLA3不仅参与调控木质部的次生生长,还参与生长发育和胁迫响应等方面的调控。因此,EgrFLA1、EgrFLA2和EgrFLA3将用于进一步研究。

4 结 论

本研究对巨桉中FLAs进行了全面的全基因组分析。根据AGP结构域和FAS结构域共鉴定出21个EgrFLAs基因。在巨桉中有3个新发现的EgrFLA基因,它们不均匀地分布在11条染色体中的9条上。在FLAs基因启动子中发现了大量的顺式元件,包括发育元件、植物激素相关元件等。在各组织中的表达谱显示,除EgrFLA1、EgrFLA2和EgrFLA3外,聚集在A组的EgrFLA5和EgrFLA7也参与了次生生长。此外,EgrFLA1和EgrFLA3主要参与不定根诱导过程。EgrFLA1和EgrFLA2在巨桉的发育和应激反应中具有潜在的多用途作用。总之,本研究提供了全面的生物信息学分析和表达谱分析,以探索与胁迫相关的候选基因,为进一步的巨桉分子育种提供了宝贵的资源。

参考文献:

[1] SEIFERT G J. Fascinating fasciclins: a surprisingly widespread family of proteins that mediate interactions between the cell exterior and the cell surface[J]. International Journal of Molecular Sciences,2018,19(6):1628.

[2] ZANG L N, ZHENG T C, CHU Y G, et al. Genome-wide analysis of the fasciclin-like arabinogalactan protein gene family reveals differential expression patterns, localization, and salt stress response in Populus[J]. Frontiers in Plant Science, 2015,6:1140.

[3] BASU D, TIAN L, DEBROSSE T, et al. Glycosylation of a fasciclin-like arabinogalactan-protein (SOS5) mediates root growth and seed mucilage adherence via a cell wall receptorlike kinase (FEI1/FEI2) Pathway in Arabidopsis[J]. PLoS ONE, 2016,11(1):e145092.

[4] HE J D, ZHAO H, CHENG Z L, et al. Evolution analysis of the fasciclin-like arabinogalactan proteins in plants shows variable fasciclin-AGP domain constitutions[J]. International Journal of Molecular Sciences,2019,20(8):1945.

[5] HUANG G Q, GONG S Y, XU W L, et al. A fasciclin-like arabinogalactan protein, GhFLA1, is involved in fiber initiation and elongation of cotton[J]. Plant Physiology,2013,161(3): 1278-1290.

[6] ROACH M J, DEYHOLOS M K. Microarray analysis of flax(Linum usitatissimum L.) stems identifies transcripts enriched in fibre-bearing phloem tissues[J]. Molecular Genetics and Genomics,2007,278(2):149-165.

[7] ROACH M J, DEYHOLOS M K. Microarray analysis of developing flax hypocotyls identifies novel transcripts correlated with specific stages of phloem fibre differentiation[J]. Annals of Botany,2008,102(3):317-330.

[8] WANG H H, JIANG C M, WANG C T, et al. Antisense expression of the fasciclin-like arabinogalactan protein FLA6 gene in Populus inhibits expression of its homologous genes and alters stem biomechanics and cell wall composition in transgenic trees[J]. Journal of Experimental Botany,2015,66(5):1291-1302.

[9] WANG H H, JIN Y L, WANG C T, et al. Fasciclin-like arabinogalactan proteins, PtFLAs, play important roles in GAmediated tension wood formation in Populus[J]. Scientific Reports,2017,7(1):6182.

[10] MACMILLAN C P, MANSFIELD S D, STACHURSKI Z H, et al. Fasciclin-like arabinogalactan proteins: specialization for stem biomechanics and cell wall architecture in Arabidopsis and Eucalyptus[J]. The Plant Journal,2010,62(4):689-703.

[11] JOHNSON K L, KIBBLE N A J, BACIC A, et al. A fasciclinlike arabinogalactan-protein (FLA) mutant of Arabidopsis thaliana, fla1, shows defects in shoot regeneration[J]. PLoS ONE,2011,6(9):e25154.

[12] MA H L, ZHAO J. Genome-wide identification, classification, and expression analysis of the arabinogalactan protein gene family in rice (Oryza sativa L.)[J]. Journal of Experimental Botany,2010,61(10):2647-2668.

[13] FAIK A, ABOUZOUHAIR J, SARHAN F. Putative fasciclin-like arabinogalactan-proteins (FLA) in wheat (Triticum aestivum) and rice (Oryza sativa): identification and bioinformatic analyses[J]. Molecular Genetics and Genomics,2006,276(5):478-494.

[14] WU X Y, LAI Y C, LV L Q, et al. Fasciclin-like arabinogalactan gene family in Nicotiana benthamiana: genome-wide identification, classification and expression in response to pathogens[J]. BMC Plant Biology,2020,20(1):305.

[15] HUANG G Q, XU W L, GONG S Y, et al. Characterization of 19 novel cotton FLA genes and their expression profiling in fiber development and in response to phytohormones and salt stress[J]. Physiologia Plantarum,2008,134(2):348-359.

[16] LI J, WU X M. Genome-wide identification, classification and expression analysis of genes encoding putative fasciclin-like arabinogalactan proteins in Chinese cabbage (Brassica rapa L.)[J]. Molecular Biology Reports,2012,39(12):10541-10555.

[17] 邓海燕,申琳琳,胡中洋,等.巨桉用材林林分质量评价与界定标准划分[J].中南林业科技大学学报,2023,43(7):65-73. DENG H Y, SHEN L L, HU Z Y, et al. Stand quality evaluation and demarcation standard division of Eucalyptus plantation[J]. Journal of Central South University of Forestry & Technology, 2023,40(7):65-73.

[18] POTTER S C, LUCIANI A, EDDY S R, et al. HMMER web server: 2018 update[J]. Nucleic Acids Research,2018,46(W1): 200-204.

[19] MACMILLAN C P, TAYLOR L, BI Y D, et al. The fasciclin-like arabinogalactan protein family of Eucalyptus grandis contains members that impact wood biology and biomechanics[J]. New Phytologist,2015,206(4):1314-1327.

[20] PETERSEN T N, BRUNAK S, von HEIJNE G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods,2011,8(10):785-786.

[21] EISENHABER B, WILDPANER M, SCHULTZ C J, et al. Glycosylphosphatidylinositol lipid anchoring of plant proteins. sensitive prediction from sequence-and genome-wide studies for Arabidopsis and rice[J]. Plant Physiology,2003,133(4): 1691-1701.

[22] KUMAR S, STECHER G, TAMURA K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution,2016,33(7):1870-1874.

[23] WANG Y P, TANG H B, DEBARRY J D, et al. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity[J]. Nucleic Acids Research,2012,40(7):e49.

[24] CHEN C J, CHEN H, ZHANG Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant,2020,13(8):1194-1202.

[25] ZHANG Z. KaKs_Calculator 3.0: calculating selective pressure on coding and non-coding sequences[J]. Genomics Proteomics Bioinformatics,2022,20(3):536-540.

[26] THOMPSON J D, GIBSON T J, PLEWNIAK F, et al. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Research,1997,25(24):4876-4882.

[27] ROMBAUTS S, DéHAIS P, Van MONTAGU M, et al. PlantCARE, a plant cis-acting regulatory element database[J]. Nucleic Acids Research,1999,27(1):295-296.

[28] FAN C J, LYU M J, ZENG B S, et al. Profiling of the gene expression and alternative splicing landscapes of Eucalyptus grandis[J]. Plant Cell and Environment,2024:1-16. DOI: 10.1111/pce. 14814.

[29] QIU D Y, WILSON I W, GAN S M, et al. Gene expression in Eucalyptus branch wood with marked variation in cellulose microfibril orientation and lacking G-layers[J]. New Phytologist, 2008,179(1):94-103.

[30] GUERRIERO G, MANGEOT-PETER L, LEGAY S, et al. Identification of fasciclin-like arabinogalactan proteins in textile hemp (Cannabis sativa L.): in silico analyses and gene expression patterns in different tissues[J]. BMC Genomics, 2017,18(1):741.

[31] ZHANG Y Y, ZHOU F W, WANG H, et al. Genome-wide comparative analysis of the fasciclin-like arabinogalactan proteins (FLAs) in Salicacea and identification of secondary tissue development-related genes[J]. International Journal of Molecular Sciences, 2023,24:1481.

[本文编校:谢荣秀]