程 赫 田双慧 张 洋 刘 聪 夏德安 魏志刚
(1. 林木遗传育种国家重点实验室,东北林业大学,哈尔滨 150040;2. 国家林业和草原局盐碱地研究中心,中国林业科学研究院,北京 100091)
非特异性脂质转运蛋白(non-specific lipid transfer proteins,nsLTP)广泛存在于高等植物中,是一类在体外膜之间介导磷脂转移的碱性蛋白,具有8个保守的半胱氨酸基序(C-Xn-C-Xn-CC-Xn-CXC-Xn-C-Xn-C,8 CM)(其中的二硫键能形成稳定的疏水结构),是其参与结合和转运各种脂质(如脂肪酰辅酶A、磷脂和脂肪酸等)的调控活性中心。nsLTP蛋白于1975年首次在马铃薯()发芽块茎中被发现,随后,在油菜()、黄瓜()和火炬松()等多种植物中相继克隆出。根据其编码蛋白分子量、序列相似和脂质转移效率的差异性,植物nsLTP 可分为nsLTP1(8~10 kDa)和nsLTP2(约7 kDa)2种类型,其中nsLTP1 型的疏水腔呈隧道状,而nsLTP2 型则呈三角形的空心状。
研究发现,植物参与细胞壁松弛和延伸、花药和花粉的发育与萌发等生长发育的多个生物学过程,如被家族沉默的水稻()花粉外壁发育缺陷、花粉育性降低,玉米()nsLTP 蛋白能与一种钙调素结合蛋白相互作用,从而调节自身的生理活性。同时,植物在生物与非生物胁迫响应中也能发挥重要作用,如过表达小盐芥()的转基因株系在盐胁迫下生物量和叶绿素值显著高于野生型植株。拟南芥()脂质转运蛋白AZI1 不仅能与蛋白激酶MPK3相互作用形成复合物,也能够被MPK3 上调表达,从而介导其盐胁迫响应。此外,植物对脱落酸、水杨酸、赤霉毒和乙烯等激素胁迫也具有响应性,如马铃薯中在水杨酸、茉莉酸和脱落酸的诱导下表达量有明显的上调趋势。
先前研究已经在拟南芥、水稻和小麦()等模式植物中分别鉴定出了49、52、106 个基因并对其进行了全基因组分析。由于8 个保守的半胱氨酸的结构不同,被分为9 大类、被分为10 类,且处于相同类别的基因在多条染色体上形成了基因簇,说明该基因家族的扩增主要是由串联复制事件演化而来;结构分析表明该家族内含子—外显子结构多样性较低,多数基因无内含子;在盐和干旱胁迫条件下家族基因被上调表达,说明该家族基因在响应逆境胁迫方面可能具有重要的功能。毛果杨()作为首个全基因组测序的木本植物,是研究木材形成、季节性生长、性别分化以及木本植物逆境胁迫响应的模式植物。然而,目前为止,尚未见家族基因的研究报导。本项研究从全基因组水平对家族成员的基因数量、亲缘关系、基因结构、染色体定位、编码蛋白保守基序分布与数量等特征进行研究。同时,利用qRT-PCR 技术并结合转录组数据,对其组织与逆境胁迫响应特性进行初步研究。本项研究将为在杨树生长发育与逆境胁迫下的生物学功能分析与鉴定奠定基础。
为了鉴定毛果杨基因家族的成员,首先利用已知的拟南芥家族各基因编码氨基酸序列在毛果杨基因组数据库(https://phytozome.jgi.doe.gov/pz/portal.html)进行搜索,将获得的序列结果汇总整理,剔除重复序列后作为候选基因。为了验证初始结果的可靠性,将候选基因的氨基酸序列上传至HMMER 网站(https://www.ebi.ac.uk/Tools/hmmer/)以及NCBI 保守结构域数据库(https://www.ncbi.nlm.nih.gov/)鉴定其是否具有家族保守结构域。通过上述步骤,初步确定家族包含39个基因。
下载和编码的氨基酸序列,通过MEGA6.0 软件中的邻接法(Neighbor-joining,NJ),校验参数Bootstrap 重复10 000 次,构建进化树,随后在iTOL(https://itol.embl.de/)网站上对生成的进化树进行可视化处理。
利用ExPASy(https://web.expasy.org/protparam/)在线预测PtrnsLTP 蛋白理化性质,包括氨基酸数目、分子量和等电点等;从Phytozome 数据库中获取该基因家族的染色体位置、基因序列、氨基酸序列、开放阅读框长度以及氨基酸长度等信息,并根据基因所在的染色体号以及位置对其命名;通过Plant-mPLoc(http://www. csbio. sjtu. edu. cn/bioinf/plant-multi/)网站,在线预测家族成员的亚细胞定位信息。
通过Blastp 比对氨基酸序列,利用TBtools 软件分析同源基因对之间的Ka(异意替换)和Ks(同意替换)以及二者的比率。这个比率可以判断是否有选择压力作用于这个蛋白质编码的基因。若Ka/Ks=1 则同义突变和非同义突变将以同样的速率被固定,即中性选择,突变不会影响蛋白质的结构和功能;若Ka/Ks>1,氨基酸发生了改变,此时的非同义突变会提高植物的生存力,即正选择;只有当Ka/Ks<1 时,非同义突变是有害的,即负选择,使得突变具有纯化作用。
通过GSDS 网站(http://gsds.cbi.pku.edu.cn/in⁃dex.php)将的内含子和外显子信息进行可视化,并结合MEGA6.0 软件对其进化树文本进行基因进化树比对分析。
利用MEME(http://meme-suite.org/tools/meme)网站对PtrnsLTP 氨基酸序列进行保守基序分析,TBtools软件对该分析结果进行可视化处理。
组织表达特异性分析:通过Phytozome 数据库,下载各在各组织中的表达量数据,并与qRT-PCR 分析结果相互验证。野生型毛果杨来自中国科学院上海生物科学研究所,用组织培养的方法扩繁后。将1 月大小的组培苗移栽到土壤中,在25 ℃、长日照(光照16 h 黑暗8 h)环境下温室中培养3 周。分别采集根、茎和叶组织,利用植物总RNA 提取试剂盒(MiniBEST,TaKaRa)提取总RNA,然后采用PrimeScriptRT reagent Kit(Per⁃fect Real Time,TaKaRa)试剂盒反转录RNA 获得cDNA 用于qRT-PCR。每组处理重复3 次,采用2法计算相对表达量并利用TBtools可视化。
盐胁迫下的响应特性:将幼苗随机分成7 组,每组包含5 棵毛果杨幼苗。用100 mmol•LNaCl处理3、6、12、24、48、72 h 同时用水处理作为对照组。分别采集上述处理组内各植株材料的根、茎和叶组织,提取总RNA 后反转录获得cDNA 进行qRT-PCR 分析。每组处理重复3 次,采用2法计算相对表达量并利用TBtools可视化。
根据荧光定量引物设计原则,设计家族基因定量引物,以为内参基因(见表1)。在赛默飞ABI 7500实时荧光定量PCR仪上进行试验,体系如下:2×TransStart TOP/Tip Green qPCR Supermix 10 μL、上下游混合引物(10 μmol·L)0.4 μL、cDNA1.5 μL,PassiveReference Dye(50×)0.4 μL,加ddHO 至20 μL。反应程序:94 ℃30 s;94 ℃5 s,60 ℃15 s,72 ℃35 s,循环40次;95 ℃15 s,60 ℃1 min,95 ℃30 s。
表1 PtrnsLTP定量引物序列Table 1 PtrnsLTP quantitative primer sequence
以家族基因序列为参考,在毛果杨基因组中鉴定出39个,其编码蛋白均含有植物nsLTP 典型的C--C-Xn-CC-Xn-CXC-Xn-C-Xn-C保守结构域。为了进一步分析家族成员间进化关系,构建了毛果杨和拟南芥编码的蛋白序列进化树。结果(见图1)表明:毛果杨与拟南芥可分为5 个亚家族,不同的亚家族间用不同的背景颜色表示,同时外部的黑色和白色圆圈分别代表毛果杨及拟南芥nsLTP 家族基因。可以看出A 亚族有6 个、B 亚族有2 个、C 亚族有13 个、D 亚族有3 个、E 亚族有15 个成员,与其他物种的进化方式相似。
图1 拟南芥和毛果杨nsLTP基因家族系统进化树黑色圆圈标记PtrnsLTP,白色圆圈标记AtnsLTPFig.1 Phylogenetic tree of Arabidopsis thaliana and P.trichocarpa nsLTP gene family PtrnsLTP is marked with a black circle,AtnsLTP is marked with a white circle
家族各基因编码蛋白分子质量为8.58~16.95 kDa、pI 值为4.27~9.91,符合植物家族基因编码蛋白的等电点基本特征(见表2)。亚细胞定位预测表明,编码蛋白如PtrnsLTP1.1等14 个蛋白定位在细胞膜上,PtrnsLTP1.3等22个蛋白定位在细胞壁上,其中PtrnsLTP9.2、PtrnsLTP11.1和PtrnsLTP15.1在细胞膜和细胞壁上均有定位。
表2 PtrnsLTP家族概况Table 2 Overview of the PtrnsLTP gene family
为了阐明家族基因在染色体上的分布,利用TBtools 构建了家族基因染色体定位以及同源关系图。结果(见图2)表明,主要分布在毛果杨1 号和16 号染色体上,各有6 个且16号染色体上的6 个基因形成了基因簇。4、9、11、12和14号染色体上各有3个,2、7、10、15和17号染色体上各有2个,其余染色体上均只含有1个基因。
图2 PtrnsLTP染色体定位及序列一致性Fig.2 Chromosome location and sequence identity analysis of PtrnsLTP
Blastp 结 果 显 示,和与同源片段长度大于300 bp且序列一致性高于80%,同样的还有和、和、和、和(见图3,表3),说明这7 对基因为基因复制事件进化而形成的旁系同源基因。
图3 PtrnsLTP家族基因外显子—内含子结构Fig.3 Exon-intron structure of PtrnsLTP family gene
表3 同源基因的Ka/Ks比值及序列一致性Table 3 Ka/Ks ratio and sequence identity of homologous genes
同源基因Ka/Ks 分析发现,家族共有7 对同源基因,其中6 对基因(和、和、和、和、和、和)的Ka/Ks 比值小于1,1 对(和)大于1(见表3),上述结果表明,家族各成员在进化过程中大多数基因经过了纯化选择,少部分基因受到了正向选择。值得注意的是这6 对基因处于同一个大的进化分支上,推测进化压力的不同可能会导致基因功能的分化。
为了更好地阐明家族中各基因外显子与内含子分布规律,利用GSDS网站对上述内容进行了可视化处理。结果表明(见图3),不同基因的内含子与外显子在基因中的分布方式相似,所有基因均无内含子,表明家族基因的结构在进化中极为保守。
家族编码蛋白保守域分析发现,9 个保守基序中Motif 1 和Motif 2 为家族共有基序(见图4)。虽然不同基因编码蛋白所含基序数量与种类存在一定的差异,但相同分枝的基因编码蛋白具有相似的基序组合,而不同亚家族、类型之间的基序存在明显的差别。上述结果表明,不同亚家族的生物学功能在进化过程中可能产生了分化。
图4 PtrnsLTP蛋白的保守基序分析Motif 1~9用不同的颜色表示;Motif 1~4序列展示在下方Fig.4 Conserved motif analysis of PtrnsLTP protein Motif 1~9 are represented by different colors,and Motif 1~4 sequences are shown below
为了解家族各成员在毛果杨生长发育中的生物学功能,我们对Phytozome 中家族各基因在不同组织部位的表达量数据并进行了初步分析,结果(见图5A)表明,家族成员在毛果杨各组织表达量不同,其中除、、、、、以 及在网站无表达量数据以外,其余基因均在毛果杨不同部位有所表达。该家族大部分基因在茎部表达量较高,其次为叶部,相同进化分枝基因的表达模式相似。同时,我们利用qRT-PCR 技术对家族成员在毛果杨不同组织部的表达情况做进一步验证,结果(见图5B)表明,各家族成员在毛果杨根、茎和叶中的表达变化趋势与phytozome 中各基因表达值基本吻合。上述结果初步表明,家族成员在毛果杨根、茎和叶发育过程中的生物学功能产生了分化。
图5 PtrnsLTP组织表达特异性A.Phytozome网站数据;B.qRT-PCR结果Fig.5 PtrnsLTP tissue expression specificity A.Phytozome website data;B.qRT-PCR results
为鉴定家族成员的盐胁迫响应特性,利用qRT-PCR 技术分析了不同时间盐胁迫下家族成员在毛果杨根、茎、叶部的表达量。结果(见图6)表明,39个成员均对盐胁迫有不同程度的响应;根部组织中,随着盐胁迫时间的增加,除、、和表达量降低以外,其余基因表达量均有明显的上升趋势;茎部几乎所有基因表达量随着胁迫时间的增加呈现明显的先升高后降低的“倒U”曲线趋势,即随着胁迫时间的增加表达量先升高,达到峰值后逐渐降低;同样,叶部相同进化分支的基因如、和表达量也在12 h 时达到了峰值,而其他大部分基因表达量随胁迫时间增加呈现明显上升的趋势。
图6 PtrnsLTP在盐胁迫不同时间下的表达特性Fig.6 Expression characteristics of PtrnsLTP under salt stress at different times
脂质(磷脂)在维持植物细胞功能、生长发育以及各种胁迫的应答中起着重要作用,而nsLTP蛋白是植物体内脂质(磷脂和脂肪酸)跨膜转运的主要载体。研究表明,植物nsLTP 对干旱、盐碱和低温等非生物胁迫具有较强的响应能力。目前为止,植物家族基本特性的研究主要集中在水稻和拟南芥等草本模式植物中,木本模式植物毛果杨家族的研究目前尚无报导。
本项研究在毛果杨基因组中鉴定出39 个,按照进化关系将其分为5 个亚组族(见图1),其编码蛋白分别定位在细胞壁、细胞膜或在二者之间均有定位(见表2)。家族成员分布于毛果杨14 条染色体上,且各染色体上基因分布数量存在差异,其中1 号和16 号染色体上分布最多,分别有6 个(见图2),而6 和8 号染色体上均只含有1个基因,表明导致家族成员扩张的历史事件存在差异。家族中有7 对基因为旁系同源基因(见图2 和表3),其中1 对旁系同源基因的Ka/Ks 比值大于1,证明其受到了正向选择,6 对远小于1,且这6 对基因处于同一个大的进化分支。该家族基因在进化过程当中既经历了纯化选择也经历了正向选择,有害的非同义替换在进化过程中消失,极少数的无害或有益替换得以保留,上述结果表明,毛果杨家族基因在进化过程受到的选择作用不同,因此其家族基因编码蛋白的细胞定位与理化性状产生了分化。同时,这一现象也预示了该基因家族的生物学功能产生了分化。家族基因均无内含子(见图3),一般认为无内含子基因能够连续编码成蛋白质,且内含子与真核生物基因组的复杂程度有很大的关系,越复杂的生物体其体内的内含子数越多。此外近期研究表明,无内含子基因能够更加快速的应答胁迫信号,预示着该家族基因在非生物胁迫下可能具有重要功能。与其他植物一样,家族编码蛋白含有多个基序,表明该基因家族生物学功能的多样性,但所有基因均含有保守基序Motif 1 和Motif 2(见图4),表明这两个基序是该家族的特征基序,且是毛果杨生命活动所必需的。上述结果进一步预示了家族结构相对较为保守,但不同进化分枝基因可能在生物学功能上出现了分化。
结合毛果杨生物学网站表达谱数据(见图5A)与本研究中qRT-PCR 结果(见图5B)发现,家族成员在毛果杨根、茎和叶部均有表达,但表达量在3 种组织中存在差异,其中11 个基因在根部表达水平较高,15 个在茎部表达水平较高,13个在叶部表达水平较高,预示了各成员分别在毛果杨不同组织发育过程中扮演着不同的作用。前期研究表明,多涉及环境胁迫响应,而盐胁迫又是最常见的环境胁迫之一。盐胁迫过程主要分为两部分即渗透胁迫和离子胁迫,渗透胁迫是植物在盐渍土壤中经历的第1次胁迫,当盐浓度达到临界值时就会产生离子毒害。我们利用qRT-PCR 分析毛果杨在盐胁迫不同时间下的表达情况(见图6),结果进一步表明,家族基因对盐胁迫具有不同程度的响应能力,与拟南芥中该家族在盐胁迫中表现类似。值得注意的是茎部几乎所有的基因在盐胁迫12 h时表达水平显著上升,而茎部又是输送水、无机盐以及有机物等维持植物体正常生长必不可少成分的关键部位。据此,我们推测该家族基因可能在植物盐胁迫中主要参与渗透胁迫过程。
本研究通过对家族基因生物学功能的鉴定和盐胁迫表达特征分析为今后更深入了解该基因家族奠定了基础,同时也对基因资源的挖掘具有积极的意义。