牛 娜 刘 震 黄鹏翔,3 朱金勇 李志涛 马文婧 张俊莲,3 白江平,* 刘玉汇,*
1 甘肃农业大学农学院,甘肃兰州 730070;2 甘肃省干旱生境作物学重点实验室 / 甘肃省作物遗传改良与种质创新重点实验室,甘肃兰州 730070;3 甘肃农业大学园艺学院,甘肃兰州 730070
糖基转移酶家族(glycosyltransferase,GTs)是专门负责催化糖基化反应的酶类,它们将活性糖基从糖基供体转移到糖基受体,并形成糖苷键,产物包括寡糖、多糖、各种复合糖(糖蛋白、糖脂)和多种多样的糖苷化合物(如花色苷、黄酮糖苷、白藜芦醇糖苷等)[1]。根据蛋白氨基酸序列的相似性,GTs被分为100多个亚家族[2]。其中一些家族的结构特征及其功能有被报道。Yin等[3]研究发现,糖基转移酶家族8 (GT8)基因家族的蛋白含有一个Glyco-transf-8结构域(约256个氨基酸),其中一些GT8基因参与植物细胞壁的生物合成。
半乳糖基转移酶基因(GAUT)属于GT8基因家族,它编码的半乳糖醛酸转移酶(GAUT,alphagalacturonosyltransferase, EC2.4.1.43)与果胶和半纤维素生物合成密切相关[4-5]。Sterling等[6]在拟南芥中共鉴定出15个GAUT家族成员,分为3个分支:GAUT-A(AtGAUT1~AtGAUT7)、GAUT-B (AtGAUT8~AtGAUT11)和GAUT-C (AtGAUT12~AtGAUT15)。Mohnen等[7]研究表明,GAUT1是参与果胶合成的半乳糖醛酸转移酶。GAUT4沉默的番茄植株果实表现出果胶成分的改变,积累的淀粉减少,果胶的数量减少,除其在果胶生物合成中的作用外,GAUT4还干扰了碳的代谢和分配[5]。GAUT13与GAUT14位于高尔基体中,参与了植物的发育过程,例如促进了花粉管壁和营养体细胞壁中果胶和木聚糖的合成[8]。GbGAUT32和GbGAUT04在海岛棉纤维发育过程中发挥着重要作用[9]。然而,GAUT基因在马铃薯中的功能尚不明确。鉴于GAUT基因在植物生长发育中发挥重要的作用,本研究从马铃薯全基因组水平对GAUT基因家族成员的数目、染色体上的分布特征、基因结构、理化性质、蛋白质保守结构域的组成和基因间的亲缘关系进行了全面的鉴定和分析,同时利用RNA-seq数据筛选出可能参与双单倍体马铃薯DM的不同器官发育和响应非生物胁迫的StGAUT基因,并进一步对3个不同颜色马铃薯品种的薯皮及薯肉中的StGAUT基因表达进行分析,获得了可能参与花色素苷生物合成的StGAUT基因,旨在为进一步研究GAUT基因家族成员的功能提供理论基础。
研究材料为3种不同颜色的马铃薯品种,包括‘黑美人’ (紫皮紫肉)、‘新大坪’ (白皮白肉)和‘铃田红美’ (红皮红肉)。所有试验材料在甘肃省定西市农业科学研究院试验田种植。每个品种取6个新鲜块茎(直径约4~5 cm),蒸馏水冲洗干净后,用手术刀将块茎薯皮分离取样,距离薯皮组织至少5 mm取薯肉,并将薯肉切成薄块。样品立即冷冻在液氮中,存放在-80℃的冰箱中以备使用。
马铃薯基因组信息、蛋白质和CDS序列及染色体位置等信息均下载自在线数据资源(PGSC, https://solanaceae.plantbiology.msu.edu/pgsc_download.shtml)。采用2种方法鉴定马铃薯GAUT家族成员:(1) 在Pfam数据库(http://pfam.xfam.org/)下载GAUT保守结构域(PF01501)作为模板序列,利用HMM3.0(http://hmmer.org/download.html)比对,得到可能含有该保守结构域的候选成员。(2) 采用BLASTP方法[10](阈值设为E≤1e-5):利用已知的15个拟南芥AtGAUT成员[6]氨基酸序列,在马铃薯全基因组(PGSC_DM_4.03)范围内进行比对以获取StGAUT成员。将上述2种比对方法获得的候选成员去除重复,进一步利用在线网站SMART (http://smart.emblheidelberg.de/)和NCBI (https://www.ncbi.nlm.nih.gov/)删除不含或者缺失GAUT结构域的候选成员,最终获得马铃薯GAUT基因家族成员。
使用Expasy网站(https://www.expasy.org/vg/index/Protein)计算StGAUT成员的氨基酸数量、蛋白质分子量(molecular weight,MW)和理论等电点(isoelectric point, pI)[11-12]。利 用CELLO网 站(http://cello.life.nctu.edu.tw/)对蛋白质进行亚细胞定位预测[13]。使用MEME程序(http://meme-suite.org/tools/meme)分析所有StGAUT蛋白序列中的基序(motif),参数如下:最大基序数设为10,最佳序列宽度为50~100个氨基酸残基,任意重复次数[14]。利用Gene Structure Display Server (GSDS 2.0 https://gsds.cbi.pku.edu.cn/)[15]图形化显示StGAUT的基因结构。
根据StGAUT家族成员在染色体上的位置信息,利用MapChart软件绘制StGAUT基因的染色体位置图和相对距离。StGAUT基因的串联重复事件由以下2个条件确定:(1) 短序列的长度覆盖了长序列的70%以上;(2) 2个对齐序列的相似性大于70%[16-17]。串联重复是指2个基因位于同一染色体片段中,距离小于100 kb,且它们之间的基因个数≤5[18]。用MCScanX分析了马铃薯基因的重复事件[19],并用Circis v0.69[20]绘图。为进一步估计StGAUT的重复事件,使用KaKs calculator 2.0[21]计算非同义替换率(Ka)和同义替换率(Ks)。
利用ClustalW软件对新鉴定的马铃薯GAUT氨基酸序列以及已知的15个拟南芥GAUT氨基酸序列[6]进行多序列比对,利用MEGA7.0软件[22]构建无根系统发育树(最大似然法和1000次迭代bootstrap测试)。
采用RNA提取试剂盒DP419 (天根生化科技(北京)有限公司)提取总RNA,之后利用琼脂糖凝胶电泳和Nanodrop ND-2000 (Nanodrop Technologies,美国)分光光度计检测RNA的完整性和浓度。使用带有gDNase的快速RT试剂盒KR116 (天根生化科技(北京)有限公司)进行基因组DNA污染的消除和第一链cDNA的合成。使用(天根生化科技(北京)有限公司)的SuperReal PreMix Plus (SYBRGreen FP205)试剂盒在CFX96 (Bio-Rad,美国)上进行qPCR,采用3次生物学重复。反应体系为20 μL,包含2 μL cDNA (50 ng μL-1)、上下引物(10 µmol L-1)各0.6 μL、2×SYBRGreen MasterMix 10 μL、ddH2O 6.8 μL。qPCR反应条件为95℃预变性30 s;95℃变性下5 s,60℃退火30 s,40个循环;65~95℃条件下检测熔点曲线。通过分析cDNA梯度稀释的标准曲线获得每个基因的扩增效率,利用2–ΔΔCt方法计算基因的相对表达水平,以StEF-1α(AB061263)作为内参基因[23],使用Origin 2018绘图。由生工生物工程(上海)股份有限公司设计并合成引物,引物名称及序列详见表1。
表1 qPCR引物序列Table 1 Primers for qPCR used in this study
利用PGSC的Illumina RNA-seq数据,分析DM马铃薯中的StGAUT基因在非生物胁迫下(盐处理:150 mmol L-1NaCl;甘露醇诱导干旱胁迫处理:260 µmol L-1甘露醇;热处理:35℃)和不同组织(未成熟果实、成熟果实、心皮、花瓣、叶柄、花、匍匐茎、雄蕊、萼片、块茎、芽、根和叶)中的表达模式。使用TBtools软件绘制表达量的热图[24]。
对3个不同颜色马铃薯品种‘新大坪’、‘黑美人’和‘铃田红美’薯皮和薯肉的18个样品进行RNA-seq文库的构建,利用Ilumina HiSeq高通量测序平台对构建的cDNA文库进行测序,由百迈客生物科技有限公司负责完成RNA-seq文库的构建和测序。测序获得的Raw date提交至NCBI (Project ID PRJNA 541919)。
以RNA-seq数据为基础,分析StGAUT基因在‘新大坪’的皮和肉(XDS、XDF)、‘黑美人’的皮和肉(HMS、HMF)以及‘铃田红美’的皮和肉(LTS、LTF)中的表达。
通过生物信息学方法共鉴定出44个候选StGAUT基因,利用Smart和NCBI在线软件剔除不含完整Glyco_transf_8保守结构域的序列,最终确定出41个StGAUT家族成员。
由染色体定位(图1)可知,40个StGAUT基因(PG0004427尚未定位)不均匀地分布在10条染色体上,其中1号和2号染色体上StGAUT基因分布最多(分别为8个),4号染色体次之(7个),而在8号和11号染色体上没有StGAUT基因的分布。1号、3号、4号、7号染色体上的StGAUT基因主要分布在染色体的远端。
由图2可知,55个GAUT (除At2G38650外)共分为4个亚组,其中有11个StGAUT属于8亚组,12个StGAUT属于C II亚组,7个StGAUT和4个AtGAUT属于C III亚组,11个StGAUT和10个AtGAUT属于C IV亚组。C I、C II亚组中只包含StGAUT。
由表2可知,StGAUT家族成员的氨基酸长度和理化性质存在较大的差异。这些蛋白质的氨基酸残基长度为90个(PG0012098)至688个氨基酸(PG0000010),分子量为10,714.47 kD (PG0012098)至78,728.64 kD (PG0014677),等电点(pI)的范围为5.48 (PG0003522)到10.39 (PG0012098)。10个(PG0003522、PG0015490、PG0001183、PG0016880、PG0046135、PG0005216、PG0010088、PG0024800、PG0014401、PG0024623) GAUT氨基酸序列理论等电点在酸性范围内,其余都在碱性范围内,说明StGAUT蛋白质分子富含碱性氨基酸。同时,利用在线软件CELLO v.2.5对41个家族成员的进行亚细胞定位预测发现,4个家族成员定位于细胞核中,17个位于细胞膜中,11个位于线粒体中,6个位于细胞质中,3个位于细胞外。
表2 StGAUT基因家族理化性质及亚细胞定位Table 2 Physicochemical properties and subcellular location of StGAUT gene family
(续表2)
对41条StGAUT基因的氨基酸序列进行系统进化树分析(图3-A),将其分为4个亚组,C I、C II、C III、C IV亚组,分别包含11个、12个、7个和11个基因。基因结构图(图3-B)显示,7个StGAUT基因不含内含子,9个StGAUT基因只含有1个内含子,6个StGAUT基因含有2个内含子,其余基因含有3~9个内含子。此外,同一亚组的StGAUT基因表现出相似的基因结构。
使用在线MEME程序对StGAUT成员的氨基酸序列进行分析发现,StGAUT结构域存在多种组成形式,如motif 1和motif 2、motif 3和motif 5。motif 3主要位于GAUT的C端,motif 1主要位于GAUT的N端。由图3-C可知,一个亚组中的大部分StGAUT具有相似的motif组成,motif 5、motif 8、motif 9为C II亚组所特有,motif 10是C IV亚组所特有的。总的来说,一个亚组成员的motif组成相对保守,基因结构则较为相似,可以进一步证明进化分析的可靠性。
在植物基因组进化中,串联重复和片段重复有助于扩展基因家族的新成员和新功能。为研究StGAUT基因的重复事件,本研究分析了StGAUT基因家族中的片段重复和串联重复,共鉴定出12对片段重复基因(21/41,56.09%),其中2号染色体上的片段重复基因最多,共有6个片段重复基因(图4和表3)。每一对片段重复基因均属于同一亚组,其中C I亚组的片段重复基因最多(5对)。表明,片段复制在StGAUT基因家族的扩展中发挥着重要作用。
非同义替换率(Ka)和同义替换率(Ks)是评价重复事件正向选择压力的基础。Ka/Ks值为1表示自然选择,Ka/Ks<1表示纯化选择,Ka/Ks>1表示正选择。重复基因的结果表明,片段重复基因Ka/Ks在0.0330~0.8173之间,平均值是0.2199。所有重复事件基因的Ka/Ks值均小于1,说明这些基因均在纯化选择的作用下进化(表3)。
表3 StGAUT片段重复基因的Ka/Ks比值Table 3 Ka/Ks ratios of tandemly and segmentally duplicated StGAUT
由图5可知,PG0000827、PG0017341、PG0020 103、PG0024800在所有的组织中表达量均很高(FPKM>5),PG0018996、PG0018997在所有的组织中均低表达(FPKM<2)。一些StGAUT基因表现出组织特异性的表达模式,例如PG0007896在雄蕊中特异性高表达(FPKM>100);PG0001396和PG0001444在匍匐茎中高表达(FPKM>80);PG0003843只在雄蕊和成熟的花中特异性表达(FPKM>30),而在其他的组织中则完全不表达(FPKM=0)。
为研究StGAUT基因对非生物胁迫的响应,进一步分析了盐胁迫(150 mmol L-1NaCl)、干旱胁迫(260 µmol L-1甘露醇)和热胁迫(35℃)下StGAUT的表达模式(图6)。结果表明,与对照相比,在盐胁迫、干旱胁迫和热胁迫处理下,分别有5个、6个、14个StGAUT基因差异表达(FPKM>1和|log2FC|>1),其中4个StGAUT基因(PG0001396、PG0005216、PG0012098和PG0022608)在3种非生物胁迫下均差异表达,2个StGAUT基因(PG0008015、PG0007896)在2种非生物胁迫下差异表达,9个StGAUT基因只响应一种非生物胁迫。这些StGAUT可能参与了马铃薯对非生物胁迫的响应,值得我们进一步研究。
由图7可知,在薯皮中有6个StGAUT基因不表达(FPKM=0),5个StGAUT基因表达水平较低(FPKM<1)。与‘新大坪’的白色薯皮(XDS)相比,有6个StGAUT基因在红色和紫色薯皮中差异表达(FPKM>1和|log2FC|>1),其中4个StGAUT基因在彩色薯皮中上调表达,PG0005216、PG0007896和PG0027950在‘黑美人’的紫色薯皮(HMS)中上调表达,PG0008015在‘铃田红美’的红色薯皮(LTS)中上调表达;2个StGAUT基因在彩色薯皮中下调表达,其中PG0024782在HMS和LTS中下调表达,PG0017341只在HMS中下调表达。
在薯肉中有4个StGAUT基因未表达(FPKM=0),11个StGAUT基因的FPKM值小于1。与‘新大坪’的薯肉(XDF)相比,在‘黑美人’的薯肉(HMF)和‘铃田红美’的薯肉(LTF)中,分别有5个和8个StGAUT基因表达上调(FPKM>1和|log2FC|>1),其中2个基因(PG0020103、PG0024800)在HMF和LTF均上调表达,3个基因(PG0011872、PG0016880、PG0027950)在HMF中上调表达,6个基因(PG0001388、PG0003522、PG0024623、PG0024824、PG0025139、PG2003179)在LTF中上调表达。此外,与XDF相比LTF中有2个基因(PG0022608、PG0001396)下调表达(FPKM>1和|log2FC|>1),这2个基因都属于C I亚组。
为验证RNA-seq数据的可靠性,我们选取了8个在彩色马铃薯薯皮和薯肉中FPKM值较高的StGAUT基因进行qPCR分析(图8)。结果表明,qPCR表达模式与RNA-Seq数据集一致,彩色马铃薯品种RNA-seq数据集与qPCR的线性关系为y=1.7097x+0.3585,R2= 0.8268,呈现了较高的相关性。
本研究对马铃薯GAUT基因家族进行了全基因组分析,共鉴定了41个StGAUT,多于拟南芥(15个)、番茄(17个)和棉花(37个) GAUT基因家族成员。分析了马铃薯和拟南芥的GAUT基因之间的进化关系,以鉴定StGAUT基因的进化和可能的功能。进一步分析了StGAUT基因成员的基因结构、保守基序组成、染色体定位和基因重复事件,以及GAUT基因在马铃薯不同组织部位、非生物胁迫下和彩色马铃薯品种薯皮和薯肉中的表达模式。对StGAUT基因的功能分化有了更深入的了解,为进一步研究马铃薯基因家族提供了综合信息。
StGAUT基因家族发生了扩张,可能是导致StGAUT基因家族比拟南芥和番茄的庞大的原因。串联重复和片段复制是植物基因家族扩张的主要方式[25]。这些基因通过串联重复和片段复制保留在植物基因组中,在对环境刺激的适应性反应中起重要作用[26-27]。本研究发现,片段重复是StGAUT基因家族主要的扩张方式。我们对StGAUT基因家族中的基因重复事件进行分析,共鉴定出12对片段重复基因,大多片段重复基因位于C I亚组,并且在2号染色体上的片段重复基因最多。因此,片段重复可能对StGAUT基因家族的扩张起主导作用。
基因重复事件中一些正在进化的新成员可能失去其原有的功能成为伪基因,或获得新功能已增强植物适应性[28]。在本研究中,我们发现了一些片段重复基因,存在截然不同的表达模式,如PG0003522和PG0015490是一对片段重复基因,PG0003522在LTF中 上 调 表 达(FPKM>1和|log2FC|>1),而PG0015490在LTF中则完全不表达(FPKM=0)。PG0001396和PG0022608是一对片段重复基因,它们在盐胁迫和干旱胁迫下均上调表达。
我们可以通过了解已知家族成员的功能来确认直系和旁系同源基因的功能,因为同一个亚组成员可能具有共同的进化起源和保守功能。根据系统发育比较分析,一些StGAUT基因与AtGAUT基因的直系同源物在不同的亚组中聚集在一起。例如,PG0019228、PG0014401与GAUT12(At5G54690)聚集在一起,表明可能参与细胞壁多糖的合成。PG0020103、PG0001388、PG0024824、PG0024623与GAUT8(AT3G25140)、GAUT9(At3G02350)、GAUT10(At2G20810)、GAUT11(At1G18580)聚集在一起,表明可能参与果胶或木聚糖的生物合成[29]。通过对外显子和内含子的研究,有助于我们进一步了解家族成员基因结构和功能的差异[30]。StGAUT基因家族的外显子数量介于1~10之间,且位于同一分支的StGAUT基因具有相似的外显子数量和排列模式。StGAUT蛋白保守结构域也表现出类似的结果。说明同一亚组内的成员较为保守。
基因的组织特异性表达可初步预测其相应的功能[31]。通过对StGAUT基因在马铃薯不同组织中的表达谱分析发现,有的基因只在某一组织中表达,例如PG0003843和PG0014637是C I亚组中同一簇的一对片段重复基因,他们均在雄蕊和成熟的花中特异性表达;PG2003179和PG0007896属于C IV亚组同一簇的一对片段重复基因,它们在雄蕊里面特异性表达。因此,这些基因可能与马铃薯雄蕊的生长发育有关。Fabiana等[5]研究发现,SlGAUT4基因在发育器官中的表达水平较高,是决定番茄植株生长和果实产量的关键。与SlGAUT4同源的马铃薯PG0027227在花瓣中特异性表达,说明PG0027227可能与马铃薯植株生长发育有关。AtGAUT12(At5G 54690)参与拟南芥细胞壁多糖的合成[32],在本研究中,与AtGAUT12同源的一对片段重复基因PG0014401和PG0019228在匍匐茎和未成熟的果实中特异性表达,它们的功能有待进一步研究。
GAUT基因参与非生物胁迫的相关研究尚未见报道。本研究发现了一些响应多种非生物胁迫(盐、甘露醇、热)的StGAUT基因,如PG0001396和PG0022608是C I亚组的一对片段重复基因,它们在盐胁迫和干旱胁迫下均上调表达(FPKM>1和|log2FC|>1),PG0001396在热胁迫下上调表达,而PG0022608则下调表达。此外,我们发现34.15%(14/41)的StGAUT基因在热胁迫下差异表达。这些StGAUT基因可能参与了对非生物胁迫的响应,它们的功能有待进一步研究。
同时,本研究发现了一些StGAUT基因可能参与花色素苷的合成,例如一对片段重复基因PG0001396和PG0022608在红色的薯肉中均下调表达(FPKM>1和|log2FC|>1),PG0027950在紫色薯皮薯肉中都上调表达(FPKM>1和|log2FC|>1)。综上所述,StGAUT基因家族成员可能在马铃薯的器官发育、抵御非生物胁迫和花色素苷的合成方面发挥着重要的作用。
本研究在全基因组水平上鉴定并分析了41个StGAUT基因,不均匀的分布在10条染色体上。基于高度保守的基因结构和基序,把StGAUT基因划分为4个亚组。共线性分析表明,片段重复事件在StGAUT基因家族的扩展中起着至关重要的作用。根据Ka/Ks比率,这些基因对在纯化选择下进化。