酿酒酵母PAD1 基因生物信息学分析*

2022-12-16 02:29:02马福仙韩沛辰奚登贤张汉尧
关键词:肉桂酸酿酒酵母

尹 拓,马福仙,韩沛辰,奚登贤,张汉尧

(西南林业大学 林学院,西南地区生物多样性保育国家林业与草原局重点实验室,云南 昆明 650224)

酿酒酵母(Saccharomyces cererisiae)隶属于子囊菌门(Ascomycota)半子囊菌纲(Hemiascomycetes)酵母目(Saccharomy cetales)酵母科(Saccharomycetaceae) 酵母属[Saccharomyces(E.C.Hansen 1838) Meyen][1]。几千年前人类就已经开始利用酵母,酿酒酵母与人类生产生活息息相关。20世纪中叶以来,酿酒酵母在化工行业和食品生产方面不断得到推广和应用[2],其研究备受关注。大量学者从基因层面研究酿酒酵母,开始利用生物信息学分析法研究酿酒酵母的基因功能。张先昂等[3]采用生物信息学分析方法对贝酵母中ADR1基因进行研究分析,最终发现ADR1基因是贝酵母乙醇代谢过程中与醇脱氢酶相关的正调节基因,同时也是生长过程中必要的调节基因。吴杰新等[4]采用生物信息学分析方法研究了酿酒酵母CAD1基因,结果表明:在重金属镉存在的逆境条件下,CAD1 蛋白与SKN7 蛋白相互作用,可增强酿酒酵母对镉的抗性。

电子克隆(electronic cloning)又称虚拟克隆(virtual cloning),是以基因数据库为基础,利用表达序列标签(expressed sequence tags,ESTs)和基因组数据库快速克隆已知基因或者找寻新基因的一种克隆方式。1994 年,电子克隆方法就被BOGUSKI 等用于获取新基因;1996 年陈润生等也开始使用电子克隆方法;后续更多学者利用电子克隆的方法搜寻新基因,到现在已经获得了众多功能基因,如与人SR 相关的剪切调控蛋白508(SRp508)基因和TECTB基因等[5]。随着酵母基因组研究的不断完善,电子克隆也被引入到酿酒酵母的基因克隆。

自1980 年起,大批学者开始关注PAD1基因,关于微生物体内的PAD1基因已经有所报道。GOODEY 等[6]研究发现:啤酒酵母PAD1基因是造成POF+(POF 指引起某些特殊气味的酚类物质)的主要原因;MEADEN 等[7]对POF1(即PAD1)基因进行克隆,并将其转入啤酒酵母中,但转入的PAD1基因沉默;SHINOHARA 等[8]对200 多种葡萄酒和啤酒酵母进行研究,结果表明:大多数都为POF 酵母,并采用Southern Blot 方法又一次证明PAD1基因是控制POF+的关键基因。可见,前人研究表明啤酒酵母中PAD1基因可以调节啤酒发酵过程中芳香族化合物的代谢。LARRSSON 等[9]在研究木质纤维素水解时发现,当啤酒酵母的PAD1基因过量表达时啤酒中酒精的含量显著增加;STRATFORD 等[10]发现有害酵母的PAD1基因可以调控山梨酸脱羧;PLUMRIDGE 等[11]发现:黑曲霉中包含的PAD1基因可以调控山梨酸和肉桂酸脱羧。PAD1基因在许多微生物中是芳香族羧酸代谢过程中的重要基因,在现代工业中,芳香族化合物是化工产业的重要原料;在酿造行业,适量芳香族化合物的存在可以极大地提高食品风味。酿酒酵母作为模式生物,其体内也存在PAD1基因,对其功能合理的开发利用可将酿酒酵母引入到芳香族化合物的工业生产和酿造行业,因此,对酿酒酵母中PAD1基因的研究具有重要意义。

本研究通过电子克隆获取酿酒酵母PAD1基因,对PAD1基因所在的染色体进行定位,再通过PAD1基因的碱基序列获得氨基酸序列;借助多种在线分析工具对酿酒酵母PAD1基因编码的蛋白质的理化性质、卷曲螺旋区域、潜在跨膜区、亚细胞定位、二级结构以及三级结构进行分析预测[3,12],进而为研究酿酒酵母中PAD1基因在芳香族化合物代谢过程中的作用和途径奠定基础。

1 材料与方法

1.1 酿酒酵母PAD1 基因序列的电子克隆

1.1.1 电子克隆探针的选取

对NCBI 数据库(https://www.ncbi.nlm.nih.gov)中已知的PAD1基因进行搜索,选取并下载1 条与酿酒酵母亲缘关系较近的物种PAD1基因cDNA 序列[13],然后利用NCBI 数据库的BLAST工具进行检索,从检索结果中选取多条同源性高(大于50%)的基因序列;利用同源性比对软件MEGA-Ⅹ进行DNA 同源性比对,再从比对结果中选择高度保守的核苷酸序列片段(同源性为100%且连续碱基数大于18 的核苷酸序列片段)作为探针。

1.1.2 酿酒酵母基因组获取

从酵母基因组数据库(saccharomyces genome database,SGD)中下载酿酒酵母菌株X2180-1A(S.cerevisiaeX2180-1A)的全基因组序列[14],并将其格式转换为文档格式保存。

1.1.3 目的基因在基因组中的定位

利用Word 的查找工具查找探针核苷酸序列在酵母基因组序列中的对应位置并进行标记。

1.1.4 目的基因序列的获取

PAD1基因长度一般小于1 000 bp,因此以探针标记的位置为中心,上、下游分别延伸1 000 bp,获得1 个长度约为2 000 bp 的核苷酸序列,即为探针延伸序列;将该序列提交至NCBI 提供的开放阅读框(open reading frame,ORF)查找工具中查找ORF,查找结果中最长且最完整的ORF 所对应的核苷酸序列即为电子克隆的目的基因序列。

1.2 酿酒酵母PAD1 基因的生物信息学分析

1.2.1 染色体定位

将电子克隆获得的核苷酸序列提交到NCBI数据库(https://www.ncbi.nlm.nih.gov/gene/852150)中查询即可获得酿酒酵母PAD1基因的序列长度、基因编号、基因结构以及所在染色体的定位等基本信息[3]。

1.2.2 编码蛋白质的进化树分析

将PAD1基因的碱基序列导入到NCBI 数据库,利用NCBI 数据库提供的在线分析工具BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi)对酿酒酵母PAD1核苷酸序列进行翻译,获得对应编码的氨基酸序列;对该氨基酸序列进行比对,从比对结果中选择并下载多条与该氨基酸序列具有较高同源性的氨基酸序列,构建PAD1基因的系统发生树,分析PAD1基因编码蛋白质与所选取的多条氨基酸序列之间的亲缘关系。建立系统进化树过程中,将参与建树的全部氨基酸序列导入分子进化遗传分析软件Mega-Ⅹ进行多序列比对,采用邻接法(neighbour-joining) (执行参数:Bootstrap method 1 000;Poisson model;Pairwise deletion)进行系统进化树构建[15-17]。

1.2.3 编码蛋白质的基本性质分析

蛋白质序列的基本性质分析通常包括其理化性质、亲/疏水性、信号肽和亚细胞定位等4 个方面[18]。使用在线分析工具ProtParam (https://web.expasy.org/protparam/)分析PAD1基因编码蛋白质的理化性质;使用在线分析软件ProtScale (https://web.expasy.org/protscale/)分析预测PAD1基因编码蛋白质的亲/疏水性;使用信号肽在线预测软件SignalP 3.0 (http://www.cbs.dtu.dk/services/SignalP-3.0/)对PAD1基因编码蛋白质进行预测;使用在线分析工具TargetP 1.1 (http://www.cbs.dtu.dk/services/TargetP-1.1/index.ph)和 PSORT Ⅱ(https://psort.hgc.jp/form2.html)预测PAD1基因编码蛋白质的亚细胞定位。

1.2.4 编码蛋白质的二级结构预测

使用在线分析工具TMHMM Server v.2.0 (http://www.cbs.dtu.dk/services/TMHMM/)预测PAD1基因编码蛋白质的跨膜区域;使用在线分析工具COILS Server (https://embnet.vital-it.ch/software/COILS_form.html)预测PAD1基因编码蛋白质的Coil 区;使用在线分析工具SOPMA (https://npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)预测PAD1基因编码蛋白质的二级结构。

1.2.5 编码蛋白质的三级结构预测

使用基于同源建模的在线三维空间结构分析工具Swiss-Model (https://swissmodel.expasy.org/)对酿酒酵母PAD1基因所编码蛋白质的三级结构进行预测[3-4,19-20]。

2 结果与分析

2.1 获取的酿酒酵母PAD1 序列

2.1.1 选取的电子克隆探针

通过NCBI 进行BLAST,从结果中选取S.cerevisiaestrain Y169 chromosome Ⅳ (ID:CP0334-73.1)、S.cerevisiaestrain SY14 chromosome I,complete sequence (ID:CP029160.1)、S.cerevisiaestrain BY4742 chromosome Ⅳ,complete sequence (ID:CP026298.1)、S.cerevisiaestrain S288c chromosome Ⅳ,complete sequence (ID:CP020126.1)和S.cerevisiaeYJM555 chromosome Ⅳ sequence (ID:CP004677.2)共5 条同源性较高的核苷酸序列,经MEGA-X 同源性比对后选取探针序列为:AGGATTTAATTACAAGAGCTGCCGATGTTTCGATTAAAGAGAATCGTAAGTTACTACTGGTTACTCGGGAAACCCCTTTATCTTCCATCCATCTTGAAAACATGTTGTCT。

2.1.2 获取的目的基因序列

将包含目的基因的探针延伸序列提交到NCBI 数据库提供的开放阅读框查找工具,共获得19 个ORF,其中最长且最完整的1 条为ORF8。该核苷酸序列经BLAST 后,结果 (图1) 显示:该基因编码的蛋白质与酿酒酵母S288C 菌株PAD1基因编码的蛋白质序列同源性高达100%,即认为该核苷酸序列是所要获取的目的基因序列。

图1 PAD1 同源基因关系树Fig.1 Relationship tree of PAD1 homologous genes

2.2 酿酒酵母PAD1 基因染色体定位

酿酒酵母PAD1基因导入到NCBI 基因数据库查询,结果表明:酿酒酵母PAD1又称POF1,RNA 名称phenylacrylic acid decarboxylasePAD1,外显子数为1,全长729 bp,基因组序列:NC_001136.10,基因编号851 730,染色体定位于Ⅳ染色体1 510 902~1 511 630。

2.3 PAD1 基因的系谱发生分析

酿酒酵母PAD1基因的碱基序列全长为729 bp,其编码的蛋白质由242 个氨基酸连接构成。核苷酸序列与氨基酸序列对应如图2 所示。

图2 PAD1 基因核苷酸序列及蛋白质序列Fig.2 Nucleotide sequence and protein sequence of the PAD1 gene

将由酿酒酵母PAD1基因翻译获得氨基酸序列导入到NCBI 在线分析工具中进行蛋白质的BLASTP,从结果中选取同源性较高的17 条蛋白质序列(表1)构建系统进化树(图3),结果显示:克隆得到的酿酒酵母PAD1基因所编码的蛋白质和6 种酿酒酵母聚为一类,且与肉桂酸脱羧酶(AAA20484.1)最为接近,二者同源性高达99.59%,说明本研究克隆的PAD1基因序列正确无误。

图3 PAD1 系统进化树分析Fig.3 Phylogenetic tree analysis of PAD1

表1 同源性较高的17 条蛋白质序列Tab.1 17 protein sequences with high homology

2.4 酿酒酵母PAD1 基因编码的蛋白质基本性质分析

2.4.1 理化性质分析

酿酒酵母PAD1基因编码的蛋白质包含242个氨基酸,该蛋白质由C、H、N、O 和S 等5 种元素共同构成,每个蛋白质分子包含3 831 个原子,蛋白质分子式为C1208H1950N328O336S9,相对分子质量约为26 733.31 ku;该蛋白在pH 为9.69的溶液中呈电中性,即该蛋白质理论等电点为9.69;在构成PAD1基因编码蛋白的所有氨基酸中,含量最高的是亮氨酸(10.7%),含量最低的是色氨酸(1.2%);吡咯赖氨酸和硒半胱氨酸在该蛋白中都不存在;不稳定指数为33.74,表明该蛋白是一个稳定的蛋白质;脂肪指数为100.74,平均亲水系数为0.137。

2.4.2 亲/疏水性分析

由图4 可知:高分值峰(score>1.5)存在,故推断该蛋白可能存在潜在的跨膜区;4 个高分值峰分别位于66、142、188 和196 氨基酸位点附近,在66 位点出现最高峰,峰值为1.700;于47 和97 氨基酸位点附近分别出现2 个低分值峰位,分值分别为-1.616 和-1.174;从整体图像来看,正值的占比大于负值的占比。根据氨基酸疏水特性参数规律来看,氨基酸疏水性越强则疏水特性参数通常为越高的正值,而氨基酸的亲水性强时则疏水特性参数通常为越低的负值[21],故推断PAD1基因所编码的蛋白为疏水性蛋白,该推断与理化性质分析结果相符。

图4 PAD1 基因编码的蛋白质的亲/疏水性分析Fig.4 Analysis of hydrophobicity or hydrophobicity of protein encoded by the PAD1 gene

2.4.3 信号肽预测

由图5 可知:酿酒酵母PAD1基因编码的蛋白属于非分泌蛋白,信号肽存在的概率为0.070,锚定蛋白存在的概率为0.372,在30 和31 氨基酸位点之间存在最大切割位点的概率为0.035。

图5 PAD1 基因编码蛋白质的信号肽预测Fig.5 Signal peptide prediction of protein encoded by the PAD1 gene

2.4.4 亚细胞定位预测

TargetP 预测结果表明:该蛋白定位于线粒体的可能性最大(概率为0.795),位于分泌通路的概率为0.066,位于其他位置的可能性最小(概率为0.104),由PAD1基因所编码蛋白的分泌途径为“M”型,且可靠等级为2,即定位到线粒体。PSORT Ⅱ预测结果显示:该蛋白亚细胞定位的可能性从大到小依次是线粒体、内质网、高尔基体、细胞质和细胞核,概率依次为47.8%、26.1%、13.0%、8.7%和4.3%。

2.5 酿酒酵母PAD1 基因编码的蛋白质二级结构预测

2.5.1 蛋白质的跨膜区域分析

由图6 可知:该蛋白有部分跨膜区域存在。蛋白质含有跨膜区,表示它可能作为膜受体起作用,也可能是在膜上的锚定蛋白或离子通道蛋白[22-23],这些蛋白均不溶于水,故推断该PAD1基因编码的蛋白质为脂溶性蛋白。这些结果均与蛋白亲/疏水性分析的推测结果相符。

图6 PAD1 基因编码蛋白质的跨膜区分析Fig.6 Analysis of the transmembrane domain of the protein encoded by the PAD1 gene

2.5.2 蛋白质的Coil 区分析

由图7 可知:在Window14、28 和21 窗口中酿酒酵母PAD1基因编码的蛋白质残基都不存在卷曲螺旋区域,故推断酿酒酵母PAD1基因编码的蛋白无卷曲螺旋区域存在。

图7 PAD1 基因编码蛋白质Coil 区分析Fig.7 Analysis of Coil region of protein encoded by the PAD1 gene

2.5.3 蛋白质的二级结构预测

预测酿酒酵母PAD1基因编码的蛋白质二级结构如图8 所示。二级结构的组件含量自少至多依次为β-转角、延伸链、α-螺旋、随机卷曲,其数量分别为20、34、84 和104,其含量占比分别为8.26%、14.05%、34.71%、42.98%。可见,在PAD1基因所编码的蛋白质二级结构中,α-螺旋和随机卷曲是主要组件,β-转角与延伸链在蛋白中分散存在。

图8 PAD1 基因编码蛋白质的二级结构预测Fig.8 Prediction of secondary structure of protein encoded by PAD1 gene

2.6 酿酒酵母PAD1 基因编码蛋白质三级空间结构预测

酿酒酵母PAD1基因所编码蛋白质的三级如图9 所示。

图9 PAD1 基因编码蛋白质的三级空间结构预测Fig.9 Prediction of tertiary spatial structure of protein encoded by PAD1 gene

3 讨论

自20 世纪80 年代以来,有学者就微生物体内的PAD1基因展开了较全面地研究。PLUMRIDGE 等[11]发现黑曲霉中含有PAD1基因,并证明了黑曲霉的PAD1基因是苯基丙烯酸脱羧相关的、芳香族羧酸脱羧重要的调控基因,可以调控山梨酸和肉桂酸的脱羧。RICHARD 等[24]在研究酿酒酵母中FDC1基因和PAD1基因的表达时发现:PAD1基因可编码1 种肉桂酸脱羧酶,可将反式肉桂酸转化为苯乙烯;当只有PAD1基因表达时,酿酒酵母对肉桂酸的耐受性与PAD1 蛋白含量成正比,最高可耐受0.6 mmol/L 肉桂酸;当PAD1基因和FDC1基因都同时表达时,PAD1蛋白和FDC1 蛋白出现了明显的相互作用,使酿酒酵母对肉桂酸的耐受性最高可达到10 mmol/L。本研究发现:PAD1基因编码的蛋白质与编码肉桂酸脱羧酶的酿酒酵母 (Saccharomyces cerevisiae,AAA20484.1)同源性高达99.59%,即PAD1基因编码的蛋白质极大可能是芳香族羧酸脱羧酶,参与微生物体内芳香族羧酸的代谢,能够赋予酿酒酵母对肉桂酸的抗性,这与PLUMRIDGE 等[11]和RICHARD 等[24]的研究结果一致。

肉桂酸经脱羧酶可转化成苯乙烯。苯乙烯是现代工业中的关键单体,可用于生产丁苯橡胶、离子交换树脂、苯乙烯系列树脂和医药品原料,在染料、农药制药、石油和选矿等行业也被广泛应用[25]。MCKENNA 等[26]曾将大肠杆菌用于苯乙烯的生产;随着基因工程技术的发展,采用合适技术充分利用酿酒酵母PAD1基因的功能特性选育能使肉桂酸快速脱羧的酿酒酵母菌株,再将该菌株用于生产苯乙烯,可为低成本的苯乙烯及其副产品商业生产提供新途径。此外,果酒受到越来越多人的关注和喜爱,其独特的口感将成为最大的卖点。研究表明:乙烯基愈创木酚、4-乙基愈创木酚、苯乙醇和乙酸-2-苯乙酯等一系列的芳香族化合物、脂类、有机酸以及硫化物等是使果酒具有特殊香味的重要原因[27-31]。随着分子生物技术的不断发展,合理利用PAD1基因调控酿酒酵母中芳香族化合物的代谢,将有可能极大地提高酒的品质。

4 结论

酿酒酵母PAD1基因是编码芳香族羧酸脱羧酶的基因,编码的蛋白质结构稳定,可能在线粒体中参与代谢,与酿酒酵母芳香族羧酸的代谢和其对芳香族羧酸的耐受性存在直接联系。本研究为后期该基因应用于芳香族化合物的生产奠定了基础。

猜你喜欢
肉桂酸酿酒酵母
上半年酿酒产业产、销、利均增长
酿酒科技(2021年8期)2021-12-06 15:28:22
肉桂酸对db/db小鼠肝脏PI3K/AKT/FoxO1信号通路的影响
为什么酵母菌既能做面包也能酿酒?
酵母抽提物的研究概况
中国调味品(2017年2期)2017-03-20 16:18:25
基于配体邻菲啰啉和肉桂酸构筑的铜配合物的合成、电化学性质及与DNA的相互作用
酵母魔术师
人CyclinD1在毕赤酵母中的表达
酿酒忘米
生物量高的富锌酵母的开发应用
调亏灌溉在酿酒葡萄上的应用