16种豆科植物DXS基因密码子偏好性分析

2022-08-16 00:45郑乔木黄思沛李秋娥蒋瑞平周嘉裕
生物学杂志 2022年4期
关键词:豆科植物萜类禾本科

郑乔木,黄思沛,李秋娥,蒋瑞平,周嘉裕,廖 海

(西南交通大学 生命科学与工程学院,成都 610031)

萜类化合物属于次生代谢产物,由异戊二烯单元构成其基本骨架,参与了光合作用、呼吸作用和细胞周期等生理过程。萜类化合物还具有药用[1-3]、芳香和杀虫[3]等生物活性,具有重要的临床、保健与经济价值。植物主要利用两个途径生成萜类物质,分别是胞质中的甲羟戊酸 (Mevalonate pathway,MVA) 途径和位于质体中的甲基赤藓醇4-磷酸途径(Methylerythritol 4-phosphate pathway,MEP)[4]。1-脱氧-D-木酮糖-5-磷酸合成酶 (1-deoxy-D-xylulose-5-phosphate synthase,DXS)是催化MEP途径第一步反应的关键酶,其基因的表达水平与下游代谢产物含量表现出正相关性[5]。过表达DXS基因的转基因株系中,类胡萝卜等萜类物质的含量显著增加[6-8]。豆科植物中含有多种不同类型的萜类化合物,许多豆科植物的DXS基因已被克隆并鉴定功能,这为了解DXS基因在萜类化合物生成中发挥的作用奠定了基础。

密码子偏好性指的是在编码氨基酸时,同义密码子有不同的使用频率。不同生物体的密码子偏好性有很大的差异性,即使在同一生物体中,编码基因的不同也会造成偏好性的差异性[9]。由于密码子偏好性,大肠杆菌作为宿主时,薰衣草的DXS基因表达量并不高[10],有较多研究证实,通过优化密码子在一定程度上增强了基因的表达效率[11-13]。

研究收集包括豆科16种植物及禾本科、藻类等其他物种共26种生物的DXS基因CDS序列,利用Codon W软件和EMBOSS等程序来分析密码子的偏好性,计算碱基组成、ENc与RSCU值等,结合ENc-plot和PR2-plot分析,找到最优密码子并评估聚类结果,分析豆科植物DXS基因的潜在合适宿主。研究系统地分析了豆科DXS基因的密码子偏好性,为理解这些植物DXS基因的进化规律及提高该基因异源表达效率提供依据。

1 材料与方法

1.1 序列来源

决明(Cassiaobtusifolia)的DXS基因序列来源于课题组前期获得的转录组数据,SRA登录号为SRP144670[14]。其余15种豆科植物、5种禾本科植物与5种藻类的DXS基因来自NCBI数据库。具体序列信息见表1。

表1 26个物种DXS基因信息Table 1 The DXS genes information from 26 species

1.2 密码子偏性分析数据

通过CodonW软件获得DXS基因的相对密码子使用度(Relative synonymous codon usage,RSCU)、密码子适应指数(Codon adaptation index,CAI)、第3位碱基GC含量(GC3s)和GC含量。RSCU=1代表没有偏好性差异,RSCU>1和RSCU<1分别代表该密码子的使用频率相对较低和较高。CAI值由0到1代表某基因中该密码子使用偏好性从弱到强,CAI接近1时,表达水平较高[15]。

利用EMBOSS(http://vmbio-info.toulouse.inra.fr/emboss)的CUSP和CHIPS在线分析程序,计算各DXS基因编码序列中密码子出现的频率和有效密码子的数量(Effective number of codons,ENc) 。用ENc表示整体的密码子偏好性水平。ENc的值从20至61,低于35且数值越低表示对指定的密码子具有较高的偏好性[16]。

1.3 ENc-plot分析

ENc-GC3关联图反映了只受突变压力影响而无选择压力条件下两者间关系,标准曲线公式为ENc=2+GC3+29/[GC32+(1-GC3)2][16]。若基因分布在标准曲线上,表明主要受到碱基突变影响,受到自然选择及其他因素影响的基因则在曲线外。

1.4 PR2-plot偏倚分析

以A3/(A3+T3)值为纵坐标、G3/(G3+C3)值为横坐标绘图,以坐标(0.5,0.5)为中心,从这个中点出发的矢量可以反映奇偶偏好(parity rule2,PR2)[17]。如果偏好性主要是受到突变的影响,则A/T及G/C含量分布均匀,即A=T/G=C,否则偏好可能受自然选择及其他因素影响。分析图中两条直线将图分为4个区域,分布于直线上半部分,表明在第3个碱基上,A的使用频率比T高,分布在直线的左半部分说明在第3位碱基上,C的使用次数比G高。

1.5 数据统计

以26个物种DXS基因的RSCU值为变量,将密码子参数的相关性系数用SPSS 26.0统计软件分析聚类。用TBtools软件作基于RSCU值的聚类热图。用MEGA-X软件对这些物种的DXS基因基于CDS序列来构建进化树。

1.6 最优密码子分析

以ENc作为偏好性标准,分别选取ENc值最高和最低两端各5个基因作为密码子低偏好性组和高偏好性组。计算两组RSCU值,分别记为RSCUhigh和RSCUlow,并计算密码子的△RSCU值 (RSCUhigh-RSCUlow)作为ENc的差异。参照已有研究进展将0.08作为临界值[18]。将△RSCU>0.08且RSCU值>1的视为最优密码子。

2 结果与分析

2.1 同义密码子分析

豆科植物DXS基因偏好使用的密码子有19个(RSCU>1),见图 1,包括UUG、CUU、AUU、GUU、UCU、UCA、CCU、CCA、ACU、ACA、GCU、GCA、CAU、GAU、GAA、AGA、AGG、GGU与GGA。其中有11个密码于U结尾,7个密码子于A结尾。AUG、UGG和UGA密码子无偏好性差异。在氨基酸水平上,编码缬氨酸的GUU在所有豆科植物中都表现出强烈的偏好性,其次是编码丝氨酸的UCU。16种豆科植物DXS序列通过与不同表达宿主的密码子使用频率表进行对比发现,在拟南芥和烟草的适应指数相当,酒酿酵母的适应指数高于大肠杆菌。

图1 DXS基因密码子RSCU聚类热图Figure 1 Cluster heat map of relative synonymous codon usage (RSCU) for the DXS genes

2.2 密码子组成特征分析

如表2所示,豆科植物DXS基因GC含量和GC3s均小于0.5,即碱基均偏向于A和U,且ENc值为48.66~53.4,平均为51.50。禾本科植物与藻类DXS基因的GC含量均大于0.5,ENc值为29.48~34.43,平均值仅为31.772,说明在豆科植物中,DXS基因的密码子使用的偏好要低于禾本科植物。

表2 26个物种DXS基因密码子使用参数Table 2 Codon usage parameters of DXS genes in 26 species

2.3 ENc-plot绘图分析

ENc-GC3关联分析(图 2)显示,大部分点分布在标准曲线附近。通过比较ENc比值与频数,可以更清楚地说明ENc的预期值与实际间的差别,结果表明,豆科植物DXS基因的ENc值与预期的值相差较小,主要受碱基组成的影响。

图2 26个物种DXS基因GC3s与ENc含量分布Figure 2 Distribution of ENc and GC3s content of DXS genes in 26 species

2.4 PR2-plot绘图分析

PR2-plot分析(图 3)显示,这些坐标点相对于中心都有相对地偏离,豆科植物偏离程度和分布相对一致,禾本科植物坐标点相对偏离较远且分散。该结果进一步说明了来源于不同的科属植物的DXS基因,偏好性的形成机制不同,其中豆科植物主要受到碱基突变的影响,而禾本科植物主要受到自然选择的影响。豆科植物坐标点均分布在A3/(A3+T3)<0.5区域,表明豆科植物DXS基因在碱基T的使用上有更强的偏好性。

图3 PR2-plot偏倚分析Figure 3 PR2-plot analysis

2.5 DXS密码子偏好性聚类分析

基于RSCU值可将26个物种聚类为两大支(图 4),其中第一支包括禾本科植物与2种藻类,第二支为其余16个豆科物种和3种藻类。在第二支中,决明等16种豆科植物与2种藻类聚类为一个下级分支,莱茵衣藻单独为另一个下级分支。基于CDS序列构建的系统进化树将所有植物分为3支(图 5),其中,16种豆科植物聚为一支,5种禾本科与2种藻类聚为一支,其余3种藻类聚为一支。

图4 DXS基因的RSCU聚类分析Figure 4 Cluster analysis tree of RSCU of DXS genes

图5 26个物种DXS基因的CDS序列系统进化树Figure 5 Phylogenetic tree of DXS genes of 26 species by CDS sequences

2.6 豆科植物DXS最优密码子

分析16种豆科植物DXS基因主要偏好密码子,计算构建的高低库ΔRSCU值,ΔRSCU值大于0.08的有21个。对这些密码子进行分析与确定,同时满足ΔRSCU>0.08和RSCU>1的为CCA、GGA。满足ΔRSCU>0.08的密码子中,有15个以G/C为结尾,6个以A/U结尾。

3 讨论与结论

与禾本科和藻类相比,豆科植物DXS基因的CAI值偏低,说明使用偏好性整体偏低,这可能与豆科植物萜类物质的低含量相关。若对豆科植物开展基因改造来提高萜类物质的生产效率,DXS可能是一个较好的候选靶基因,已有通过提高DXS的表达来增强下游的萜类化合物生产效率的成功例子[6]。16种豆科植物的DXS基因GC含量偏低,且大多用A/U结尾,该特征与同样来自MEP途径的DXR基因相同[19]。然而,DXS基因的优势密码子数量(19个)与最优密码子类型 (CCA、UGU) ,与DXR基因均不同(8个,AGA),表明来自同一代谢途径的不同基因,在进化过程中可能受到不同的选择压力,导致了不同的偏好性。余下的非优势密码子,可能是DXR基因优化的重点区域。与豆科不同,禾本科和藻类的DXS基因的末端更多以C/G作为结尾。研究表明,单子叶植物的编码末端大多为G/C,而双子叶植物大多为A/T(U)[20],这进一步验证了偏好密码子分析结果。选择和突变都能影响密码子的偏好使用[21-22]。通过ENc-plot和PR2-plot等分析可以发现,在豆科植物中,碱基突变是影响DXS基因密码子偏好性的主要因素(图 2和图 3),这一结果与油茶[18]和木兰科叶绿体基因组[23]等研究结果相似,与川芎COMT基因[24]研究结果相反,说明这些影响存在一定的多样性。

基于RSCU值的聚类相近于基于CDS序列的聚类结果,表明进化过程中,基因组的位点突变特征以及编码区的序列信息均起到相应作用。然而,基于RSCU值的聚类效果要弱于基于CDS序列的聚类效果,类似结果也出现在前人研究中[20,25]。以上研究表明,基于CDS序列的聚类为主,RSCU值的聚类为辅来研究豆科植物的系统发育研究能够获得更准确的结果。为了选择豆科DXS基因的合适表达宿主,比较其在大肠杆菌(Escherichiacoli) 、酿酒酵母(Saccharomycescerevisiae) 、拟南芥(Arabidopsisthaliana)和烟草(Nicotianatabacum)中的适应指数,表明拟南芥、烟草和酵母均是DXS基因的合适宿主。

DXS是MEP途径的关键酶之一,其表达水平的高低与下游次生代谢产物具有密切的正相关性,由此,提高DXS基因的表达水平,可以增强下游萜类化合物产率,具有较高的理论及应用价值。研究获得了豆科植物DXS基因的密码子的偏好使用信息,为认识豆科植物DXS基因的进化规律及合适宿主的选择提供了理论依据。

猜你喜欢
豆科植物萜类禾本科
阿拉善荒漠两种典型豆科植物主要物候期对气候变化的响应*
科学家揭示豆科植物能与根瘤菌共生固氮机制
科学家在豆科植物根瘤发育研究中获进展
三叶委陵菜的化学成分和药理作用研究进展
科学家揭示豆科植物能与根瘤菌共生固氮机制
苍耳子中萜类化学成分的研究
深海来源真菌Alternaria tenuissma DFFSCS013中混源萜类化合物及其抗菌活性研究
芦根及其混淆品的鉴定
植物中萜类化合物的提取方法研究进展
禾本科植物之王