非洲菊CAD基因的密码子偏好性分析

2019-06-12 03:07王星淇石小保林芳柯孙雪丽刘范田娜郝向阳程春振
园艺与种苗 2019年4期
关键词:密码子木质素遗传

王星淇,石小保,林芳柯,孙雪丽,刘范,田娜,郝向阳,程春振

(福建农林大学园艺学院,福建福州 350002)

遗传转化是研究基因功能和植物遗传改良的重要手段。在特定植物的遗传转化体系不够成熟或研究一个植物的基因在其他植物或微生物中的作用时,常常会用到异源表达系统。然而不同生物对密码子的使用有一定的偏好性,这使得在异源表达某一基因时有时会出现基因在异源表达系统中不能成功翻译出相应蛋白的情况。因此,在进行基因克隆、基因功能鉴定、异源表达系统选择以及改进和优化提高基因表达水平等方面的研究时,密码子偏好性分析显得极为重要[1]。

非洲菊是世界五大鲜切花之一[2],具有极高的经济价值。然而非洲菊抗逆性较弱,容易受病害和环境变化的影响[3],提高非洲菊的抗逆性对非洲菊产业的健康发展意义重大。木质素生物合成途径在植物抗逆反应中发挥着重要作用[4]。肉桂醇脱氢酶(C A D)是木质素生物合成途径最早被研究的酶之一,其在木质素单体生物合成的最后一步反应过程中催化肉桂醛还原成相应的木质素单体的前体[5-6],在3种木质素的合成过程中都起到了非常重要的作用。CAD基因自1973年被发现以来,国内外学者从其组成结构、生物性质、基因克隆及遗传转化等方面展开了系列研究,并取得了一定的进展。目前有关非洲菊CAD基因的研究较少,该研究基于前期获得的非洲菊转录组数据进行了CAD基因筛选,并进行了密码子偏好性分析,旨在为今后该基因的功能研究、生物信息学分析和木质素代谢研究奠定基础。

1 材料与方法

1.1 CAD基因的筛选及模式生物基因组的密码子偏好性数据来源

基于实验室前期获得的非洲菊转录组数据,筛选包含全长CDS的CAD基因。5个常见模式生物:拟南芥(Arabidopsis thaliana)、烟草(Nicotiana sylvestris)、番茄(Solanum lycopersicum)、大肠杆菌(Escherichia coli)以及酵母菌(Saccharomyces cerevisiae)基因组密码子偏好性数据下载自Codon Usage Database(http://www.kazusa.or.jp/codon/)[7]。

1.2 CAD基因密码子使用偏好性分析与碱基组成分析方法

通过CodonW软件计算非洲菊CAD基因的ENC和CAI值,并通过使用EMBOSS在线网站(http://www.bioinformatics.nl/emboss-explorer/) 分析计算得到非洲菊CAD基因密码子第1、2、3位的GC含量(GC1s、GC2s、GC3s)与总GC含量。再使用CodonW软件获得非洲菊CAD基因的RSCU值。

利用软件Origin8.0进行中性绘图分析、ENC-plot分析和 PR2分析(PR2-bias plot analysis),具体步骤参照屈蒙蒙等的方法[8]。

2 结果与分析

2.1CAD基因家族的ENC和GC

从非洲菊转录组数据中筛选获得5条具有完整CDS的CAD基因,分别命名为CAD1、CAD2、CAD3、CAD4、CAD5。通过CodonW软件计算它们的ENC和CAI值,利用EMBOSS在线分析得它们的总GC含量以及位于密码子不同位置的GC含量,整理得表1。由表1可以看出,5个非洲菊CAD基因的ENC值相差不大,介于53.37~58.07,平均值为55.77,说明非洲菊CAD基因密码子的使用偏好性较弱。从CAI指数看,非洲菊CAD基因CAI值介于0.191~0.225,平均值为0.210,远小于1,进一步说明了非洲菊CAD基因的密码子偏好性较弱。总GC含量为44.16%~50.23%,平均值为46.46%;GC1s为48.46%~55.71%,平均值为52.56%;GC2s为37.05%~40.67%,平均值为39.16%;GC3s为44.08%~57.94%,平均值为47.67%,由此推测非洲菊CAD基因家族编码氨基酸时使用较多的A或T,G或者C的偏好性较弱,且偏向于以A或T结尾。

2.2 同义密码子相对使用度

通过CodonW软件分析后得到5个非洲菊CAD基因的RSCU值,取平均值后整理得到表2。偏好性较强的密码子(RSCU>1)有32个,其中以G或者C结尾的密码子有12个,以A或者U(T)结尾的密码子有20个,说明以A或者U(T)结尾的密码子出现的频率较高而G或者C的偏好性较弱,与GC含量值预测结果一致。此外,无相对使用度极大的特定同义密码子,表明该家族成员对密码子的偏好性较为平均,无特别偏好的密码子。

表2 非洲菊CAD基因同义密码子的使用频率

2.3 CAD基因成员碱基组成

采用 SPSS17.0 进行GC1s、GC2s、GC3s、GC和ENC两两Pearson关联分析,由表3可得GC1s、GC2s、GC3s、GC和ENC之间无显著相关性(P<0.05为显著,P<0.01为极显著),说明非洲菊CAD基因第1、2和3位上的碱基组成无特别的相似关系。

表3 非洲菊CAD基因不同位置的密码子GC含量及ENC的相关性

图1 5个非洲菊CAD基因的密码子使用偏好性中性绘图

由图1可得,5个非洲菊CAD基因较为分散,且分布在对角线两侧,大部分都距离对角线较为接近。G1s、G2s与G3s无明显的线性关系,与Pearson分析结果一致。

由图2分析可得,5个非洲菊CAD基因的ENC值距离ENC的期望曲线都较远,无显著规律。而由图3分析可得,这5个非洲菊CAD基因A3/(A3+T3)与G3/(G3+C3)的比值大部分与0.5偏离较大,这表明该基因编码氨基酸时除受突变压力的影响外,外界因素与自然压力影响较大。且从图3的整体布局上看,纵坐标主要集中于小于0.5的位置,横坐标也主要集中在小于0.5的位置,这说明密码子第3位上T(U)的含量大于A的含量,第3位上C的含量大于G的含量。

2.4 CAD基因受体系统选择

目前,国内外对非洲菊遗传转化体系的研究仍较为少见[9-10],非洲菊的遗传转化体系的研究也较为不成熟[11-13],因此找寻非洲菊合适的异源表达系统和模式受体为基因进行相关的功能验证以及为遗传转化体系的研究奠定基础仍然非常重要。非洲菊CAD基因家族成员密码子平均使用频率分别与模式植物拟南芥(At)、烟草(Nt)、番茄(Sl)、大肠杆菌(Ec)、酵母菌(Sc)基因组密码子使用偏性的数据比较的汇总表如表4所示,与大肠杆菌使用偏性相差较大的密码子有18个,而与酵母菌使用偏性相差较大的密码子仅有10个,说明酵母菌真核表达系统较适合成为非洲菊CAD的异源表达系统;番茄、烟草、拟南芥与非洲菊CAD基因使用频率相差较大的密码子分别是10、7、6,由此推测拟南芥是作为非洲菊CAD基因遗传转化研究的更为理想的受体。

图3 5个非洲菊CAD基因的PR2分析

表4 非洲菊CAD基因与5个常见模式生物基因组密码子使用频率的比较

3 讨论

通过对5个非洲菊CAD基因的ENC和CAI值和总GC含量以及位于密码子不同位置的GC含量的分析可得,非洲菊CAD基因的密码子偏好性较弱,基因表达水平总体偏低。该基因编码氨基酸时使用较多的A或T,G或者C的偏好性较弱,且偏向于以A或T结尾。同时,通过RSCU分析发现,非洲菊CAD基因密码子使用偏性较强的密码子有32个,其中以G或者C结尾的密码子有12个,以A或者U(T)结尾的密码子有20个。以上结果与双子叶植物更偏好使用A或T(U)结论一致[14]。

非洲菊CAD基因位于第1、2、3位的密码子无明显的线性关系,A3/(A3+T3)与G3/(G3+C3)的比值大部分与中间值0.5偏离较大,可推测该基因编码氨基酸时除受突变压力的影响外,外界因素与自然压力影响较大。

目前,非洲菊基因原核表达多使用大肠杆菌原核表达系统[15-17],而该研究发现酵母菌真核表达系统更适合作为非洲菊CAD基因的异源表达系统。此外,该研究还发现拟南芥是非洲菊CAD基因异源植物表达最为理想的植物受体,该结论可对非洲菊CAD基因遗传转化研究以及功能验证提供参考。

猜你喜欢
密码子木质素遗传
◎维美德为Mercer Rosenthal公司交付木质素提取生产线
双盐离子液体处理过程中木质素的结构变化
木质素低共熔溶剂分离、功能材料制备及应用研究进展
镰翅羊耳蒜叶绿体基因组密码子偏好性分析
“85后”非遗传承人的旗袍梦
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
木质素清洁高效分离研究进展
新型密码子、反密码子、氨基酸对应盘