李秋娥,秦 余,郑乔木,谭国栋,廖 海,周嘉裕
(西南交通大学 生命科学与工程学院,成都 610031)
植物中所有含苯丙烷骨架的物质都是由苯丙烷类合成途径直接或间接所产生的,该途径是植物中最重要的次生代谢途径之一,与植物的生长发育和抗逆防御反应等生理过程息息相关[1]。苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL)将苯丙氨酸非氧化脱氨转化生成反式肉桂酸,然后形成香豆素与绿原酸等中间体,最后转化为异黄酮、木质素与生物碱等次生代谢产物[2]。欧芹PAL结构中的Ala-Ser-Gly形成了4-methylidene-imidazole-5-one(MIO)环化结构,与酶的催化反应相关,为解析PAL的催化机制与合理化改造奠定了基础[3]。
PAL是苯丙烷合成途径的第一个关键酶,其表达强弱与植物抗逆性强弱呈正相关,这也使其成为苯丙烷途径代谢调控的重要候选基因之一[4-5]。目前,已从单细胞藻类[6]、裸子[7]与被子植物[8]等不同类别植物中克隆获得PAL基因。过表达PAL基因的转基因植物获得了较高的生长发育速度与较强的抗逆性,而降低PAL基因的表达导致植物木质素合成减少和抗逆性减弱[2, 9]。提高PAL基因的表达效率是开展以PAL基因为靶点代谢调控的重要基础。然而,由于物种密码子的不同,其各自特有的偏好性也有所差别,因此必须分析外源基因密码子偏好性,选择适宜宿主来表达外源基因,通过对密码子进行合理优化进而提高外源基因的表达效率[10]。此外,通过对密码子偏好性的分析,还能够了解密码子偏好性形成的机制及不同物种间的遗传进化关系[11]。
本文从NCBI下载41条不同植物来源的PAL基因序列,及本课题组获得的暗紫贝母转录组中的PAL基因序列,利用CodonW、EMBOSS、SPSS、Origin与MEGA等程序与在线软件获得密码子偏好性、RSCU聚类树及系统进化树等信息。通过比较拟南芥、烟草、大肠杆菌和酵母等模式生物体的密码子,确定最适表达宿主。以上结果将为开展PAL基因的功能鉴定、植物遗传进化研究及转基因植物培育奠定理论基础。
暗紫贝母(Fritillariaunibracteata)转录组经过功能注释后,获得暗紫贝母PAL(FuPAL)基因的CDS序列。其余41种不同植物的PAL基因序列来源于GenBank(http://www.ncbi.nlm.nih.gov/genbank/),登录序号见表1。从密码子使用数据库(http://www.kazusa.or.jp/codon/)中获得了模型生物如酵母菌(Saccharomycescerevisiae)和大肠杆菌(Escherichiacoli)的基因组密码子偏好性数据。
表1 PAL的密码子偏好性参数
采用EMBOSS在线程序(http://emboss.toulouse.inra.fr.)以及CodonW程序分析PAL基因的编码序列(coding sequence,CDS)的RSCU、有效密码子数(effective number of codon,ENc)、密码子G/C含量、密码子第3位G/C含量GC3s、密码子适应指数(codon adaptation index,CAI)等,并用SPSS分析相关基因及基因组密码子使用偏好性聚类。用PAL基因的ENc及GC3s值构建散点图和ENc-GC3s期望曲线:ENc=2+GC3s+29/[GC3s2+(1-GC3s)2]。
利用MEGA-X软件邻接法(neighbor-joining)构建PAL的系统进化树,检验方法设为Bootstrpmethod,检验次数设为1 000,分析其在进化上的亲缘关系。通过聚类树的比较,分析PAL密码子偏好性与物种进化之间的联系。
RSCU反映的是特定密码子编码其对应氨基酸时同义密码子之间的相对使用概率,当RSCU>1,说明该密码子的相对使用频率较高;当RSCU<1,则说明相对使用频率较低[12]。图1为根据42条PAL的RSCU值制作的热图,结果显示密码子相对使用度在单子叶植物、双子叶植物和其他低等植物PAL之间存在较大差异,并且单子叶与其他植物差异存在显著分界线。单子叶、双子叶及其他低等植物PAL的优势密码子(RSCU>1)分别有22、18与10个,且最优密码子分别为CUC、UUG与CUG。由于单子叶植物有ACC、CUC、AUC和GGC等4种优势密码子的RSCU>2,而其他种类植物优势密码子的RSCU均小于2,说明单子叶植物的密码子偏好性强于其他植物[13]。
图1 PAL的RSCU热图
图2为42条PAL的GC、GC3s、CAI与Enc热图,显示不同植物类群的密码子偏好性参数可以被有效聚类。单子叶、双子叶和其他低等植物PAL的GC平均值分别是58.9%、46.6%和53.2%,GC3s平均值分别为75.4%、45%和59%。结果表明双子叶植物PAL偏好AT,而单子叶和其他植物PAL偏好CG。单子叶、双子叶和低等植物ENc平均值分别为42、51.8、50.4。这说明单子叶植物的PAL基因相比其他植物的PAL基因的密码子偏好性更强。
图2 PAL的密码子偏好性参数
根据42条PAL基因的CDS序列构建系统进化树,发现能够有效反映PAL基因在进化上的亲缘关系(图3)。42条PAL基因被分为两大簇类,第1簇由被子植物组成(葡萄、紫萍例外),第2簇由其他植物组成。第1簇中,单双子叶植物又分别聚类为两个小簇。第2簇中,大多数蕨类与苔藓植物小立碗藓聚集。在RSCU聚类(图4)中PAL基因也可大致分为2大簇。第1簇包含了大多数双子叶及少量蕨类、裸子植物;第2簇主要由单子叶、蕨类与苔藓植物组成,然而单子叶植物玉米和双子叶植物苋却单独形成两个分支。苔藓植物小立碗藓与蕨类问荆靠近,与蕨类退化形成苔藓类植物的观点相符。将RSCU聚类与系统进化树进行比较,表明RSCU聚类反映植物进化的关系准确度弱于系统进化树。类似现象已多次发现,其原因可能源于基因的倍增和重组、水平的基因转移等[14]。
图3 PAL系统进化树
图4 PAL的RSCU值聚类分析
以GC3s为横坐标,ENC为纵坐标绘制ENc-plot图,自然选择或是碱基突变的影响导致密码子偏好性可以由图中各点离期望曲线显示,距期望值近则受碱基突变影响较大,反之受自然选择影响大[15]。ENc-plot图(图5)显示来源于单子叶植物的暗紫贝母、杂交百合、石蒜、紫萍与凤梨PAL基因,以及来源于双子叶植物的拟南芥PAL基因分布于期望曲线附近,表明突变影响是导致这6种PAL基因密码子偏好性形成的主要因素,而自然选择影响是导致其余植物密码子偏好性形成的主要因素。
图5 PAL基因的ENc-plot分析
将42种PAL密码子使用频率与大肠杆菌、酵母、烟草与拟南芥等常用表达宿主的基因组密码子使用频率进行比较,计算密码子适应指数,值越大,则说明外源基因在宿主内的表达水平越高。结果显示,相比烟草,拟南芥更适合作为42种植物PAL的遗传转化宿主。暗紫贝母、百合、郁金香、异叶天南星、凤梨、玉米、水稻、西谷椰子、香蕉与紫萍等10种单子叶植物和问荆、江南卷柏和小立碗藓等低等植物,大肠杆菌是比酵母更适合的外源表达宿主,而酵母是适合其余植物的外源表达宿主。
单双子叶、低等植物等不同植物来源PAL基因有不同的优势密码子,提示余下的非优势密码子可能是密码改造的重点区域。裴建军[16]利用类似思路,对海栖热袍菌木聚糖酶基因的非优势密码区域进行改造,提高了表达效率。Enc值是目前评价密码子偏好性强弱最具参考价值的参数,Enc分析发现植物PAL偏好性整体性较弱,这可能导致植物PAL基因的表达较弱,使其成为苯丙烷代谢途径的关键步骤。Huang等[9]也发现类似结果,即植物苯丙烷类化合物与PAL基因的表达强度呈正相关性。分析同样来自苯丙烷代谢途径的COMT、4CL[17]等对G/C偏好性,发现它们具有相同的G/C偏好性,并且来自单子叶植物与低等植物PAL偏好G/C,双子叶植物PAL偏好A/T,产生这一现象的原因可能是单、双子叶植物在进化过程和生存环境的差异[18]。同时,推测来源于同一代谢途径的基因可能受到相近的遗传压力,从而表现出相近的密码子偏好性。
ENc-plot分析(图5)显示,双子叶植物(除拟南芥)与低等植物的PAL基因偏好性主要受自然选择的影响,单子叶植物既受到突变影响又受到自然选择影响。这一结果与张孟伟等[19]的观点一致,他们认为自然选择压力导致了苯丙氨酸解氨酸密码子使用偏好性的产生。严子成等[14]发现COMT基因的密码子偏好性形成主要受自然选择影响。对比基于密码子偏好性的RSCU聚类与基于核酸序列的系统进化树证实,RSCU聚类在一定程度上能够反映物种进化的关系,但和系统进化树相比其准确度较弱,推测其原因,可能是PAL核酸序列更易受到自然选择的影响,而单子叶植物PAL密码子偏好性受自然选择与突变的双重影响。侯惠静等[20]与严子成等[14]也认为基于密码子偏好性的聚类与物种的真实系统关系存在少量差异,提示物种分类不仅限于对核苷酸序列分析,也需要结合不同水平上的综合结果才能获得更准确的结果。
通过与模式生物对比,可为不同植物PAL选择适合的外源表达载体提供参考。例如,大肠杆菌相比酵母更适合作单子叶植物PAL的外源表达载体,已有单子叶植物玉米PAL在大肠杆菌中获得了成功表达,其重组蛋白可同时催化苯丙氨酸和酪氨酸[21]。相比烟草,拟南芥更适合作为所有植物PAL的遗传转化系统,提示以拟南芥基因组密码子为参考,对PAL基因进行改造,能够获得高效表达,用于植物抗逆育种及PAL基因的功能研究。
通过分析42种PAL基因的密码子偏好性,发现各序列的优势密码子,可通过对该基因非优势密码区域进行改造从而提高表达效率,为提高植物基因的表达提供理论指导。通过对比模式生物的密码子偏好性,确定不同植物PAL基因最适表达宿主,大肠杆菌适合绝大多数单子叶植物表达,酵母适合双子叶等植物;拟南芥相比烟草更适合作为所有42种植物PAL基因的遗传转化宿主,可为PAL的异源表达提供理论依据。研究结果可为开展植物PAL基因的功能鉴定、植物遗传进化研究与转基因植物培育等奠定理论基础。