龚意辉 唐诗眙 周桂花 陈磊 张斌 李鹏
摘要:为了解黄荆坪竹根椒(Capsicum annuum L. cv Huang Jingping)叶绿体基因组密码子使用模式,以其51条蛋白编码序列(coding sequence,CDS)为研究对象,采用Codon W 1.4.2、CUSP、 Excel 2010、SPSS 16.0等软件对黄荆坪竹根椒密码子的GC含量、有效密码子值(ENC)、RSCU、中性绘图、ENC-plot、PR2-plot、最优密码子及其影响因素进行详细的分析。结果表明,黄荆坪竹根椒密码子第1位(GC1)、第2位(GC2)、第3位(GC3)中的GC含量分别为42.68%、36.25%、27.89%,其中 GC1>GC2>GC3,表明密码子第3位碱基以A/U结尾为主;ENC值介于34.10%~54.31%之间,平均值为46.55%,表明黄荆坪竹根椒密码子偏好性较弱。相关性分析结果表明:(1)GC1 与 GC2 呈极显著正相关,GCall与 GC1、GC2、GC3 均为极显著正相关;(2)ENC 与 GC1、GC2均不存在显著相关关系,但与 GC3 存在极显著相关关系。RSCU分析结果显示:在黄荆坪竹根椒叶绿体基因组中共有30个高频密码子的RSCU>1,其中以U、A、G结尾的高频密码子数分别为16、13、1个,表明黄荆坪竹根椒密码子第3位偏好以A或U结尾。ENC-plot绘图分析结果表明,黄荆坪竹根椒基因组中大多数基因位于标准曲线下方,有13个基因的ENC 比值介于-0.05~0.05 之间,说明选择压力主要影响黄荆坪竹根椒密码子的偏好性;PR2-plot 分析结果表明,黄荆坪竹根椒叶绿体基因组中大部分基因位于平面图的右下方,即 T>A、G>C,表明碱基突变、自然选择压力等多种因素共同影响黄荆坪竹根椒密码子的偏好性。在黄荆坪竹根椒叶绿体基因组中共筛选出GCA、GCU、AGA等19个最优密码子并全部以A/U结尾。本研究结果可为进一步开展黄荆坪竹根椒性状改良、遗传进化及叶绿体基因工程的应用提供分子理論支撑。
关键词:黄荆坪竹根椒;叶绿体基因组;密码子偏好性;最优密码子
中图分类号:S641.301文献标志码:A
文章编号:1002-1302(2023)20-0028-06
密码子是构成原核生物与真核生物遗传信息的基本单元,在生物体转录、翻译过程中起着非常重要的作用。自然界中64种密码子编码20种氨基酸和3种终止密码子(TGA、TAA和TAG),除甲硫氨酸(Met)和酪氨酸(Trp)外,其余18种氨基酸均有多个同义密码子与之对应。同义密码子在不同物种叶绿体基因组中,甚至在同种物种同样基因中的使用频率也不是均等的[1]。同义密码子使用频率的差异性称之为密码子偏好性(synonymous codon usage bias,SCUB)。越来越多的研究表明,不同植物中密码子的偏好性不同,例如天山雪莲(Saussurea involucrata)[2]、云南樟(Cinnamomum glanduliferum)[3]、橄榄(Canarium album)[4]。因此,对植物密码子的偏好性进行深入探究,不仅有利于明确植物的分类与鉴定[5],而且还可根据最优密码子设计植物的外源基因,进一步提高外源基因的表达丰度及转化效率,从分子角度全面解析植物的进化过程[6]。
叶绿体是植物进行光合作用的重要场所,为植物的正常生长提供源源不断的营养物质。叶绿体拥有一套完整的遗传信息,能进行母系遗传,长度大小一般为120~160 kb,具有高度保守的特征[7]。因此,叶绿体基因组学在物种遗传分类、鉴定、进化规律、基因工程等方面有重要的研究意义[8-9]。植物叶绿体全基因组伴随着现代高通量测序技术的快速发展而不断被美国国家生物技术信息中心(NCBI)数据库收录,已有越来越多的学者在植物中开展叶绿体基因组密码子的偏好性研究,例如,萝卜(Raphanus sativus L.)[10]、苋菜(Amaranthus tricolor L.)[11]、莲藕(Nelumbo nucifera Gaertn)[12]。因此,分析植物密码子的偏好性及其影响因素不仅可以确定该物种的最优密码子,然后根据最优密码子设计基因表达载体,进一步提高外源基因的表达水平,从而有利于阐明植物适应外界环境的分子机制。
黄荆坪竹根椒(Capsicum annuum L. cv Huang Jingping)是茄科(Solanaceae)辣椒属(Capsicum)一年或有限多年生草本植物,主要分布在湘潭市黄荆坪排头乡。黄荆坪竹根椒因个体细长、色泽鲜艳、皮薄肉多、味道鲜美而深受广大消费者的青睐。近年来,黄荆坪竹根椒规模及产业发展迅速,现已成为湘潭市黄荆坪排头乡实现乡村振兴、农民致富的重要支柱产业。目前有关辣椒的研究主要集中在高产高效技术栽培[13]、遗传育种[14]、品质评价[15]等方面,随着黄荆坪竹根椒全基因组测序和拼接组装工作的完成,目前国内外有关黄荆坪竹根椒密码子偏好性的研究还尚未见报道。本研究对黄荆坪竹根椒密码子的碱基组成及其各相关参数进行分析,首次阐明黄荆坪竹根椒密码子偏好性使用的特征,从而在黄荆坪竹根椒叶绿体基因组中遴选出最优密码子,并明确影响黄荆坪竹根椒密码子偏好性的主要因素,以期为今后进一步开展黄荆坪竹根椒性状改良、进化规律及叶绿体基因工程的应用提供分子理论支撑。
1 材料与方法
1.1 黄荆坪竹根椒叶绿体全基因序列的获得
2022年5月15日采集湘潭市农业科学研究所种苗中心的黄荆坪竹根椒幼嫩叶片,经液氮速冻后送华智生物技术有限公司进行叶绿体基因组测序,采用Illumina/MGI测序平台完成了黄荆坪竹根椒叶绿体基因组的测序,全长为 156 817 bp,包括82个蛋白编码基因(CDS),GenBank 登录号为OP919650.1。在筛选黄荆坪竹根椒蛋白编码基因时,首先删除重复序列,然后选择ATG 作为起始密码子,TGA、TAA和TAG为终止密码子,且以编码序列大于 300 bp 的叶绿体基因用于密码子偏好性分析,最后共得到51个满足条件的CDS序列。
1.2 中性绘图分析
参照Liu等的方法[16],计算黄荆坪竹根椒叶绿体密码子第3位中的 GC 含量(GC3),以GC3 为横坐标,密码子第1、第2位中的平均 GC 含量(GC12)为纵坐标,制作散点图进行相关性分析。
1.3 相对同义密码子使用度分析
参照原晓龙等的方法[17],使用 CodonW 软件分别统计黄荆坪竹根椒各密码子的相对同义密码子使用度(relative synonymous codon usage,RSCU),将黄荆坪竹根椒密码子的RSCU>1定义为高频密码子。
1.4 ENC-plot 绘图分析
参照Fuglsang 的方法[18],分别以黄荆坪竹根椒的GC3s、有效密码子 ENC(effective number of condon)为横坐标和纵坐标,绘制散点图,其ENC的计算公式为ENC=2+GC3s+29/[GC23s+(1-GC3s)2]。结合黄荆坪竹根椒的ENC比值频数分布对其差异进行定量分析,以ENC值为-0.05~0.05 区间作为具体的判断标准。
1.5 PR2-plot 绘图分析
参照Sueoka的方法[19],分别统计黄荆坪竹根椒密码子第3位中碱基组成(G3、C3、A3、T3)比例,分别以G3/(G3+C3)、A3/(A3+T3)为横坐标和纵坐标进行黄荆坪竹根椒的PR2 偏倚分析。
1.6 最优密码子分析
参照原晓龙等的方法[17],最优密码子以黄荆坪竹根椒的ENC 值作为衡量密码子偏性标准,分别在两端挑选最高和最低的10%基因构建黄荆坪竹根椒高低基因表达库,分别计算黄荆坪竹根椒各高低基因的RSCU 和ΔRSCU值,将同时符合高频率密码子(RSCU>1)和高表达密码子(ΔRSCU≥0.08)2个条件的密码子定义为最优密码子。
2 结果与分析
2.1 黄荆坪竹根椒相关偏性指数分析
利用在线软件Codon W 1.4.2和CUSP软件对黄荆坪竹根椒叶绿体中的51条CDS序列进行分析,其各基因不同位置的GC含量和ENC值如表1所示,51条CDS密码子中的总GC含量介于 30.73%~45.32%之间,平均GC 含量(GCall)为35.61%,GC1含量介于34.39%~58.88%之间,平均GC含量为42.68%,GC2含量介于29.13%~56.83%之间,平均GC 含量为36.25%,GC3含量介于18.52%~37.39%之间,平均GC 含量为27.89%,其结果说明黄荆坪竹根椒密码子不同位置的GC含量存在差异,GC1>GC2>GC3,表明在黄荆坪竹根椒密码子第3位多为A/T 碱基;ENC值介于34.10%~54.31%之间,平均值为46.55%,其中35条 CDS 的 ENC 值高于45.00%,占总编码基因数的68.63%;可判断出黄荆坪竹根椒密码子的使用偏好性较弱。
对黄荆坪竹根椒叶绿体密码子各项系数进行相关性分析(表2),GCall与GC1、GC2、GC3均呈极显著相关(P<0.01);GC1与GC2呈极显著相关,但与GC3相关性不显著,说明黄荆坪竹根椒密码子第1位和第2位碱基组成存在相似性;ENC与GC3呈极显著相关,其相关系数为 0.448,但与GC1和GC2并不存在显著相关性,说明GC3碱基组成主要影响黄荆坪竹根椒密码子的偏好性。
根据黄荆坪竹根椒的RSCU分析可知,在黄荆坪竹根椒叶绿体基因组中共有30个高频密码子的RSCU>1,其中以U、A、G结尾的高频密码子数分别为16、13、1个(表3),表明黄荆坪竹根椒密码子第3位偏好以A或U结尾。
2.2 中性绘图分析
中性绘图分析结果(图 1)表明,GC3取值介于18.52%~37.39%之间,GC12 取值介于31.76%~57.86%之间,黄荆坪竹根椒全部基因分布在对角线之上,回归系数为0.022 1,r2为0.02,说明黄荆坪竹根椒叶绿体基因组中GC12 和 GC3的相关性显著,说明黄荆坪竹根椒密码子第1位和第2位与第3位的碱基组成不同但不存在显著性相关,说明自然选择主要影响黄荆坪竹根椒偏好性的形成。
2.3 ENC-plot 繪图分析
黄荆坪竹根椒叶绿体基因组密码子的 ENC-plot 分析结果(图2)表明,黄荆坪竹根椒少数基因沿着标准曲线周围分布,说明黄荆坪竹根椒密码子的实际 ENC 值与期望 ENC 值接近,大部分基因则分布在标准曲线下方,并且与标准曲线相距较远,表明自然选择主要影响黄荆坪竹根椒叶绿体基因组密码子的偏好性。通过计算黄荆坪竹根椒密码子的ENC 比值(表4),ENC 比值介于-0.05~0.05 区间的基因共有13个,而ENC 比值位于这个范围之外的基因共有38个,且距期望 ENC 值较远,说明这些基因与标准曲线相距较远,说明选择压力主要影响黄荆坪竹根椒密码子的偏好性。
2.4 PR2-plot 分析
采用 PR2-plot 绘图对黄荆坪竹根椒叶绿体基因氨基酸 A、G 和 T、C 之间的关系进行分析(图3),在黄荆坪竹根椒叶绿体基因组中大多数基因位于平面图的下半部分,说明A、G、T、C 4种碱基的使用频率存在差异,即T>A,G>C;这表明碱基突变、自然选择压力等多种因素共同影响黄荆坪竹根椒密码子的偏好性。
2.5 最优密码子的确定
对黄荆坪竹根椒 51条 CDS 的 ENC 值进行排序,从两极分别挑选 10%的基因建立高低表达库,计算各密码子的 RSCU值、ΔRSCU 值,将同时符合RSCU>1且ΔRSCU≥0.08这2个条件的密码子确定为黄荆坪竹根椒的最优密码子(表5),结合表3统计的30个RSCU>1 的高频密码子,有26个密码子的ΔRSCU≥0.08,最终在黄荆坪竹根椒叶绿体基因组中筛选出19个最优密码子,分别为GCA、GCU、AGA、CGA、UGU、CAA、GAA、GGU、AUU、CUA、CUU、AAA、CCA、CCU、UCU、ACA、ACU、GUA、GUU,其中10个最优密码子以A 结尾,9个最优密码子以U结尾,说明黄荆坪竹根椒密码子偏好使用A/U。
3 结论与讨论
密码子偏好性是有效分析原核生物和真核生物进化特征的一个重要手段[20]。大量研究结果表明,密码子偏好性受多种生物因素的影响,例如基因表达丰度、基因片段大小、tRNA丰度、碱基组成及突变等因素均可以影响物种密码子的使用模式[21]。然而,已有研究报道碱基突变和自然选择是决定物种密码子使用偏性的重要原因,已被广泛用于阐明物种基因组密码子使用的特异性[17]。据报道,在植物中,核苷酸组成在核基因组密码子偏性形成中发挥重要作用,但自然选择则在植物线粒体基因组和叶绿体基因组密码子偏好性形成中发挥重要作用[22-23]。本研究系统分析了影响黄荆坪竹根椒密码子偏好性的主要因素,中性分析表明,黄荆坪竹根椒基因组中GC12和GC3不存在显著相关性,且回归方程斜率较低,说明自然选择可能比突变更能影响黄荆坪竹根椒密码子偏好性的形成。
本研究发现黄荆坪竹根椒密码子 GC1(42.68%)>GC2(36.25%)>GC3(27.89%),GC3与GC1、GC2均不存在显著相关性,但GC1与GC2呈极显著相关(P<0.01),说明黄荆坪竹根椒密码子第3位偏好使用A或U结尾,使用模式为NNA或NNU,其偏好性主要受自然选择因素的影响。这与茄科同属植物番茄(Solanum lycopersicum)[24]、枸杞(Lycium barbarum)[25]等研究结果相似,表明黄荆坪竹根椒与番茄和枸杞的密码子使用模式相似。
本研究发现黄荆坪竹根椒密码子ENC平均值为46.55>45,其中35条 CDS 的 ENC 值高于45,可推测这些基因密码子的使用偏性较弱。对黄荆坪竹根椒密码子的中性绘图分析表明,密码子第3位(GC3)与密码子第1、2位(GC12)中的A、T、C、G组成存在较大差异,GC3含量明显低于GC12,进一步阐明自然选择对黄荆坪竹根椒密码子偏好性的影响较大,这与秋茄(Kandelia obovata)[26]的研究结果一致。利用ENC-plot分析了影响黄荆坪竹根椒密码子偏性因素,自然选择相比于突变因素更加能影响黄荆坪竹根椒密码子偏好性的形成。黄荆坪竹根椒与迎春樱桃(Prunus discoidea)[27]、酸枣(Ziziphus jujuba var. spinosa)[28]等植物密码子偏好性研究结果相似,而突变是影响籽粒苋(Amaranthus hypochondriacus)[29]密码子偏好性形成的主要原因,突变和选择在芒果(Mangifera indicate L.)[30]密码子偏好性形成中起同等重要作用。可见,不同植物在自然进化过程中影响密码子偏好性的因素可能存在一定的差异,但具体影响密码子偏好性的机制还有待深入研究。
在黄荆坪竹根椒叶绿体基因组中共筛选出GCA、GCU、AGA等19个最优密码子,且全部以 A/U 结尾,再次证明了黄荆坪竹根椒密码子使用模式为NNA或NNU,其密码子的使用模式与菠萝(Ananas comosus)[31]、金花茶(Camellia nitidissima)[32]等植物的最优密码子 NNA、NNU 的模式相同。黄荆坪竹根椒、菠萝和金花茶等植物密码子偏好使用NNA或NNU模式,可能是由于这些植物中密码子第3位A、U含量偏高所造成的。最优密码子分析表明,在利用黄荆坪竹根椒进行基因工程研究设计外源基因时,优先选择A或U结尾的密码子,在一定程度上可提高其外源基因的表达转化效果,为今后开展其性状改良、种质资源保存和进化机制研究提供理论支撑。
参考文献:
[1]Wei L,He J,Jia X,et al. Analysis of codon usage bias of mitochondrial genome in Bombyx mori and its relation to evolution[J]. BMC Evolutionary Biology,2014,14(1):262.
[2]何亚玲,彭业军,李 锦,等. 天山雪莲叶绿体基因组密码子偏好性分析[J]. 石河子大学学报(自然科学版),2022,40(1):84-92.
[3]肖明昆,嚴 炜,熊贤坤,等. 云南樟叶绿体基因组密码子偏好性分析[J]. 中南林业科技大学学报,2022,42(6):127-134.
[4]赖瑞联,陈 瑾,冯 新,等. 橄榄叶绿体基因组密码子偏好性特征[J]. 福建农林大学学报(自然科学版),2022,51(4):502-509.
[5]Leffler E M,Bullaughey K,Matute D R,et al. Revisiting an old riddle:what determines genetic diversity levels within species?[J]. PLoS Biology,2012,10(9):e1001388.
[6]Christofi M,Pavlou A,Lantzouraki D Z,et al. Profiling carotenoid and phenolic compounds in fresh and canned fruit of peach cultivars:impact of genotype and canning on their concentration[J]. Journal of Food Composition and Analysis,2022,114:104734.
[7]Niu Y F,Gao C W,Liu J.Complete mitochondrial genomes of three Mangifera species,their genomic structure and gene transfer from chloroplast genomes[J]. BMC Genomics,2022,23(1):147.
[8]Han C Y,Ding R,Zong X Y,et al. Structural characterization of Platanthera ussuriensis chloroplast genome and comparative analyses with other species of Orchidaceae[J]. BMC Genomics,2022,23(1):84.
[9]Lian C L,Yang H,Lan J X,et al. Comparative analysis of chloroplast genomes reveals phylogenetic relationships and intraspecific variation in the medicinal plant Isodon rubescens[J]. PLoS One,2022,17(4):e0266546.
[10]孙继峰,韩太利,徐立功,等. 萝卜ICE1密码子使用偏性分析[J]. 核农学报,2018,32(3):477-485.
[11]肖 昉,陈 何,陈家兰,等. 苋菜AtrADH2基因密码子偏好性与进化分析[J]. 分子植物育种,2022,20(9):2821-2830.
[12]惠小涵,程婷婷,柯卫东,等. 莲藕PPO基因密码子偏好性特征分析[J]. 江苏农业学报,2020,36(2):438-446.
[13]闫文涛,张建金,张 婧,等. 生物有机肥用量对日光温室辣椒生长、产量及品质的影响[J]. 中国瓜菜,2022,35(8):86-91.
[14]Barik S,Ponnam N,Reddy A C,et al. Breeding peppers for industrial uses:progress and prospects[J]. Industrial Crops and Products,2022,178:114626.
[15]Chatterjee D,Dutta S K,Kikon Z J,et al. Recycling of agricultural wastes to vermicomposts:characterization and application for clean and quality production of green bell pepper (Capsicum annuum L.)[J]. Journal of Cleaner Production,2021,315(4):128115.
[16]Liu H B,Lu Y Z,Lan B L,et al. Codon usage by chloroplast gene is bias in Hemiptelea davidii[J]. Journal of Genetics,2020,99(1):8.
[17]原晓龙,刘 音,康洪梅,等. 蒜头果叶绿体基因组密码子偏好性分析[J]. 西南林业大学学报(自然科学),2021,41(3):15-22.
[18]Fuglsang A. Impact of bias discrepancy and amino acid usage on estimates of the effective number of codons used in a gene,and a test for selection on codon usage[J]. Gene,2008,410(1):82-88.
[19]Sueoka N. Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses[J]. Journal of Molecular Evolution,2001,53(4):469-476.
[20]Wang B,Yuan J,Liu J,et al. Codon usage bias and determining forces in green plant mitochondrial genomes[J]. Journal of Integrative Plant Biology,2011,53(4):324-334.
[21]Song Y F,Yang Q H,Yi X G,et al. Comparative analysis of Codon usage patterns in chloroplast genomes of cherries[J]. Forests,2022,13(11):1891.
[22]Morton B R,Wright S I. Selective constraints on Codon usage of nuclear genes from Arabidopsis thaliana[J]. Molecular Biology and Evolution,2007,24(1):122-129.
[23]Liu Q P,Xue Q Z. Comparative studies on codon usage pattern of chloroplasts and their host nuclear genes in four plant species[J]. Journal of Genetics,2005,84(1):55-62.
[24]陸奇丰,黄至欢,骆文华. 番茄WRKY转录因子密码子偏性分析[J]. 分子植物育种,2020,18(18):5908-5916.
[25]段淋渊,戴国礼,焦恩宁,等. 枸杞自交不亲和基因S-RNase密码子偏性分析[J]. 西南林业大学学报(自然科学),2020,40(2):44-52.
[26]赵 森,邓力华,陈 芬. 秋茄叶绿体基因组密码子使用偏好性分析[J]. 森林与环境学报,2020,40(5):534-541.
[27]叶 琦,宋炎峰,李 蒙,等. 迎春樱桃叶绿体基因组特征及其密码子使用偏好性分析[J]. 分子植物育种,2022,20(14):4576-4585.
[28]胡晓艳,许艳秋,韩有志,等. 酸枣叶绿体基因组密码子使用偏性分析[J]. 森林与环境学报,2019,39(6):621-628.
[29]喻 凤,韩 明. 紫花苜蓿叶绿体基因组密码子偏好性分析[J]. 广西植物,2021,41(12):2069-2076.
[30]唐玉娟,赵 英,黄国弟,等. 芒果叶绿体基因组密码子使用偏好性分析[J]. 热带作物学报,2021,42(8):2143-2150.
[31]杨祥燕,蔡元保,谭秦亮,等. 菠萝叶绿体基因组密码子偏好性分析[J]. 热带作物学报,2022,43(3):439-446.
[32]耿晓姗,贾 魏,陈佳宁,等. 金花茶叶绿体基因组密码子偏好性分析[J]. 分子植物育种,2022,20(7):2196-2203.
收稿日期:2022-12-22
基金项目:湖南省教育厅科学研究重点项目(编号:20A281);湖南省自然科学基金面上项目(编号:2021JJ30376);湖南省科技特派员服务乡村振兴项目(编号:2022NK4218);湘潭市农业科学研究所横向项目(编号:380220590112)。
作者简介:龚意辉(1988—),男,湖南涟源人,博士,讲师,主要从事园艺作物分子生物学方向研究。E-mail:gyhzgh@163.com。
通信作者:李 鹏,农艺师,主要从事果蔬分子生物学方向研究。E-mail:907653797@qq.com。