沈宗芳 陆添权 张志荣 蔡传涛 田波
摘要:叶绿体基因组密码子偏好性使用模式往往影响基因表达效率,为促进药用植物叶绿体基因工程的发展,提高槲蕨药用品质,该研究以川滇槲蕨、栎叶槲蕨和槲蕨三个近缘药用植物为材料,使用CodonW、 CUSP 和 SPSS等软件分析其叶绿体基因组编码基因密码子使用偏好性,筛选出三个物种的最优密码子。结果表明:川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组的有效密码子数(ENC)范围分别为40.10~61、40.33~61和40.15~61,其密码子偏好性较弱;ndhE、rpl22、rpl14、rpl20、ccsA、rps4和rpl16编码基因的ENC值差异较大,表明近缘物种中,部分基因的密码子偏好性存在一定差异;三个物种编码基因的ENC频数集中于-0.1~0.1 之间,说明槲蕨属基因密码子偏好性主要受到突变的影响。川滇槲蕨12個最优密码子有6个和栎叶槲蕨相同,分别是UCU、ACU、GCU、CAA、AAA和GAU;栎叶槲蕨10个最优密码子有2个和槲蕨相同,分别是UUA和AUU,而川滇槲蕨与槲蕨无相同的最优密码子。该研究结果可为槲蕨属药用植物基因工程中外源基因的改良及其表达奠定基础。
关键词: 川滇槲蕨, 栎叶槲蕨, 槲蕨, 叶绿体基因组, 密码子偏好性
中图分类号:Q943.2
文献标识码:A
文章编号:10003142(2021)02026608
Abstract:The codon usage patterns of the chloroplast genes were related to the expression efficiency of genes. In order toimprove the development of the chloroplast genetic engineering of medicinal plant and to promote the quality of medicinal plant Drynaria roosii, the optimal codons in chloroplast genome were identified through analyzing the factors shaping of codon bias of D. delavayi, D. quercifolia and D. roosii using CodonW, CUSP and SPSS softwares. The results were as follows: The effective number of codons (ENC) of the chloroplast gene ranged from 40.10 to 61, from 40.33 to 61, and from 40.15 to 61 in D. delavayi, D. quercifolia, and D. roosii, respectively, which suggested the codon bias was weak among the three species; The ENC of gene ndhE, rpl22, rpl14, rpl20, ccsA, rps4 and rpl16 showed significant difference among species, which suggested the codon bias of some genes was various in closely species; The distribution of ENC frequency ratio of most coding gene ranged from -0.1 to 0.1, suggesting the codon usage bias was produced by gene mutation in Drynaria species. In addition, 12 codons were identified as optimal codons in D. delavayi, ten in D. quercifolia, and three in D. roosii. The codons UCU, ACU, GCU, CAA, AAA and GAU were the optimal codons in D. delavayi and D. quercifolia, the codons UUA and AUU were the optimal codons in D. quercifolia and D. roosii, while did not in D. delavayi and D.roosii. Our results will be useful for the codon preference analysis of ferns and the chloroplast genetic engineering of medicinal plant.
Key words: Drynaria delavayi, D. quercifolia, D. roosii, chloroplast genome, codon preference
槲蕨属(Drynaria)共有16个种,主要分布在亚洲至大洋洲,其中9个种分布于我国长江以南各省(区),包括中华槲蕨(D. sinica)、团叶槲蕨(D. bonii)、川滇槲蕨(D. delavayi)、栎叶槲蕨(D. quercifolia)、槲蕨(D. roosii)等 (中国科学院中国植物志编辑委员会,2000)。《中华人民共和国药典》记载,“骨碎补”指槲蕨的干燥根茎,可用于多种疾病的治疗,如肾虚腰痛、耳鸣耳聋、牙齿松动、跌扑闪挫、筋骨折伤、外治斑秃、白癜风等,其活性成分主要是柚皮苷,其含量不得少于0.50%(国家药典委员会,2015)。其他种为“骨碎补”的混伪品,“骨碎补”混伪品中柚皮苷含量较低,槲蕨柚皮苷含量为0.77%,栎叶槲蕨柚皮苷含量为0.11%,而川滇槲蕨柚皮苷含量为0(李顺祥等,2003)。“骨碎补”虽然分布较广,但生长环境特殊、生长速度缓慢、品质差异大,如果野生资源被破坏将很难恢复(黄宝优等,2014)。随着“骨碎补”药材用量不断加大,依靠野生资源和普通种植方式难以满足市场需求。利用叶绿体基因工程作为生物反应器可以合成大量的次生代谢产物,德国研究人员将黄花蒿中合成青蒿酸相关的多个基因转入到烟草叶绿体基因组中, 提高了青蒿素产量(张剑锋等,2015)。利用叶绿体基因工程,通过引入外源基因来调控植物的代谢过程,使代谢途径向着预设的方向变化(温贝贝等,2016),将有助于提高“骨碎补”品质和保护野生植物资源。
外源基因的导入和外源基因的稳定表达是叶绿体基因工程转化体系的2个关键步骤(张剑锋等,2015)。密码子使用模式会影响基因的功能和表达,基因的表达量越大,其密码子偏好性越强(Hershberg et al., 2008; Quax et al., 2015; Zhou et al., 2016)。对密码子偏好性进行分析,有助于提高外源基因的表达和选择更合适的宿主表达系统,提高外源基因在宿主细胞中的表达量(Zelasko et al., 2013; 李丽莎等,2016)。因此,本文从川滇槲蕨、栎叶槲蕨和槲蕨三个近缘药用植物,分析槲蕨属叶绿体基因组编码基因的密码子使用模式及其密码子偏好性影响因素,并筛选出三个物种的最优密码子,為槲蕨属药用植物基因工程中外源基因的改良及其表达研究奠定基础。
1材料与方法
1.1 叶绿体基因组序列
野外采集新鲜的川滇槲蕨、栎叶槲蕨和槲蕨材料,通过Illumina HiSeq XTen测序平台获取三种槲蕨的DNA序列的reads,其覆盖度(coverage)分别为497、304和370。使用SPAdes3.9.0软件进行组装,参数按软件默认设置获得组装结果(Bankevich et al., 2012)。将SPAdes组装得到的contigs比对到参考基因组上,用Geneious 8.0 (Kearse et al., 2012)对contigs碱基的位置进行人工校对。川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组长度分别为151 348、151 536和154 011 bp,通过GeSeq (Tillich et al., 2017)在线注释分别获得87、86和87个CDS,去掉小于300 bp和重复的CDS序列,最终分别保留52、53和52个CDS进行后续分析。川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组序列提交到NCBI Genbank的序列号分别为MK761239、MK761243和MK761233。
1.2 方法
1.2.1 密码子偏好性分析分别对川滇槲蕨、栎叶槲蕨和槲蕨的编码基因进行过滤,去掉小于300 bp和重复的编码基因。使用CodonW 1.4.2和在线软件CUSP(http://imed.med.ucm.es/EMBOSS/)分析川滇槲蕨、栎叶槲蕨和槲蕨过滤后的编码基因,统计同义密码子相对使用度(RSCU, relative synonymous codon usage)、有效密码子数目(ENC, effective number of codon)、总GC含量和密码子第1位、第2位、第3位碱基组成GC含量(分别用GC1、GC2和GC3表示密码子第1位、第2位、第3位碱基组成的GC含量)。
1.2.2 中性绘图以CDS的GC3(第3位碱基GC含量)值为横坐标,GC1(第1位碱基GC含量)和GC2(第2位碱基GC含量)的平均值GC12为纵坐标绘制散点图,分析GC3与GC12的相关性,确定密码子3个位置碱基组成的差异性(Sueoka, 1988)。若GC3与GC12相关性显著,说明碱基的使用模式相同,突变是其主要影响因素;若GC3与GC12相关性不显著,说明密码子第1位、第2位碱基与第3位碱基的使用存在差异,选择压力对密码子使用影响较大。
1.2.3 ENCplot 绘图分析以 GC3 为横坐标,ENC为纵坐标,绘制散点图,并与 ENC期望值(ENC=2+GC3+29/([GC32+ (1-GC3) 2]) 进行比较,分析碱基组成对密码子偏好性的影响(尚明照等,2011)。通过基因散点于标准曲线的位置判断影响密码子偏好性的原因,若基因分布在标准曲线附近,密码子偏好性仅受到突变影响;若基因坐落在标准曲线下方较远的位置,则密码子偏好性受到选择的影响(杨国锋等,2015)。
1.2.4 最优密码子确定同义密码子相对使用度(RSCU)是该密码子的实际观察值与理论观察值的比值(杨国锋等,2015)。当RSCU=1时,密码子无偏好性;当RSCU>1时,密码子使用频率偏高;而RSCU<1时,则说明密码子出现的频率较低。最优密码子(the most preferred codon)的选择,以ENC为偏好性标准,分别对川滇槲蕨、栎叶槲蕨、槲蕨CDS的ENC值进行排序,分别从ENC最高和最低两端选取10%的基因,建立高表达库和低表达库。计算密码子的ΔRSCU值,将ΔRSCU>0.08,且整体 RSCU>1的密码子作为最优密码子(秦政等,2018;石元豹等,2018)。
2结果与分析
2.1 密码子组成分析
通过 CodonW 1.4.2和在线 CUSP 对槲蕨、栎叶槲蕨和川滇槲蕨叶绿体基因组进行分析,结果如表 1 所示。从表1可以看出,川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组A3s(第3位碱基是A)含量分别是36.68%、36.59%和36.11%,T3s(第3位碱基是T)含量分别是37.38%、37.39%和37.39%,说明三种槲蕨的第3位碱基主要以A/T为主。川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组GC含量分别为42%、41.8%和42.2%,GC3含量分别为40.53%、40.97%和41.12%,三种槲蕨的GC含量相近。川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组ENC值分别是57.82、58.03和57.96。
川滇槲蕨、栎叶槲蕨和槲蕨的编码基因密码的相关参数值用热图统计,每一行代表1个基因,基因名位于图右侧,图中的值表示该基因相应参数(列名)值的大小,其结果如图1所示。从图1可以看出,三种槲蕨不同位置碱基GC含量不同,大部分基因的GC1含量高于GC2和GC3;川滇槲蕨(40.101~61)、栎叶槲蕨(40.329~61)和槲蕨(40.148~61)的ENC值都大于40。ndhE、rpl22、rpl14、rpl20、ccsA、rps4和rpl16等基因的ENC值在三个物种的极差大于5,同一个基因在近缘物种的密码子偏好性有较大差异。由于rps12在川滇槲蕨和槲蕨两个种编码基因长度不到300 bp,故不对其进行分析。
编码基因GC1、GC2、GC3、GC和ENC及相关性分析结果见图2。从图2可以看出,川滇槲蕨的GC1、GC2、GC3与GC均极显著相关,且ENC与GC显著相关,GC1与GC3,GC2与GC3相关性不显著,其编码基因的3位碱基组成不相似。栎叶槲蕨、槲蕨的GC1与GC3显著负相关,相关性系数分别为-0.3和-0.27;GC3与ENC相关性极显著。三种槲蕨编码基因密码子第3位碱基组成对密码子偏好性影响较大。
2.2 中性绘图分析
中性绘图分析结果如图3所示,GC12和GC3的分布范围都较为分散,川滇槲蕨GC12的范围在0.282 2~0.538 1之间,GC3在0.330 2~0.542 0之间;栎叶槲蕨GC12的范围在0.288 4~0.536 9之间,GC3在0.331 8~0.542 0之间;槲蕨GC12的范围在0.264 0~0.535 5之间,GC3在0.321 1~0.538 1之间。川滇槲蕨、栎叶槲蕨、槲蕨的Pearson 相关系数分别为-0.224、-0.259和-0.24,双尾检验结果不显著(P>0.05),说明GC12和GC3相关性不显著;基因分布范围分散,部分基因的GC3大于GC12,说明该部分基因密码子的偏好性受突变的影响较大。
2.3 ENCplot绘图分析
由图4可知,川滇槲蕨、栎叶槲蕨、槲蕨编码基因大多分布在标准曲线两侧,ENC值与ENC期望值 [ENCexp=2+GC3s+29/(GC3s2+(1-GC3s)2]较为接近。川滇槲蕨的ndhC和psbA、栎叶槲蕨的ndhE、ndhC和psbA、槲蕨的ndhC和psbA 基因离标准曲线较远,且ENC值较小,密码子偏好性較强, 主要受到选择压力的影响。根据ENC比值 [(ENC期望-ENC实际)/ENC期望]统计基因ENC的分布频数(表2),大部分基因的ENC频数集中于-0.1~0.1 之间,进一步表明大部分基因的ENC值与ENC期望值差异较小,突变对编码基因密码子偏好性影响较大。
2.4 最优密码子确定
对三种槲蕨叶绿体基因组编码基因的ENC值进行排序后,先从两端各选取10%的基因建立高、低表达基因库,然后计算两个表达库中密码子的RSCU值和两个库中的ΔRSCU值(ΔRSCU=RSCU高表达-RSCU低表达),以ΔRSCU>0.08 为标准筛选高表达密码子,以高表达密码子和高频密码子(RSCU>1)共有的密码子作为最优密码子,结果如图5所示。从图5可以看出,川滇槲蕨24个高表达密码子,其中8个以A结尾,6个以C结尾,两个以G结尾,8个以U结尾,最优密码子有12个,分别是UUG、UCU、CCU、ACU、GCU、GCA、CAA、AAA、GAU、GAA、UGU和GGU;栎叶槲蕨28个高表达密码子,其中8个以A结尾,6个以C结尾,一个以G结尾,13个以U结尾,最优密码子有10个,分别是UUA、CAA、AAA、AUU、GUU、UCU、ACU、GCU、UAU、AAU、GAU;槲蕨23个高表达密码子,其中4个以A结尾,10个以C结尾,9个以U结尾,最优密码子只有3个,分别是UUA、UGC、AUU。川滇槲蕨和栎叶槲蕨有6个相同的最优密码子,栎叶槲蕨和槲蕨有2个相同的最优密码子,而川滇槲蕨与槲蕨并无相同的最优密码子。
3讨论与结论
川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组ENC值分别是57.82、58.03和57.96,其叶绿体基因组编码基因的ENC值都大于40。密码子偏好性判定标准,以ENC值低于35的为强偏好性密码子,高于35的为弱偏好性密码子(Jiang et al., 2008)。这说明川滇槲蕨、栎叶槲蕨和槲蕨叶绿体基因组的密码子偏好性较弱。
自然选择和突变是影响密码子使用偏好性的重要因素(Sharp et al., 2011; 石元豹等,2018),ENC值与期望ENC值差异越小,说明突变对密码RSCU. 同义密码子相对使用度。H. 高表达; L. 低表达。
子偏好性影响越大,ENC值与期望ENC值差异越大,选择对密码子偏好性的影响越大(秦政等,2018)。ENC频数位于-0.1~0.1 之间的编码基因在川滇槲蕨有96%、栎叶槲蕨有94%、槲蕨有96%,说明槲蕨属基因密码子偏好性主要受到突变的影响;三个近缘物种编码基因密码子偏好性主要受到突变影响的比例较为一致,说明自然选择和突变两个主要因素对密码子偏好性影响作用的强弱在近缘物种较一致,可能与物种的遗传进化有关。
密码子使用模式会影响基因的表达,基因的表达量越大,其密码子偏好性越强 (Hershberg et al., 2008; Quax et al., 2015; Zhou et al., 2016)。通过对三种槲蕨密码子的偏好性进行分析,发现ndhE、rpl22、rpl14、rpl20、ccsA、rps4和rpl16等基因的ENC值差异较大,说明近缘物种中同一个基因的密码子偏好性也有一定差异,与柚皮苷代谢相关的基因可能也会受到密码子偏好性的影响而造成基因表达的不同,可能是槲蕨属不同种植物柚皮苷含量不同的原因之一。
参考文献:
BANKEVICH A, NURK S, ANTIPOV D, et al., 2012. SPAdes: A new genome assembly algorithm and its applications to singlecell sequencing[J]. J Comp Biol, 19(5): 455-477.
Chinese Pharmacopoeia Commission, 2015. Pharmacopoeia of the Peoples Republic of China (Part I) [M]. Beijing: China Medical Science Press, 2015: 256.[国家药典委员会, 2015. 中华人民共和国药典(一部)[M]. 北京: 中国医药科技出版社: 256.]
Editorial Committee of Flora Reipublicae Popularis Sinicae, Chinese Academy of Science, 2000. Flora Reipublicae Popularis Sinicae[M]. Beijing: Science Press, 6(2): 227.[中国科学院中国植物志编辑委员会, 2000. 中国植物志 [M]. 北京: 科学出版社, 6(2): 227.]
HERSHBERG R, PETROV DA, 2008. Selection on codon bias[J]. Ann Rev Genet, 42:287-299.
HUANG BY, HUANG XY, PENG YD, et al.,2014. Germplasm resources of Davallia mariesii Moore ex Bak. in Guangxi Province[J]. Hubei Agric Sci, 53(16):3832-3834. [黄宝优, 黄雪彦, 彭玉德, 等,2014. 广西骨碎补种质资源调查研究 [J]. 湖北农业科学, 53(16):3832-3834.]
JIANG Y, DENG F, WANG HL, et al., 2008. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Arch Virol, 153(12): 2273-2282.
KEARSE M, MOIR R, WILSON A, et al., 2012. Geneious basic: An integrated and extendable desktop software platform for the organization and analysis of sequence data[J]. Bioinformatics, 28(12): 1647-1649.
LI LS, LI XL, ZHOU RY, et al., 2016. Analysis of codon bias of TYRP gene in Capra hircus[J]. Guizhou Agric Sci, 44(3):113-119. [李麗莎, 李祥龙, 周荣艳, 等, 2016. 山羊酪氨酸相关蛋白1(TYRP1)基因密码子偏好性分析 [J]. 贵州农业科学, 44(3):113-119.]
LI SX, ZHANG ZG, LONG M, 2003. Detemrination of naring in gusuibu (Rhizoma Drynariae) from different places[J]. Cent S Pharm, 2:103-104. [李顺祥, 张志光, 龙勉, 2003. 不同产地骨碎补的柚皮苷含量考察 [J].中南药学, 2:103-104.]
NOBORU S, 1988. Directional mutation pressure and neutral molecular evolution[J]. Proceed Natl Acad Sci USA, 85(8): 2653-2657.
QIN Z, ZHENG YJ, GUI LJ, et al., 2018. Codon usage bias analysis of chloroplast genome of camphora tree (Cinnamomum camphora)[J]. Guihaia,38(10): 1346-1355. [秦政, 郑永杰, 桂丽静, 等, 2018. 樟树叶绿体基因组密码子偏好性分析 [J]. 广西植物, 38(10):1346-1355.]
QUAX TE, CLAASSENS NJ, SOELL D, et al., 2015. Codon bias as a means to finetune gene expression[J]. Mol Cell, 59 (2); 149-161.
SHANG MZ, LIU F, HUA JP, et al., 2011. Analysis on codon usage of chloroplast genome of Gossypium hirsutum[J]. Sci Agric Sin, 44(2 ):245-253. [尚明照, 刘方, 华金平, 等, 2011. 陆地棉叶绿体基因组密码子使用偏好性的分析[J]. 中国农业科学, 44(2):245-253.]
SHARP PM, EMERY LR, ZENG K, 2010. Forces that influence the evolution of codon bias[J]. Phil Trans R Soc B, 365(1544): 1203-1212.
SHI YB, WANG GB, YANG XM, et al., 2019. Analysis of codon usage bias of WRKY transcription factors in Ginkgo biloba[J]. Mol Plant Breed, 17(5):1503-1511. [石元豹, 汪贵斌, 杨晓明, 等, 2019. 银杏WRKY家族基因密码子使用偏向性分析 [J]. 分子植物育种, 17(5):1503-1511.]
SONG ZB, LI WZ, GAO YL, et al., 2016. Suppression of tobacco FLS genes expression and its effect on flavonoid metabolism[J]. Genom Appl Biol, 35(12):3501-3506. [宋中邦, 李文正, 高玉龙, 等, 2016. 烟草FLS基因表达抑制对类黄酮代谢的影响 [J]. 基因组学与应用生物学, 35(12):3501-3506.]
TILLICH M, LEHWARK P, PELLIZZER T, et al., 2017. GeSeqversatile and accurate annotation of organelle genomes[J]. Nucl Acids Res, 45: 6-11.
WEN BB, SU H, LI MF, et al., 2016. Development of chloroplast gene engineering[J]. Chin Hortic Abstr, 32(6):16-18. [温贝贝, 苏会, 李美凤, 等, 2016. 叶绿体基因工程发展现状 [J]. 中国园艺文摘, 32(6):16-18.]
YANG GF, SU KL, ZHAO YR, et al., 2015. Analysis of condon usage in the chloroplast genome of Medicago truncatula [J]. Atca Pratac Sin, 24(12):171-179.[杨国锋, 苏昆龙, 赵怡然, 等, 2015. 蒺藜苜蓿叶绿体密码子偏好性分析 [J]. 草业学报, 24(12): 171-179.]
ZELASKO S, PALARIA A, DAS A, 2013. Optimizations to achieve high-level expression of cytochrome P450 proteins using Escherichia coli expression systems[J]. Protein Express Purif, 92 (1): 77-87.
ZHANG JF, LI Y, JIN JJ, et al., 2017. Recent advances in tobacco chloroplast genetic engineering[J]. Tobacco Sci Technol: 6. [张剑锋, 李阳, 金静静, 等, 2017. 烟草叶绿体基因工程研究进展 [J]. 烟草科技: 6.]
ZHOU ZP, DANG YK, ZHOU M, et al., 2016. Codon usage is an important determinant of gene expression levels largely through its effects on transcription[J]. Proc Natl Acad Sci USA, 26:e6117-e6125.
(責任编辑何永艳)