忍冬属囊管组植物叶绿体基因组进化分析

2024-05-14 09:08张晶晶郑雪梅王英芳刘海瑞
中草药 2024年9期
关键词:管组密码子叶绿体

张晶晶,袁 庆,魏 瑶,刘 欢,郑雪梅,王英芳,刘海瑞*

忍冬属囊管组植物叶绿体基因组进化分析

张晶晶1,袁 庆1,魏 瑶1,刘 欢1,郑雪梅3,王英芳2,刘海瑞1*

1. 青海大学生态环境工程学院,青海 西宁 810016 2. 三江源生态与高原农牧业国家重点实验室,青海 西宁 810016 3. 青海省国家公园科研监测评估中心,青海 西宁 810000

揭示忍冬属囊管组16种植物叶绿体基因组特征及系统发育关系。以16种囊管组植物为研究材料,利用CodonW、EMBOSS、Excel等软件分析其叶绿体基因组密码子使用偏好性;利用IRscope、mVISTA、DNAsp进行叶绿体基因组比较分析;利用PhyloSuite基于最大似然法及贝叶斯法2种方法构建系统发育树。结果显示ENC值为46.54~47.37,均大于35,密码子偏好性较弱。GCall含量范围为38.92%~39.22%,均小于40%,具有明显的A/U偏好性,且GC1>GC2>GC3,密码子第3位碱基以A/U为主。通过中性绘图、ENC-plot及PR2-plot分析,发现影响密码子使用偏好性的主要因素是自然选择。筛选出最优密码子7个,且密码子第3位均以A/U结尾。16种囊管组植物中均出现1假基因。IR边界保守,差异较小。变异主要集中在非编码区,且单拷贝区域核苷酸多态性大于反向重复区域,存在更多的变异位点。系统发育分析结果显示,红花亚组与紫花亚组内物种系统发育位置与《中国植物志》存在差异。揭示了影响忍冬属囊管组植物密码子偏好性的因素。结合叶绿体基因组比较分析,系统发育分析,有助于进一步理解忍冬属植物的进化和适应机制。

忍冬属;囊管组;叶绿体基因组;密码子偏好性;系统进化

忍冬属L.植物具有药用和观赏价值,属内有《中国药典》2020年版收载的著名中药植物—金银花,可以清热解毒、消炎退肿[1]。囊管组(Sect.)隶属于忍冬属忍冬亚属Chamaecerasus,组下有8个亚组,在我国分布有51种3亚种和7变种,物种多,在属内占比大,且变异明显,全国各省均有分布,在忍冬属内占据着重要的地位[2]。组内有不少入药物种,具有重要的资源利用价值,如蓝果忍冬Linn.富含多种微量元素和人体所需的氨基酸,有较好的医疗保健价值,且果实酸甜可口,被广泛引种栽培用作保健水果[3];唐古特忍冬Maxim.在青海、甘肃、宁夏等地作金银花用,有效成分含量高,适应性强[4]。加强忍冬属植物叶绿体基因组的基础研究对其高效利用具有重要意义。近年来,对忍冬属的研究主要集中于成分开发以及基于叶绿体基因片段的系统发育研究[5-6],然而基于叶绿体全基因组进化特征和遗传多样性的研究较少。同时有关忍冬属密码子偏好性的研究尚不完整,仅何志敏探讨忍冬属木犀草苷关键合成酶基因在进化过程中形成的密码子使用模式,为实现异源高表达提供依据[7]。另外,张加强[8]基于叶绿体全基因组探究金银花大毛花单个物种密码子使用偏好性影响因素。本实验利用生物信息学方法对16种囊管组植物进行分析,所用物种覆盖组内所有亚组,分析更加全面,将为忍冬属植物遗传进化研究提供参考。

叶绿体是植物重要的半自主细胞器,具有独立的遗传系统,可以独立复制,转录和翻译,在次级代谢产物合成和植物发育中起着重要的作用[9]。与核基因组和线粒体基因组相比,叶绿体基因组结构保守,变异率低[10],核苷酸替换率适中、适用于不同阶元的系统进化研究。同时叶绿体中蕴含着丰富的变异位点信息,可以用于揭示物种的起源,是当前研究系统发育的有力工具[11]。

密码子是核酸和蛋白质传递遗传信息的桥梁,在生物遗传变异中有着至关重要的地位。密码子具有简并性,除个别氨基酸外,大多数的氨基酸均由2~6个密码子编码,不止具有单一密码子,由前后相连的3个核苷酸组成,64个密码子共编码20种氨基酸[12]。密码子使用偏好性是对同义密码子编码氨基酸时不同的使用频率进行定义,也是影响外源基因表达量的重要因素。密码子偏好性会受到多种因素的影响,而造成密码子偏倚的主要因素则是自然选择以及基因突变[13],亲缘关系较远的物种偏好性大,且蛋白质表达或者基因功能也存在差异。因此,研究囊管组物种密码子使用偏好性,有助于理解生物与环境适应的机制,为植物品种改良等提供参考[14]。

本研究拟探究囊管组植物的密码子使用偏好性,囊管组植物的叶绿体基因组基本特征及比较分析以及囊管组植物的亲缘关系,以期为后续品种改良以及开发优质种质资源奠定基础。

1 材料

测序对象采自湖北省恩施市芭蕉乡(地理坐标:42°05′N,128°04′E)。经青海大学刘海瑞副教授鉴定为忍冬属蕊帽忍冬Oliv. var.Rehd.,凭证标本存放于青海大学生态环境工程学院。从NCBI数据库(www.ncbi.nlm.nih.gov/ genome)下载其余15种囊管组内已公布的叶绿体基因组数据,包括蕊被忍冬Hemsl.(NC064373)、紫花忍冬(Rupr.) Regel(NC050941)、下江忍冬Rehder(MW801018)、红脉忍冬Maxim.(NC040961)、华北忍冬Maxim.(MN524606)、郁香忍冬Lindl. ex Paxton(NC058578)、早花忍冬Batalin(NC039635)、北京忍冬Franch.(MN524603)、葱皮忍冬Franch.(MW242825)、唐古特忍冬Maxim.(OP388440)、四川忍冬Maxim.(OP388441)、丁香叶忍冬K. S. Hao ex P. S. Hsu(NC064932)、蓝果忍冬Linn.(OP345475)、刚毛忍冬Pall. ex Roem.(MN524605)、冠果忍冬Franch.(NC037954)。外类群选择糯米条R. Br.(NC045043、锦带花(Bunge) A. DC.(MW788539)、鬼吹箫Wall.(NC057000)。

2 方法

2.1 叶绿体基因组测序、组装及注释

用改良的CTAB法从蕊帽忍冬新鲜嫩叶组织中提取DNA[15],测序平台选择Illumina NovaSeq 6000。采用SPAdes进行拼接组装,获得完整叶绿体基因组。利用Geseq和Sequin v15.50对叶绿体基因组进行注释和修正。完成后向NCBI数据库进行提交,获得登录号OR146745。

2.2 叶绿体基因组结构基本特征

用Chloroplot(http://irscope.shinyapps.io/ Chloroplot/)进行基因组图谱的绘制[16]。

2.3 密码子偏好性分析

2.3.1 密码子组成分析 利用16种囊管组物种的叶绿体基因组蛋白质编码序列进行密码子偏好性分析。用CodonW 1.4.2软件,计算RSCU以及ENC值,并使用在线网站EMBOSS(http://emboss.toulouse.inra.fr/cgibin/emboss/cusp),计算不同位置(GC1、GC2、GC3、GC3S、GCall)GC含量17]。

2.3.2 中性绘图分析 同义密码子突变位点为GC3,作为横坐标;非同义密码子突变位点为GC1、GC2,取2个位点的平均值为纵坐标,在Excel中绘制散点图,分析两者之间的相关性[18]。

2.3.3 ENC-plot分析 ENC值能表明密码子偏离随机选择的程度,作为纵坐标;以GC3为横坐标,在Excel中绘制散点图,以公式ENC=2+GC3+29/[GC32+(1−GC3)2]绘制标准曲线[19]。

2.3.4 PR2-plot分析 以G3/(G3+C3)为横坐标;A3/(A3+T3)为纵坐标,绘制散点图,对密码子第3位碱基上的A、T、C、G含量进行分析,避免A/T 和C/G之间突变的不平衡[20]。

2.3.5 同义密码子分析 利用TBtools对整理后的同义密码子数据进行热图绘制[21]。

2.3.6 最优密码子分析 最优密码子由ENC值和RSCU值共同确定[22],筛选出高低表达基因构建表达库,利用CodonW 1.4.2软件计算ΔRSCU值。同时满足RSCU>1和ΔRSCU≥0.08的密码子即为最优密码子[23]。

2.4 叶绿体基因组比较分析

2.4.1 序列差异性分析 以蕊帽忍冬基因组注释文件作参考,Python3.10.1运行脚本对所有物种注释得到gbk文件,用mVISTA(https://genome.lbl.gov/vista/mvista/submit. shtml)进行全序列差异性分析,选择全局比对模式,最小差异设置为0.5,估测序列差异、统计倒位、缺失情况[24]。

2.4.2 边界分析 用IRscope(https://irscope. shinyapps.io/irapp/)对LSC,SSC和IR区域边界进行差异分析,包括边界收缩可视化等[25]。并对边界基因定位,显示边界基因种类及大小差异进行分析,评估叶绿体基因组边界稳定性。

2.5 系统发育分析

基于叶绿体全基因组序列,利用MAFFT对囊管组及其外类群叶绿体基因组进行全序列比对。用PhyloSuite基于最大似然法(maximum likelihood,ML)构建系统发育树(GTR+R,5 000次)[27]。基于贝叶斯法(Bayes)构建BI树(GTR+I+G,10 000 000次)[24]。导入FigTree进行可视化及树形优化。

3 结果与分析

3.1 叶绿体基因组结构特征

蕊帽忍冬叶绿体基因组全长为154 759 bp(图1),呈典型的四分体结构。包含的基因类型与数目与忍冬属内物种基本一致,共有130个基因,其中蛋白编码基因85个,转运RNA(tRNA)基因37个,核糖体RNA(rRNA)基因8个。4类叶绿体基因统计详情见表1。

3.2 密码子偏好性分析

3.2.1 密码子组成分析 由表2可知,囊管组内的物种GCall含量范围为38.92%(四川忍冬)~39.22%(葱皮忍冬),且16种囊管组物种的GCall含量小于40%,说明A/U碱基多于G/C碱基,对A/U结尾的密码子有更高的偏好性。GC含量在不同位置分布不同,GC1>GC2>GC3,密码子第3位碱基以A/U为主。16种囊管组植物叶绿体基因组ENC值整体相差不大,范围为46.54(冠果忍冬)~47.37(唐古特忍冬),均大于35,表明16种囊管组植物的密码子偏好性较弱。

3.2.2 中性绘图分析 中性分析(图2)可用GC12和GC3的相关性来表示密码子使用偏差值的大小,估算自然选择和突变压力对密码子偏好性的影响程度。16种忍冬属植物中性图斜率为0.0748(唐古特忍冬)~0.308(紫花忍冬,丁香叶忍冬),表明突变压力的影响占7.48%~30.80%,选择压力占比为69.20%~92.52%,选择压力与突变压力数值相差很大,表明囊管组植物主要受选择压力影响,突变压力影响较小。

图1 叶绿体基因组图谱

表1 蕊帽忍冬叶绿体基因组基因

*-内含子为1:**-内含子为2:():多拷贝基因,为拷贝数。

*-contains an intron; *-containing two introns; (n): multi copy gene, n is copy number.

表2 16种囊管组植物叶绿体基因组密码子参数特征

3.2.3 ENC-plot分析 ENC-plot是对密码子的ENC和GC3进行关联性分析(图3)。囊管组16种植物的基因分布很接近,大部分基因都与标准曲线有一定的距离,只有小部分基因在标准曲线上,且大多数基因点都位于曲线以下,只有极少数的点位于曲线上方,说明16种囊管组植物主要受到选择压力影响,突变压力影响较小。唐古特忍冬和蓝果忍冬位于曲线上方的点数量多于其他物种,说明突变压力的影响相较于其他同组的物种来说更大。

3.2.4 PR2-plot分析 PR2-plot又被称为偏倚性分析(图4),中心点代表A和T、C和G的使用频率一样,表明密码子使用偏好性完全受基因突变影响,通过判断散点与中心点(A=T,C=G)的矢量距离,来确定偏移的程度和方向。16种囊管组植物坐标点分布相似,不均匀地分布在4个区域内,主要分布在右下角TG区,极少数基因分布在左上角AC区,表明第3位密码子使用频率表现T>A,G>C。进一步说明16种囊管组植物叶绿体基因主要受到自然选择影响。

3.2.5 同义密码子分析 16种囊管组植物叶基因组的RSCU值极为相似,相差较小(图5),一定程度上说明其叶绿体基因组进化较为保守。57个同义密码子中共有的RSCU>1即使用偏好性强的密码子数为29个。RSCU值最高的为编码精氨酸的密码子AGA。密码子RSCU≥2时,有极强偏好性,冠果忍冬的AGA密码子RSCU值为2.07>2,早花忍冬RSCU值为2.00=2,说明这2个物种有极强的偏好性。经统计以A/U结尾的有24个,说明高频密码子偏好使用A/U结尾,因此偏好使用G/C结尾的为负偏倚密码子。

3.2.6 最优密码子分析 根据RSCU值确定最优密码子(表3),16种囊管组植物的最优密码子介于15个(蓝果忍冬)~19个(冠果忍冬、刚毛忍冬和丁香叶忍冬)之间。经筛选共同的最优密码子有7个,分别是CGA(精氨酸)、UGU(半胱氨酸)、CAA(谷酰胺酸)、GGU(甘氨酸)、UUA(亮氨酸)、AAA(赖氨酸)、GUA(亮氨酸),密码子第3位均以A/U结尾,有明显的A/U偏好性。

3.3 叶绿体基因组比较分析

3.3.1 序列差异 本研究以蕊帽忍冬的叶绿体全基因组序列作为参考,对16种囊管组植物的叶绿体基因组进行比对(图6)。结果表明,编码区(Exon)差异较小,其基因组成和排列顺序的相似度都较高;差异主要集中在非编码区(CNS),序列的变异程度也相对较高。差异存在于-、-、--和--4基因间隔区。

图2 16种囊管组植物中性绘图分析

3.3.2 边界分析 叶绿体基因组长度差异较小(分布在154 553~163 413 bp)且序列高度相似(图7)。除北京忍冬和冠果忍冬23基因位于LSC区,距边界99 bp外,其余物种23基因均横跨JLB(LSC/IRb)边界。在IRb区域内,葱皮忍冬,紫花忍冬,丁香叶忍冬以及下江忍冬的H基因距JLB边界286 bp,其余物种I基因距JLB边界74~286 bp。蕊帽忍冬,蕊被忍冬以及下江忍冬的JSB边界在F基因内部,其余物种此基因距JSB(SSC/IRb)边界5~151 bp。四川忍冬较为特殊,15基因位于SSC区内,距JSB边界132 bp,F基因位于位于SSC区内,距JSA(SSC/IRa)边界47 bp。其余15种囊管组物种中,JSA边界附近分布的基因一致,但基因序列长度与距边界的距离稍有不同。JLA(LSC/IRa)边界在H基因内部,其余物种此基因距边界0~459 bp,冠果忍冬和北京忍冬发生了明显的边界收缩。

3.4 系统发育关系

为明确囊管组的系统发育关系,阐述蕊帽忍冬的系统发育位置,本研究选择16个囊管组物种及3个外类群物种基于2种不同的算法构建系统发育树(图9),树形完全一致,BI树后验概率都为1,ML树除单个节点的支持率较低外,其余均大于85,说明基于叶绿体全基因组构建的系统发育树可信度较高。结果显示,囊管组物种聚为一支,属间亲缘关系显示,忍冬属与鬼吹箫的亲缘关系较近,与北极花属以及锦带花属亲缘关系较远。组内亲缘关系显示,同属于紫花亚组的四川忍冬与唐古特忍冬显示并未聚为一支,而四川忍冬与红花亚组的红脉忍冬聚为一支,与唐古特忍冬距离较远。红花亚组除华北忍冬外,其余物种聚为一支,而华北忍冬与郁香亚组的早花忍冬亲缘关系更为相近。蕊帽亚组的蕊帽忍冬与短冠亚组的丁香叶忍冬聚为一支,而与同亚组的蕊被忍冬相距较远。

图3 16种囊管组植物ENC与GC3关联分析

4 讨论

忍冬属植物具有重要的药用价值和资源利用价值,对于金银花有效成分的开发以及选育优质新品种一直是研究的重点,因此对于其遗传信息的研究尤为重要。本研究完成了蕊帽忍冬叶绿体全基因组的测序,组装和注释工作,结合NCBI下载的其余15种囊管组植物的序列进行叶绿体基因组特征,比较分析以及系统发育分析。16种囊管组植物叶绿体基因组高度保守,呈典型的四分体结构,长度为154 553~163 413 bp,同大多数被子植物叶绿体基因组相似[28]。

密码子偏好性分析是一种可以揭示植物进化历史,为提高异源基因表达效率提供参考[29]。密码子的第3位碱基改变并不会影响编码氨基酸的种类,GC3含量高表明由基因突变主导,反之则由自然选择影响,因此GC3含量被作为判定物种进化主导因素的一种指标[31]。本研究GCall含量为38.92%~39.22%,均小于40%,具有明显的A/U偏好性,说明囊管组物种主要受自然选择影响。与线粒体或者核基因相比,叶绿体基因高度保守,其GC含量在不同物种间相差极小,且GC1>GC2>GC3,与本研究结果一致[30]。密码子第3位碱基以A/U为主,与酸枣[32]、巴山松[33]、茄科[34]等双子叶植物研究结论一致[35];而单子叶植物如石斛属[35]、杓兰[36]等也存在类似的现象,说明不同物种间的密码子使用偏好性存在着相似性。另外像烟草[37]此类双子叶植物的核基因,其GC3值则高于GC2值;而玉米[38]此类单子叶植物的核基因组GC3值为69.77%,更倾向于G/C结尾的密码子,与叶绿体基因明显不同。这也证明叶绿体基因组可能是独立于核基因组进化和起源的,保守性更强。有效密码子数(ENC)在20~61,当ENC值低于35时,认为密码子使用偏好性较强且基因表达量较高,反之则表明密码子偏好性较弱即每个氨基酸均匀使用所有的同义密码子[39]。在16种囊管组植物中,ENC值(46.54~47.37)均大于35,说明密码子偏好性较弱。57个同义密码子中RSCU>1即高频密码子为29个,具有明显的A/U偏好性。不同物种同义密码子的使用偏好性存在差异,这是环境与植物在漫长的适应演变中产生的进化结果[40]。自然选择会使植物在对环境的适应中优先编码最优密码子,而基因突变则会产生一部分非偏好性密码子。本研究筛选出7个共同最优密码子,第3位均以A/U结尾,这与王杰敏[41]关于忍冬属叶绿体基因组密码子使用偏好分析的结果一致。且表现形式为NNA或NNU的模式,与油茶[42]等陆地物种最优密码子使用偏好性结果一致。不同物种间密码子使用偏好性相同,也是叶绿体基因组保守性的体现。同时研究还发现,紫花忍冬与下江忍冬共享17个相同的最优密码子,因此两者的亲缘关系较其与同亚组的其余物种,红脉忍冬以及华北忍冬更相近。这也验证了Liu等[43]的结论,遗传距离越小,密码子使用偏好性越相似。

图4 16种囊管组植物偏倚性分析

图5 16种囊管组植物同义密码子分析

表3 16种囊管组植物最优密码子分析

下划线为16个囊管组物种共有的最优密码子。

The underlines represent the optimal codons shared by the 16 Sect.species.

图6 16种囊管组植物cp DNA序列比对

图7 16种囊管组物种叶绿体基因组的LSC、SSC和IR边缘区的比较

图8 16种囊管组物种核苷酸多态性

图9 16种囊管组植物系统进化树

ENC-plot分析、中性绘图分析结果均表明影响16种囊管组植物叶绿体基因组密码子使用偏好性的主要因素为自然选择,而突变压力则影响较小,这与蝴蝶兰[44]、阳春砂[40]等植物的研究结果类似。PR2-plot分析显示第3位密码子使用频率表现T>A,G>C,也可以证明囊管组植物受自然选择影响。这与金银花大毛花[8]、灯盏花[14]等多数植物研究结果一致。但乳油木[45]受到突变压力的影响超过了自然选择;而菠萝[46]选择和突变影响相对均衡,受多种因素影响。推测虽然密码子使用偏好性影响因子在不同物种间存在差异,但都是由突变压力和自然选择共同作用的结果。环境和人为因素都会对自然选择产生影响,使不同的密码子有不同的翻译效率和折叠性,影响蛋白质的功能和表达[30]。例如严寒和干旱会使GC含量高的密码子使用频率增加[47],而杂交、引种驯化等人类活动会改变物种基因流、种群结构和遗传多样性,导致密码子改变[48]。同时密码子偏好性可能通过影响mRNA的稳定性和翻译效率来影响蛋白质的合成速度和量,进而影响植物的形态和生理特性。虽然,目前已有相关研究在探索密码子偏好性在植物基因表达和进化中的作用[49],但这是一个复杂的过程,涉及到多重因素,调控植物形态和生理特性的机制还需要深入研究。

IR区边界的收缩和扩张会造成叶绿体基因组长度差异,影响植物进化[33]。16种囊管组植物IR区差异较小,虽存在部分扩张或收缩情况,但整体边界较为保守且存在1假基因。LSC/IRb边界位置一般为23及H、I基因簇,除北京忍冬和冠果忍冬23距边界99 bp外,其余物种该基因均横跨JLB边界,且进入IRb区的基因长度一致,这与Liu等[50]对于忍冬属7个物种的研究结果一致,进一步验证了叶绿体基因组的保守性。冠果忍冬和北京忍冬H基因在LSC/IRa边界中发生了明显的边界收缩,其余物种该基因均在JLA边界内部。囊管组植物叶绿体基因组全序列比对及核苷酸多态性结果显示,编码区序列更保守,变异主要集中在非编码区,IR区遗传多态性比SC区低,这与大多数被子植物研究结果类似[28]。位于LSC区的LI基因为高变区域,这与全序列比对结果相一致。变异率高的区域被认为是进化分析的潜在分子标记,姚辉等[51]利用高变异基因间隔区序列K-I对18种药用石斛及其混伪品进行成功辨别。本研究筛选出高变区域LI、NF、15N和32L,可作为忍冬属植物DNA条形码的候选片段,结合核基因片段联合分析,将为后续物种鉴定等研究奠定基础。

基于叶绿体全基因组的系统进化关系表明,囊管组内物种聚为一支,且属间亲缘关系表明忍冬属与鬼吹箫属亲缘关系较近,这与Nina基于ITS序列[52]、Nakaji利用5个叶绿体基因组非编码区序列[6]构建的系统发育树结果一致。红花亚组的聚类情况与《中国植物志》囊管组内的亚组划分相悖[45],华北忍冬与早花忍冬亲缘关系更为相近,而与同亚组的下江忍冬、红脉忍冬和紫花忍冬相距较远。蕊帽忍冬与丁香叶忍冬聚为一支,而与同亚组的蕊被忍冬亲缘关系较远,通过全序列比对结果也可以看出丁香叶忍冬与蕊帽忍冬的序列更为相似[53]。但本研究所用物种量较小,部分物种系统发育位置的确定仍有争议,应完善该属物种取样覆盖度,以便从分子层面明确属内植物分类地位,为后续忍冬属植物系统发育,资源鉴定及进化等研究提供参考。

利益冲突 所有作者均声明不存在利益冲突

[1] 中国药典 [S]. 一部. 2020: 26.

[2] Rehder A. Synopsis of the genus[J]., 1903, 1903: 27.

[3] 李建开. 金银花的药用价值与种植技术 [J]. 热带农业工程, 2019, 43(6): 18-19.

[4] 霍俊伟. 蓝果忍冬种质资源叶片酚类物质及抗氧化性研究 [J]. 黑龙江省, 东北农业大学, 2021-02-02.

[5] 刘安成, 毕毅, 尉倩, 等. 中国忍冬属植物育种研究进展 [J]. 北方园艺, 2022(5): 133-139.

[6] Nakaji M, Nobuyuki T, Takashi S. A Molecular phylogenetic study ofL. (Caprifoliaceae) in Japan based on chloroplast DNA sequences [J]. A, 2015, 66(3): 137-151.

[7] 何志敏, 曾子豪, 朱肖霞, 等. 忍冬属黄酮合成酶基因FNSⅡ密码子偏好性及进化分析 [J]. 中国中医药信息杂志, 2022, 29(5): 105-111.

[8] 张加强, 刘慧春, 王杰, 等. 金银花大毛花叶绿体基因组密码子的偏好性分析 [J]. 浙江农业学报, 2023, 35(4): 821-830.

[9] Wicke S, Schneeweiss G M, DePamphilis C W,. The evolution of the plastid chromosome in land plants: Gene content, gene order, gene function [J]., 2011, 76(3/4/5): 273-297.

[10] 燕安, 朱登云. 叶绿体基因组在系统发育学及基因工程领域的应用 [J]. 细胞生物学杂志, 2004, 26(2): 153-156.

[11] 秦政, 郑永杰, 桂丽静, 等. 樟树叶绿体基因组密码子偏好性分析 [J]. 广西植物, 2018, 38(10): 1346-1355.

[12] 代江鹏, 蔡一鸣, 刘巧珍, 等. 甘草属7种植物叶绿体基因组密码子使用偏好性分析 [J]. 中草药, 2023, 54(9): 2907-2916.

[13] Maheswari P, Kunhikannan C, Yasodha R. Chloroplast genome analysis of Angiosperms and phylogenetic relationships among Lamiaceae members with particular reference to teak (L.f) [J]., 2021, 46: 43.

[14] 李显煌, 杨生超, 辛雅萱, 等. 灯盏花叶绿体基因组密码子偏好性分析 [J]. 云南农业大学学报: 自然科学, 2021, 36(3): 384-392.

[15] Jin J J, Yu W B, Yang J B,. GetOrganelle: A fast and versatile toolkit for accurateassembly of organelle genomes [J]., 2020, 21(1): 241.

[16] Zheng S Y, Poczai P, Hyvönen J,. Chloroplot: An online program for the versatile plotting of organelle genomes [J]., 2020, 11: 576124.

[17] 陆奇丰, 骆文华, 黄至欢. 两种梧桐叶绿体基因组密码子使用偏性分析 [J]. 广西植物, 2020, 40(2): 173-183.

[18] Sueoka N. Directional mutation pressure and neutral molecular evolution [J]., 1988, 85(8): 2653-2657.

[19] Wright F. The ‘effective number of codons’ used in a gene [J]., 1990, 87(1): 23-29.

[20] Romero H, Zavala A, Musto H.usage inis the result of strand-specific mutational biases and a complex pattern of selective forces [J]., 2000, 28(10): 2084-2090.

[21] 金刚, 覃旭, 龙凌云, 等. 剑麻叶绿体基因组编码序列密码子的使用特征 [J]. 福建农林大学学报: 自然科学版, 2018, 47(6): 705-710.

[22] Sueoka N. Translation-coupled violation of Parity Rule 2 in human genes is not the cause of heterogeneity of the DNA G+C content of third codon position [J]., 1999, 238(1): 53-58.

[23] Lloyd A T, Sharp P M. Evolution of codon usage patterns: The extent and nature of divergence betweenand[J]., 1992, 20(20): 5289-5295.

[24] Frazer K A, Pachter L, Poliakov A,. VISTA: Computational tools for comparative genomics [J]., 2004, 32(Web Server issue): W273-W279.

[25] 马孟莉, 孟衡玲, 张薇, 等. 阳春砂叶绿体全基因组解析及系统发育研究 [J]. 西北植物学报, 2020, 40(6): 978-986.

[26] Rozas J, Ferrer-Mata A, Sánchez-DelBarrio J C,. DnaSP 6: DNA sequence polymorphism analysis of large data sets [J]., 2017, 34(12): 3299-3302.

[27] 李泳潭, 张军, 黄亚丽, 等. 杜梨叶绿体基因组分析 [J]. 园艺学报, 2020, 47(6): 1021-1032.

[28] 原晓龙, 郝佳波, 王毅, 等. 铁核桃叶绿体基因组密码子偏好性分析 [J]. 分子植物育种, 2020, 18(20): 6671-6677.

[29] 张得芳, 夏涛. 基于转录组的唐古特白刺密码子偏好性分析 [J]. 干旱区资源与环境, 2021, 35(12): 163-170.

[30] Suzuki Y. Statistical methods for detecting natural selection from genomic data [J]., 2010, 85(6): 359-376.

[31] 赵振宁, 孙浩田, 宋雨茹, 等. 山楂属植物叶绿体基因组特征与密码子偏好性分析 [J]. 江苏农业学报, 2023, 39(2): 504-517.

[32] 胡晓艳, 许艳秋, 韩有志, 等. 酸枣叶绿体基因组密码子使用偏性分析 [J]. 森林与环境学报, 2019, 39(6): 621-628.

[33] 徐贝. 巴山松及其近缘种的叶绿体基因组比较分析 [D]. 西安: 西北大学, 2021.

[34] Zhang R Z, Zhang L, Wang W,. Differences inusage bias between photosynthesis-related genes and genetic system-related genes of chloroplast genomes in cultivated and wildspecies [J]., 2018, 19(10): 3142.

[35] 王晓双, 杨芳, 罗茜, 等. 石斛属叶绿体基因组密码子使用偏性及系统发育分析 [J]. 分子植物育种, 2022, 20(23): 7759-7769.

[36] 丁锐, 胡兵, 宗小雁, 等. 杓兰叶绿体基因组密码子偏好性分析 [J]. 林业科学研究, 2021, 34(5): 177-185.

[37] Kawabe A, Miyashita N T. Patterns of codon usage bias in three dicot and four monocot plant species [J]., 2003, 78(5): 343-352.

[38] 赵耀, 刘汉梅, 顾勇, 等. 玉米waxy基因密码子偏好性分析 [J]. 玉米科学, 2008, 16(2): 16-21.

[39] 赵月梅, 杨贵清, 徐其碧, 等. 建始槭叶绿体基因组密码子使用偏性分析 [J]. 福建农林大学学报: 自然科学版, 2022, 51(6): 792-799.

[40] 马孟莉, 孟衡玲, 张薇, 等. 阳春砂叶绿体全基因组解析及系统发育研究 [J]. 西北植物学报, 2020, 40(6): 978-986.

[41] 王杰敏, 马东来, 韩晓伟, 等. 24份忍冬属材料叶绿体基因组密码子使用偏好性分析 [J]. 植物资源与环境学报, 2023, 32(3): 12-23.

[42] 王鹏良, 杨利平, 吴红英, 等. 普通油茶叶绿体基因组密码子偏好性分析 [J]. 广西植物, 2018, 38(2): 135-144.

[43] Liu S X, Xue D Y, Cheng R,. The complete mitogenome of(Lepidoptera: Geometridae: Ennominae) and comparison with that of other lepidopteran insects [J]., 2014, 547(1): 136-144.

[44] 续晨, 贲爱玲, 蔡晓宁. 蝴蝶兰叶绿体基因组密码子使用的相关分析 [J]. 分子植物育种, 2010, 8(5): 945-950.

[45] 原晓龙, 李云琴, 张劲峰, 等. 乳油木叶绿体基因组密码子偏好性分析 [J]. 分子植物育种, 2020, 18(17): 5658-5664.

[46] 高灿, 樊智丰, 马长乐, 等. 菠萝蜜叶绿体基因组密码子偏好性分析 [J]. 福建农林大学学报: 自然科学版, 2023, 52(6): 776-784.

[47] 张伟. 稻田抗五氟磺草胺稗 [crusgalli (L.) beauv]种群扩散机制研究 [D]. 南京: 南京农业大学, 2018.

[48] 程培蕾, 严陶韬, 高静瑶, 等. 古老月季叶绿体基因组密码子分析 [J]. 江苏农业科学, 2023, 51(17): 34-41.

[49] Parvathy S T, Udayasuriyan V, Bhadana V.usage bias [J]., 2022, 49(1): 539-565.

[50] Liu M L, Fan W B, Wang N,. Evolutionary analysis of plastid genomes of sevenL. species: Implications for sequence divergence and phylogenetic relationships [J]., 2018, 19(12): 4039.

[51] 姚辉, 杨培, 周红, 等. 基于叶绿体psbK-psbI序列的石斛属药用植物鉴定 [J]. 药学学报, 2015, 50(6): 783-787.

[52] Theis N, Donoghue M J, Li J H. Phylogenetics of the caprifolieae and(dipsacales) based on nuclear and chloroplast DNA sequences [J].:, 2008, 33(4): 776-783.

[53] 徐述夔, 王汉津. 中国植物志(第72卷) [M] 北京: 科学出版社, 1988: 143-259.

Evolutionary analysis of chloroplast genomes of Sect.() species

ZHANG Jingjing1, YUAN Qing1, WEI Yao1, LIU Huan1, ZHENG Xuemei3, WANG Yingfang2, LIU Hairui1

1. College of Eco-Environmental Engineering, Qinghai University, Xining 810016, China 2. State Key Laboratory of Plateau Ecology and Agriculture, Qinghai University, Xining 810016, China 3. Qinghai National Park Research Monitoring and Evaluation Centre, Xining 810000, China

To explore the characteristic of chloroplast genomes and phylogenic relationship of 16 species of Sect.()The codon usage bias parameters of 16 Sect.plants were analyzed by CodonW, EMBOSS, and Excel. Comparative analysis of chloroplast genome was performed using IRscope, mVISTA and DNAsp. And the phylogenetic tree was constructed by PhyloSuite using maximum likelihood method and Bayesian method.The results showed that the ENC values were 46.54—47.37, all of which were greater than 35, indicating a weak codon bias. The GCallcontent ranged from 38.92% to 39.22%, all values being less than 40%, which revealed a clear A/U bias as well as GC1>GC2>GC3pattern, and the third position of codon tends to use A/U base. Through the analysis of neutrality plot, ENC-plot and PR2-plot, it was determined that natural selection was the primary factor influencing codon usage bias. Seven optimal codons of 16 Sect.plants were screened out, and the third position of the codons all ended with A/U. The1 pseudogenes were found in all 16 Sect.plants. The IR boundaries were conserved, with little difference. The variable regions were mainly in the non-coding regions and the nucleotide polymorphism of the single-copy region was greater than that of the inverted repeat region, and there were more variable sites. The results of phylogenetic analyses showed that the phylogenetic positions of the species within the safflower subgroup and the purple flower subgroup differed from those of.Factors affecting the codon bias of Sect.() were revealed. By combining comparative chloroplast genome analysis and phylogenetic analysis, the study could enhance the understanding about evolutionary and adaptive mechanisms of this genus.

L., Sect.chloroplast genome, codon usage bias, phylogenetic evolution

R286.12

A

0253 - 2670(2024)09 - 3085 - 13

10.7501/j.issn.0253-2670.2024.09.022

2023-12-02

青海省自然科学基金资助项目(2024-ZJ-723);西宁植物多样性资源调查与种质资源圃建设(2023-Z-13);生态环境工程学院研究生三江源一流学科建设科技创新项目(2023-stxy-Y21)

张晶晶,硕士研究生,研究方向为植物系统进化。Tel: 15833929266 E-mail: jiuchangan666@sina.com

通信作者:刘海瑞,硕士生导师,副教授,研究方向为植物分子系统学。Tel: 13709760916 E-mail: lhrbotany@163.com

[责任编辑 时圣明]

猜你喜欢
管组密码子叶绿体
密码子与反密码子的本质与拓展
一种改良盲肠结扎穿刺致大鼠脓毒症模型的方法
10种藏药材ccmFN基因片段密码子偏好性分析
沸腾炉蒸发管组爆管原因分析及措施
置管方式及时间对肾盂输尿管成形术后患儿尿路感染的影响
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
嗜酸热古菌病毒STSV2密码子偏嗜性及其对dUTPase外源表达的影响
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析
聚合反应器内冷管组与壳体的组装