黑果枸杞叶绿体基因组特征分析

2024-11-02 00:00:00柳迪杜雨李效雄马瑞刘筠马彦军
西北农业学报 2024年10期

摘 要 为揭示黑果枸杞叶绿体基因组(cpDNA)特征及系统发育规律,采用二代测序技术对黑果枸杞叶绿体进行测序,并分析其基因组特征。结果表明:黑果枸杞cpDNA全长154 979 bp,其中包括1个大单拷贝区LSC,长度为85 984 bp,1个小单拷贝区SSC,长18 205 bp和2个反向互补重复区(IRs,25 395 bp)。共注释到125个基因,其中,81个蛋白编码基因(CDS),36个tRNA基因,8个rRNA基因。共检测到60个核苷酸重复序列,有5种核苷酸类型,其中单核苷酸重复最多,为38个,占总体数的63.33%,基因序列为A/T。密码子偏好性研究显示,黑果枸杞cpDNA偏好G或C碱基,其中编码亮氨酸(Leu)的密码子最多,为2 154个,占总数的10.57%;编码半胱氨酸(Cys)的密码子最少,为219个。多态性分析结果显示,IR区域表现出最高的保守性,而高变区在SSC区;SSR位点在叶绿体基因组中分布不均,多态性较高。系统发育结果表明,宁夏枸杞和中国枸杞聚为一类,与黑果枸杞、非洲枸杞汇聚在一起形成姐妹分支,四者之间的遗传关系较近。

关键词 黑果枸杞;叶绿体基因组;SSR;密码子;系统发育分析

黑果枸杞(Lycium ruthenicum Murr)为茄科(Solanaceae)枸杞属(Lycium),是一种多年生灌木,主要分布在中国西北荒漠地区,在中亚和欧洲等地也有分布,具有极高的药用和食用价值[1-2]。黑果枸杞花色苷含量的测定原理主要通过其光学特性,目前常用的测定方法包括:色阶法、消光系数法和pH示差法等[3]。阿力同·其米克等[4]通过ISSR分子标记法及DNA分析法研究黑果枸杞的遗传多样性,从60个引物中筛选出7个有效引物,结果显示,黑果枸杞在物种水平的遗传多样性较高。Yun等[5]通过物理和酶的方法从黑果枸杞中提取多糖,发现表面枸杞多糖的结构与分离纯化方法及其生长环境有关。Sina等[6]使用ImageJ程序测定不同基因型的枸杞叶片特征,研究表明,在同一物种的不同基因型之间,枸杞叶片的大小和形状存在明显差异。

随着分子测序技术的迅速发展,植物系统发育研究从比较生理学和形态学开始向分子研究转变[7]。叶绿体基因组具有相对分子量小、结构简单且高度保守的特点,因此广泛应用于分子系统发育研究[8]。安明珠等[9]在基于叶绿体基因,筛选鸭茅(Dactylis glomerata L .)叶绿体引物的研究中,从搜集的35对叶绿体引物中成功筛选出7对作为目的引物,为鸭茅的系统发育分析提供了依据。Yin等[10]通过采用Illumina高通量测序技术对野茄子(Solanum coagulans Forsk .)叶绿体基因组测序研究显示,整个叶绿体基因组共注释了128个编码基因,包括83个蛋白编码基因、37个转移RNA基因和17个核糖体RNA基因;完整叶绿体基因组的长度为155 771 bp,其GC含量为37.76%。毛桂莲等[11]通过钙离子和过氧化氢对NaCl胁迫下枸杞叶片叶绿体功能的影响研究显示,对氯化钠胁迫的枸杞造成的伤害,外源Ca2+和H2O2具有一定缓解作用。Cui 等[12]对宁夏枸杞(L.barbarum)、中国枸杞 (L.chinense Mill)的叶绿体全基因组测序和分析,两种枸杞叶绿体均注释到133个基因,基因组全长分别为155 656 bp、155 745 bp,揭示了宁夏枸杞与中国枸杞的亲缘关系。目前,有关黑果枸杞叶绿体的基因组研究较少,本研究以黑果枸杞叶片为材料,采用二代测序技术获得黑果枸杞叶绿体全基因组序列,利用生物信息学相关软件,分析其叶绿体基因组构成和特征,不仅丰富了黑果枸杞的遗传信息,也为后续黑果枸杞的遗传多样性、种群历史动态和枸杞亲缘关系等发展研究奠定了基础。

1 材料与方法

1.1 试验材料

2017年采集民勤(地理坐标为39°01′N, 103°36′E,海拔1 309 m)1 a生野生黑果枸杞枝条,带回学校,进行扦插育苗,2018年4月将扦插苗移栽到甘肃农业大学校内实习基地(地理坐标:38°28′N,106°16′E)。2022年7月,从长势基本一致的不同黑果枸杞植株上随机摘取成熟健康的叶片,冲洗干净后,用液氮速冻处理,然后放于 -80 ℃超低温冰箱中保存,备用。

1.2 叶绿体DNA提取和检测

依据DNA提取试剂盒[生工生物工程(上海)股份有限公司,型号:B518731-0050]的提取步骤,将备用叶片放入研钵中充分研磨后提取黑果枸杞的cpDNA。经过除杂后,将检测合格的 cpDNA进行纯化、末端修复等过程,然后开始建立文库,并且通过Illumina高通量测序获得高质量数据(Clean Data)。

1.3 叶绿体全基因组序列拼接、组装与注释

使用SPAdes、GapFiller和PrInSeS-G软件对基因组拼接、检查与组装,从而获得完整叶绿体基因组。基于反向blast、参考基因组或内建数据库进行比对,优化并提取拼接结果,注释其CDS、tRNA、rRNA等基因元件。ARAGORN v1.2.38的tRNA注释与blast结果进行矫正,最终汇总整理为完整的注释结果。注释完成后,提交到NCBI数据库(https://www.ncbi.nlm.nih.gov/genbank/),利用OGDRAW软件绘制黑果枸杞叶绿体基因组完整图谱。

1.4 叶绿体基因组比较和系统发育分析

利用MISA软件(https://webblast.ipk-gatersleben.de/misa/index.php)对枸杞的微卫星序列(SSR)进行分析和检测。根据分布模式将黑果枸杞叶绿体基因组重复序列分为散在重复序列和串联重复序列,使用在线软件REPuter(https://bibiserv.cebitec.uni-bielefeld.de/reputer)分析枸杞叶绿体基因组的重复序列。利用CodonW1.4.2软件对黑果枸杞叶绿体基因组密码子偏好性(RSCU,relative synonymous codon usage)进行分析和统计。利用DnaSP软件对黑果枸杞的叶绿体核苷酸多态性指数(nucleotide diversity,Pi)进行计算与分析。利用IRscope软件(https://irscope.shinyapps.io/irapp/)绘制黑果枸杞、红果枸杞、黄果枸杞、白果枸杞、烟草和拟南芥的叶绿体基因组边界对比图,比较枸杞种间与其他物种间的基因大小和分布差异。为探究黑果枸杞的系统进化关系,利用muscle软件对22个叶绿体全基因组序列进行多重序列比对,使用raxml软件和最大似然法(ML)构建系统发育树。

2 结果与分析

2.1 叶绿体基因组结构与特征

将已测得的黑果枸杞叶绿体基因序列上传到NCBI,从中获取黑果枸杞叶绿体的基因序列号为OP846043。由表1可知,黑果枸杞叶绿体基因组的总长度为154 979 bp,GC含量为37.9%。黑果枸杞叶绿体基因组结构与大多数被子植物相同,呈四段式结构,由IRA、IRB、LSC和SSC组成,且4个区的长度存在差异,LSC区最长,SSC区最短;其中,LSC结构区长度为85 984 bp,SSC结构区长度为18 205 bp,2个反向互补重复区IR长度相等,总长为50 790 bp。

由图1可知,黑果枸杞叶绿体基因组中共检测到125个基因,其中,注释有81个蛋白编码基因(protein-coding genes,CDS),36个tRNA基因,8个rRNA基因。其中有17个基因在IR区重复,包含6个蛋白质编码基因( rpl2、 rpl23、ndhB、 rps12、 rps7、 ycf2),4个rRNA基因( rrn16、 rrn23、 rrn4.5、 rrn5),7个tRNA基因(trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC);SSC区包含11个蛋白质编码基因,1个tRNA基因;LSC区包含62个蛋白质编码基因,21个tRNA基因。

如表2所示,叶绿体基因主要包括光合作用和自我翻译功能,依据基因功能可划分为光合系统基因,遗传系统基因,其他基因和未知功能基因。其中ndhA、petB、atpF、trnG-UCC等12个基因含有1个内含子,clpP和 ycf3则含有2个内含子,而内含子比外显子更容易在进化中丧失功能。与核糖体RNA的合成有关的4个基因都位于IR区,且存在2个拷贝。此外,有12个基因存在2个拷贝,分别为: rpl2, rpl23,trnI-CAU,trnI-GAU,trnA-UGC,trnR-ACG,trnL-CAA,trnV-GAC, ycf2、ndhB、trnN-GUU、 rps7。

2.2 叶绿体基因组重复序列分析

黑果枸杞叶绿体基因组的简单重复序列(SSR)分析结果如表3和表4所示:黑果枸杞的核苷酸重复序列有60个,在5种核苷酸类型中,单核苷酸重复最多,为38个,占总体数的 63.33%,基因序列为A/T;其次是二核苷酸和四核苷酸序列,均为9个,各占总数的15%,其中,二核苷酸重复包含AT/TA基因序列,四核苷酸重复包含TTCT/TTTG、AAAT/TATT、TTAT/TTTA、CAAA/AAAC和CTAT/ATCA 4种基因序列类型;三核苷酸重复数为3个,占总体数的5%,重复包含AAG/TTA基因序列;五核苷酸重复数是1个,占总体数的1.70%,包含AATTG基因序列。

散在重复序列主要包括4种类型:正向重复(forward,F)、回文重复(palindrome,P)、反向重复(reverse,R)和互补重复(complement,C)。如图2所示,黑果枸杞叶绿体的散在重复序列包含回文序列(palindromic)和正向重复序列(forward)2种,共40条,其中有22条回文序列和18条正向重复序列;对黑果枸杞的重复序列分析显示大多数重复序列分布在基因间隔区或内含子区域,且绝大多数序列的长度为30~50 bp。

2.3 叶绿体基因组密码子偏好性分析

对黑果枸杞叶绿体密码子分析结果如表5所示,检测到所有密码子的出现次数为20 370(终止子除外),其中编码亮氨酸(Leu)的密码子为UUA、UUG、CUU、CUC、CUA、CUG,出现次数为2 154,占总数的10.57%;编码半胱氨酸(Cys)的密码子为UGU、UGC,出现次数最少,为219,占总数的1.08%。相对同义密码子相对使用度的值大于1时,说明密码子在蛋白质编码的使用上具有偏好性。使用度最高的是UUA,为 1.90,使用度最低的是AGC,为0.35;有31个密码子的RSCU值大于1,其中,有28个密码子的碱基构成以A或U结尾,3个密码子的碱基构成以G或C结尾。

叶绿体蛋白质编码基因的RSCU值的大小是衡量密码子偏好性的标准。如图3所示,黑果枸杞叶绿体蛋白编码基因主要偏好以A、T结尾的密码子,且T的使用率大于A。以亮氨酸(Leu)和丝氨酸(Ser)为例,编码Leu的密码子共有6个(TTA、TTG、CTT、CTC、CTA、CTG),其中TTA的RSCU值最大,为1.9,CTC和CTG的RSCU值最小,分别为0.41和0.40,说明黑果枸杞叶绿体在编码Leu时偏好使用密码子TTA,而尽量避开CTC和CTG两个密码子;编码Ser的密码子也有6个(TCT、TCC、TCA、TCG、AGT、AGC),但测序结果显示主要使用TCT、TCA、AGT(RSCU值均大于1),尤其是TCT的使用率最高,而AGC的使用率最低,为0.35。

2.4 叶绿体基因组的核苷酸序列多态性分析

对黑果枸杞叶绿体基因组序列进行多态性分析,结果如图4所示,用核苷酸变异性(Pi)表示,在黑果枸杞叶绿体基因组的4个典型区域中,IR区域表现出最高的保守性,而高变区在SSC区;黑果枸杞叶绿体CDS中突变率最高的5个基因分别为 ycf1、ndhE、ccsA、trnL-UAG和ndhF,Pi值依次为0.103 31、0.102 55、0.111 31、0.111 49和0.111 75,这些区域可能包含关于叶绿体基因组中进化速率较快的位点信息。

2.5 叶绿体基因组IR区边界分析

为探究叶绿体基因组的IR区与LSC、SSC区之间连接区域的详细信息,对模式植物拟南芥(MT955897.1)、烟草(NC_035952.1)和4种枸杞属植物的叶绿体进组进行分析。结果如图5所示,6个叶绿体基因组中IR区域的长度范围为 25 384~25 451 bp,显示出适度的扩张。在这6个物种的叶绿体基因组中,除烟草的LSC区明显扩张外,其他物种的IRb/LSC的连接区域均处于 rps19基因的编码区,导致了3′端基因的重复,而这种重复在IRb/LSC的连接区域产生了长度不等(48~61 bp)的 rps19假基因;此外,4种枸杞属植物的IRb/SSC边界和2种模式植物的IRa/SSC边界均存在于 ycf1基因的编码区,烟草和拟南芥在IRb/SSC边界产生的 ycf1假基因长度均为995 bp,4种枸杞属植物在IRa/SSC边界产生的 ycf1假基因长度不等(995~998 bp)。在这些叶绿体基因组中, rpl2基因长度为1 491 bp,分别位于IRb区域靠近IRb/LSC边界71~132 bp和IRa区域靠近IRa/LSC边界 70~132 bp的位置;trnN基因分别位于IRb区域靠近IRb/SSC边界和IRa区域靠近IRa/SSC边界72 bp(拟南芥为73 bp)的位置;trnH基因仅存在于LSC区,距离IRa/LSC边界11~26 bp;ndhF基因只存在于SSC区域,拟南芥和烟草靠近IRb/SSC边界的距离分别为52 bp、44 bp,其他4种枸杞属植物则距离IRa/SSC边界52 bp(红果枸杞为42 bp)。[JP]

2.6 叶绿体基因组的系统进化分析

为了确定黑果枸杞的系统进化发育关系,本研究将黑果枸杞与茄科以及2个外类物种等共21个cpDNA序列构建ML系统发育树。发育树如图6所示,21个物种可分为2类,第1类是外类群组,碱草(Cressa cretica)和圆叶牵牛(Ipomoea purpurea)聚为1类,第2类由19个茄科物种组成;第2类群又可分为2个小类群,其中烟草(Nicotiana attenuata)自为1类,其余的茄科植物为一类。宁夏枸杞(Lycium barbarum)与中国枸杞(Lycium chinense)聚为一类,与黑果枸杞 (Lycium ruthenicum)、非洲枸杞(Lycium ferocissimum)汇聚在一起形成姐妹分支,支持率较高。枸杞属植物与天仙子(Hyoscyamus niger)、马尿脬(Przewalskia tangutica)和颠茄(Atropa belladonna)汇聚成的姐妹分支聚为一个大分支,说明枸杞属植物与这3个属的植物遗传关系 较近。

3 讨 论

目前,因基因组测序技术的广泛运用和叶绿体基因组的深入研究,使其数据库迅速扩大,从而为探究分子进化的过程提供了基础,与枸杞核基因组相比,叶绿体基因组更具有显著的优势,因此,本试验对黑果枸杞叶绿体的全基因组序列进行研究。试验测得黑果枸杞的cpDNA全长为154 979 bp,LSC长度为85 984 bp,SSC为 18 205 bp,IR为25 395 bp,与已报道的高等植物的叶绿体基因组数据相符[13]。有关枸杞属叶绿体基因组测序研究的报道较少,目前只有2种枸杞属植物被报道,分别为中国枸杞[14] 、宁夏枸杞 [15]。比较这3种枸杞叶绿体基因组的组成和特征发现,宁夏枸杞和中国枸杞叶绿体基因组总GC含量为37.8%;黑果枸杞叶绿体基因组GC含量为37.9%,而GC的含量可反应叶绿体基因组组成特征,在同属内枸杞的叶绿体基因组的进化速度慢,表现出的保守性较高。不同植物叶绿体的tRNA基因数目存在较大差异,如砂仁[16](Amomum villosum Lour.)叶绿体基因组中注释113个基因,包括79个蛋白编码基因,30个tRNA个基因和4个rRNA基因;山楂[16](Crataegus pinnatifida Bunge.)注释到112个基因,包括78个蛋白编码基因、30个tRNA基因和4个rRNA基因。对测得的黑果枸杞叶绿体基因组进行基本功能注释,共注释到125个基因,检测到81个蛋白编码基因,36个tRNA基因,8个rRNA基因,而出现这种差异的原因是不同植物之间叶绿体基因本就存在较大差异。黑果枸杞的编码基因主要分布在LSC区,大多数基因只含有1个内含子,这与其他植物研究结果一致[17]。SSR序列常见于动物和植物中,由于DNA在进行复制时 ,碱基容易发生错位,因此使得SSR序列具有丰富的多态性,为生物的进化和系统进化提供依据[18]。枸杞的散在重复序列主要有回文序列(Palindromic)和正向重复序列(Forward)2种类型[14],在39~48之间,并且回文序列的重复次数较多,黑果枸杞叶绿体基因组含22条回文序列和18条正向重复序列。在黑果枸杞的叶绿体基因组中,检测出60个SSR序列,共有5种类型(除了这5种重复序列外,其他所有重复序列都位于相同的基因或基因间区域),其中大多数为单核苷酸重复序列,没有检测到六核苷酸序列,且主要由多聚腺苷酸(polyA)和多聚胸腺嘧啶(polyT)重复序列组成[19]。本研究中的重复序列差异,有助于枸杞植物的探索和利用。黑果枸杞SSR位点在叶绿体基因组中分布不均,多态性较高,为人们研究枸杞叶绿体基因组片段的进化,以及SSR分子标记技术的开发提供理论依据。

密码子的偏好性是由基因突变和物种进化等多种因素作用下形成的[20]。在植物基因中,不论在同一物种还是不同物种之间,不同密码子的出现频率有明显差异。RSCU值是衡量密码子偏好性的一个重要参数,RSCU值越大,则表示该密码子在基因表达中的使用频率越高,反之则越低;当RSCU 值等于1时,认为该密码子的使用情况仅受基因突变的影响[21]。本研究中黑果枸杞叶绿体基因组有31个密码子的RSCU值大于1,说明这31个密码子在蛋白质基因编码上具有偏好性,其中以A或U结尾的密码子占90.32%,这与番茄等植物的研究结果一致[22];而在山楂属[23]的叶绿体基因组中,最优密码子的数目为17~20个,两者之间的差异可能与植物种类以及选入的基因数量有关。比较密码子使用频率之间的差异,在黑果枸杞中亮氨酸(Leu)、精氨酸(Arg)、丝氨酸(Ser)RSCU同义密码子使用度最大,由此推测,黑果枸杞中这3种氨基酸的含量可能较高。普遍认为IR区是叶绿体基因组中最保守的部位,而形成植物叶绿体基因组长度变化的主要原因是IR区边缘的收缩和扩张[24]。研究表明,叶绿体基因组的演化和系统发育分析的过程可由 ycf1、ndhF基因的特征分析[25]。本试验研究发现,不同物种叶绿体基因组的IR区与LSC、SSC区之间连接区域的编码基因存在相似的规律,但仍存在一定差异,例如 ycf1和ndhF基因在不同的连接区域编码。在枸杞属植物的叶绿体基因组IR区分析中发现,属内植物的连接区域及基因表达具有高度相似性,这与丁香属[26]植物的研究结果也类似。核苷酸多态性可以用来评价群体基因组遗传多样性水平,本研究得出在黑果枸杞叶绿体基因组中,IR区域表现出最高的保守性,而高变区在SSC区,其中ndhF基因的多态性最高,且 ycf1、ccsA和ndhE等基因的突变率也比较高,这些突变位点可为枸杞属内物种鉴定和系统进化分析提供更有价值的信息,这与南洋杉科叶绿体基因组在基因组特征的各个方面均高度保守的特征相同[27]。系统发育基本组学研究是通过分子数据来探讨生物之间的发育规律的;系统发育对于研究进化历史对生态群落中物种组装的影响以及物种组合系统发育结构的地理和生态模式至关重要[28-29]。由于cpDNA具有序列保守、结构稳定等特点[30],因此,基于cpDNA进行的系统发育研究得到了很好的发展。本研究以测得黑果枸杞叶绿体基因组全部序列联合NCBI下载的茄科植物以及外类群组植物的叶绿体基因组序列构建了进化树,结果表明,该进化树的分辨率较高,各节点也获得了较高的支持率,茄科内属间呈现出较为明确的发育关系,枸杞属内呈明显的姐妹关系,与Wang等 [31]研究的枸杞(宁夏枸杞)的进化关系一致。

4 结 论

综上所述,黑果枸杞cpDNA全长154 979 bp,共注释到125个基因,其中,包含有81个蛋白编码基因,36个tRNA基因,8个rRNA基因,黑果枸杞cpDNA偏好G或C碱基。系统发育结果表明,黑果枸杞与非洲枸杞、宁夏枸杞和中国枸杞等枸杞属植物亲缘关系较近。本研究丰富了黑果枸杞的研究内容,为进一步研究黑果枸杞系统进化和遗传育种提供了理论依据。

参考文献 Reference:

[1] 万国海.枸杞的生物学特性、栽培管理及采收加工[J].种植与环境,2013(4):214.

WAN G H.Biological characteristics,cultivation management and harvesting and processing of Lycium barbarum L.[J].Modern Animal Husbandry Science & Technology,2013(4):214.

[2]YU ZH L,XIA M Q,AN J P,et al.A comprehensive review on the ethnobotany,phytochemistry,pharmacology and quality control of the genus Lycium in China[J].Food & Function,2023,14:2998-3025.

[3]闫亚美,冉林武,曹有龙,等.黑果枸杞花色苷含量测定方法研究[J].食品工业,2012,33((6):145-147.

YAN Y M,RAN L W,CAO Y L,et al.Determine the total anthocyanins in Lycium ruthenicum Murr.by different methods[J].The Food Industry,2012,33((6):145-147.

[4]阿力同·其米克,王青锋,杨春锋,等.新疆产药用植物黑果枸杞遗传多样性的ISSR分析[J].植物科学学报,2013, 31(5):517-524.

ALITONG QIMIKE,WANG Q F,YANG CH F,et al.ISSA analysis on genetic diversity of medically important Lycium ruthenicum Murr.in Xinjiang.[J].Plant Science Journal, 2013,31(5):517-524.

[5]YUN D W,YAN Y M,LIU J.Isolation,structure and biological activity of polysaccharides from the fruits of Lycium ruthenicum Murr:A review[J].Carbohydrate Polymers,2022,291:119618.

[6]SINA C,FLAVIA S,MANUELA M.Determination of leaf characteristics in different medlar genotypes usingthe image program[J].Horticultural Science,2020,47(2):117-121.

[7]SOMSSICH MARC.The dawn of plant molecular biology:how three key methodologies paved the way[J].Current Protocols,2022,2(4):e417.

[8]潘 登,高宏波.叶绿体DNA的发现历程[J].生物学通报,2012,47(7):53-55.

PAN D,GAO H B.Discovery process of chloroplast DNA[J].Bulletin of Biology,2012,47(7):53-55.

[9]安明珠,赵世伟,朱文露,等.鸭茅叶绿体引物筛选[J].草学,2022(1):30-36,47.

AN M ZH,ZHAO SH W,ZHU W L,et al.Screening of Dactylis chloroplast primers[J].Journal of Grassland and Forage Science,2022(1):30-36,47.

[10] YIN M Y,YU Y A,GONG Y J,et al.The complete chloroplast genome of; Solanum sisymbriifolium; (Solanaceae),the wild eggplant[J].Mitochondrial DNA Part B,2022,7(5):886-888.

[11]毛桂莲,付晓辉.外源Ca2+和H2O2对NaCl胁迫下枸杞离体叶片叶绿体中活性氧代谢的影响研究[J].干旱地区农业研究,2009,27(5):191-195.

MAO G L,FU X H.Effects of exogenous Ca2+ and H2O2 on active oxygen metabolism of isolated leaves of Lycium barbarum L.chloroplast under NaCl stress[J].Agricultural Research in the Arid Areas,2009,27(5):191-195.

[12]CUI Y,ZHOU J,CHEN X,et al.Complete chloroplast genome and comparative analysis of three Lycium (Solanaceae) species with medicinal and edible properties[J].Gene Reports,2019,10:0464.

[13]ZHANG T W,FANG Y J,WANG X M,et al.The complete chloroplast and mitochondrial genome sequences of Boea hygrometrica:insights into the evolution of plant organellar genomes[J].PloS One,2012,7(1):e30531.

[14]YANG Z,HUANG Y,AN W,et al.Sequencing and structural analysis of the complete chloroplast genome of the medicinal plant Lycium chinense Mill[J].Plants,2019, 8(4):87.

[15]刘晶星.宁夏枸杞和黑果枸杞叶绿体全基因组测序及基因注释分析[D].北京:中国科学院北京基因组研究所,2013.

LIU J X.De novo assembly and gene annotation of the chloroplast genomes of Lycium barbarum and Lycium ruthenicum[D].Beijing:Beijing Institute of genome research,Chinese Academy of Sciences,2013.

[16]崔英贤.药食两用药材砂仁、枸杞、山楂和姜基原植物叶绿体基因组结构解析[D].北京:北京协和医学院,2020.

CUI Y X.Structural analysis of complete chloroplast genome of medicinal and edible original plants of Amomum,Chinese Wolfberry,Hawthorn and Ginger[D].Beijing:Peking Union Medical College,2020.

[17]NI Z X,YE Y J,BAI T D,et al.Complete chloroplast genome of Pinus massoniana (Pinaceae):Gene rearrangements,loss of ndh genes,and short inverted repeats contraction,expansion[J].Molecules,2017,22(9):1528.

[18]JANSEN R K,SASKI C,LEE S,et al.Complete plastid genome seque nces of three Rosids (Castanea,Prunus,Theobroma):evidence for at least two independent transfers of rpl22 to the nucleus[J].Molecular Biology and Evolution,2011,28(1):835-847.

[19]ZHANG Y J,DU L W.The complete chloroplast genome sequences of five Epimedium species:lights into phylogenetic and taxonomic analyses[J].Frontiers in Plant Science,2016,7(696):1-11.

[20]HLNE CHIAPELLO A B,FRDRIQUE LISACEK B,et al.Codon usage and gene function are related in sequences of Arabidopsis thaliana[J].Gene,1998,209(1/2):1-38.

[21]SONG H,LIU J,CHEN T,et al.Synonymous codon usage pattern in model legume Medicago truncatula[J].Journal of Integrative Agriculture,2018,17(9):2074-2081.

[22]LI N,LI Y Y,ZHENG C C,et al.Genome-wide comparative analysis of the codon usage patterns in plants[J].Genes&Genomics,2016,38(8):723-731.

[23]赵振宁,孙浩田,宋雨茹,等.山楂属植物叶绿体基因组特征与密码子偏好性分析[J].江苏农业学报,2023,39(2):504-517.

ZHAO ZH N,SUN H T,SONG Y R,et al.Chloroplast genome characteristics and codon usage bias analysis of Crataegus L.[J].Jiangsu Journal of Agricultural Sciences,2023,39(2):504-517.

[24]WANG Q,ZHANG CH H,WANG CH J,et al.Complete chloroplast genome data for Mimosa diplotricha and Mimosa diplotricha var.inermis from China[J].Data in Brief,2023,48:109045.

[25]JOEY S,EDGAR B L,EDWARD E S,et al.Comparison of whole chloroplast genome sequences to choose noncoding regions for phylogenetic studies in angiosperms:the tortoise and the hare III[J].American Journal of Botany,2007,94(3):275-288.

[26]张 航.丁香属3种植物完整叶绿体基因组与系统发育研究[D].哈尔滨:东北林业大学,2022,001431.

ZHANG H.Complete chloroplast genomes and phylogeny of three plants of the Syringa[D].Harbin:Northeast Forestry University,2022,001431.

[27]VAN BINH NGUYEN,VO NGOC LINH GIANG,NOMAR ESPINOSA WAMINAL,et al.Comprehensive comparative analysis of chloroplast genomes from seven Panax species and development of an authentication system based on species-unique single nucleotide polymorphism markers[J].Journal of Ginseng Research,2020,44(1):135-144.

[28]TANGJ Y,WEI R,ZHANG X CH,et al.Mitogenome-based phylogenomics provides insights into the positions of the enigmatic sinensis group and the sanguinolenta group in Selaginellaceae (Lycophyte)[J].Molecular Phylogenetics and Evolution,2023,179:107673.

[29]YU M,ZHANG D,ZHAO X M.Sequencing and phylogenomics of the complete mitochondrial genome of Allodiplogaster sp.(Rhabditida:Diplogasteridae):a new gene order and its phylogenetic implications[J].Gene,2022,840:146761.

[30]CASTROA A,NUNES R,CARVALHO L R,et al.Chloroplast genome characterization of Uncaria guianensis and Uncaria tomentosa and evolutive dynamics of the Cinchonoideae subfamily[J].Scientific Reports,2023,13(1):8390.

[31]WANG C P,JIA G L,ZHU L ZH,et al.The complete chloroplast genome sequence of Lycium ruthenicum(Solanaceae),a traditional medicinal plant in China[J].Mitochondrial DNA Part B,2019,4(2):2495-2496.

Analysis of Chloroplast Genomic Characteristics of L.ruthenicum Murr

LIU Di1,DU Yu1,LI Xiaoxiong 2,MA Rui1,LIU Yun1 and MA Yanjun1

(1.Forestry College,Gansu Agriculture University,Lanzhou 730070,China; 2.LanzhouResources & Environment Voc-Tech University,Lanzhou 730030,China )

Abstract Tounveil the chloroplast genome (cpDNA) characteristics and phylogenetic development of Lycium ruthenicum,we sequenced the chloroplast of Lycium ruthenicum using NGS technology,and analyzed its genomic characteristics.The results showed that the total length of the cpDNA of Lycium ruthenicum was 154 979 bp,comprising a large single copy region LSC with a length of 85 984 bp,a small single copy region SSC with a length of 18 205 bp,and two reverse complementary repeat regions (IRs) totaling 25 395 bp. Annotation identified a total of 125 genes,including 81 protein coding genes (CDS),36 tRNA genes,and 8 rRNA genes. We detected 60 nucleotide repeat sequences, with five nucleotide types showing the highest single nucleotide repeat of 38,accounting for 63.33% of the total number. The gene sequence was A/T. Codon preference analysis showed a preference for G or C bases,with 2 154 codons encoding Leucine (Leu) accounting for 10.57% of the total,while the least encoded codon was Cysteine (Cys) with 219 occurrences.Polymorphism analysis showed that the IR region exhibited the highest conservatism,while the SSC region was hypervariable; the SSR loci were unevenly distributed and exhibited high polymorphism in the chloroplast genome. The phylogenetic analysis indicated that Lycium barbarum and Lycium chinense clustered together forming sisters branches with Lycium barbarum and Lycium ferocissimum,indicating a close genetic relationship among the four species.

Key words Lycium ruthenicum,; Chloroplast genome; SSR; Codon; Phylogenetic analysis

Received 2023-08-16 Returned 2023-09-19

Foundation item Research Project of Lanzhou Resources & Environment Voc-Tech University (No.X2022ZD-05); University Industry Support Plan of Gansu Province (No.2023CYZC-46); Lanzhou Science and Technology Plan (No.2022-2-22).

First author LIU Di,male,master student.Research area:investigation,collection,preservation,and research of plant germplasm resources. E-mail:18193143002@163.com

Corresponding author MA Yanjun,male,Ph.D,professor.Research area:investigation,collection,preservation,and research of plant germplasm resources.E-mail:mayanjun@gsau.edu.cn

(责任编辑:潘学燕 Responsible editor:PAN Xueyan)

基金项目:兰州资源环境职业技术大学重点研究项目(X2022ZD-05);甘肃省高校产业支撑计划(2023CYZC-46);兰州市科技计划(2022-2-22)。

第一作者:柳 迪,男,硕士研究生,从事植物种质资源调查收集、保存与研究。E-mail:18193143002@163.com

通信作者:马彦军,男,博士,教授,主要从事植物种质资源调查收集、保存与研究。E-mail:mayanjun@gsau.edu.cn