腊肠树叶绿体基因组序列特征及其系统发育分析

2023-01-17 05:08向如双段宝忠孙伟宋驰王艳AtiatulWahab孟祥霄
环球中医药 2022年12期
关键词:腊肠密码子扁豆

向如双 段宝忠 孙伟 宋驰 王艳 Atia tul Wahab 孟祥霄

腊肠树(Cassia fistulaL.)属于豆科决明属植物,在我国南部及西南部地区有种植[1],它原产于印度,广泛分布于世界各地[2],是一种具有较高的药用、观赏与工业经济价值的天然药用植物[1]。 腊肠树在许多传统医药系统中被使用,包括:印度采用的阿育吠陀体系、我国采用的传统医药体系和巴基斯坦采用的希腊阿拉伯体系[3-4],腊肠树的果实、种子、树皮、树根、叶和花等部位均可入药,在印度,它被用于治疗肝脏疾病、糖尿病、结核病和泌尿道感染等[1,5-6],在巴基斯坦它被用于治疗便秘、感冒、发烧[7],在我国,它被用于通便与抗菌[1]。

现代研究表明,因腊肠树不同部位均富含大量活性化学物质,且这些活性化学物质大多数尚未被开发,它整体的药理作用不明确[8],所以目前国内外大多数研究主要集中于化学成分研究[3,9-10]和药理作用研究[6,11-12]。 但是,在植物分类领域学术界对决明属(Cassia)植物种类的划分一直存在着较大争议[13-15]。 近年来,随着分子生物学领域研究的发展,叶绿体基因组研究越来越受到广大科研人员的青睐,叶绿体基因组分析方法的出现为植物物种鉴定和系统发育研究提供了可靠手段[16],基于叶绿体基因组的系统发育研究已为毛重楼[17]、人参[18]、虎杖[19]等药用植物更好地发挥其应用价值提供了理论基础,由于腊肠树分子生物学领域方面的研究进程缓慢,极大地限制了腊肠树的开发与利用。

鉴于此,本研究使用Illumina 测序技术及生物信息学方法对腊肠树进行了叶绿体基因组特征和系统发育分析,以期从基因组学层面为决明属植物分类提供依据,并为腊肠树资源的有效开发、保护和利用奠定理论与数据基础。

1 材料与方法

1.1 试验材料

样品的新鲜叶片采自广东省云浮市云安区产业转移工业园霭霖花园路边(N23°2′5″, E112°10′52″),经昆明采智生物技术有限公司鉴定为腊肠树C.fistula,凭证标本(标本号:GD20220115)存放于中国中医科学院中药研究所国家中药基因库。

1.2 基因组DNA 的提取和测序

叶片基因组总DNA 使用天根植物基因组DNA提取试剂盒(DP305)提取,总DNA 检测合格后,通过安诺优达基因科技有限公司高通量测序平台Illumina NovaSeq(Illumina,美国)进行文库构建与测序[20]。 采用 SOAPnuke[21](版本:1.3.0)软件对原始数据进行过滤,原始测序数据已上传至NCBI 序列读取档案(SRA,登录号:SRR18556254)。

1.3 叶绿体基因组的组装与注释

采用GetOrganelle[22](版本:1.7.5;参数:-R 10)软件对过滤后的数据进行基因组拼接;采用Bandage[23](版本:0.8.1)软件手动解环得到完整的叶绿体基因组全序列;然后,以布鲁斯特决明C.brewsteri(F.Muell.) Benth.(序列号:NC_047376)为参考序列,采用CPGAVAS2[24](网址:http:/ /47.96.249.172:16019/analyzer/home)对叶绿体全基因组序列进行注释,组装、注释的叶绿体基因组已上传至GenBank(登录号:ON099431);采用在线工具Chloroplot ( 网 址: https:/ /irscope.shinyapps.io/Chloroplot/)绘制叶绿体全基因组的物理图谱。

1.4 重复序列和密码子使用分析

采用Codon W[25](版本:1.4.4)软件对叶绿体全基因组密码子偏好性进行分析,统计同义密码子相对使用度(Relative Synonymous Codon Usage,RSCU) 的值。 采用 REPuter[26](网址: https:/ /bibiserv.cebitec.uni-bielefeld.de/reputer)在线工具(参数:minimal repeat size 30 bp; Hamming Distance 3; Maximum Computed Repeats 5000.)分析叶绿体基因组中的散在长重复序列片段。 简单重复序列(simple sequence repeats, SSR)分析采用MISA[27](版本:1.0;参数:默认;unit size:1-10 2-5 3-4 4-3 5-3 6-3)软件分析。

1.5 基因组比较分析

从NCBI 下载了与腊肠树同属的布鲁斯特决明C.brewsteri(NC_047376)、美丽决明Senna spectabilis(DC.) H.S.Irwin et Barneby.(NC_054185)、山扁豆Chamaecrista mimosoidesStandl.(NC_047400)、望江南S.occidentalis(Linnaeus) Link.(NC_038222)、铁刀木S.siamea(Lamarck)H.S.Irwin & Barneby.(MN525772)和决明S.tora(Linnaeus) Roxburgh.(NC_030193)的叶绿体基因组,使用Perl 中的SVG模块,可视化了反向重复区(inverted repeat regions,IRa 和 IRb)、大单拷贝区(large single copy, LSC)和小单拷贝区(small single copy, SSC)区域的边界差异信息。 并采用mVISTA 对其进行全基因组比对分析。

1.6 系统进化分析

为探讨腊肠树C.fistula的系统发育位置,本研究从NCBI 下载了7 条叶绿体基因组序列(6 条为近缘物种叶绿体基因组序列,1 条为外类群)构建最大似然(maximum likelihood, ML)系统发育树。 采用MAFFT(版本:7.471)软件[28]对叶绿体基因组序列进行比对;采用RAxML(版本:8.2.12;核苷酸模型:GTRGAMMA;重复迭代次数:1000)软件[29]使用ML构建系统发育树。

2 结果

2.1 叶绿体基因组结构

腊肠树C.fistula叶绿体基因组是全长为161,724 bp 的四分体结构,包括一对反向重复序列(IRA和IRB,26,032 bp)、小单拷贝区(SSC, 18,616 bp)和大单拷贝区(LSC, 91,044 bp)(图1 和表1),叶绿体基因组总GC 含量为36.1%。 在决明属已发布叶绿体基因组的物种中除了铁刀木S.siamea和山扁豆Ch.mimosoides叶绿体全基因组序列长度较短外,其余物种的叶绿体基因组的序列长度特征均与腊肠树具有相似性(表1)。

表1 决明属叶绿体基因组的序列特征列表

图1 腊肠树叶绿体基因组图谱

2.2 叶绿体基因组功能及分类

经CPGAVAS2 注释结果显示,其叶绿体基因组共包含128 个基因,其中83 个蛋白质编码基因,37个 tRNA 基因和8 个 rRNA 基因(表 2)。 这些基因主要分为四类:与光合作用相关的基因、自我复制相关的基因、功能未知的基因,以及成熟酶(matK)、蛋白酶(clpP)等其他基因。 在这些基因中,共有17个基因是双拷贝基因,包括6 个蛋白质编码基因,7个tRNA 编码基因和4 个rRNA 编码基因。 决明属已发布叶绿体基因组的物种中,美丽决明S.spectabilis和铁刀木S.siamea注释基因较少,其余物种的叶绿体基因组的基因个数与腊肠树具有相似性(表3)。

表2 腊肠树叶绿体基因组基因列表

表3 决明属叶绿体基因组的基因个数统计表

2.3 散在长重复序列及SSR 分析

在腊肠树叶绿体基因组中,共有62 条散在长重复序列,包括4 种类型,正向重复序列(forward,F)28 条、回文重复序列(palindromic,P)25 条、反向重复序列(reverse,R) 7 条、互补重复序列(complement,C)2 条。 四种类型片段的长度范围均在30 ~52 bp 长度,而且长度为30 bp 的长重复序列数量最多,包括正向重复序列10 条,回文重复序列9 条,反向重复序列5 条(图2)。 在腊肠树叶绿体基因组中共检测到113 个SSRs 位点,SSRs由77 个单核苷酸、15 个二核苷酸、10 个三核苷酸、7 个四核苷酸、4 个五核苷酸组成,SSR 的类型主要以 A/T 为主(77 个),而且大多数 SSRs 以 A或T 结尾(图3)。 SSR 位点在很大程度上分布在基因间隔区(intergenic spacer, IGS) 区(78 个,68%),其次是编码区(19 个,17%)和内含子区(16 个,15%)(图 3)。

图2 腊肠树叶绿体基因组长序列重复类型

图3 腊肠树叶绿体组SSR 统计及SSR 位点分布

2.4 叶绿体基因组密码子偏好性分析

本研究计算了腊肠树叶绿体基因组密码子RSCU 的值,统计结果显示(图4),检测到共有20 种氨基酸被编码,最常见的氨基酸是Leu(亮氨酸)、Arg(精氨酸)和Ser(丝氨酸),AUG 是20 种编码氨基酸中最常用的密码子(RSCU 值为3)。 同时,频率最低的密码子是 AGC(RSCU 值为 0.3509)。RSCU 值>1 的密码子数量为32 个,其中以 A 结尾的有13 个,以U(T)结尾的有19 个,表明腊肠树叶绿体基因组主要偏好以A 和U(T)结尾的密码子。

图4 腊肠树叶绿体基因组密码子RSCU 分布情况

2.5 IR 边界分析

腊肠树与六个同属物种(布鲁斯特决明C.brewsteri、山扁豆Ch.mimosoides、望江南S.occidentalis、铁刀木S.siamea、美丽决明S.spectabilis和决明S.tora)的叶绿体基因组的IR 边界及基因分布见图5。结果显示,腊肠树与六个同属物种的叶绿体基因组共存在 4 个边界,分别是 LSC/IRB、IRB/SSC、SSC/IRA 和IRA/LSC 边界。 7 个决明属物种的LSC/IRB边界较为保守,LSC/IRB 边界均位于rps19 基因内,且该基因跨越IRB 区域的长度范围在103 ~109 bp内。 所有物种在IRB/SSC 处边界存在较大分化,仅有布鲁斯特决明和铁刀木的ndhF基因位于该边界区域,其余物种的该基因均位于SSC 区域。 SSC/IRA 边界除了望江南,其余物种的ycf1 基因均位于该边界。 所有物种的IRA/LSC 边界均与基因trnH存在着0 ~12 bp 的间隙。

图5 腊肠树叶绿体基因组的大单拷贝、小单拷贝和反向重复区边界区域的比较分析

2.6 腊肠树叶绿体基因组的比较分析

本研究尝试将腊肠树与NCBI 中上述六个同属物种的叶绿体基因组的物种进行比较,因铁刀木物种的psaB、psaA和ycf3 等多个基因或基因间隔区大概缺失达5200 bp,因此,本研究以组装的腊肠树叶绿体基因组为参照,将腊肠树与其余5 个同属物种进行比较。 结果显示(图6),6 条叶绿体基因组序列中LSC 区序列变异明显大于SSC 区,非编码区域序列变异高于编码区域。 结果显示,绝大多数基因的相似度均在90%以上,变异较大的基因有rpoc2、ycf1 和ndhF等由图可见。 六个决明属植物的基因间区,如:trnK-UUU-rps16、rps16-trnQ-UGG、trnSGCU-trnG-UCC、trnC-GCA-petN、trnT-UGU-trnLUAA、ndhC-trnV-UAC、rps8-rp114、ycf2-trnL-CAA、trnN-GUU-ndhF等,其基因间区变异均大于基因区。

2.7 腊肠树叶绿体基因组的比较分析

为了确定腊肠树的系统发育关系,使用8 条叶绿体基因组序列(包括1 条豆科任豆属的任豆Zenia insignisChun.序列为外类群,7 条豆科决明属序列),构建ML 系统发育树。 结果显示(图7),各节点的自展支持率均为100%,表明聚类结果的可靠性较高。 7 个决明属物种被聚为3 个支,美丽决明S.spectabilis、 望 江 南S.occidentalis、 铁 刀 木S.siamea和决明S.tora聚为一支,腊肠树C.fistula与布鲁斯特决明C.brewsteri聚为一支,山扁豆Ch.mimosoide单独聚为一支,且腊肠树亲缘关系与布鲁斯特决明C.brewsteri的亲缘关系最近。

图7 基于叶绿体全基因组序列构建ML 系统进化树

3 讨论

植物叶绿体基因组在基因结构、基因组成等方面具有一定的保守性,进化速度相对适中[30-32],为植物物种鉴定、系统进化、遗传多样性提供了有价值的信息[33]。 本研究完成了叶绿体基因组组装、注释、密码子的偏好性、简单重复序列及系统发育分析等。 叶绿体全基因组分析结果显示,腊肠树绿体基因组全长为161,724 bp,有典型的环状DNA 双链结构,叶绿体基因组结构、基因功能分类与已发表的决明属物种一致[34];重复序列分析结果显示,腊肠树叶绿体基因组中共检测到113 个SSRs 位点,并且SSR 位点在很大程度上分布在基因间隔区,这与苦马豆[Sphaerophysa salsula(Pall.) DC.][35]、苦参(Sophora flavescensAlt.)[36]和黄丹木姜子[Litsea elongata(Wall.ex Nees) Benth.et Hook.f.][37]等众多植物分析结果一致,腊肠树叶绿体基因组中检测到的SSRs 位点可为决明属植物分子标记开发提供理论依据。 叶绿体基因组序列变异分析结果显示,非编码区域序列变异高于编码区域,变异较大的基因位点(rpoc2、ycf1、ndhF)和基因间区位点(trnK-UUU-rps16、rps16-trnQ-UGG、trnS-GCU-trnG-UCC等),为决明属植物的分子鉴定提供了位点资源。

在之前的研究中, 学术界对决明亚族(Cassiinae)植物种类的划分、学名的应用、属下分类系统等方面一直存在着较大争议[13-15]。 决明属(Cassia)是由 Linnaeus 首次发表,1964 年 Hutch 使用了该属名称[13]。 Irwin 和Barneby[15,38]将其提升为决明亚族(Cassiinae),其下拆分成3 个属,包括决明属(Cassia)、山扁豆属(Chamaecrista)和番泻决明属(Senna)。 而1988 版《中国植物志》[39]中决明族只分为长角豆属(Ceratonia)、任豆属(Zenia)和决明属(Cassia)3 个属,记载决明属的物种有22 种[14],并且有些决明属的物种在中国植物志上搜索显示学名、拉丁名已被修订,如Cassia siamea、Cassia spectabilis、Cassia tora拉丁名已修订为Senna siamea、Senna spectabilis、Senna tora,而含羞草决明Cassiamimosoides的学名、拉丁名分别被修订为山扁豆Chamaecrista mimosoides。 但在 2010 版的 Flora of China[40]中,豆科决明亚族下有决明属、番泻决明属、长角豆属和山扁豆属4 个属[14]。 本研究结果表明,基于叶绿体基因组的ML 树显示,7 个物种被聚为3 支,美丽决明S.spectabilis、望江南S.occidentalis、铁刀木S.siamea和决明S.tora聚为一支,腊肠树C.fistula与布鲁斯特决明C.brewsteri聚为一支,山扁豆Ch.mimosoide单独聚为一支。 从叶绿体基因组系统发育的角度来看,本研究支持2010 版的 Flora of China 的决明亚族植物种类的划分结论[40],腊肠树C.fistula归为决明属(Cassia), 美丽决明S.spectabilis、望江南S.occidentalis、铁刀木S.siamea和决明S.tora归为番泻决明属(Senna),山扁豆Ch.mimosoide应归为山扁豆属(Chamaecrista)。 关于决明亚族植物种类的划分存在的问题,仍需要后续更多分子生物学和形态学的研究去提供证据。本研究的腊肠树的叶绿体基因组特征和系统发育分析可为决明亚族植物种类的划分提供重要的参考依据,对腊肠树资源的有效开发、保护和利用奠定理论与数据基础。

猜你喜欢
腊肠密码子扁豆
新年的腊肠
有趣的腊肠树
密码子与反密码子的本质与拓展
腊肠果化学成分及其生物活性
新型密码子、反密码子、氨基酸对应盘
10种藏药材ccmFN基因片段密码子偏好性分析
有趣的腊肠树
盛夏保健宜喝扁豆汤
烟草叶绿体密码子的偏好性及聚类分析
调皮鬼当家