3种木莲属濒危药用植物叶绿体基因组密码子偏好性分析

2022-08-02 03:32杨林谭萍姜月影舒军霞王玉昌王大玮
中国中医药信息杂志 2022年8期
关键词:毛果偏性木莲

杨林,谭萍,姜月影,舒军霞,王玉昌,王大玮

西南山地森林资源保育与利用教育部重点实验室,云南 昆明 650224

叶绿体是大部分具有光合作用的植物不可或缺的细胞器,其基因组的大部分基因拥有控制光合作用、自我复制和其他生物合成功能。凭借单亲遗传特性,叶绿体基因组在研究植物系统发育领域发挥着越来越重要的作用。近年来,随着高通量测序技术的快速发展,有效缩短了测序技术的成本和时间,加速了植物叶绿体基因组组装注释的进程。大量叶绿体基因组序列的组装为这些植物的种间亲缘关系、物种分化、谱系地理学等方面的研究提供了数据支撑。

密码子是生物体内用于传递信息的重要组成部分,是连接DNA与蛋白质之间的纽带。密码子的偏好性是指同种生物中的不同基因对密码子的使用频率存在差异的现象。密码子的突变偏好在一定程度上影响了外源基因的表达和蛋白质的翻译过程,是物种感应自然环境变化从而引起的一种分子适应机制。密码子的偏好性分析可为蛋白结构、基因功能、外源基因的转录和翻译等研究提供理论依据。因此,对植物叶绿体基因组密码子使用模式的偏好性进行分析可为基因工程的基因表达和载体选择提供理论依据。

木兰科Magnoliaceae植物是具有较高药用、观赏价值的经济树种,是被子植物中最濒危的科之一,其中以木莲属Bl.最为严重。木莲属植物主要分布于我国热带和亚热带地区,富含大量单萜类和倍半萜类化合物,具有较好的抗肿瘤和抗癌活性,以及治疗痉挛、溃疡、炎症等功效,为传统药用资源。粗梗木莲Law、大果木莲Hu et Cheng和毛果木莲N.V.Tiep是木兰科木莲属濒危药用植物,目前对这3个种的研究主要集中在繁殖方法、生理生殖及居群结构等方面。本研究基于木莲属植物叶绿体的拼装注释结果,对其密码子使用模式的偏性进行分析,以期为这3种木莲属濒危药用植物的基因表达和基因载体选择等研究提供依据。

1 材料

植物样本由西南林业大学王大玮教授于2020 年7 月14 日采集自云南省昆明植物研究所(102°10′E,24°23′N,海拔1 891 m),经西南林业大学刘江华教授鉴定,分别为木兰科木莲属植物粗梗木莲Law、大果木莲Hu et Cheng、毛果木莲N.V.Tiep。

2 方法与结果

2.1 DNA提取及测序

参照王大玮等方法提取DNA,委托安诺优达基因科技(北京)有限公司使用Illumina测序平台进行高通量测序并将结果上传至NCBI数据库(https://www.ncbi.nlm.nih.gov/),登录号为粗梗木莲MW415418、大果木莲MW415419、毛果木莲MW415421。

2.2 密码子偏好性分析

使用CodonW1.4.2软件筛选出45条密码子编码序列(CDS)偏好参数,分析获得相对同义密码子使用度(RSCU)、每条CDS的密码子出现次数(N)和有效密码子数(ENC);通过EMBOSS(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)获得木莲属植物叶绿体基因组中各密码子第1 位(GC)、第2 位(GC)、第3位(GC)及3位碱基(GC)的GC含量。3种木莲属植物叶绿体基因组的GC含量及ENC见表1。GC、GC、GC平均含量为47.12%~48.49%、40.22%~41.39%、30.23%~32.50%,GC平均含量为39.74%~40.43%,均小于50%,且GC>GC>GC,表明3 种木莲属植物叶绿体基因组均偏好使用A/U结尾的密码子。粗梗木莲、大果木莲、毛果木莲叶绿体基因组编码区ENC分别为35.74%()~55.37%()、39.95%()~52.98()、35.74%()~52.98(),均大于35%,表明木莲属植物叶绿体基因组密码子偏性较弱。

表1 3种木莲属植物叶绿体基因组密码子不同位置GC含量(%)

利用SPSS19.0软件对3种木莲属植物叶绿体基因组密码子ENC、N和不同位置GC含量进行相关性分析,结果见图1。3种木莲属植物叶绿体基因组密码子的 GC、GC、GC与 GC呈极显著相关,GC与 GC呈极显著相关,但GC与GC、GC无显著相关性,表明3种木莲属植物的第1、2位碱基之间差异较小,与第3位碱基差异较大。此外,ENC与GC极显著相关,与GC、GC的关系未达到显著水平,表明木莲属密码子最后一位碱基受到的偏性影响较大。

图1 3种木莲属植物叶绿体基因组密码子数据相关性分析

2.3 中性绘图分析

中性绘图分析可以初步辨别影响密码子使用偏性的因素。若图中所有基因沿对角线分布,回归系数接近于1,即GC和GC的变异基本相同,表明该基因受突变的影响较大,受自然选择的影响小,反之则说明该基因受到自然选择的压力较大。3种木莲属植物叶绿体基因组中性绘图分析见图2。粗梗木莲、大果木莲、毛果木莲的GC分别为0.224 4~0.369 3、0.274 5~0.369 3、 0.274 5~0.369 3; GC分 别 为0.345 90~0.557 55、0.380 45~0.505 25、0.345 90~0.505 25。回归系数为-0.262 7~0.049 1,其中粗梗木莲和毛果木莲GC与GC呈负相关,大果木莲呈正相关,回归系数显示均无显著相关性,表明密码子偏好使用受自然选择影响较大,受突变的影响较小。

图2 3种木莲属植物叶绿体基因组中性绘图分析

2.4 ENC-plot绘图分析

ENC-plot分析可直观表明密码子的使用模式和偏好性形成受到自然选择及突变的影响程度。ENC值理论范围为20~61,该值越接近20表示该基因受到自然选择的影响较弱,反之则受自然选择影响较大。3种木莲属植物叶绿体基因组ENC-plot绘图分析见图3,结果显示大部分基因离标准曲线有一定的距离,ENC实际值与期望值存在一定差异,表明自然选择作用对密码子的影响较大,但部分基因位于标准曲线周围,ENC实际值与期望值基本相似,表明突变对这些密码子影响较大。以上数据表明3种木莲属植物叶绿体基因组密码子的使用偏好性同时受到突变和自然选择的影响,其中自然选择为主要影响因素。

图3 3种木莲属植物叶绿体基因组ENC-plot分析

2.5 PR2-plot绘图分析

若PR2-plot平面图内的基因均匀分布,则说明密码子中各碱基的A、U、C和G使用频率相同。3种木莲属植物叶绿体基因组PR2-plot绘图分析见图4。可见,3种木莲属植物的叶绿体基因呈不规则分布,其中大部分基因分布在图中左下角。U/C在密码子最后一位出现的频率较高,且G与C、A与U的使用频率不相同,表明3种木莲属植物叶绿体基因组密码子的使用偏性受到多种因素的共同影响。

图4 3种木莲属植物叶绿体基因组PR2-plot绘图分析

2.6 最优密码子确定

同时符合高频及高表达条件的密码子被认定为最优密码子。以RSCU>1 为条件,筛选出高频密码子;以ENC值为参考,从大到小排序,筛选最高和最低两端各10%的基因,建立高、低表达基因库,以ΔRSCU(高表达基因RSCU-低表达基因RSCU)≥0.08为条件,筛选出高表达密码子。结果粗梗木莲、大果木莲、毛果木莲分别确定了15、12、16个最优密码子,共43个最优密码子。其中,23个密码子以A结尾,12个密码子以U结尾4,6个密码子以C结尾,2个密码子以G结尾。3个物种共有的最优密码子有5个,分别为编码缬氨酸(Val)的GUU和GUA、编码丝氨酸(Ser)的UCA、编码脯氨酸(Pro)的CCA、编码丙氨酸(Ala)的GCA。见表2。

表2 3种木莲属植物叶绿体基因组最优密码子分析

3 讨论

粗梗木莲、大果木莲、毛果木莲一直以来被用于治疗炎症等疾病。近年来随着生物信息技术的发展,发现其体内含有的单萜类和倍半萜类化合物具有较高的抗癌活性。随着需求量不断增加,粗梗木莲、大果木莲、毛果木莲均呈濒危状态,野生资源不断减少,因此亟须对其进行保护和引种研究。目前,从叶绿体基因组层面对3种木莲属濒危药用植物的研究未见报道,因此本研究通过对其叶绿体基因组密码子偏好性进行分析,为其植物保护利用和引种驯化等研究提供理论依据。

研究表明,密码子的使用偏性与GC含量密切相关。本研究3种木莲属濒危药用植物叶绿体基因组密码子的GC、GC、GC和GC平均含量均小于50%,表明其偏好使用A/U结尾的密码子和碱基,这与前人对于木莲属其他物种的碱基使用偏性研究结果一致。推测可能与植物富含A/U碱基并且进化过程中相对保守的关系有关。同时本研究结果与竹亚科、茄科等高等植物结果一致,也说明高等植物的密码子在使用偏性上具有一定的相似性。相关性分析发现,3种木莲属植物叶绿体基因组密码子3个位置上碱基的GC含量之间无显著相关性,其中ENC值仅与第3位上的GC含量呈显著相关,由此可见其密码子最后一位碱基受到的偏性影响较大。

自然选择和突变是影响密码子使用偏性的最主要因素。3种濒危木莲属植物叶绿体基因组密码子中性绘图、PR2-plot 绘图及ENC-plot 绘图分析结果显示,其回归系数均无显著相关性;大部分密码子ENC值和期望值差异较大,但也有少部分基因差异较小。说明3种濒危木莲属植物叶绿体基因组密码子的使用偏性同时受到了自然选择和突变的影响,其中自然选择为主要因素。这与同属的香木莲、大叶木莲、川滇木莲等近缘种的分析结果一致,表明绝大多数情况下近缘种之间对密码子使用偏性的影响因素相似,密码子的使用偏好不是受到选择或突变中某个单一因素的影响,而是共同作用的结果。

本研究在3种濒危木莲属药用植物叶绿体基因组中确定了GUU、GUA、UCA、CCA、GCA等43个最优密码子,其中以A结尾有23个,以U结尾的有12个,可以看出木莲属最优密码子大部分是以A/U结尾。在3种濒危木莲属植物叶绿体基因组的最优密码子中,粗梗木莲、大果木莲、毛果木莲的RSCU最高值密码子分别是编码亮氨酸(Leu)的CUU、编码缬氨酸(Val)的GUU、编码精氨酸(Arg)的AGA,说明3种濒危药用木莲属物种中使用频率最高的密码子和对应编码的氨基酸各不相同,这与季凯凯等对木莲属植物的最优密码子研究结果一致,表明不同物种之间在密码子和氨基酸的使用上存在一定差异。研究表明,可利用物种的叶绿体基因组密码子使用频率的差异来推断该物种的氨基酸含量,因此对3种濒危木莲属药用植物叶绿体基因组密码子的使用频率进行比较,发现其密码子使用频率基本相同,仅毛果木莲中编码精氨酸(Arg)的AGA与其他密码子的使用频率差异较大,因此推测毛果木莲中的精氨酸含量可能较高。

本研究通过木莲属植物的密码子使用偏好性分析发现,3个濒危物种的密码子使用偏性均受到选择和突变的共同影响,但更多受到自然选择的影响。分析筛选出的最优密码子,揭示物种基因工程中的基因表达和基因载体选择等方面的重要信息,可为后续3种濒危木莲属药用植物进行外源基因密码子改造及重要经济性状的改良提供理论依据。

猜你喜欢
毛果偏性木莲
住在楼上的老马(三)
贵州乡土木莲属植物资源及园林应用前景
独行菜抗逆相关转录因子LaDREB密码子偏性与进化分析
石山木莲Manglietia calcarea X.H.Song
倒卵叶木莲Manglietia obovalifolia C.Y.Wu ﹠Y.W.Law
看待中药毒性 厘清三大误区
密码子偏性分析方法及茶树中密码子偏性研究进展
微波辐射-溶剂回流法提取/HPLC法测定倒提壶中天芥菜碱与毛果天芥菜碱的含量
《本草纲目》选读:木莲
毛果鱼藤黄酮类化合物提取工艺及抑菌作用的研究