三种块菌(松露)全基因组密码子使用偏性及其影响因素

2022-07-28 06:47韩利红田雪莲付小林王远献
浙江农业学报 2022年7期
关键词:碱基基因组含量

韩利红,田雪莲,刘 潮,付小林,王远献

(曲靖师范学院 生物资源与食品工程学院,云南省高校特色果酒技术创新与应用工程研究中心,云南 曲靖 655011)

块菌(truffle)又称松露,为块菌科(Tuberaceae)块菌属()菌根型野生食用菌,常生于针阔混交林,与多种宿主植物形成专性菌根共生体,主要分布在欧洲、大洋洲和我国西南地区。块菌对生长环境要求苛刻,其人工培养已取得一定进展。块菌气味独特,富含维生素、鞘脂类和微量元素等,属珍稀名贵菌物,兼具营养、保健、药用等多种功效于一体,深受各国人民的喜爱。内转录间隔区(internally transcribed spacer,ITS)rDNA序列分析表明,块菌至少包含180个种,其中,黑孢块菌()和白块菌()已有几百年的食用历史。波氏块菌()广泛分布于欧洲各地,在北美和大洋洲均有栽培。醇类、酮类、醛类、脂类和含硫化合物导致块菌产生独特的香味,不同种类块菌香味不同,生长季节、生长环境也会影响块菌的香味构成成分。黑孢块菌、印度块菌()、攀枝花白块菌()、中华夏块菌()和拟凹陷块菌()是5种主要分布在欧洲和中国的商业块菌,其中,黑孢块菌是含有香味成分最丰富的类群。白块菌香味成分含量受个体影响较大,而受栽培地域的影响较小,土壤细菌群落影响了部分化合物成分含量。

作为遗传信息识别和传递的载体,密码子在生物遗传和变异过程中发挥关键作用。除甲硫氨酸(Met)和色氨酸(Trp)外,其余氨基酸均由2~6个同义密码子编码。自然界中,不同物种对密码子的使用并不是完全随机的,甚至同一物种的不同基因对密码子的使用偏好性也不同,这种现象称为密码子使用偏性(codon usage bias,CUB)。CUB与鸟嘌呤和胞嘧啶(guanine and cytosine,GC)含量、第3位碱基使用频率和重复序列等有关,会改变蛋白的翻译效率和准确性,对物种的表型和适应性产生影响。CUB受到突变压力和自然选择等因素的影响,是物种适应性进化的结果,可反映物种起源和进化方式。最优密码子往往对应更丰富的转运RNA(transfer RNA,tRNA),在高表达基因中含量更丰富。密码子使用偏性分析对于基因进化、环境适应、植物基因工程和遗传分析具有重要的生物学意义。目前,黑孢块菌、白块菌和波氏块菌的全基因组数据已相继公布,然而未见其密码子使用偏性的报道。本研究系统分析3种块菌基因组密码子使用模式及其影响因素,以期为块菌基因进化研究和遗传育种提供理论依据。

1 材料与方法

1.1 序列获取与筛选

从Ensembl数据库(http://fungi.ensembl.org/index.html)搜索并下载黑孢块菌、白块菌和波氏块菌基因编码序列(coding sequence,CDS)。为确保结果的准确性,仅筛选CDS以ATG起始,以终止密码子TAA、TAG或TGA结尾,且长度大于300 bp的序列。

1.2 方法

1.2.1 密码子组成分析

利用CodonW 1.4.2软件(https://sourceforge.net/projects/codonw/)分析CDS的有效密码子数(effective number of codons,ENC)、密码子第3位上4种碱基腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶出现频率(A3s、T3s、G3s、C3s)、GC含量、第3位同义密码子上G和C的含量(GC3s)和最优密码子使用频率(Fop)等。利用EMBOSS在线网站的cusp软件分析相对同义密码子使用度(relative synonymous codon usage,RSCU)。利用Mega X软件对CDS进行核苷酸组成分析。

1.2.2 密码子使用相似度分析

基因密码子使用相似度分析可以反映不同物种的遗传差异。使用同义密码子RSCU值计算物种间密码子使用度相似度参数。

(1)

(2)

式(1)和(2)中:(,)为物种A和B基因密码子RSCU的夹角余弦值,表示二者总体密码子使用模式的相似度;(,)表示物种B对物种A密码子使用模式的影响与差异,(,)越趋于0,表示两物种密码子使用模式相似度越高;分别代表物种A和物种B同义密码子的RSCU值。

1.2.3 最优密码子分析

综上,基于大学生实习支教的研究视角主要有:一是实习工作管理,教育教学管理,师范生专业素质发展;二是实习学生实践创新能力、心理问题、社会适应性、综合素质等;三是实习支教大学生思想政治教育模式、方法、路径等。研究中以实证性调研为主,基于本校本地的经验居多,缺乏普遍性规律的探讨和理论总结与提升。河西学院援疆实习支教与以上研究结论有重合之处,但也有自己鲜明的特点,总结十年的做法与经验,对做好大学生思想政治教育具有一定的借鉴意义。

根据基因ENC值排序,选择数值最低和最高5%的基因分别作为高表达基因(high expression genes,HEG)和低表达基因(low expression genes,LEG)。RSCU值大于1表明该密码子使用偏性较强,该密码子确定为高频密码子,如果同时满足ΔRSCU(HEG-LEG)大于0.08,该密码子确定为最优密码子。

1.2.4 奇偶偏性绘图(Parity Rule 2 plot,PR2-plot)分析

根据Mega X软件分析的A3、T3、C3和G3数值,计算G3/(G3+C3)和A3/(A3+T3),分别作为横坐标和纵坐标绘图。G3/(G3+C3)和A3/(A3+T3)分布靠近中心坐标0.5,表示碱基使用不存在突变或选择偏性。

1.2.5 ENC-GC3s关联绘图分析

ENC-GC3s关系可用于分析反映密码子偏性的影响因素。分别以GC3s和ENC值作为横坐标和纵坐标绘制散点图。ENC期望值计算公式为:

(3)

式(3)中,表示ECN值,表示GC3s的值。

1.2.6 中性绘图分析

GC3与GC12(GC1和GC2的平均值)相关性分析反映密码子使用偏性受碱基突变作用的强弱。以GC3和GC12分别作为横坐标和纵坐标绘制散点图。

1.2.7 对应性与相关性分析

对应性分析(correspondence analysis,COA)从多维空间中提取密码子使用偏性的影响变量,每个变量的占比表示对密码子使用性影响的权重,反映其对密码子使用影响大小。利用CodonW 1.4.2软件根据59个密码子(Met、Trp和3个终止密码子除外)的RSCU值进行COA分析。参数间的相关性分析使用SPSS 23.0完成。

2 结果与分析

2.1 密码子使用偏性

黑孢块菌、白块菌和波氏块菌基因组大小依次为124.95、192.78和97.19 Mb,分别含有7 496、9 431和12 345个基因,GC含量分别为44.9%、40.0%和46.4%。经过筛选,分别从3种块菌中获得6 613、7 623和10 591条CDS进行密码子使用偏性分析。碱基频率分析显示,3种块菌编码基因GC含量均明显高于基因组GC含量,白块菌C3s、G3s、GC3s、GC与三联密码子各位置上GC含量(GC1、GC2和GC3)均较高,其次为黑孢块菌,波氏块菌最低。编码基因GC含量均大于AT含量,波氏块菌T3s和A3s显著高于黑孢块菌和白块菌(表1)。黑孢块菌、白块菌和波氏块菌平均ENC值均大于55,小于35的基因数量分别为9、21和28,白块菌基因平均ENC值略低于黑孢块菌和波氏块菌,表明3种块菌多数基因密码子偏性较弱,表达潜力较低。

表1 三种块菌碱基组成与密码子使用参数

2.2 密码子使用相似度

基因组密码子使用相似度分析显示,3种块菌间差异性指数(,)数值较小,黑孢块菌与白块菌差异性指数为0.001 3,白块菌与波氏块菌为0.000 9,黑孢块菌与波氏块菌为0.000 4(图1),说明三者密码子使用存在较高的相似度,遗传分歧较小,其中,黑孢块菌与波氏块菌密码子使用相似度最高,黑孢块菌与白块菌相似度最低,白块菌的密码子使用性与其他两种块菌存在一定差异。

图1 三种块菌基因组密码子使用差异

2.3 最优密码子

黑孢块菌、白块菌和波氏块菌基因组中,RSCU分别为0.52~1.45、0.62~1.38和0.58~1.43,RSCU值大于1的密码子个数分别为30、32和30个,其中三者共有的高频密码子有24个,9个以A/T结尾,15个以G/C结尾(表2)。黑孢块菌、白块菌和波氏块菌最优密码子的ΔRSCU最高值分别为0.82、0.79和0.76,最优密码子数(G/C和A/T结尾数)分别为22(18,4)、19(15,4)和21(13,8),包含14个共有的最优密码子,其中8个以C结尾,3个以G结尾,3个以T结尾,表明3种块菌均偏好G/C结尾的密码子,基因密码子使用模式虽有差异但总体相似。

表2 三种块菌基因组密码子的密码子使用度

2.4 密码子变异影响因素

2.4.1 ENC-GC3s关联分析

ENC-GC3s关联绘图可以反映GC3s对密码子使用偏性的影响。3种块菌少数基因位于ENC-GC3s关联曲线上方,大多数基因位于下方,且远离曲线(图2)。3种块菌中远离曲线的基因特征存在明显差异,其中,黑孢块菌和白块菌基因主要位于下部偏右的区域。黑孢块菌中12个基因靠近左下角,这些基因ENC值较小,密码子使用偏性较强,具有较高的表达潜力。波氏块菌基因主要位于下部中间区域。ENC-GC3s关联分析表明,3种块菌基因密码子使用偏性除了受到碱基突变影响外,还受到较强的翻译选择等其他

GC3s,第3位同义密码子上G和C的含量。

因素的作用。相对而言,黑孢块菌基因密码子使用偏性受非碱基突变因素影响最强,其次是白块菌,波氏块菌基因密码子使用偏性受非碱基突变因素影响最弱。

2.4.2 奇偶偏好分析

PR2-plot显示密码子第3位碱基使用的偏好性,可反映密码子偏性形成的影响因素。总体上,3种块菌密码子G3/(G3+C3)介于0.492~0.496,A3/(A3+U3)介于0.440~0.445,表明第3位嘧啶含量(C+T)高于嘌呤含量(G+A)(图3)。白块菌少数基因密码子嘌呤含量明显高于嘧啶含量。密码子第3位上4种碱基的不平衡分布,说明3种块菌受碱基突变影响的同时,均受到了翻译选择等其他因素的影响,少数偏离中心点的基因受选择作用影响更强。

图3 三种块菌PR2-plot分析

2.4.3 中性绘图分析

Neutrality plot反映密码子第一二位GC含量(GC12)和第3位GC含量(GC3)的相关性,用于评估密码子受碱基突变的影响程度。相关性分析显示,黑孢块菌和波氏块菌基因GC3与GC12均为极显著相关(<0.01),白块菌为显著相关(<0.05),但3种块菌GC3与GC12拟合优度值均较低(分别为0.001 5、0.000 8和0.007 9),线性回归斜率分别为0.019 7、0.015 5和0.050 8,黑孢块菌和白块菌基因在中心图中的分布整体靠右,波氏块菌略偏右(图4),表明3种块菌基因密码子使用偏性主要受自然选择等多种因素影响,相比较而言,黑孢块菌和白块菌受选择压力因素影响大于波氏块菌。

图4 三种块菌中性绘图分析

2.4.4 对应性与相关性分析

基于RSCU值的对应性分析可以了解3种块菌密码子使用性的影响因素。前4个轴累计解释黑孢块菌、白块菌和波氏块菌基因组变异的31.37%、29.65%和27.43%,其中第一轴(Axis 1)分别解释了3种块菌基因组变异权重的12.24%、10.63%和9.40%,第二轴(Axis 1)分别解释了变异权重的9.41%、9.58%和9.14%,其余轴的权重均小于5.40%,表明第一轴和第二轴是影响块菌密码子使用性的主要因素。不同GC含量的基因在3种块菌基因组中的占比差异明显,黑孢块菌、白块菌和波氏块菌中GC含量小于45%的基因占比分别为1.01%、7.81%和4.32%,GC含量为45%~60%的基因占比分别为97.05%、68.98%和94.98%,GC含量大于60%的基因占比分别为1.94%、23.22%和0.71%。GC含量为45%~60%的基因均匀分布在坐标轴的中心区域;GC含量小于45%的基因分布表现出明显的差异,具体表现为在黑孢块菌中偏左,在白块菌中偏右,在波氏块菌中偏下;GC含量大于60%的基因分布与小于45%的基因位置正相反,在黑孢块菌中偏右,在白块菌中偏左,在波氏块菌偏上(图5)。

图5 三种块菌基因组对应性分析

为进一步分析密码子使用偏好的影响因素,对密码子使用参数与向量轴相关性进行分析,发现黑孢块菌第一轴与GC3s、GC和Fop呈极显著正相关,而与ENC值呈极显著负相关,第二轴的结果与第一轴基本相反;白块菌第一轴与ENC值呈极显著正相关,而与GC3s、GC和Fop呈极显著负相关,第二轴与GC3s、GC和ENC值呈极显著正相关,而与Fop呈极显著负相关;波氏块菌第一轴与ENC值呈极显著正相关,而与GC和Fop呈极显著负相关,第二轴与GC3s、GC和Fop呈极显著正相关,第二轴与ENC值呈极显著负相关(表3)。

表3 密码子使用参数的相关性分析

3 讨论

块菌是一类生长在地下的珍稀野生药食兼用的大型真菌,具有极高的营养保健价值。国际市场上块菌售价昂贵,尤其受欧美地区消费者青睐,目前块菌还无法完全实现人工栽培,随着块菌需求越来越高,块菌遭到恶性采摘,产区生态环境破坏严重。针对块菌地理分布和营养成分开展了大量研究。基因组密码子使用性研究对于块菌品种选育和栽培机制研究具有重要意义。鉴于多个块菌物种的基因组已被发布,本研究通过分析黑孢块菌、白块菌和波氏块菌基因密码子使用特征,发现3种块菌基因组密码子使用模式具有较高的相似度,均仅有一二十个基因ENC值小于35,基因表达潜力较低,基因密码子使用偏性不强。与白块菌相比,黑孢块菌密码子使用性更接近波氏块菌。3种块菌编码基因G/C使用比例高于A/T。研究发现,药用真菌猪苓()基因平均GC含量为58.0%,蛹虫草()核基因GC含量高达59.35%,与块菌结果一致,而双孢蘑菇()和专性寄生真菌落叶松-杨栅锈菌(-)基因平均GC含量和GC3s小于AT含量和AT3s。不同真菌基因组碱基构成与密码子使用偏性差异,可能与物种进化过程所受的选择压力和环境适应性有关。

密码子优化可提高基因的转录水平,是异源蛋白质高效表达的重要方式。最优密码子的研究是实现密码子优化的基础。3种块菌基因组密码子RSCU取值范围为0.5~1.5,大部分基因同义密码子RSCU值相差较小,虽然均含有30个以上的高频密码子,但高频密码子的RSCU值并不高。3种块菌最优密码子的选择具有相似之处,均偏好G/C结尾的密码子,含有14个共有最优密码子,但ΔRSCU值均偏小,均有一定比例的A/T结尾的最优密码子,表明其密码子使用性偏性不强。双孢蘑菇14个最优密码子以C/T结尾,猪苓23个最优密码子多以G/C结尾,而蛹虫草16个最优密码子均以G/C结尾。不同真菌最优密码子的偏好性显示出较高多样性,其形成因素可能与物种生长环境和进化压力有关。

密码子使用偏性形成主要受碱基突变和自然选择压力等因素的影响,与物种的生长环境、生存方式等因素有关,为了解物种的分子进化和环境适应提供信息。高表达基因密码子使用偏性主要受选择作用影响,而低表达基因主要受碱基突变影响。绘图分析显示,3种块菌大部分基因远离ENC-plot曲线,偏离PR2-plot中心点,GC12和GC3显著相关,但拟合优度值较低,表明块菌密码子使用偏性形成主要受选择压力影响,少数基因主要受碱基突变影响。对应性分析显示,3种块菌密码子使用性的主要影响因素与GC碱基含量有关,该结果与绘图分析均表明翻译选择等多种因素影响了密码子使用偏性形成。相关性分析显示,黑孢块菌第一轴与ENC呈极显著负相关,而与Fop呈极显著正相关,表明翻译选择是影响黑孢块菌密码子偏性的主要因因素。白块菌第一轴与黑孢块菌结果正相反,表明非翻译选择等其他因素影响了白块菌的密码子偏性。波氏块菌影响因素与白块菌类似,但其第二轴代表了翻译选择因素对密码子偏性的影响。总之,3种块菌物种相比,黑孢块菌密码子偏性主要受翻译选择压力影响,其次为白块菌,波氏块菌受选择压力影响相对较弱。3种块菌密码子使用偏性形成与双孢蘑菇、蛹虫草、猪苓等大型真菌主要受选择压力影响类似,而与病原菌落叶松-杨栅锈菌主要受突变压力不同。

猜你喜欢
碱基基因组含量
“植物界大熊猫”完整基因组图谱首次发布
HPLC法测定盐酸伐地那非的杂质含量
宏基因组测序辅助诊断原发性肺隐球菌
基因“字母表”扩充后的生命
创建新型糖基化酶碱基编辑器
这15款零食偷偷加了好多盐
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
克拉玛依油田地层水中硼和二价铁的分布特征及地质意义
HPLC法测定维吾尔药驱白艾力勒思亚散中没食子酸的含量