郭媛婷 杨玉洁 胡晓艳 杜淑辉
关键词:δ8-FAD2;密码子使用偏好性;油料作物;非油料作物
随着人们对食品健康的关注度越来越高,油脂作为食品必不可少的成分,得到了广泛的社会关注。不饱和脂肪酸(如油酸、亚油酸)可保持细胞膜的相对流动性、有效降低血液胆固醇和甘油三酯含量,人体若缺乏此类脂肪酸,胆固醇便会和一些饱和脂肪酸进行结合,沉积于血管壁,逐渐形成动脉粥样硬化,引发心脑血管疾病[1]。植物中不饱和脂肪酸分布广泛,如花生、大豆、油菜、油橄榄中含有丰富的亚油酸、亚麻酸以及其他不饱和脂肪酸[2-3],且各种植物中油酸及亚油酸含量与比例并不相同,如核桃中亚油酸含量可以高达70%[4];花生中油酸含量为35%~80%,亚油酸变含量为1%~40%[5];而油菜中油酸含量可达60%,亚油酸仅占12%~24%[6]。
脂肪酸去饱和酶(FAD2)是一种常见的脱氢酶,存在于细胞内质网的表面,调控植物中各种不饱和脂肪酸的合成,故FAD2基因直接决定了植物体储存脂中不饱和脂肪酸的含量与比例[7-9],然而,FAD2基因并非聚集于油料作物中,而是普遍存在于各种植物中[8],且不同类型植物中FAD2基因序列编码存在着差异。据报道,基因序列对密码子的使用不是完全随机的,而是具有一定的偏好性,合成某种蛋白质的基因序列对同义密码子的使用频率不同,会造成mRNA转录产生的蛋白数量发生显著变化。研究发现,酸枣[10]、银杏[11]等中已被检测出较弱的密码子偏好性;而在油茶[12]、棉花[13]中发现,自然选择的影响对其密码子偏好性的形成起到很大作用。近年来,对不同植物中某一特定基因的密码子使用偏好的探索已成为基因研究的热点。朱灵芝等[14]进行马尾松PmDXR基因密码子偏好性分析,得出其密码子偏好性较弱、偏好使用A/T结尾的密码子结论。吴彦庆等[15]对不同植物中花的APETALA1基因密码子使用模式进行比较,结果发现,芍药和牡丹AP1基因的密码子使用特点相似,碧桃和苹果AP1基因的密码子使用特点相似。然而,目前大多对密码子偏好性的研究都只从亲缘关系的层面讨论植物密码子使用偏好性规律的相似性[16-17],未有提及木本与草本植物的密码子使用模式是否也有规律可循;此外,對于FAD2基因的研究也多在论述其功能作用[7-9],少有学者探讨油料与非油料植物中的FAD2基因在序列结构中是否存在差异。
本研究在FAD2基因家族中挑选出δ8-FAD2基因,通过对比分析15种不同类型植物的基因序列,对其密码子使用偏好性及其影响因素进行分析,旨在明确草本与木本、油料与非油料作物中δ8-FAD2基因密码子的使用偏好成因及其差异,从而为理解不同物种的基因结构与进化关系,并进一步通过基因调控改良油料作物品质提供研究基础。
1 材料和方法
1.1 序列数据来源
目前,GenBank数据库中来自不同物种的δ8-FAD2基因序列共166条。为明确草本与木本、油料与非油料作物内δ8-FAD2基因密码子的使用偏好性及其影响因素的差异,本试验选取15种代表性植物作为研究对象,具体序列信息如表1所示。
1.2 密码子使用偏好性分析
1.2.1 碱基组成偏好性分析 使用CodonW1.4.2软件对15个基因序列的碱基组成进行分析,并计算各基因的GC含量(GC)、密码子第3位的GC含量(GC3)、密码子末位碱基使用频率(T3、C3、A3、G3)、最优密码子的使用频率(Fop)、密码子适应指数(CAI)及密码子偏爱指数(CBI)[18]。通过对15种植物的综合比较分析,评估δ8-FAD2基因的碱基组成偏好性与不同植物中同一基因的碱基组成差异性。
1.2.2 有效密码子分析 有效密码子(effectivenum?berofcodons,ENC)可用于反映各同义密码子的使用偏好度,取值范围为20~61,ENC值越小偏好性越强,基因表达量也越高,因此,通过比较ENC值大小可以得出内源基因表达量的相对高低[15]。
1.2.3 相对同义密码子使用度分析 相对同义密码子使用度(RelativeSynonymousCodonUsage,RSCU)是密码子实际使用值与无偏好值之比[19]。RSCU=1表示所有同义密码子被均衡使用,无偏好性;RSCU<1表示密码子使用频率较低,反之则偏高;RSCU>1.6表示该密码子有极强偏好性[20]。
1.2.4 最优密码子分析 利用MicrosoftExcel对CodonW计算得到的数据进行相关性分析和不同氨基酸最优密码子确定。将基因序列参照ENC值由高到低进行排序,选取ENC值最低的5个基因作为高偏好组,最高的5个基因为低偏好组,分别计算2组的RSCU值,记作RSCUhigh和RSCUlow,计算二者差值ΔRSCU值。将同时满足ΔRSCU>0.08和RSCU值>1的密码子视为最优密码子[21]。
1.3 ENC-plot绘图分析
ENC-GC3关联图可用来判断基因密码子使用偏好性的压力来源。已知标准曲线为:ENC=2+GC3+29/(GC3?+(1-GC3)?)[22]。若ENC绘图中所有点分布在标准曲线上或分布于标准曲线附近,则密码子使用偏好只受到突变压力影响;若这些点分布于标准曲线外,则认为密码子使用偏好受到自然选择及其他因素影响[23-24]。
1.4 PR2-plot分析
PR2-plot绘图可用来判断基因密码子第3位点碱基的使用偏性情况。为便于分析不同植物δ8-FAD2基因密码子第3位点使用偏好,以G3/(G3+C3)值为横坐标、A3/(A3+T3)值为纵坐标绘制直角坐标系,当A=T,G=C时,坐标为(0.50,0.50),过此坐标分别作垂直于横纵坐标的直线,将坐标轴第1象限分成4个区域[25]。若点分布于中心点附近,则说明密码子使用偏好性主要受到了碱基突变的影响;若分布于直线上部区域,表明该基因密码子末位碱基使用频率A高于T;若分布在直线的左部区域,则表明末位碱基C高于G。
1.5 統计分析
利用R软件绘制不同植物RSCU值的聚类热图[15]。基于15种植物δ8-FAD2不同RSCU值使用SPSS26.0软件进行聚类分析[17],使用MEGA-X软件对不同物种δ8-FAD2完整基因编码序列进行对比,并对其聚类分析[26]。
2 结果与分析
2.1 不同植物δ8-FAD2基因的密码子碱基组成
15种植物δ8-FAD2基因密码子使用参数如表2所示。
使用CodonW1.4.2软件对15种植物δ8-FAD2基因完整编码序列进行分析统计,结果表明(表2),在密码子末位碱基的选择上,除高粱使用C3频率最高外,其余14种植物皆为T3频率最高,且C3和G3频率都较低;GC值变化范围为0.342~0.592,平均值为0.433,GC3值变化范围0.305~0.568,平均值为0.409。除高粱的δ8-FAD2基因GC含量和GC3大于0.5,其余14种植物均小于0.5,说明这14种植物δ8-FAD2基因密码子偏好使用AT,且偏好以A或T结尾。15种植物的ENC值范围为47.200~58.030,平均为52.448,说明这15种植物δ8-FAD2基因的密码子使用偏好性都较弱。
2.2 最优密码子确定
对15种植物δ8-FAD2基因所有氨基酸不同密码子的含量以及RSCU值进行统计,结果显示(表3),除起始密码子(AUG、UGG)和终止密码子(UAA、UAG、UGA)以外,δ8-FAD2基因偏好使用的密码子共有26个,其中,23个以U、A结尾,仅有3个以G、C结尾,AGA、UCU和GUU表现为较强偏好性。基于δ8-FAD2基因中各氨基酸不同密码子含量的差异,在氨基酸水平上,得到了17个优势密码子,分别为GCU、AGA、AAU、GAU、UGU、CAA、GGA、CAU、AUU、UUG、AAA、UUU、CCU、UCU、ACA、UAU、GUU。
从图1可以看出,不同植物δ8-FAD2基因最优密码子存在一定差异,开心果、美国山核桃、角豆树、大豆、野大豆、甘蓝的最优密码子为AGG,棉花、木薯、桑树的最优密码子为AGA,豌豆和花生的最优密码子为UCU,而核桃、高粱、向日葵、油菜的最优密码子分别为GGA、UUG、GUU和CCG。
对δ8-FAD2基因高偏好组和低偏好组进行分析结果表4所示。其中,有27个密码子RSCU>1,表现为较高使用偏性,23个密码子ΔRSCU>0.08,具有高表达性。同时满足2个条件的密码子有21个,视为δ8-FAD2基因的最优密码子。
2.3 ENC-plot绘图分析
ENC-plot绘图可以对15种植物δ8-FAD2基因的实际ENC值与ENC期望曲线进行比较,结果显示(图2),15种植物δ8-FAD2基因的实际ENC值与期望值都存在一定差异,全部分布于ENC期望曲线下方,说明这些物种δ8-FAD2基因密码子使用偏好性的形成都受到了自然选择的影响。木本油料作物的ENC值大都偏离标准曲线且分布相对集中,而草本油料作物的ENC值分布差异较大,如向日葵、油菜等接近期望曲线,而大豆、花生等却偏离严重,说明木本植物受到选择压力情况相似,而不同种类草本植物受到的突变压力与选择压力不尽相同;非油料作物的ENC值均偏离期望曲线,说明大多非油料作物δ8-FAD2基因密码子使用偏好性的主导因素是选择压力。
2.4 PR2-plot分析
PR2-plot绘图可用来比较不同植物δ8-FAD2基因密码子第3位碱基的使用偏好性情况,若点落于x=0.5的直线上,表示密码子第3位G和C的使用频率相同;若点落于y=0.5的直线上,则表示密码子第3位A和T的使用频率相同。分析统计15种植物δ8-FAD2基因的密码子使用情况(图3),发现除桑树密码子第3位对A或T、G或C没有选择偏好性,其余物种皆偏离中心点(0.5,0.5),且集中分布在右下部分,因此,几乎所有物种的δ8-FAD2基因密码子使用偏好性皆很大程度上受自然选择的影响,密码子末位碱基使用频率G高于C,T高于A。非油料作物相对更接近“x=0.5”和“y=0.5”2条辅助线,说明非油料作物在密码子第3位点碱基的选择上偏好性较弱。
2.5 不同植物δ8-FAD2基因密码子使用模式的系统关系
基于RSCU值构建δ8-FAD2基因进化树,结果如图4所示。图4-A反映了密码子相对使用度的相似性,有相同密码子使用偏好的物种离得更近,而有些亲缘关系接近的植物却并有着相似的密码子使用偏好。例如甘蓝单独分为一类,而非与油菜等亲缘物种归为一类,其余14种植物又分为2类,高粱单独为一类。基于15种植物δ8-FAD2基因完整序列构建的系统进化树(图4-B)则更能反映出物种基因序列相似性,亲缘关系接近的分为一类。由此可见,许多物种的分类在2个聚类中并不完全相同。然而,无论哪种分类方式,都有将木本植物单独划分出来的趋势,而草本植物中许多物种虽然亲缘关系较接近,在2个分类结果中却差异较大,表明物种间的亲缘关系并不是密码子使用偏好性的决定性因素。
3 结论与讨论
由于同义密码子的差异集中表现于密码子末位碱基,且密码子此位点选择压力较小,因此,常把GC3用于密码子使用模式分析[10]。ENC值同样是评价基因密码子偏好性的重要参考指标[27]。本研究表明,15种植物中,草本植物δ8-FAD2基因序列长度普遍大于木本植物,而密码子GC含量和GC3除高粱外都小于0.5,使用多种方式统计优势密码子,结果都表现为此基因偏好使用AT碱基,且偏好用A或T结尾,这一结果与晁岳恩等[28]的研究结果类似,是由于15种植物中仅高粱是禾本科植物,禾本科植物密码子偏好以G或C结尾,而双子叶作物则更偏好使用以A或T结尾的密码子[29]。15种植物δ8-FAD2基因ENC平均值为52.448,说明此基因密码子使用偏好性弱,这与前人的研究结果一致[30]。
本研究表明,15种植物δ8-FAD2基因密码子使用情况有较大差异,自然选择和碱基突变的影响是造成不同物种同一基因密码子使用出现偏差的主要原因[23,31]。在ENC-plot绘图分析中,油料木本植物除棉花外都偏离ENC标准曲线且分布相对集中,可能是由于木本植物受到选择压力情况相似,具有相似的密码子使用偏好,而棉花作为唯一一种1年生木本植物,生命周期短且基因序列相对其他木本植物较长,可以积累更多的变异,密码子使用偏好性被强烈的碱基突变左右。1年生草本油料植物如油菜、向日葵的ENC值接近预期曲线,密码子使用偏好性的主导因素是碱基突变,而豆科植物如大豆、花生等因受到长期定向选择育种而远离标准曲线[32-33]。此外,其他非油料作物除高粱外的ENC值均偏离期望曲线,说明大多数非油料作物密码子使用偏好性的主导因素是选择压力,这便导致非油料作物密码子使用偏好性远小于油料作物。PR2-plot绘图中,多数物种密码子末位碱基的使用都受到了自然选择的影响,且非油料作物的密码子第3位碱基的选择上偏好性较弱,因此得出,油料作物δ8-FAD2基因密码子使用偏好性强于非油料作物,这与ENC-plot绘图分析结果一致。
本研究结果表明,15种不同类型植物δ8-FAD2基因密码子使用偏好差异较大,油料作物的密码子使用偏好性要强于非油料作物,木本植物间其密码子偏好性的受压力情况基本类似,草本植物间各不相同,而大家普遍认为的物种间的亲缘关系并非密码子使用偏好性的决定性因素。由此推断,植物中δ8-FAD2基因的改变或许会间接改变其脂肪酸组分与油脂含量,要解决这个问题仍需今后进一步验证与分析。深入了解δ8-FAD2基因密码子使用偏好性有助于进一步理解脂肪酸转化与累积规律,通过基因调控改良油料作物质量,为寻找和培育更加优质的油料作物提供了方向。