耿树香,宁德鲁,李勇杰,陈海云
(云南省林业科学院,昆明 650201)
油橄榄是世界著名的优质木本油料树种,是木犀科木犀榄属的小乔木。栽培油橄榄OleaeuropaeaL.是从野生种OleachrysophyllaLam.经过OleaoleasterL.或Oleaeuropaeaoleaster进化而来的。橄榄油是油橄榄中最有价值的部分,其富含不饱和脂肪酸及维生素、类胡萝卜素、多酚类化合物和有机酸等[1-2]。目前,国外对油橄榄基因组方面的研究做了很多工作[3-10]。如对油橄榄栽培种莱星进行测序、组装,获得完整基因组;对油橄榄栽培种Farga使用RNA序列数据进行注释,产生了56 000多个蛋白质编码基因,同时进行测序、组装,获得完整基因组;研究发现结合siRNA中的一个油橄榄OD基因随其积累可导致FAD2不表达,抑制FAD2基因表达的结果是可导致油橄榄果中油酸含量增高。国内近年来对木本油料油脂合成代谢途径的转录组基因组学研究越来越多[11],如林萍[12]、Xia[13]等对普通油茶种子进行转录组测序分析,陈昊等[14]对油桐种子3个不同发育时期转录组进行分析,丁健[15]对沙棘果油脂积累转录组进行了系统的分析。目前,对影响油橄榄油脂合成的关键基因及途径尚未清晰,特别是油橄榄果中髙积累油酸的机制未见报道。对油橄榄果油脂和脂肪酸组分的动态变化规律,以及发育过程中相关功能基因的转录表达模式进行研究,可为通过现代组学技术探索油橄榄油脂合成积累机理研究奠定基础,也为进一步提高油橄榄油脂含量提供技术支撐。
以云南永仁引种油橄榄佛奥(FA)及鄂植8号(EZ)品种为实验对象,取2个油橄榄品种授粉后60 d(5月)、120 d(7月)、180 d(9月),分别在所选油橄榄品种株样树冠中部的东、西、南、北4个方位随机采摘果实10个,立即置于液氮中,于-80℃冰箱保存,备用。
重蒸水;CTAB、水饱和酚、三氯甲烷、异戊醇、无水乙醇,分析纯;安捷伦RNA提取试剂盒、TruSeq RNA样品准备试剂盒,美国Illumina公司;超级II逆转录酶,美国Invitrogen公司;AgencourtAMPure XP-Medium,美国Agencourt公司;TaKaRa Ex Taq Hot Start版、HiSeq 4000 SBS工具包、HiSeq 4000 PE Cluster Kit,美国Illumina公司。
荧光定量PCR仪,瑞士Roche;冷冻混合球球磨仪,德国莱驰;日本奥林巴斯显微成像系统;Nano drop 2000超微量紫外可见分光光度计,美国Thermo公司;Illumina genome Analyzer测序仪、Cluster generation、HiSeq System,美国Illumina公司;Agilent 2100 Bioanalyzer,美国安捷伦公司;Eppendorf高速低温离心机、全套Eppendorf微量移液器。
1.2.1 油橄榄果实RNA的提取
油橄榄果实RNA的提取方法按照TIANGEN®多糖多酚植物总RNA提取试剂盒说明书进行。
1.2.2 cDNA文库构建和测序
油橄榄佛奥(FA)及鄂植8号(EZ)的转录组测序由成都生命基线科技有限公司完成。提取的样品总RNA用DNasel消化基因组DNA,经质检合格后,用带有Oligo(dT)的磁珠富集真核生物mRNA;加入打断试剂在恒温混匀仪中将mRNA打断成150~200 nt的短片段,以短片段mRNA为模板,用6碱基随机引物合成一链cDNA;然后配制二链合成反应体系合成二链cDNA,并利用试剂盒纯化双链cDNA;纯化后的cDNA先进行黏性末端修复,随后在cDNA的3′末端加上碱基A并连接接头,最后进行片段大小选择和PCR扩增;构建好的文库用Agilent 2100 Bioanalyzer和ABI StepOnePlus Real-Time PCR Syst实时荧光定量系统质检合格后,进行测序。
测序得到的原始数据经过滤和数据质控后得到高质量序列数据,使用HISAT2软件将高质量序列数据比对到参考基因/基因组序列后,统计其在二者上的分布情况,比对质控合格后才能进行定量分析、功能富集分析、可变剪接、新转录组本预测及注释、SNP/InDel检测和基因融合等后续一系列分析。
1.2.3 转录组基因功能注释和表达分析
参考油橄榄基因组数据库进行功能注释。基因表达量的计算采用FPKM(Fragments per Kilobase Million),即每100万个比对上的测序序列到外显子的每1 000个碱基上的可读序列个数。在RNA-Seq分析中,可通过对测序序列的计数来估计基因的表达水平。一个基因表达水平的直接体现就是其两端不能再延长的序列的丰度情况,两端不能再延长的序列丰度程度越高,则基因表达水平越高。Reads计数除了与基因的真实表达水平成正比外,还与基因的长度和测序深度呈正相关。
1.2.4 差异基因表达分析
差异基因表主要用于考察各发育阶段间的基因表达差异,主要参照Audic法。在得到差异检验的错误发现率(False discovery rate,FDR)值的同时,根据基因的表达量(FPKM)计算该基因2个样本间的差异表达倍数。FDR值越小,差异倍数越大,则表示表达差异越显著。在本研究数据分析中,将基因表达矩阵分为随机组和对照组,使用DEGSeq软件对差异基因表达进行分析,对差异检验的概率作多重假设检验校正,通过控制FDR来决定概率的域值,分析中取p不大于0.05为筛选差异基因的阈值。
1.2.5 差异基因表达Pathway及GO分析
以油橄榄基因组数据为参考基因进行构建人工比对数据库,以佛奥和鄂植8号测得的具有编码蛋白序列的289、593、580个两端不能再延长的序列基因在KEGG数据库中进行功能注释,并运用人工比对进行功能分类。Pathway分析同时还借助GO和MapMan(3.5.1R2)进行分析。
佛奥(FA)和鄂植8号(EZ)的鲜果在不同的成熟时期果实的形态差异明显,参照GB/T 14772—2008中提油方法,对佛奥和鄂植8号的鲜果在果实成熟阶段的60 d(5月)、120 d(7月)、180 d(9月)对鲜果含油率进行测定,结果如图1所示。
从图1可以看出,佛奥的含油率显著高于鄂植8号。伴随着果实成熟,果实颜色逐渐变黑,2个油橄榄品种含油率显著增加,呈上升趋势。因此,本研究选取成熟过程中的佛奥和鄂植8号的鲜果进行转录组测序,探究参与油橄榄脂肪酸代谢途径的表达差异基因,通过转录组分析解析2个品种间含油率差异的原因。
图1 佛奥(FA)与鄂植8号(EZ)油橄榄鲜果含油率
经检测,提取2个品种3个时期油橄榄鲜果的RNA样品28S∶18S值均在0.5~1.3间,反应RNA完整性的RIN值大于7.5,初提质量良好,符合进一步检测并测序的要求。浓度和纯度检测结果显示大部分样本RNA提取完整性好,无降解,无蛋白、多糖、多酚和DNA等杂质污染,完全达到文库构建要求(RIN值>7)。
表1 油橄榄成熟过程中果实转录组基本数据
由表1可知,通过Illumina测序,FA5得到46 764 072条高质量序列数据,FA7得到49 780 566条高质量序列数据,FA9得到49 689 152条高质量序列数据,EZ5得到46 646 112条高质量序列数据,EZ7得到49 435 120条高质量序列数据,EZ9得到47 278 558条高质量序列数据,平均长度在327 bp。将2个品种的成熟过程中的高质量序列数据比对到油橄榄基因组,FA5、FA7、FA9、EZ5、EZ7、EZ9基因组分别达到55.48%、55.86%、45.43%、55.39%、54.79%、58.22%的匹配,所比对到的表达基因分别为26 231、26 079、25 292、27 255、25 994、25 344个,所比对的测序所得序列与基因序列达到35.29%、37.99%、27.13%、34.41%、35.71%、37.32%的匹配。两端不能再延长的序列长度在200 bp以上。
注:A、B、C、D、E、F分别为FA7-vs-FA5、FA9-vs-FA7、FA9-vs-FA5、EZ7-vs-EZ5、EZ9-vs-EZ7、EZ9-vs-EZ5。
图2 油橄榄成熟过程中果实差异基因统计
从图2可以看出,佛奥的不同月份发育时期之间差异基因的表达(上调或下调)变化不明显,而鄂植8号5月与7月、5月与9月的差异基因的表达差异较大,下调的基因数量是上调基因数量的两倍,推测可能与果实的成熟和发育相关。颚植8号油橄榄品种在果实成熟初期及末期差异基因数较多,说明其成熟前后,差异基因表达较多,这与果实成熟规律趋于一致,即果实成熟初期,细胞分裂旺盛,内含物质新陈代谢旺盛,而发育后期,油脂累积趋于稳定所致。
表2 油橄榄油脂生物合成途径中关键基因的表达
从表2可以看出:橄榄油生物合成途径中第一步的关键酶是生物素羧基载体蛋白(Biotin carboxyl carrier proteins,BCCP),EZ7的基因表达最高,FPKM为3 338.30,FA5最低,FPKM为482.96,FA7为FA中表达量最高的,FPKM为2 351.68;第二步反应中的β-酮酰基ACP还原酶(Beta-ketoacyl-ACP reductase,FABG)基因表达量最高的是EZ7,FPKM为3 063.45,FA5最低,FPKM为811.36,FA7为FA中表达量最高的,FPKM为2 494.31;β-羟酰ACP脱氢酶(Beta-hydroxyacyl-ACP dehydrases,FABZ)基因表达量最高的是EZ7,FPKM为2 708.94,FA5最低,FPKM为657.02,FA7为FA中表达量最高的,FPKM为1 547.22。在油橄榄的整个成熟期,两品种油橄榄果实在7月脂肪酸的生物合成中关键酶基因表达量最高。
脂肪酸去饱和酶有许多种,可以将其分为两大类,一类在脂肪酸形成甘油酯之前引入第一个双键时起作用,仅包含一种酶,即硬脂酰ACP去饱和酶(stearoyl-ACP desaturase,SACPD),主要存在于质体中,是唯一的一种可溶性去饱和酶,另外一类是形成甘油酯之后,在脂肪酸基团进一步去饱和过程中起作用,包括油酸去饱和酶(FAD2-4和FAD2-5)和亚油酸去饱和酶(FAD3-3)。
油橄榄不饱和脂肪酸形成相关酶中omega-6油酸去饱和酶(FAD2)基因表达量最高的是FA5,FPKM为415.47,FA7基因表达量最低,为70.12,EZ5为EZ中表达量最高的,FPKM为366.46,两品种均为5月样品具有高表达量的FAD2。油橄榄果中的β-酮酰基ACP合成酶(Beta-ketoacyl-ACP synthases,KAS)中的KASI基因是启动脂肪酸合成的关键酶,在鄂植8号果实的3个发育时期,随油橄榄成熟度增加,油橄榄果中的KAS基因的表达水平不断增加,EZ5中FPKM为227.66,EZ9为416.10,KAS基因的表达水平影响橄榄油中脂肪酸的合成。
表3 2个品种不同发育相邻时期脂肪酸合成与降解差异基因表达
在6个油橄榄样本中总共检测出1 886个基因具有表达。由表3可知:佛奥果实FA5-vs-FA7发育时期,脂肪酸合成路径乙酰辅酶A合成丙二酰辅酶A,1个基因发生了上调表达,而在脂肪酸降解途径中有4个基因发生了上调表达,2个基因发生了下调表达;FA7-vs-FA9时期,脂肪酸合成途径上有1个基因发生下调表达,没有注释到上调表达的候选基因,脂肪酸降解途径发生了1个基因的下调表达,2个基因的上调表达;FA5-vs-FA9时期,脂肪酸合成路径上被注释到的基因有2个发生了下调表达,而没有上调表达的基因,脂肪酸降解途径被注释到的基因有5个发生了上调表达,有4个发生了下调表达;鄂植8号果实EZ5-vs-EZ7时期,在脂肪酸合成路径上被注释到的基因有3个发生了上调表达,有3个发生了下调表达,脂肪酸降解途径上被注释到的基因有3个发生了上调表达,有5个发生了下调表达;EZ7-vs-EZ9时期,脂肪酸合成路径上注释到的基因有1个发生了上调,没有注释到下调基因,脂肪酸降解途径上注释到的基因有3个发生了上调表达,有3个发生了下调表达;EZ5-vs-EZ9时期,脂肪酸合成路径上注释到的基因有4个发生了上调表达,有2个基因发生了下调表达,脂肪酸降解途径上注释到的基因有6个发生上调表达,有7个发生下调表达。
根据差异基因检测结果,使用gplots软件包进行层次聚类分析。对1 886个基因进行筛选,将FPKM 值低于200的差异基因去除,对筛选后的208个与油脂合成相关的基因采用Omicshare在线工具(http://www.omicshare.com)作图并进行聚类分析,结果见图3。
图3 油橄榄果与油脂合成相关基因聚类分析
从图3可以看出,2个品种油橄榄参与油脂合成的差异基因表达模式在5月较为相似,每个品种的7月和9月差异基因的表达模式较为相似,果实成熟后期(7月和9月)与果实生长初期(5月)相比,大多数基因发生了表达量上调,可能与果实的成熟有关。
为寻找脂肪合成的相关基因,以脂肪合成初期(FA5)与合成盛期(FA9)的表达谱比对,分析比对脂肪酸合成通路的差异基因,包括脂肪酸合成通路、脂肪酸链延伸通路以及不饱和脂肪酸的合成通路等。结果显示:在脂肪合成盛期上调表达的基因均为与橄榄油脂肪酸合成相关的基因,有β-酮酰基ACP合成酶、硬脂酰ACP去饱和酶(SACPD)等。
(1)以含油率差异显著的2个品种(高含油率品种佛奥(FA),9月油橄榄果含油率为23.16%和低含油率品种鄂植8号(EZ),9月含油率为15.17%)为材料,转录组分析探究了其果实发育3个关键时期(5月、7月和9月)基因表达与油脂积累的关系。研究发现,在FA7-vs-FA5、FA9-vs-FA7、FA9-vs-FA5、EZ7-vs-EZ5、EZ9-vs-EZ7、EZ9-vs-EZ5 6个阶段中分别找到783、634、1 518、716、486和1 017个差异基因上调,662、614、1 467、1 478、594和2 210个差异基因下调。
(2)在脂肪酸代谢途径中富集到的KAS、FAD、BCCP、FABG、EAR等基因可能是油橄榄果油脂和脂肪酸生物合成关键基因,其后续通过表达载体构建和蛋白异源表达等对基因功能进行验证,为进一步阐明油橄榄果油脂合成途径及其关键酶的功能,揭示油橄榄果油脂合成的分子机理,进而为建立油橄榄果油脂异源合成系统奠定基础,而不同时期油橄榄果差异基因表达的掌握对研究不同组织中生物活性成分的品质形成机制具有重要作用。
(3)脂肪酸合成、甘油酯代谢和甘油磷脂代谢等途径是影响油橄榄油脂合成的关键途径,在FA-vs-EZ的脂类代谢途径中,仅有脂肪酸生物合成途径中的差异基因表达呈显著富集,表明油橄榄果油脂在从头合成中即产生明显差异,油橄榄果中与脂肪酸合成相关的关键基因的表达水平均随果实成熟度的增加呈上升趋势。