3个不同品种百香果转录组分析

2019-07-02 11:27
种子 2019年5期
关键词:满天星差异基因百香果

(贵州省农业科学院果树科学研究所,贵阳 550006)

百香果(PassifloraeduliaSims)又名鸡蛋果、西番莲、巴西果,为西番莲科西番莲属多年生藤本植物。全球已发现超过500个品种,其中可供食用的有20个品种,多数栽培种为黄百香果(P.edulisvar.flovioarpaDegener)、紫百香果(P.edulisSims)等。因其果实多汁,且能散发出芒果、草莓、香蕉、苹果、菠萝等多种水果的香味,故有“果汁之王”的美誉。

图1 转录组数据分析

百香果除具有一般水果的特性,还具有很高的营养价值和药用价值。邓博一等研究表明,每100 mL百香果果汁中含有21.23 mg维生素C和65.00 mg蛋白质;每100 g果肉中含有儿童生长发育必需氨基酸组氨酸28.05 mg和精氨酸3.94 mg,必需氨基酸苏氨酸9.43 mg,缬氨酸6.63 mg,蛋氨酸0.56 mg,赖氨酸8.27 mg,异亮氨酸6.92 mg,亮氨酸6.43 mg,苯丙氨酸5.61 mg,大量元素Ca 508.54 mg,Mg 21.22 mg,微量元素Fe 0.39 mg,Mn 0.11 mg,Zn 0.46 mg[1]。此外,百香果中还含有多种生物活性物质,主要包括黄酮类化合物如异荭草素、木犀草素、芹菜素、山奈酚等[2-3],油脂如脂肪酸、不饱和烃类等[4]。黄酮类化合物是百香果中的重要化学成分。Deng等[5]采用高架十字迷宫实验(elevated plus-maze test,EPM)和自发活动测定试验(spontaneous activity test,SA),分别测定了百香果乙醇、正丁醇及水等提取物对小鼠的影响,结果表明低剂量时表现为抗焦虑特性,高剂量时表现为镇静特性。采用核磁共振技术对提取物进行鉴定分析表明,乙醇提取物为异荭草素。Farid等[6]对33 名膝关节骨性关节炎(Knee osteoarthritis,OA)患者在服用百香果果皮提取物30 d和60 d分别评估其骨关节炎指数,发现服用百香果果皮提取物的患者较对照组其疼痛、僵直等指数均显著降低,结果表明,百香果果皮中的黄酮类化合物具有抗氧化和抗炎症的功效。

采用第2代Illumina高通量测序技术可在较短时间内获取并分析海量数据。近年来,利用这一技术已成功发掘和鉴定了多种植物与生理过程、生长发育及次生代谢产物生物合成的相关基因。赵德刚等[7]对10年以上树龄的杜仲(EucommiaulmoidesOliv.)雌雄株转录组数据库分析比对,研究杜仲雌雄株之间的基因表达差异。Zhang等[8]对茯苓(Wolfiporiacocos)的转录组数据库进行分析,获得了与茯苓次生代谢产物三萜类物质合成和菌核生长发育的相关基因。本研究以百香果果皮和果肉为主要研究对象,通过对3个不同品种的百香果转录组测序和分析,可以有效发掘和鉴定百香果次生代谢产物合成相关酶的编码基因及代谢调控相关基因,为克隆开发百香果重要功能基因奠定基础,及通过生物工程手段提高百香果药用成分含量、选育高品质百香果、规范化种植和质量控制提供理论基础和技术支撑。

1 材料与方法

1.1 实验材料

以黄果、满天星和紫果3个不同品种百香果果皮和果肉为转录组测序材料。

1.2 样品处理及转录组数据库分析流程

样品RNA提取、文库构建、库检、上机测序,委托美因基因公司完成。获得的测序结果,进行了如图1所示的数据分析。

2 结果与分析

2.1 3个不同品种百香果转录组测序产量及组装质量分析

对黄果、满天星、紫果3个百香果品种果皮和果肉部分进行转录组测序后,分别获得黄果果皮47 875 830条、果肉44 325 678条,满天星果皮47 019 772条、果肉45 472 434条,紫果果皮48 789 846条、果肉49 372 968条Clean reads片段,包含黄果果皮7 181 374 500 nt、果肉6 648 851 700 nt,满天星果皮7 052 965 800 nt、果肉6 820 865 100 nt,紫果果皮7 318 476 900 nt、果肉7 405 945 200 nt核苷酸序列信息,序列长度大于20个核苷酸序列(Q 20)值分别为黄果果皮98.13%、果肉98.00%,满天星果皮97.67%、果肉97.37%,紫果果皮96.96%、果肉98.17%,中间未知序列片段(N%)均为0.00%,GC核苷酸含量(GC%)分别为黄果果皮45.05%、果肉46.23%,满天星果皮45.39%、果肉45.71%,紫果果皮46.04%、果肉45.93% (表1)。测序结果可用于数据组装。

表1 百香果黄果、满天星和紫果转录组测序产量分析

样品总原始读数总读数核苷酸序列总长度/ntQ20/%N/%GC/%黄果果皮5033138247875830718137450098.130.0045.05黄果果肉4578153144325678664885170098.000.0046.23满天星果皮4893625447019772705296580097.670.0045.39满天星果肉4639598445472434682086510097.370.0045.71紫果果皮4998831848789846731847690096.960.0046.04紫果果肉5016257449372968740594520098.170.0045.93

图2 百香果黄果转录组的Unigene数据长度分布图

图3 百香果满天星转录组的Unigene数据长度分布图

使用Trinity软件(https://github.com/trinityrnaseq/trinityrnaseq/wiki)对黄果、满天星和紫果的Clean reads片段进行拼接,获得黄果34 968条、满天星41 896条、紫果41 701条Unigene片段。其中黄果长度300~500 nt的Unigene片段11 368条,500~1 000 nt 8 029条,1 000~2 000 nt 6540条,大于2 000 nt的9 031条,平均长度1 487 nt;满天星长度300~500 nt的Unigene片段16 098条,500~1 000 nt 9 967条,1 000~2 000 nt 6 573条,大于2 000 nt的9 258条,平均长度1 361 nt;紫果长度300~500 nt的Unigene片段14 291条,500~1 000 nt的10 557条,1 000~2 000 nt的7 530条,大于2 000 nt的9 323条,平均长度1 329 nt。黄果、满天星和紫果Unigene长度分布见图2,图3,图4。综合所有样品,最终拼接组装获得78 583条All Unigene片段,平均长度1 668 nt,核苷酸序列总长度131 135 737 nt,N 50为3 047 nt (表2),其长度为300~500 nt 24 934条,500~1 000 nt 16 641条,1 000~2 000 nt 13 229条,大于2 000 nt的23 779条(图5)。

2.2 差异表达基因筛选

使用DESeq软件进行样品组间的差异表达分析,设置筛选标准为差异倍数(Fold Change) ≥2或差异倍数≤1/2且错误发生率(False Discovery Rate,FDR)<0.01,不同样品间差异基因个数如图6所示。

图6 差异基因维恩图

图5 百香果黄果、满天星和紫果转录组的All Unigene数据长度分布图

2.3 差异基因GO富集与KEGG富集分析

使用topGO软件进行差异表达基因的Gene Ontology (GO)富集分析,统计方法为KS-检验(Kolmogorov-Smirnov test),结果如图7所示。在生物过程(biological process)、细胞组分(cellular component)和分子功能(molecular function)3大类别上,黄果、满天星和紫果间差异基因均有分布。黄果与满天星差异基因主要集中在乙酰氨基葡萄糖转移酶(acetylglucosaminyltransferase),代谢过程(metabolic process),膜(membrane),水解酶活性(hydrolase activity)等条目中;黄果与紫果差异基因主要分布在氧化还原酶活性(oxidoreductase activity),催化活性(catalytic activity),分裂后期促进复合物(anaphase-promoting complex),氧化还原过程(oxidation-reduction process),代谢过程(metabolic process)等条目中;黄果与满天星差异基因主要集中在DNA整合(DNA integration),氧化还原过程,细胞内(intracellular),核糖体(ribosome),氧化还原酶活性等条目中。

通过差异表达基因的通路(Pathway)显著性富集分析,以KEGG (Kyoto Encyclopedia of Genes and Genomes)数据库中Pathway为单位,应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway。结果如图8所示。黄果与满天星在氧化磷酸化(Oxidative phosphorylation),吞噬体(Phagosome),植物激素信号转导(Plant hormone signal transduction),核糖体内化(Ribosome)通路均有差异表达基因富集,其中在Phagosome通路富集因子(Enrichment Factor)和log10(Q value)值均最大,表明差异表达基因在Phagosome通路中富集可能性最高,且富集显著性越可靠,可见黄果与满天星在细胞胞吞作用过程中存在较大差异。黄果与紫果在玉米素生物合成(Zeatin biosynthesis),赖氨酸生物合成(Lysine biosynthesis),缬氨酸生物合成(Valine),亮氨酸和异亮氨酸生物合成(leucine and isoleucine biosynthesis),糖酵解(Glycolysis/Gluconeogenesis)等通路富集有差异基因,其中Zeatin biosynthesis通路富集因子和log10值均较高,在Glycolysis/Gluconeogenesis通路富集因子虽较低,但log10值较高,表明黄果和紫果在玉米素生物合成和糖酵解等途径中存在较大差异。满天星与紫果在C 5分枝二元酸代谢(C 5-Branched dibasic acid metabolism),花生四烯酸代谢Arachidonic acid metabolism,玉米素生物合成,核黄素代谢(Riboflavin metabolism),维生素B6代谢(Vitamin B6metabolism),赖氨酸生物合成,缬氨酸、亮氨酸和异亮氨酸生物合成(Valine,leucine and isoleucine biosynthesis)等通路富集有差异基因,其中异亮氨酸生物合成通路富集因子和log10值均较高,表明满天星和紫果在缬氨酸、亮氨酸和异亮氨酸生物合成中存在较大差异。

注:纵坐标为富集的GO term;横坐标为该term中差异基因个数。不同颜色用来区分生物过程、细胞组分和分子功能。图7 GO富集柱状图

表2 百香果黄果、满天星和紫果转录组Unigene数据组装质量统计

样品总条数总长度/nt平均长度/ntN50黄果349685200026314872624满天星418965702159213612593紫果417015542508513292330所有样品7858313113573716683047

注:图中每个图形表示1个KEGG通路。纵坐标为 log10(Q value)值,纵坐标越大,表示差异表达基因在该通路中的富集显著性越可靠;横坐标为富集因子,富集因子越大,表示差异表达基因在该通路中的富集水平越显著。图8 差异基因KEGG富集散点图

3 讨 论

通过对黄果、满天星和紫果3个不同百香果果皮及果肉进行转录组测序,分别获得黄果果皮47 875 830条、果肉44 325 678条,满天星果皮47 019 772条、果肉45 472 434条,紫果果皮48 789 846条、果肉49 372 968条Clean reads片段,拼接组装后分别获得平均长度为1 487 nt的黄果34 968条Unigene片段、平均长度为1 361 nt的满天星41 896条Unigene片段和平均长度为1 329 nt的紫果41 701条Unigene片段。通过对差异表达基因的GO富集分析表明,黄果、满天星和紫果在生物过程、细胞组分和分子功能三大类别上均分布有差异基因。KEGG富集分析表明,黄果与满天星转录水平的差异主要集中在细胞胞吞作用、氧化磷酸化、植物激素信号转导等方面;黄果与紫果转录水平的差异主要集中在玉米素生物合成,赖氨酸、缬氨酸、亮氨酸和异亮氨酸4种人体必需氨基酸生物合成以及糖酵解途径等方面;满天星与紫果转录水平差异主要集中在脂肪酸、维生素代谢,玉米素生物合成,赖氨酸、缬氨酸、亮氨酸和异亮氨酸生物合成等方面。

张弛等[9]针对大豆落花落荚问题,选取花器官脱落性质存在差异的4个大豆(Glycinemax)栽培种花序进行转录组测序,共获得原始数据20 GB,其中有效数据14.87 GB。通过对转录组数据分析发现,少荚与多荚品种花序转录水平差异主要集中在胁迫应答、物质代谢、刺激应答和病害抗性等方面,与脱落通路直接相关的基因在转录水平上并无显著差异。蒋红刚等[10]对“大红袍”花椒(Zanthoxylumbungeamum)皮刺起始分化的茎尖节点组织进行转录组测序,共获得56 242 196条数据片段,对原始数据进行拼接组装后,最终获得45 057条Unigene片段,通过检索注释,找到参与植物形态发生的基因,如参与极轴分化的YABBY基因家族和响应生长素浓度的ARF基因家族等,以期采用原位杂交技术研究花椒在皮刺分化过程中YABBY和ARF基因家族的表达情况,进一步筛选获得参与皮刺分化的关键基因,对关键基因进行干扰或敲除,为培育品质优良的无刺花椒提供依据。

通过对黄果、满天星和紫果3个不同品种百香果果皮及果肉进行转录组测序,为百香果基因的分子克隆和功能鉴定研究提供了较好的数据支持,通过差异表达基因功能注释,可为百香果氨基酸、黄酮类化合物和油脂等生物活性物质的合成及代谢研究、关键酶基因的克隆、物质的代谢调控以及百香果的优良品种选育提供线索和依据。

猜你喜欢
满天星差异基因百香果
满天星
仰望星空
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
落叶在跳舞
满天星
莫兰迪的夏天
五月的一抹新绿
蒋湘兰:百香果 香百家
紫檀芪处理对酿酒酵母基因组表达变化的影响
满天星