张 舒,王长远,*,冯玉超,盛亚男,富天昕,张艺玮,姜颖俊,于 淼,张丽媛
(1.黑龙江八一农垦大学食品学院,黑龙江 大庆 163319;2.国家杂粮工程技术研究中心,黑龙江 大庆 163319)
代谢组学主要是将某种物质内所有小分子代谢物(氨基酸、糖醇类化合物、脂类等)在不同生长环境、时期以及外界刺激下的代谢应答变化作为研究对象,并对其进行定性、定量的多种统计分析[1],在物质相关指标分析的基础上,通过高通量检测和数据处理的手段,进行系统性信息整合,从而对生物体代谢规律进行研究的一门科学[2]。代谢组学分析不仅可以观察物质代谢产物含量的变化,还可以从分子水平掌握其动态信息,将代谢产物与时间、地域、环境等因素联系起来探究代谢产物与各因素间的变化规律,从整体水平上评价物质的生物效应[3-4]。目前国内外主要通过检测分析矿物质元素[5]、稳定性同位素[6-7]、核磁共振[8]、近红外光谱[9]、DNA指纹、气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)[10]、液相色谱-质谱[11-12]等分析方法进行农产品品质、产地鉴别和溯源的研究[13];每种分析手段都有优势,但目前靠单一的分析手段还无法获得代谢物的全部信息,因此需要采取多种方法和技术联合使用。
目前稻米是世界上最为主要的粮食之一,是人类和牲畜摄取碳水化合物的主要来源,具有适应性强、产量高、经济效益高的特点[14]。稻米中含有种类丰富的初生代谢物和次生代谢物,存在基本营养物质外还包含白藜芦醇、儿茶素、生物碱等生物活性物质。除了本身遗传因素的影响,水质、局部气候、土壤条件、昼夜温差等环境因素对稻米品质的影响也十分显著,这些因素塑造了具有典型地域特色的地理标志产品,使栽培具有明显的区域性[15]。Kawasaki等[16]针对日本、中国、澳大利亚、美国和越南5 个国家大米样品中的同位素11B/10B和87Sr/86Sr值采用电感耦合等离子体质谱进行分析,发现2 种同位素值差距较大。王希越等[17]通过GC-MS技术对不同产地稻米油脂中脂肪酸进行研究,发现不同品种的稻米脂肪轮廓存在较大差异。由于我国稻米种植区域广、种类多、品质差距较大,为了防控以次充好的现象,探究一种高效、可靠的稻米产地鉴别及溯源方法尤为重要。本实验以黑龙江省五常地理标志稻米保护区和查哈阳地理标志稻米保护区的水稻样本为研究对象,通过GC-MS技术的代谢组学平台,对2 个地理标志性产地的稻米进行代谢物的差异分析,探究产地对稻米代谢及代谢产物的影响情况,以期为稻米产地鉴别及溯源提供数据支持和理论参考。
稻米采自黑龙江省查哈阳和五常地理标志性产地,依据代表性采样原则,采用五点采样法进行随机采集,每个采样点采集1~2 kg稻穗。每个产区选取30 个样本,五常地区选择9 个乡镇布点进行样本的采集,稻米品种主要为稻花香水稻,分别为绥粳4、五优4号、龙稻16、创新918;查哈阳地区选择6 个管理区布点进行样本的采集,稻米品种分别为绥粳4、五优4号、龙粳26、龙粳29、龙粳31、龙粳39、松粳9。稻米采集自2017年。
甲醇、吡啶(色谱级,纯度≥99.9%) 上海阿拉丁生化科技股份有限公司;2-氯苯丙氨酸、甲氧基胺盐酸盐、99%双(三甲基硅烷基)三氟乙酰胺+1%三甲基氯硅烷、N,O-双(三甲基硅)三氟乙酰胺 麦克林试剂有限公司。
7890A/5975C GC-MS联用仪 美国Agilent公司;色谱柱HP-5ms(30 m×0.25 mm,0.25 μm) 美国Agilent J&W Scientific公司。
1.3.1 样品采集及处理
稻米样品的前处理采用冯玉超等[18]的方法。
1.3.2 GC-MS检测
进样口温度280 ℃;电子电离源温度230 ℃;四极杆温度150 ℃;高纯氦气(纯度>99.999%)作为载气,不分流进样,进样量1.0 μL。升温程序:初始温度80 ℃,维持2 min,10 ℃/min升至320 ℃,并维持6 min。采用全扫描模式进行质谱检测,质量扫描范围m/z50~550。
在R软件平台下采用XCMS软件对GC-MS得到的原始数据进行特征峰的提取和处理,并利用SIMCA软件进行多元统计分析。通过主成分分析(principal component analysis,PCA)对数据进行降维处理,并对整体的分布趋势进行预览,然后采用正交偏最小二乘-判别分析(orthogonal partial least square-discriminant analysis,OPLS-DA)对其进行建模,之后根据Student’st检验的P值小于0.05,同时OPLS-DA模型主成分的变异权重参数(variable importance in projection,VIP)值大于1,进行差异性代谢物的筛选。差异性代谢物根据保留时间及质荷比在Fiehn代谢组数据库进行注释,对筛选出的差异代谢物进行KEGG注释,检索出差异代谢物映射的所有通路,然后通过富集分析和拓扑分析对差异代谢物所在的通路进一步筛选,找到与代谢物差异相关性最高的关键通路。
代谢物通过Fiehn数据库进行定性,五常地区共检测出127 个代谢物,查哈阳地区共检测出142 个代谢物。两产地相比较,同时存在的代谢物有102 个,五常稻米特有代谢物25 个,查哈阳稻米特有代谢物40 个。代谢物定性结果如表1所示。
表1 代谢物定性结果Table 1 Qualitative results of metabolites in rice
续表1
续表1
续表1
由表1可知,两产地共定性出包括氨基酸及其衍生物、脂肪酸及其衍生物、有机酸、糖类及其衍生物、固醇类及其他类物质代谢物167 种;其中其他类物质多为醇、烷、腈以及少部分生物活性物质。两产地特有的代谢物相比较,查哈阳特有代谢物中糖类物质和其他代谢物所占比例显著高于五常,两产地特有的代谢物的氨基酸和脂肪酸类所占比例均较少,查哈阳包含种类略低于五常;此外五常代谢物中含有亮氨酸等必需氨基酸,而查哈阳未检测出必需氨基酸物质;查哈阳的特有代谢物中包含一种固醇类代谢物二氢胆固醇,而五常地区的特有代谢物无固醇类代谢物。由此说明,相同品种的稻米,由于产地不同,其代谢物组分的种类和含量也具有一定的差异,代谢物的组成和含量是影响稻米风味品质的重要指标之一[19]。
图1 查哈阳与五常地区样本的PCA模型得分散点图Fig. 1 Score scatter plot of PCA model for rice samples from Chahayang and Wuchang
PCA能够直观显示样本间的分组、变化趋势和相似性关系,但差异变量会分布在各PC上,无法在后面的分析中将其剔除做更准确的分析。而OPLS-DA是多元统计分析方法中一种常用的有监督的分析方法,釆用偏最小二乘法对高维数据降维,然后再用线性判别,可除去代谢物中与分类变量不相关的正交变量,这样不但实现了数据的可视化,而且取得了较好的后期判别效果[20]。
图2 查哈阳对五常地区样本的OPLS-DA模型得分散点图Fig. 2 Score scatter plot of OPLS-DA model for rice samples from Chahayang and Wuchang
图3 查哈阳地区对五常地区样本的OPLS-DA模型的置换检验结果Fig. 3 Permutation test of OPLS-DA model for rice samples from Chahayang and Wuchang
如图3所示,R2和Q2的回归线与横坐标交叉或者小于0,说明评估模型可靠有效[22]。R2代表Y变量的可解释性,Q2代表模型的可预测性,原模型比较接近1,说明建立的模型比较符合样本数据的真实情况;原模型Q2大于0.5证明原模型可以较好地解释2 组样本之间的差异[23]。Q2于Y轴的截距是负值,且置换检验得到的R2=-0.13和Q2=-0.99均小于OPLS-DA置换检验中和Q2的原始值,由此可得此模型无过拟合现象。
筛选两产地间稻米差异代谢物的标准为OPLS-DA模型主成分的VIP值大于1且t检验的P值小于0.05,结合Fiehn数据库通过保留时间等条件与库中物质进行匹配,从而进行两产地稻米差异代谢物的定性,如表2所示。
差异代谢物是两产地同时存在的,但是含量上存在显著差异。查哈阳与五常稻米代谢物对比,共筛选出32 个差异代谢物,多数为糖类以及糖类的衍生物,还有少量有机酸、氨基酸、脂肪酸、固醇类及其他类物质。由表2可知,这32 个差异物质中,查哈阳稻米样本中有13 个代谢物的含量低于五常,这些物质多数属于其他类物质,主要为生物活性物质酚类、醇类、腈类等;也包括少数的脂肪酸。查哈阳稻米样本中有19 个代谢物的含量高于五常,这些物质多数为糖类及糖类的衍生物,倍性变化在0.34~2.44 倍之间。研究表明适宜的温度和充足光照有益于稻米强势籽粒的生长,而强势籽粒会提早进入淀粉糖快速累积的时期,使干物质积累多,可塑溶解的双链糖含量高,从而对稻米中糖类物质的含量和成分有较大的影响[24-25]。查哈阳地区属于寒温带大陆季风气候,日照时数为2 773 h,而五常地区属于中温带大陆性季风气候,日照时数为2 629 h,不同的气候条件可能是导致查哈阳稻米中糖类含量高于五常的主要原因。此外查哈阳地理标志稻米保护区的土壤类型以草甸黑钙土为主,具有疏松、肥沃、种植强度低的特点,而五常地理标志稻米保护区以层厚,基础肥力高的黑土为主,不同土壤的土壤水势对稻米代谢物的影响也会有较大差异[26]。
表2 差异代谢物定性结果Table 2 Qualitative results of differential metabolites
如图4所示,五常样本前13 个代谢物的表达量明显高于查哈阳样本代谢物的表达量,多数为酚类、醇类、萜类等物质,13 个代谢物中检测出一个数据库中检索不到的未知物,该未知物在代谢通路中表达量和其余12 个已知物具有相似的高表达,故推断该未知物的结构也属于酚类、醇类、萜类等物质。剩余的19 个差异代谢物的表达量查哈阳明显高于五常,这19 个差异代谢物多数为糖以及糖的衍生物,如左旋葡聚糖、半乳糖醇5、异麦芽酮糖醇、1,5-脱水葡萄糖醇等,可见查哈阳稻米可为人体提供更多的碳水化合物;此外查哈阳地区稻米的异亮氨酸、瓜氨酸等必需氨基酸的表达量也较高。通过层次聚类分析可以看出,产地对稻米中各类代谢物的含量具有显著影响,而差异代谢物是众多代谢物中因产地不同而导致含量变化显著的物质,则差异代谢物对于稻米产地鉴别具有一定的参考意义。
植物在生长过程中需要经过多种物质和反应共同调控,是十分复杂的代谢过程,并不能从某一种物质的含量高低进行整体判断,因此需进一步对其代谢通路进行分析。通过京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)中的Pathway数据库,共检索到差异代谢物参与的18 条代谢通路,分别为类固醇生物合成、次生代谢物的生物合成、柠檬酸循环、脂肪酸生物合成、氧化磷酸化、精氨酸生物合成、嘧啶代谢、丙氨酸、天冬氨酸和谷氨酸代谢、酪氨酸代谢、苯丙氨酸代谢、β-丙氨酸代谢、丙酮酸代谢、丁酸盐代谢、烟酸盐和烟酰胺代谢、泛酸盐和CoA生物合成、倍半萜和三萜生物合成、碳代谢。
将上述筛选鉴定的差异代谢物匹配信息后,利用对应物种的通路数据库对其进行富集分析和拓扑结构分析,根据代谢通路的浓缩,识别出可能的受生物扰动的代谢通路[27]。首先,通过差异代谢物对KEGG、PubChem等权威代谢物数据库进行映射,映射出5 个物质,脲基丙酸、角鲨烯、胆固醇、月桂酸、反丁烯二酸,且均为精确匹配。对差异代谢物和通路进行相关性分析,得到多条相关通路。根据-lnP值和Impact值综合分析,筛选出最为显著的9 条代谢通路,如表3所示。
表3 代谢通路分析Table 3 Metabolic pathway analysis
图4 查哈阳与五常地区样本的层次聚类分析热图Fig. 4 Heatmap of hierarchical clustering analysis for rice samples from Chahayang and Wuchang
对差异代谢物参与的代谢通路分析,共发现9 条关键通路,关键通路与代谢物差异相关性较高,见表3。可以发现这9 条通路多数为氨基酸代谢,则说明产地对稻米代谢中的氨基酸代谢具有一定影响。而这9 条通路映射的代谢物有5 个,月桂酸主要参与氨基酸代谢、反丁烯二酸主要参与糖代谢,角鲨烯和胆固醇主要参与固醇代谢,此外角鲨烯也可参与合成皂苷类物质代谢途径和合成植物甾醇类物质途径等[28],同一代谢物同时参与多条代谢通路,说明映射出的差异代谢物对通路影响较大。
图5 查哈阳对五常地区样本的通路分析图Fig. 5 Pathway analysis for Chahayang versus Wuchang rice samples
如图5所示,气泡代表代谢通路,气泡颜色越深P值越小,富集程度越显著;气泡大小表示影响因子大小,气泡越大影响因子越大。类固醇生物合成处的气泡颜色最深、气泡相对较大,说明产地不同,对稻米中固醇类物质的影响最显著,角鲨烯和胆固醇是该通路中重要的代谢物。已有研究表明脂类化合物的含量是影响米饭可口性和米饭光泽的主要因素[13,29],而固醇类物质属于脂类物质,产地差异对稻米食味品质具有较大影响。β-丙氨酸代谢、泛酸盐和辅酶A生物合成2 个通路气泡都较大,说明2 个代谢途径对稻米代谢的影响也较大。其次是柠檬酸循环,该代谢途径是糖、脂肪、蛋白质3 种主要有机物质彻底氧化的共同代谢途径。而月桂酸主要参与的脂肪酸代谢的影响因子和富集程度相对较小,通常以其含量评价稻米的蛋白质质量[30]。由代谢通路结果可知,查哈阳与五常2 个产区的稻米,在代谢中最大的差异是类固醇生物合成代谢过程,而对脂肪酸代谢影响也较大,则说明脂类物质受产地环境的影响较大[31-32],同时,氨基酸代谢通路在产地差异中相关性也很高,说明产地对稻米中脂类物质及氨基酸类物质的影响较大,但其受产地影响的机理目前尚不明确。
GC-MS的代谢组学技术研究产地对稻米代谢产物的影响具有可行性。结果表明,产地对稻米中代谢物的数量、种类及含量均具有影响,其中种类和含量的差异较显著,查哈阳稻米中的糖类、氨基酸、脂肪酸含量均高于五常稻米,相比较而言,查哈阳稻米的食味品质可能更好一些。两产地对比共筛选出含量显著变化的差异代谢物32 个,其中查哈阳稻米样本中有13 个代谢物的含量低于五常,主要为酚类、醇类、腈类、脂肪酸等;查哈阳稻米样本中有19 个代谢物含量高于五常地区,这些物质多数为糖类及糖类的衍生物。产地不同,不同种类代谢物的含量存在显著差异,则差异代谢物可作为稻米产地区分的参考物质。代谢通路分析发现,产地对稻米中脂类物质及氨基酸类物质的代谢具有显著影响,角鲨烯、胆固醇、脲基丙酸、反丁烯二酸和月桂酸是关键代谢物质。