李思源,李培瑜,刘弈彤,刘海杰,张泽俊,沙坤*
1(中国农业大学 烟台研究院,山东 烟台,264670)2(中国农业大学 食品科学与营养工程学院,北京,100083)
代谢组学是继蛋白质组学、转录组学和基因组学之后的一种新兴组学技术,是系统生物学的重要分支。它通过对生物体代谢产生的分子质量低于1 kDa的代谢产物进行定性定量分析,研究生物体系的代谢途径[1]。代谢组学通过分析生物体受到刺激或扰动后其代谢产物的变化或其随时间的变化,动态地分析生物体的代谢过程[2]。根据研究对象的不同,代谢组学可分为靶向代谢组学和非靶向代谢组学,靶向代谢分析主要定量特定代谢物,研究一种或者几种代谢通路,而非靶向代谢分析是尽可能地从样本中分析出更多的代谢物,采集更多的物质信息[3]。代谢组学技术的发展离不开核磁共振(nuclear magnetic resonance,NMR)、质谱(mass spectrograph,MS)、液相色谱(liquid chromatography, LC)、气相色谱(gas chromatography, GC)及其联用等技术的发展。NMR技术能够在不破坏样本的基础上实现快速准确分析,但是不够灵敏[4];色谱与MS技术具有灵敏度高、分析速度快、应用范围广等特点,MS技术结构鉴定能力强,但不具备分离能力,色谱与MS技术联用可同时实现复杂混合物的分离、定性与定量分析[5]。一系列公开、方便、注释良好的代谢组学数据库,作为信息共享联动的平台,促进了代谢组学数据的分析[6]。这些数据库包括:京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)、Mass Bank数据库、METLIN数据库、人类代谢组学数据库(Human Metabolome Database,HMDB)等。
代谢组学研究起源于20世纪70年代,主要用于对患者体液中代谢物进行定性、定量分析及对疾病的筛选和诊断,90年代后,开始用于研究药物在体内的代谢等。代谢组学技术发展迅速,已成为临床医学和生命科学领域研究的重要工具,同时也为食品科学领域的研究提供了新思路。食品代谢组学将食品在生产、加工、储存过程中的分子运动以及营养物质被摄入后在食用者体内的代谢过程和效果作为研究对象[7],已用于食品成分分析、食品质量鉴别、食品消费监控、饮食营养监控等[8]。本文从样品制备与前处理、检测技术、数据处理等方面介绍了代谢组学,并总结了代谢组学在食品营养、食品鉴别、食品风味研究领域的应用。
样品制备作为代谢组学研究的第一步,是获得可靠代谢组学数据的关键,要注意以下3个因素:第一,制备样品的方法要尽可能简单,可在不同实验室由不同实验人员重复操作;第二,步骤要尽量最少,有利于减少由于技术或分析的原因造成的可变性;第三,成本要尽量低,有利于扩大到更大的样本数量[9]。在具体的实验过程中,根据检测技术的不同,所采用的样品制备方法也有所不同。
在使用NMR技术检测时,样品无需复杂的前处理,若样品为液体,如牛奶、酱油、酒等,加入含有氘代水的磷酸缓冲液提取后即可检测;若样品为固体或半固体,如奶油、肉、水果等,需要先将样品搅碎,加入缓冲液提取后,再进行检测[10-11]。
LC-MS联用技术中样品前处理通常是采用液液萃取和固相萃取。液液萃取具有选择性,可与其他方法配合使用,操作简单,周期短,常用的有机溶剂有甲醇、乙醇、乙腈、丙酮、乙酸、乙酸乙酯等;固相萃取是通过选择性吸附、洗脱来富集、分离和净化样品[12]。
GC-MS联用方法常与顶空固相微萃取技术(headspace solid phase microextraction, HS-SPME)同时使用,这是一种集采样、萃取、浓缩、进样为一体的分析技术,操作简单便捷、灵敏度高,可用于食品中挥发性成分、半挥发性成分、热稳定性成分的定性和定量检测,具有良好的选择性[13]。
NMR、MS、GC是代谢组学研究中最常用的检测技术,但是由于生命体的代谢过程复杂,代谢物种类繁多,单一的测定方法难以检测完全,多采用几种方法联用。
NMR技术利用原子核在电场中的能级跃迁分析物质的化学组成和空间机构,可对小分子代谢物做出高通量分析,并且只需对样品进行简单的预处理,对样品破坏性小,无偏向性,结构信息丰富,适用于食品等复杂体系,是代谢组学研究过程中比较常见的方法[14]。NMR共振研究中,最常用的有核磁共振氢谱(1H-NMR)、核磁共振碳谱(13C-NMR)、核磁共振氮谱(15N-NMR)、核磁共振磷谱(31P-NMR),其中1H-NMR在代谢组学中使用最为广泛。1H-NMR代谢组学技术无偏向性,只要代谢成分含有质子就能够被检测分析。李爱平等[15]基于1H-NMR代谢组学方法对山西陈醋、镇江陈醋、白醋的化学组成进行检测,由于食醋中含水量较大,使用了Noesypresat序列来压制水峰,结果显示,3种不同食醋的化学成分主要为有机酸和氨基酸,但组成明显不同,其中氨基酸类物质的检测结果与氨基酸分析仪检测结果一致,表明代谢组学结果可靠。SUZUKI等[16]利用1H-NMR代谢组学方法对食品添加剂丝兰提取物的抑菌活性进行筛选,得到数据经多元数据分析,发现皂苷含量与抑菌活性成正比。1H-NMR谱的信号强度只与待测溶液中的化合物摩尔浓度有关,可以直接比较样品中化合物浓度。李玮等[17]通过1H-NMR代谢组学技术鉴别天然奶油和人造奶油的差异脂类物质,分析结果显示,天然奶油黄油和稀奶油的甾醇、丁酸、1-戊烯、共轭亚油酸含量相比于人造奶油更高,与GC测定结果基本一致,说明通过这几种物质的含量差异,可以对天然奶油和人造奶油做出区分。
基于NMR的代谢组学技术适合检测高丰度极性代谢物,可以使食品组分分析得更加细致。NMR技术通过对食品的有机酸、氨基酸、生物碱等有机化合物单体进行识别以及定性定量分析,在分子水平阐释食物的特殊味道、香气、质地、色泽[15],区分食物的产地、品种、质量、加工方式和贮藏方式。但是NMR的灵敏度相对较低,不适合分析同一样品中浓度相差较大的物质,动态检测范围小,可通过提高磁场强度、应用同位素标记等来进行改进[18]。
LC主要用于分离目标组分与基质组分,适用于不易挥发、热不稳定、离子型和分子量较大物质的分析,分离效率较高,缩短了分析时间;MS灵敏度高、特异性好、响应速度快。将LC与MS串联使用,分离效能和分离速度可极大提高,分离度和检测灵敏度得到明显改善,还可同时测定多种代谢物[19]。BI等[20]通过电喷雾离子源将四级式飞行时间质谱(quadrupole time-of-flight mass spectrometry)与高效液相色谱(high performance liquid chromatography,HPLC)串联,在河豚鱼汤中鉴别出了与河豚汤的风味、营养和安全性密切相关的19种化合物。郑海英等[21]基于HPLC-MS联用的代谢组学方法研究了转录因子SINAC4对番茄果实代谢产物的影响,经代谢组学分析,该转录因子对番茄代谢产物中的氨基酸、肽、维生素、糖类及其衍生物、核酸及其衍生物、生物碱、香精香料、有机酸均有影响。
采用GC-MS联用技术,可借助较完整的代谢物标准谱图图库对代谢产物鉴定,目前较大的数据库有Wiley库、NIST库和Palisade库。GC通过分离作用,将目标物质引入MS系统,MS部分起到检测作用,主要有电离源、质量分析器和电子倍增管,检测后可得到保留时间、m/z,离子强度,通过这些信息可更准确的对物质进行定性分析[22]。GC-MS联用在食品风味研究中应用广泛。马小明[23]基于气相色谱——飞行时间质谱联用技术分析宁夏滩羊公羊和羯羊背最长肌的差异代谢物,有丙酮、辛烷、邻苯二甲酸环丁基葵酯等14种,说明这些物质是影响滩羊肉风味的主要物质。GC-MS联用技术对挥发性化合物灵敏性高、分离性好、重复性高。SUZUKI-IWASHIMA等[24]基于GC-MS联用技术对干酪中的挥发性化合物进行代谢组学分析,确定了发酵过程中挥发性代谢物对奶酪特征香气的影响。
代谢物的种类繁多,得到的谱图复杂,因此,代谢组学研究中,数据分析是十分重要的环节。多元数据分析是目前使用较为广泛的统计方法,通过对多个数据结果同时分析,发现数据间的内在关联,实现对各个因素的综合考虑,使研究结果更准确、偏差更小,利用多元数据图还可实现分类的可视化表示[25]。多元数据分析方法可以研究各代谢物及代谢途径,代谢物之间的差异可通过模式识别方法进行区分,主要的模式识别方法有主成分分析法(principal components analysis,PCA),聚类分析法(cluster analysis, CA),偏最小二乘判别分析法(partial least squares discriminant nalysis, PLS-DA),正交偏最小二乘法判别分析法(orthogonal partial least squares discriminant analysis, OPLS-DA)[26]。
PCA技术是多元统计分析的一个基本方法,属于无监督的模式识别方法,能将实验结果转换成样本与相应变量之间的关联信息,将多个变量转化为少数几个主成分,通过这种方法得到实验结果模型可分为得分图(scores plot)和载荷图(loadings plot),得分图显示样品信息,载荷图表示变量信息,这个过程通过将相关信息分组成相同的主成分,降低了实验数据的维数,简化了数据集,达到以最少数据表示样本的目的[27]。与其他多元统计分析方法相比,PCA操作简单,没有参数限制[28]。食品是一个复杂的体系,组分繁多,PCA通过降维把多个组分转化为几个综合指标,根据各个指标数据的相关性和变异程度客观地确定权重,挑选出影响食品性质的主要特征成分,从而实现对食品品种、产地、加工方式等的鉴别。CHEN等[29]利用多元数据分析软件SIMCA 14.1对3个薰衣草品种进行PCA,将3个品种的13个样品的64种化合物处理得到13×64的数据矩阵,得分图中,3个品种的主成分区并未重叠,说明这3种薰衣草的精油组成和相对百分含量是不同的;通过载荷图分析得到了3个品种最主要的特征成分。SHUMILINA等[30]基于NMR代谢组学方法,区分新鲜和解冻过的大西洋鲑鱼,经PCA得分图可知,在冷冻后第2~9天生成的天冬氨酸是造成样本分组的主要因素之一,并通过验证试验证明在0 ℃以上,天冬氨酸途径不会发生变化。这些结果表明,天冬氨酸可作为区分新鲜与和冷冻鱼的标志性物质。
CA技术从多方面因素考虑对研究对象或指标进行分类,将样品按照品质特性的相似程度逐渐聚合在一起,相似度大的优先聚合,最终根据类别综合性质多个品种聚合,完成聚类分析[31]。CA技术的优势在于可以发现多元数据中自然存在的分组或者类型,可用于食品品种分类、产地分类、加工方式分类等。BRIGANTE等[32]对含有奇亚籽、芝麻和亚麻籽的焙烤产品进行聚类分析,可以在树状图上明显地看出含有不同种子的产品被分为3个簇,每簇样品对应的是一种种子,与主成分分析结果一致。林秀敏等[33]对不同产地和不同炮制方式的白芍饮片进行CA,通过树状图可将其聚为几类,说明生长环境及炮制方法可造成白芍饮片中的化学成分差异,这些结果可为不同白芍饮片的质量控制提供参考。
PLS-DA技术是一种线性分析方式,属于有监督分析方法,其本质也是一种降维判别分析方法,可通过已知的样品分组信息对多变量数据进行归类、识别、预测,结合了PCA、典型相关分析和多元线性分析的优点,适合于样品观测数少、解释变量多及存在多重共线性的情况[34-35]。PLS-DA在食品质量鉴别、食品品种识别、食品掺假辨别中应用较多。李永迪等[36]基于OPLS-DA分析得到影响茯砖茶和千两茶品质差异的标志性成分分别为:水浸出物、茶多酚、咖啡碱和简单儿茶素,与PCA相比,这种方法不仅能鉴别样品差异,而且可以获得造成样品差异的特征标记物。YOSHITOMI等[37]以NMR为基础,研究了皂素根的天然代谢组学,将PCA和PLS-DA结合进行分析,结果表明甲醇萃取和5%甲醇洗脱有利于从野生样品中鉴别栽培样品,根据PLS-DA分析的s-plot图,可知栽培样品的特征化学物为蔗糖,野生样品的特征物质为葡萄糖和不饱和脂肪酸。许艳超等[38]通过PLS-DA对真假样品进行分类来判断蜂蜜掺假,结果表明建立的PLS-DA模型能够很好的将真假蜂蜜分类,并且具有较好的预测能力。
代谢组学在营养学领域的应用也称作营养代谢组学,可研究食物中活性成分作用机制、食品营养素量对机体代谢的影响,代谢组学技术丰富了现代营养学研究方法,将食品科学与医学有机结合起来[39- 40]。代谢组学可以通过监测代谢物浓度来分析生理过程,适用于测量饮食的代谢效应[41]。JUNG等[42]研究了绿茶提取物对小鼠肠道微生物和皮肤的影响,通过全面的代谢组学分析,发现短期补充绿茶提取物可以显著改善微生物代谢组和皮肤代谢组,特别是包括双歧杆菌和乳酸菌在内的益生菌水平和紫外线防御水平。王希越等[43]通过GC-MS的靶向代谢组学方法分析大米中脂肪酸,共检测到16种脂肪酸,并以每种脂肪酸峰面积的相对偏差考察这种方法的稳点性,16种脂肪酸相对偏差均小于10%,说明这种方法的稳定性较好。将这种方法用于5种大米脂肪酸分析,可准确获得个样品间脂肪酸轮廓差异信息,可用于研究脂肪酸对大米营养价值及品质改善的影响。XIA等[44]采用UPLC-Q-TOF-MS的代谢组学方法评估了马奶发酵为马奶酒的过程,确定了7个关键代谢途径,共鉴定出354种代谢物,其中具有功能性的γ-亚麻酸、L-谷氨酰胺、初级胆汁酸在发酵过程中减少,γ-亚麻酸可以降血压、降低心血管疾病和癌症的发病率,L-谷氨酰胺可以用于治疗胃肠道溃疡、辅助癌症治疗、缓解疲劳、调节免疫,胆汁酸在脂肪代谢中起重要作用,能提高能量的利用,这一发现为马奶及马奶酒中功能性化合物的分离提供了重要信息。
食品原料的来源是消费者进行选择的重要依据,掺假问题也是消费者关注的重点,通过代谢组学技术通过对非特定目标物的检测,可以更加精确的做出鉴别[45]。PAVLIDIS等[46]基于HS-SPME/GC-MS技术的代谢组学方法,对肉糜中及其添加剂的挥发组分进行了鉴别,筛选出了醛、醇、酮、呋喃、酯类等几种具有鉴别意义的生物标志物,可用于区分肉的种类、鉴定未知品种肉类样品。目前,消费者认为来自放牧奶牛群的高山奶酪更健康、营养价值更高,具有很高的市场价值,在这种情况下,奶农和消费者都越来越多地要求保证以牧草为基础的奶酪的真实性,SEGATO等[47]使用NMR代谢组学的方法对成熟时间不同的PDO奶酪的水溶性代谢物进行了分析,胆碱、2,3-丁二醇、赖氨酸、酪氨酸是根据奶牛饲养系统鉴别奶酪样品最有效的水溶性化合物,但是,成熟过程的延长所引起的化学和生化变化复杂,所以用于成熟时间较短的产品,测得结果更准确。ZHANG等[48]基于GC-Q/TOF-MS 和 UPLC-Q/TOF-MS的代谢组学方法,筛选出46个初级代谢物和12个次级代谢物,可作为区分有机种植与非有机种植小麦的潜在生物标志物。
风味是影响食品品质的重要因素之一,通过代谢组学方法,分析食品中代谢物与风味物质的对应关系,可通过代谢水平研究风味物质形成过程。ZHANG等[49]对无骨干腌火腿加工过程中的代谢物进行了研究,结果显示,无骨干腌火腿加工过程中代谢物含量变化明显,大部分代谢物含量呈上升趋势,氨基酸(异亮氨酸、缬氨酸、丙氨酸、谷氨酸和组氨酸)、有机酸(乳酸、醋酸、琥珀酸、柠檬酸和甲酸盐)和核苷酸衍生物(次黄嘌呤)是无骨干腌火腿风味的主要来源。SUZUKI-IWASHIMA等[24]通过代谢组学方法研究了乳酸菌和霉菌对干酪中挥发型化合物生成的影响,结果显示,干酪中受到乳酸菌影响的风味化合物主要是乳糖衍生化合物,由糖代谢产生,受到霉菌影响的风味化合物主要是氨基酸及其代谢物,由蛋白质代谢产生,脂肪酸、甲基酮、仲醇代谢途径产生,主要在干酪后成熟期产生。这表明通过代谢组学方法监测干酪成熟过程,再对乳酸菌及霉菌活性的进行精细调控,可开发出具有理想风味的干酪产品。
代谢组学作为一种新兴的组学技术,应用于食品科学领域一方面可为提升食品营养价值、风味品质提供基础数据,有效改善食品加工保藏技术;另一方面代谢组学技术也为食品的质量检测提供了新思路,能够快速精确对食品进行鉴别,对食品安全和食品可追溯性有重要意义。但是,受到检测技术、数据分析方法等的限制,代谢组学技术在食品科学领域的应用还远未达到其最大潜能,具有广阔的发展前景。因此,需要提高仪器的灵敏度和精确度,与不同的分析方法和平台相结合,扩大代谢物的覆盖范围,提高数据质量。另外,需要进一步开发功能全面的统计软件来处理大量数据,从而更加有效的评估食品在加工生产过程的安全性和品质特性等。