王济世 刘晓夏 王彦云 赵汝婷 杨曙明
(中国农业科学院农业质量标准与检测技术研究所,农业农村部农产品质量安全重点实验室,北京100081)
肉类产品是人体不可或缺的营养源之一,为人体的生命活动提供蛋白质、脂肪、维生素、铁、锌等营养物质[1]。肉类掺假和质量安全问题不仅会带来人类健康风险[2],还可能阻碍经济发展,引起宗教矛盾[3]。随着肉类产品需求不断增加以及贸易全球化的发展,在产品交易过程中出现掺假的风险将更高。高错误标签率已被报道[4~5]。这种产品信息不实行为已构成潜在的公众健康风险[6~7]。MANE等[8]对约1000 种肉类产品进行调查时发现,近20%的产品的质量与标签不符。2013年欧洲马肉丑闻引起全球对食品欺诈的广泛关注,更是引发了巨大的公众信任危机[9]。因此,为了对肉类产品的品质开展有效研究并对其真实属性进行鉴别,开发准确可靠的分析方法显得尤为重要。
目前肉类品质及掺假鉴别的方法主要有聚合酶链式反应(PCR)法、蛋白质电泳法、免疫分析法等。虽然这些方法已在肉类鉴别中得到广泛应用,但是也存在着一定的局限性。PCR 方法因样品中DNA 降解、复杂基质的干扰等因素易造成交叉感染,出现假阳性或假阴性的结果。蛋白质电泳法在深加工或多种肉类混合制品的检测中存在缺陷,而免疫分析法在同一物种的掺假鉴别中存在一定的局限性。代谢组学的快速发展为探索肉类品质及掺假鉴别提供了新的研究思路。本文对代谢组学的工作流程、技术和分析工具进行概述,并对其在肉类品质及掺假鉴别领域的应用进行回顾和总结。
代谢组学 (metabonomics)是继基因组学、转录组学和蛋白质组学之后发展起的一门新兴学科,可在生物体受到病理、生理性刺激或遗传修饰后对动态多参数代谢响应进行定性、定量分析[10~11]。它所关注的是由疾病或环境影响引起的代谢谱的变化,其研究对象通常为分子量小于1000 Da 的氨基酸、脂类、小分子多肽、有机酸和糖醇类等小分子代谢物。根据研究方法的不同,代谢组学可分为靶向代谢组学 (targeted metabonomics)和非靶向代谢组学 (untargeted metabonomics)。靶向代谢组学关注的是特定的一类化合物,而非靶向代谢组学的目标是在样本中检测尽可能多的代谢物,以获得代谢指纹,进而显示不同样本类型之间代谢物的细微差异。代谢组学已在环境科学[12]、毒理学[13]、营养学[14]、药物及诊断[15]等多个领域的研究中发挥了重要作用,特别是在肉品质研究及掺假鉴别中也得到了很好的应用[16~17]。代谢组学的研究流程通常包括样品前处理、数据采集、数据预处理、多元变量统计分析、生物标志物的鉴定及生物学意义的阐述。
(一)代谢组学样品前处理在进行动物性产品(血液、组织)代谢组学研究时,需经过适当的前处理后方可进行后续工作。开展非靶向代谢组学研究时,为尽可能保证样品中代谢物的完整性,应尽量简化样品前处理步骤,以达到分析尽可能多的代谢物的目的。而靶向代谢组学是有方向地进行分析,前处理方法的选取及优化需根据目标代谢物的结构特点进行,进而达到选择性富集目标代谢物的目的。常用的前处理方法包括液液萃取、固液萃取和沉淀蛋白等。
液液萃取是基于相似相溶的原理采用极性或非极性溶剂将代谢物提取分离的方法。SIDWICK 等[18]采用液液萃取方法同时对鸡肉中极性和非极性代谢物进行了分析。该方法对小分子代谢物具有较好的覆盖范围,但是处理步骤较为繁琐,自动化程度较低。固液萃取是基于固相填料对不同代谢物吸附能力不同的原理实现分离的提取技术。该方法可有效除去蛋白等杂质的干扰,对低丰度代谢物进行富集,灵敏度较高,但是运行成本相对较高。目前该方法在靶向和非靶向组学的研究中得到广泛应用[19~20]。沉淀蛋白方法通常会借助极性较大的有机溶剂(如甲醇、乙腈等)将样品中的蛋白质凝聚沉淀,而高极性代谢物进入溶剂以达到提取分离的目的,但对极性较小的脂类代谢物提取效果不佳[21],另外该方法具有较强的基质效应,易造成仪器污染。前处理方法的选择要根据代谢物属性及实验目的来确定,比如针对一些低丰度、离子化效率较低的代谢物,还可以进行衍生化以提高离子化效率,促进色谱分离[22]。
(二)代谢组学数据采集平台由于肉类样本中代谢物的含量及理化性质差异较大且动态范围较宽,目前还没有单一的分析工具能够对这些小分子代谢物进行无偏向的全面分析。代谢组学分析最常用的技术平台是核磁共振波谱 (NMR)和质谱(MS)。NMR 已成功应用于肉类品质、鉴别及加工研究中[16,23~24],具有分析无偏向性、样品无损耗等特点,但可检测的动态范围较窄且灵敏度相对较低[25]。MS 尤其是高分辨质谱(HRMS),如飞行时间质谱(Q-TOF-MS)具有专属性强、采集速度快、质量数精确测定、灵敏度高且检测动态范围宽的特点,是一种很有前途的高通量代谢组学技术[26]。目前,色谱质谱联用技术如液相色谱串联质谱(LCMS)[18]和气相色谱串联质谱 (GC-MS)[27],将色谱技术强分离性能与质谱技术的高结构鉴定能力很好地结合起来,已成功应用于代谢组学的相关研究中。GC-MS 通常用于非极性、易挥发的化合物的分析,且样品需要衍生化处理。而LC-MS 灵敏度相对较高,对极性、热不稳定化合物检测能力强,可分析的代谢物质量范围更宽,检测限低可用于痕量分析,更适用于复杂生物样本的代谢组学分析。目前超高效液相色谱串联四极杆-飞行时间质谱(UPLC-Q-TOF-MS/UPLC-Triple-TOF-MS)[28~29]、超高效液相色谱-三重四极杆-线性离子阱质谱(UPLC-QTRAP-MS)[29]在代谢组学相关研究中已得到广泛应用。
近年来,随着快速分析技术的发展,绿色、无损、快速及原位分析成为新的研究热点。快速蒸发电离质谱(REIMS)和实时直接分析质谱(DARTMS)无需或只需简单的样品前处理,分析速度快且灵敏度高,克服了传统检测方法前处理复杂、耗时的缺点。目前REIMS 和DART-MS 已成功应用于动物源性产品的代谢组学研究中[30~33]。
(三)代谢组学数据处理与分析数据处理是代谢组学研究中的关键环节。代谢组学研究中会产生大量数据集,需要使用专业软件进行处理,并借助化学计量学方法进行可视化分析,对结果进行解释。通常数据处理步骤包括数据预处理、模式识别、模型的建立与验证以及差异变量的筛选等[34]。
数据预处理的目的是将实验或分析过程中产生的误差进行降低或消除,以保证变量差异来源于生物学变化而非误差所致,进而确保实验结果具有可重复性。数据预处理通常包括基线校正,峰筛选(峰识别、峰对齐及校正),滤噪,缺失值处理、归一化及标度化。
原始数据中缺失值出现的原因有多种,可能是某些代谢物在一些样本中不存在或者浓度低于仪器的检出限,也可能是因为检测出的数据与正确的质谱峰未匹配。为了不影响数据分析结果的正确性,需要对数据进行缺失值的删除或填补。缺失值的删减遵循“80 原则”,即当某一代谢物在同一类80%的样本中检测的数据为零则剔除,反之保留。缺失值删减后需要对数据中仍然存在的零值进行填补,常用的缺失值填补法有列替代法、K 邻近法[35]和多重填补法[36]等。随后为了使数据处于同一数量级,保证样品间的可比性,需要对数据进行归一化。常用的归一化方法有面积归一、中位值归一和内标归一等。然后,为防止高含量代谢物的变化将低含量代谢物的变化掩盖,往往需要对数据进行标度化,以降低高含量代谢物的重要性并提高低含量代谢物的重要性[37]。常用的标度化方法有range scaling,auto scaling,pareto scaling 等[38]。其中pareto scaling 最为常用,对代谢物重要性均等化效果较好[39]。
数据预处理之后,需要采用合适的多元统计分析方法对庞大的多维数据进行挖掘和分析。代谢组学数据分析中最常用的模式识别方法可分为无监督模式识别方法 (unsupervised method)和有监督模式识别方法 (supervised method)[40]。无监督分析方法是在样本组别等信息未知的前提下,对样本自动分类,进行可视化分析,常用的方法包括主成分分析 (principal components analysis,PCA)[40]、聚类分析 (hierarchical cluster analysis,HCA)[41]、非线性映射 (non-linear map,NLM)[42]等。当样本组间差异大于组内差异时,采用无监督分析方法可以很好地将样本进行分组判别。但是若不同组的样本量相差较大,那么样本量大的组将会在主成分贡献中占主导地位,进而导致分组判别产生误差。有监督模式则是根据样本组别等背景信息将样本进行强制分组,常用的有监督分析方法有偏最小二乘判别分 析 (partial least squares discrimination analysis,PLS-DA)[43]、正交偏最小二乘判别分析(orthogonal projection to latent structures discriminant analysis,OPLS-DA)[39]及机器学习分类算法[44]等。有监督分析方法通常用于筛选对分组有贡献的差异变量并构建模型。为了防止数据出现过拟合,需要采取合适的统计学方法(如置换检验)对模型的可靠性进行验证。通常代谢组学多元统计分析的流程是首先进行PCA 分析,查看样本的整体分组情况,观察是否出现异常样本点并确定最佳主成分数; 随后构建PLSDA 或OPLS-DA 模型,采用置换检验等方法对模型的有效性进行验证; 最后结合变量重要性(variable importance for projection,VIP)与方差分析(analysis of variance,ANOVA)对差异变量进行筛选。
(四)潜在生物标志物的鉴定代谢组学数据经过多元统计分析后,需要对筛选出的差异变量进行鉴定。首先确定差异代谢物在正或负离子模式下的准分子离子并分析其分子量、分子式; 随后将差异代谢物的一级和二级碎片信息导入数据库进行检索匹配,常用的数据库有Metlin(https://metlin.scripps.edu),Mass bank (http://www.massbank.jp/),HMDB (http://hmdb.ca)和Lipidmaps (http://www.lipidmaps.org); 最后将潜在差异代谢物的保留时间、一级谱及二级谱裂解特征与标准品的质谱信息进行比对,从而完成对潜在生物标志物的鉴定。
近年来,随着NMR 和MS 等高通量技术的进步以及化学计量学的发展,代谢组学方法已被广泛用于肉类以次充好、地理溯源,品种、营养供给、年龄等方面的差异鉴别研究中,最新的相关研究应用见表1。代谢组学的研究结果表明,肉质特性与其所含的小分子代谢物密切相关。
(一)以次充好及地理来源导致的肉品差异鉴别使用劣质或廉价肉类冒充高品质产品已成为全球性问题。目前,代谢组学已被广泛用于肉类产品的溯源与掺假鉴别研究中。PAVLIDIS 等[45]采用代谢组学方法结合顶空固相微萃取与气相色谱质谱法(HS-SPME/GC-MS)对不同牛肉中不同掺假比例的猪肉进行分析,提出了一种基于挥发性指纹图谱的鉴别方法,鉴别正确率达99%。JUNG 等[47]采用1H NMR 结合多元统计分析方法对来自澳大利亚、韩国、新西兰和美国的牛肉样品进行溯源鉴别,结果表明,基于NMR 的代谢组学方法是一种有效的牛肉指纹鉴别方法,琥珀酸及多种氨基酸(异亮氨酸、亮氨酸、蛋氨酸等)可作为鉴别牛肉原产地的生物标志物。
(二)品种因素导致的肉品差异鉴别品种是影响肉类品质优劣的重要因素。品种对动物的产肉性能、肉质及营养价值等具有显著影响。WANG等[23]采用NMR 技术对北京鸭和临武鸭两个品种鸭肉中的代谢物组成进行了研究。通过多元统计分析发现,两个品种鸭肉中肌肽、鹅肌肽、烟酰胺、琥珀酸和肌酸等代谢物存在显著差异。STRAADT等[49]采用基于NMR 的代谢组学方法对5 种不同杂交品种的猪肉进行分析,研究发现,不同杂交品种猪肉中的一些氨基酸、小肽、有机酸、鲜味物质、脂类及胆碱化合物存在差异,而这些化合物与肉类品质及感官属性密切相关。
(三)营养供给方式因素导致的肉品差异鉴别日粮是动物产肉性能的物质基础。日粮中所含的营养成分及添加物会对肉类品质及营养价值产生重要影响。饲料中的蛋白含量、脂肪含量、能量水平以及添加剂的种类和含量,不仅会对肉产品的色泽、持水力、嫩度等物理属性产生影响,还会导致产品中氨基酸、脂肪酸等营养物质的差异。SUN等[50]采用非靶向代谢组学的方法对常规基础饲喂与高脂肪、高胆固醇饲喂的猪体内代谢谱的变化进行了分析,研究表明,两种饲喂模式的猪体内胆汁酸、脂类代谢物、脂肪酸、氨基酸、磷脂类化合物等具有显著差异。BAIRA 等[52]分析了日粮中分别添加柚皮苷和橘皮苷后鸡肉代谢谱的变化,其中筛选出3 个显著差异代谢物可用于区分对照组与柚皮苷组,筛选出13 个显著差异代谢物可用于区分对照组与橘皮苷组。
表1 代谢组学在肉类鉴别与肉质分析中的应用
(四)年龄因素导致的肉品差异鉴别动物的年龄对肉质具有至关重要的影响[65]。LIU 等[16]采用基于NMR 代谢组学方法研究了年龄对鸭肉化学成分的影响。多元统计分析结果显示,不同年龄的鸭肉中的代谢物存在显著差异,乳酸和鹅肌肽随着年龄的增长而增加,而富马酸、甜菜碱、牛磺酸、肌苷和烷基取代的游离氨基酸却减少。XIAO 等[53]对110、140、170、200 和230 d 5 个不同时间段的武定鸡肉中的风味前体物质进行了研究。与110 d 的样品相比,其他4 个年龄段的鸡胸肉和鸡腿肉中总代谢物的含量明显要高,230 d 的鸡肉样品中的前体物质如乳酸、肌苷、肌酸、鹅肌肽等与其他4 个年龄段的样品有显著差异。
(五)饲养过程中疾病与药物使用导致的肉品差异鉴别虽然兽药与添加剂的使用能够起到预防和治疗畜禽疾病的作用,但不可避免地会对肉品品质及安全性产生影响。因此采用有效技术手段分析畜禽疾病以及抗生素的使用对肉品质的影响十分重要。WANG 等[54]借助基于NMR 的代谢组学方法表征了鸡胸肉硬度缺陷病对鸡肉代谢谱的影响,结果表明,硬度缺陷病鸡肉中具有独特的生化特征,含有较高的亮氨酸、缬氨酸、牛磺酸等,而组氨酸、肌酸、肌酐等含量较低。HERMO 等[56]采用代谢组学的方法对服用阿莫西林药物后肉鸡肌肉、肾脏和肝脏中代谢组的变化进行了分析,多元统计分析结果显示,服用阿莫西林组样品与未服用组能够明显区分,两组样品的代谢物存在显著差异。
(六)屠宰、包装与加工因素导致的肉品差异鉴别屠宰前应激与屠宰方式会改变动物死后体内新陈代谢,进而影响肉类品质。后期的包装与加工方式同样会对肉类品质产生影响。CAO 等[29]建立了一种非靶向和伪靶向代谢组学的联合方法用以区分常规屠宰生猪肉与异常原因死亡(如病死)的猪肉。该研究首先借助UHPLC-Triple-TOF-MS 筛选出24 个感兴趣的差异代谢物,随后基于UHPLCQTRAP-MS 的伪靶向代谢组学对这些差异代谢物进行量化,去除假阳性结果后,最终确定出可以区分活猪肉和死猪肉的14 个差异标志物并进行了准确量化。ARGYRI 等[58]采用代谢组学方法对不同温度和包装条件下牛肉中微生物及腐败情况进行了研究,结果显示,对肉类样品中有机酸的分析可作为监测肉品质的有效手段。ZHANG 等[24]采用基于NMR 的代谢组学与多元统计分析相结合的方法,对干腌火腿加工过程中代谢物的变化进行研究,以探索火腿口感的形成机制。研究发现,氨基酸(异亮氨酸、缬氨酸、丙氨酸等)、有机酸 (乳酸、醋酸、柠檬酸等)、核苷酸衍生物 (次黄嘌呤)是产品风味的主要来源,且在加工过程中呈上升趋势。
(七)贮藏时间导致的肉品差异鉴别肉类产品中的营养物质在贮藏过程中会随着时间的变化而改变。GRAHAM 等[61]对不同贮藏时间牛肉中代谢物的变化进行了研究,结果显示,有12 种氨基酸的含量随着贮藏时间的延长而增加,其中贮藏第3 d 的样品中氨基酸含量明显低于贮藏21 d 的样品,这是蛋白质水解增加所导致的结果。
(八)肉色与嫩度差异鉴别肉色和嫩度是影响消费者购买意愿的关键因素。肉类颜色的稳定性取决于动物本身以及老化、贮藏、包装、货架展示时间等。鲜红色被认为是新鲜度和整体健康度的指标,而那些因肌红蛋白氧化导致的呈褐色的鲜肉产品被认为是低质量产品。SUBBARAJ 等[62]采用代谢组学的方法对不同老化时间、贮藏条件和展示时间的绵羊肉样品进行代谢物的鉴定与比较,结果显示,鉴定出的大多数氨基酸、核苷酸、有机酸等代谢物与肌红蛋白有关,那些具有抗氧化性能的化合物在颜色稳定的样品中含量较高。同样地,MA等[63]确定了牛肉中对老化有显著响应的代谢物与肌肉颜色及氧化稳定性密切相关,且肉类嫩度、多汁性的改善是通过内源性蛋白酶在老化过程中降解肌肉蛋白实现的。LANA 等[64]通过物理分析与组学手段发现,将老化时间延长至44 d 可增加皮埃蒙特牛肉嫩度,随着老化时间延长,牛肉中肌纤维结构的完整性逐渐降低并且能量代谢受损。
代谢组学凭借其高灵敏性、高通量和稳健性等特点已成为肉类鉴别及品质分析的强有力工具。随着核磁共振以及高分辨质谱的进步以及多元统计学的发展,代谢组学技术在探究肉质特性形成的潜在分子机制方面发挥了重要作用。由于生物体是一个复杂的有机体,在新陈代谢过程中,DNA、RNA、蛋白质以及小分子代谢物之间存在复杂的相互作用关系,因此,对生物样本进行多组学方法分析将成为品质研究的重要方向。