祁 芳 刘 星 钱群丽 周佳欣 姚春霞 宋卫国*
(1.上海海洋大学 食品学院,上海 201306; 2.上海市农业科学院农产品质量标准与检测技术研究所,上海 201403)
蔬菜是消费者日常健康饮食不可或缺的食物类别。近年来,消费者越来越关注所食用蔬菜的品质和产地,愿意为高质量蔬菜(如有机蔬菜)支付高的价格,且对于同品质蔬菜,消费者更信任本地蔬菜,愿意为之支付更高价格[1-2]。蔬菜产地通常由其外包装信息获取,但为谋取不正当利益的标签虚假标识给消费者和监管机构识别蔬菜真实产地带来困扰。为解决这一问题,有学者基于不同产地蔬菜营养组分差异利用有机成分含量分析方法[3]、光谱技术[4]、多元素技术[5]等来识别蔬菜产地,也有学者基于不同产地蔬菜栽培过程中碳氮氢氧硫稳定同位素的分馏,利用稳定同位素技术来追溯蔬菜的真实产地[6]。这些方法中,蔬菜的稳定同位素比值(主要是δ13C、δ15N、δ2H、δ18O和δ34S值)与产地环境和投入品使用信息紧密相关,一定程度上已成为蔬菜固有的无形“特征”或“指纹”,因而已在蔬菜产地真实性判别上应用[7-8]。如利用δ13C、δ15N、δ2H、δ18O和δ34S值来识别地理标志保护产品金香大蒜的产地真实性,金香大蒜与阿根廷、泰国、越南及中国贵州和海南产大蒜的识别率超过89.5%[9],还有利用粗纤维中δ13C和δ18O值实现日本、墨西哥和新西兰来源的煮熟和加工过的南瓜产地溯源的研究[10];我们前期也基于δ13C、δ15N、δ2H和δ18O值开展了长三角地区上海、安徽和浙江2省1市27种424个来自基地的蔬菜样品产地溯源,产地识别率不低于85.7%[11]。但是由于市场上实际出售的蔬菜来源广泛,稳定同位素技术在排除多地蔬菜干扰来保证某一特定产地真实性上的应用能力仍需进一步验证。
因此,本研究以上海市场常见蔬菜生菜、茼蒿、辣椒、番茄和黄瓜为对象,依据不同产地蔬菜的地理气候环境及投入品使用差异导致的13C、15N、2H和18O稳定同位素自然丰度分馏差异,应用多元统计学和化学计量学方法开展上海本地产5种蔬菜的真实性判别研究,为保证蔬菜产地真实性提供参考方法,为监管机构的监测能力提供技术支撑。
2021年1月至年7月,共采集上海大型超市136个有代表性的蔬菜样品,具体见表1。
表1 蔬菜类别及产地
稳定同位素标准物质USGS90(δ2H=-13.9‰±2.4‰,δ18O=35.90‰±0.29‰)、USGS91(δ2H=-45.7‰±7.4‰,δ18O=21.13‰±0.44‰)和USGS40(δ13C=-26.389‰±0.042‰,δ15N=-4.5‰±0.1‰)购于美国Reston稳定同位素实验室;B2157(δ13C=-27.21‰±0.13‰,δ15N=2.85‰±0.17‰)购于Elemental Microanalysis 公司(英国);锡杯、银杯等购于赛默飞世尔科技公司。
EA Isolink型元素分析仪、253Plus型稳定同位素比质谱仪和ConFloⅣ型连续流接口装置(赛默飞世尔科技公司);WXTS3DU 型电子天平(梅特勒-托利多国际贸易(上海)有限公司);SCIENTZ-18N冷冻干燥机(宁波新芝生物科技股份有限公司);HR3865 飞利浦破壁料理机(飞利浦(中国)投资有限公司);HK-02A型粉碎机(广州旭朗机械设备有限公司)。
1.3.1 样品制备
将采集的蔬菜样品去杂、打浆后倒入样品罐放于-18 ℃冰箱预冻至少6 h,再置于-54 ℃冷冻干燥至少120 h,干燥后置于干燥器中备用。
1.3.2 碳和氮稳定同位素比值测定
称取1.0 mg左右蔬菜样品于锡杯(4 mm×4 mm×11 mm)中,编号后置于EA Isolink元素分析仪的自动进样盘上进行分析;当样品中碳氮元素经燃烧分别转化为CO2和N2,适当稀释后进入253Plus稳定同位素比质谱仪检测。仪器参数:元素分析仪燃烧炉温度980 ℃,色谱柱温度60 ℃,载气流速180 mL/min,参考气流速60 mL/min吹扫进样口。
1.3.3 氢和氧稳定同位素测定
称取1.0 mg左右蔬菜样品于银杯(4 mm×4 mm×11 mm)中,编号后放入元素分析仪自动进样盘中,待蔬菜样品中氢氧元素高温裂解分别转化为H2和CO,适当稀释后进入稳定同位素比质谱仪进行检测。仪器参数:元素分析仪高温裂解炉温度1 450 ℃,载气流速100 mL/min,参考气流速100 mL/min。
1.3.4 稳定同位素比值
稳定同位素比值用δ表示,是将已知稳定同位素比值的标准品作为参照来计算未知样本稳定同位素的相对值。公式如式(1)所示:
(1)
式中,R样品为样品中重同位素与轻同位素的丰度比,即13C /12C、15N/14N、2H/1H和18O/16O;R标准为国际标准样品中重同位素与轻同位素的丰度比。测试数据均采用两点校正法进行处理定值,即δ13C和δ15N值采用B2157和USGS40标准物质值校正,δ2H和δ18O值采用USGS90和USGS91标准物质值校正。
1.3.5 数据分析和模型建立
上海及其他产地蔬菜的δ13C、δ15N、δ2H和δ18O值间总差异应用Matlab软件(R2009a 美国 Mathworks公司)进行方差分析[12],P<0.05表明统计学上差异显著;不同产地蔬菜间稳定同位素比值差异分布通过Excel(Office365 美国Microsoft公司)中的箱线图进行描述性分析;通过无监督算法主成分分析(Principal component analysis,PCA)来分析不同产地蔬菜的聚类情况[13],利用有监督的偏最小二乘判别分析(Partial least squares discriminant analysis,PLS-DA)来构建不同产地蔬菜的真实性判别模型[14],由SIMCA软件(14.1 瑞典Umetrics公司)完成。
上海与其他产地蔬菜的δ13C、δ15N、δ2H和δ18O值(均值±标准偏差)分布差异见表2和图1。所有蔬菜的δ13C值均低于-22‰,且上海蔬菜的δ13C值与其他产地差异不显著(P>0.05),说明所采蔬菜样品光合作用类型一样,均属于C3植物,且水分供给情况、光照强度及栽培环境污染状况对上海蔬菜δ13C值的综合影响与其他产地蔬菜相似[8,15]。上海蔬菜的δ15N均值为5.49‰,有48.61%蔬菜的δ15N值高于5.00‰,而其他产地只有28.12%蔬菜的δ15N值高于5.00‰,这在一定程度上说明上海蔬菜栽培过程施用有机肥的比例更高,绿色和/或有机蔬菜比例也可能更高。因为蔬菜的δ15N值主要受栽培过程所施用肥料类型的影响,施用有机肥的非固氮蔬菜可能有更高的δ15N值,一般高于5.00‰,而施用化学肥料的非固氮蔬菜δ15N值一般低于3.00‰[16-19]。蔬菜的δ2H和δ18O值主要受灌溉水源水、蒸腾和蒸发作用的影响,一般随着纬度增加、海拔升高、海洋到内陆距离(大陆效应)增加,灌溉水的δ2H和δ18O值会越来越低,而蒸腾和蒸发作用则使得地表灌溉水和陆生植物的18O更富集[15]。上海蔬菜的δ2H值(-56.60‰)低于其他产地,这可能主要归因于很多其他产地蔬菜的纬度较上海更低(表2);而上海蔬菜的δ18O值(24.95‰)略微高于其他产地蔬菜,可能归因于上海的低海拔与相对高的蒸腾和/或蒸发作用综合。虽然上海蔬菜的δ15N、δ2H和δ18O均值与其他产地蔬菜差异显著(P<0.05),但是由于蔬菜中包含5个类别,不同产地总蔬菜的稳定同位素比值的标准偏差变化范围较大,尤其是δ15N和δ2H值(图1),说明不同类别蔬菜的不同产地间稳定同位素丰度差异可能不同,这也使得仅通过单个稳定同位素值的差异很难将上海和其他产地所有蔬菜类别很好地识别。因此,需要对蔬菜进行分类比较。
表2 上海与其他产地蔬菜的碳氮氢氧稳定同位素比值
图1 不同产地蔬菜的δ15N和δ2H值分布(其中“×”表示均值;“-”表示中位值;“。”表示奇异值)Figure 1 Nitrogen and hydrogen stable isotope values of vegetables from different regions where “×” represents mean values;“-” represents median values;“。” represents suspected outliers.
5种蔬菜的δ13C值在上海与其他产地间均差异不显著,这与总的蔬菜δ13C值一致;除了黄瓜外,上海蔬菜均有相对高的δ15N值,且茼蒿和番茄的δ15N值在上海和其他产地间差异显著(P<0.05),分别有66.67%和50.00%的上海茼蒿和番茄δ15N值高于5.00‰,而其他产地茼蒿和番茄的δ15N值均低于此值,进一步说明所采集的上海蔬菜中施用有机肥的比例高[18-19];上海茼蒿和辣椒有相对更负的δ2H值,但只有辣椒的δ2H值与总蔬菜一致,在上海和其他产地间差异显著(P<0.05),上海辣椒有70%的δ2H值低于-50.00‰,而其他产地仅有20.83%辣椒低于此值,说明辣椒的δ2H值是引起总蔬菜δ2H值在上海和其他产地间存在显著差异的重要因素,这可能与辣椒的其他产地如福建、广西、海南等所处的低纬度相关;除了茼蒿,上海蔬菜有相对更高的δ18O值,且番茄的δ18O值在上海和其他产地间差异显著(P<0.05),上海番茄有78.57%的δ18O值高于24.00‰,而其他产地番茄只有38.46%高于此值,这可能归因于上海的低海拔、相对低的纬度、距离海洋近及相对高的蒸腾和/或蒸发作用。由上可知,生菜和黄瓜的稳定同位素比值在上海和其他产地间差异均不显著,通过单个稳定同位素比值的差异仅可将部分上海茼蒿、番茄和辣椒与其他产地区分开。因此,需要借助化学计量学方法将所有同位素信息综合起来提高蔬菜产地真实性判别的正确率。
PCA是将多个变量通过正交变换转化为少数综合变量(即主成分)来表征原变量信息的一种无监督学习方法,主成分保留了原有变量的大部分信息,其得分图在一定程度上反映了不同数据集的聚类,可以通过原变量对主成分的贡献(即载荷变量)来反映其在主成分中的重要性[13,20-21],上海和其他产地不同类别蔬菜的PCA载荷变量及得分图见图2。PCA前两个主成分对原始变量的解释能力为0.609,基本包含了碳氮氢氧稳定同位素的数据信息。对第一个主成分(为0.327,保留了最多原变量信息)影响大的变量为δ2H和δ18O值,对第二主成分(为0.284,保留的原变量信息次之)影响大的变量为δ15N值,这与方差分析结果一致,说明蔬菜栽培过程的灌溉水源水、蒸腾和蒸发作用及所施用肥料类型的差异是导致上海和其他产地蔬菜稳定同位素比值差异的主要因素[8,15]。
由前两个主成分得分图知,只有5个上海生菜相对聚集(图2b绿色圈),其他生菜较均匀地分布在4个象限内;茼蒿均分布在第一主成分的左侧,有7个上海茼蒿相对聚集(图2b浅蓝色菱形);辣椒多分布在第一主成分的右侧,除了2个其他产地辣椒(图2b深蓝色正方形)聚集外,上海辣椒和其他产地辣椒不能被明显区分;6个上海番茄聚集(图2b黄色倒三角),其他番茄较均匀地聚集;上海和其他产地黄瓜也没有明显的聚集,这些结果说明PCA可以将组间差异明显的样本区分[13],如生菜、辣椒、番茄和茼蒿的圈内外样品,但很难将组间差异不明显的蔬菜进行产地判别,如黄瓜样品。因而,PCA很难将上海蔬菜与其他产地蔬菜进行完全识别,需要运用有监督的算法PLS-DA来实现不同类别蔬菜产地真实性判别。
PLS-DA是一种基于偏最小二乘的有监督算法,可以通过变量权重反映不同变量间关系,发现不同类别间的异同点,并通过人为赋值有效区分不同类别[13-14],每个类别的上海蔬菜和其他产地蔬菜的真实性判别结果见表3,影响模型判别结果的重要变量(VIP)见表4。最优PLS-DA模型对上海生菜的排他性判别正确率为100.00%,其他产地生菜的判别率较低。此时,第一主成分对原变量的解释能力为0.40,VIP变量顺序为δ18O>δ13C>1>δ15N>δ2H,说明不同产地生菜的水分蒸腾和/或蒸发作用及光照强度可能存在较大差异[8,15,22]。PLS-DA模型也可以很好地实现茼蒿(判别正确率91.67%)和番茄(判别正确率85.71%)的产地真实性判别,由VIP值知对模型贡献最大的变量均为δ15N值(分别为1.73和1.48),说明上海和其他产地的茼蒿和番茄所施用的肥料存在显著差异,这也与方差分析结果一致(表2)。虽然上海辣椒的产地真实性判别正确率为60.00%,但其他产地辣椒的判别正确率为100.00%,说明该PLS-DA模型可以很好地排除市场上其他产地的辣椒虚假标识;δ2H值(1.67)对该模型的贡献最大,说明辣椒产地判别主要是依据纬度效应导致的灌溉水源水中氢同位素分馏的差异。上海和其他产地黄瓜的产地判别正确率分别为50.00%和78.57%,说明发生黄瓜产地混淆的可能性较高,δ18O值(1.87)对该模型的贡献最大,说明了不同产地黄瓜生长过程中灌溉水来源、水分蒸腾和/或蒸发作用可能存在差异[8,15]。上述结果证实了碳氮氢氧同位素比值结合PLS-DA可以较好地实现生菜、茼蒿、番茄和辣椒的产地真实性判别,但是由于样品数量及不同产地蔬菜实际栽培过程多因素差异导致的稳定同位素比值的复杂变化,上海蔬菜产地真实性模型,尤其是黄瓜,仍需进一步改善。
图2 PCA载荷变量图(a)及得分图(b)Figure 2 The loading variable plot (a) and score plot (b) of PCA.
表3 PLS-DA模型分类结果
表4 PLS-DA的第一个主成分VIP值
通过δ13C、δ15N、δ2H和δ18O值结合单因素方差分析、箱线图、PCA和PLS-DA对上海市场常见蔬菜生菜、茼蒿、辣椒、番茄和黄瓜的产地真实性进行分析和判别。上海蔬菜与其他产地蔬菜的δ15N、δ2H和δ18O值差异显著,且茼蒿的δ15N值、辣椒的δ2H值、番茄的δ15N和δ18O值在上海和其他产地间差异显著,说明上海与其他产地蔬菜在所施用的肥料类型、灌溉水源水、蒸腾和蒸发作用方面存在较大差异。PCA很难将组间差异不明显的蔬菜进行产地聚类,PLS-DA模型很好地实现了上海生菜(判别准确率100.0%)、茼蒿(判别正确率91.67%)和番茄(判别正确率85.71%)的产地真实性判别,辣椒的PLS-DA模型也可以很好的避免其他产地辣椒(判别正确率100.0%)错误标识上海辣椒,但是黄瓜的PLS-DA模型仍需进一步改善。这些结果说明稳定同位素技术结合多元统计学及化学计量学方法可以实现特定产地蔬菜的真实性判别,但因不同产地气候地理环境和投入品使用的差异及样品数量有限,后续需要增加不同产地蔬菜的水、肥、土等样品的稳定同位素自然丰度信息,并不断增加蔬菜样品数量来提高蔬菜产地真实性判别模型的通用性。