夏立娅,高 巍,李亚平,尹洁璇,张晓瑜,李晓杨
(1.河北大学质量技术监督学院,河北保定 071002;2.中国农业大学工学院,北京 100083)
基于多元素分析的冬枣产地鉴别方法
夏立娅1,高 巍1,李亚平2,尹洁璇1,张晓瑜1,李晓杨1
(1.河北大学质量技术监督学院,河北保定 071002;2.中国农业大学工学院,北京 100083)
为了探讨利用产地间差异性元素进行产地判别的可行性,测定了不同产地冬枣样本中10种元素的含量,并对数据进行了差异性分析、聚类分析、Fisher判别分析和偏最小二乘判别分析(partial least squares discrimination analysis,PLS-DA)。结果表明,不同产地冬枣中Mg、B、Mn、Fe、Zn元素存在显著差异,是具有产地特征的指纹元素。R型系统聚类分析也证实B、Mn、Fe和Zn元素具有共同特征。基于产地特征元素和Q型聚类、Fisher判别和PLS-DA建立的冬枣产地鉴别模型正确率均高于基于全部元素的分析结果,其中利用特征元素建立的PLS-DA模型鉴别正确率最高,回代检验和交叉检验正确率均为94.0%,Q型聚类模型的判别能力最差,最高的判别正确率为84.06%。本研究证实了产地间差异性元素是有效的产地判别因子,具有监督模式的Fisher判别和PLS-DA算法准确率远高于无监督模式的系统聚类法,更适于产地鉴别分析。
冬枣,元素,判别分析,偏最小二乘
冬枣(Ziziphusjujuba cv. Dongzao)又名雁过红,九月底到十月中旬采摘,是一种晚熟鲜食的枣品种,主要分布于河北、山东等渤海湾地区。河北的黄骅冬枣肉质细嫩,酸甜可口,营养丰富。黄骅冬枣拥有三千多年种植历史,拥有全世界面积最大,年代最古老的原始冬枣林。2001年,黄骅冬枣被确定为我国地理标志保护产品。有研究表明,我国的冬枣没有明显遗传差异,品质差异主要由产地土壤条件、气候条件以及栽培管理措施引起[1]。这类具有原产地特征的产品,通过地理标志产品保护体系,可以实现持续健康的发展,利于产品品质的保持。但目前市场中广泛存在乱用地理标志标识的现象,极大影响了地理标志产品的声誉和农户的经济利益。为了有效的保护具有原产地特色的冬枣,迫切需要鉴别冬枣原产地的方法。
国内外学者对于食品产地鉴别的研究主要集中于食品中有机成分,矿物元素,同位素和重金属元素等方面[2-5]。利用食品中元素指纹特征可以更为准确的鉴别原产地。不同产地环境中矿物元素的分布具有各自特点,通过植物的新陈代谢反映到农产品中[6-7],可以稳定有效的标记农产品产地[8-12]。虽然施肥、浇水、往年耕种作物等人为因素对农产品中元素指纹有一定影响,但有报道证实,产地环境对矿物元素分布的影响大于人为因素带来的影响[13]。选择合理的元素建立溯源方法,可以极大降低人文因素带来的影响[14-19]。因此,如何选择带有产地特征的元素成为了提高农产品产地鉴别正确率的关键。已报道的研究中,多利用主成分分析、逐步判别分析等方法筛选特征元素并建立鉴别模型[20-25]。但方法的有效性和稳定性有待提高。
不同产地的农产品中,存在统计学差异的元素可以有效的表达产地的特征信息,同时无监督模式的R型聚类可以根据元素分布的共同性进行分类。本课题以冬枣为具体研究对象,分析了不同产地冬枣中元素分布差异性,并利用R型聚类对元素进行了聚类分析,提供了产地特征元素筛选的新方法,考察了利用多元素结合计量学分析方法建立产地溯源模型的可行性,为地理标志保护工作的开展提供了技术支撑。
1.1 材料与仪器
冬枣 在河北黄骅市和山东沾化市的主要冬枣产区内采集了69个冬枣样本,具体的样本信息见表1,样本采集时间集中在9月中旬至10月中旬,每个采样点采集样本1000 g,并于-3 ℃环境中暂时存放;钾、钠、钙、镁、铁、硼、锰、铜、锌和钡标准溶液 国家有色金属及电子材料分析测试中心;硝酸、盐酸、高氯酸和过氧化氢试剂 MOS级天津科密欧化学试剂有限公司;氯化铯和氧化镧试剂 高纯,天津光复精细化工有限公司。
表1 冬枣样本的采样地点
Thermo X Series 2电感耦合等离子体质谱仪 赛默飞世尔公司;TAS-990原子吸收分光光度计 北京普析通用公司;XH-800J微波消解仪 北京祥鹄科技发展有限公司;Milli-Q超纯水系统 美国Millipore公司。
1.2 实验方法
1.2.1 冬枣样本预处理 将冬枣洗净切片后120℃干燥至恒重,研磨过筛。准确称取0.500 g,于微波消解罐中,加入5 mL硝酸、2 mL过氧化氢;200℃微波消解4 h后,赶酸后用超纯水定容至50 mL。
1.2.2 原子吸收分光光度法 钾,钠,钙和镁元素的测定用火焰原子吸收分光光度法。钾和钠的检测中加入50 g/L的氯化铯水溶液,镁和钙的检测中加入30 g/L的氧化镧水溶液以排除干扰离子的影响。镁、钾、钙和钠的检测波长分为231、232、312和292nm。
1.2.3 电感耦合等离子体质谱法 硼、铁、锰、铜、锌和钡的测定采用电感耦合等离子体质谱法。样品的分析操作条件如下:射频功率1200 W,等离子气体流速1.12升/分,辅助气体流速0.5升/分,喷雾室温度2 ℃,0.45%的氧化物指数,双电流指标为1.22%。用内标法保证仪器的稳定性,选用Li、Ge和Bi作为内标,当内标元素的RSD>5%,重新测定样品。
1.3 数据处理
利用SPSS22.0软件对数据进行差异性分析、聚类分析、Fisher判别分析和主成分分析,利用Minitab 16数据处理软件进行偏最小二乘判别分析,OriginPri9.1软件用于作图。在Fisher判别和PLS-DA分析中,随机选取50个样本作为训练集,建立预测模型;剩余的19个样本作为验证集,利用外部检验对所建模型的准确度进行分析。
2.1 检测方法评价
每个样品平均测定3次,使用外标法计算。利用标准物质GBW10043(中国地质科学院地球物理地球化学勘探研究所)的校准方法。表2为在上述分析条件下对标准物质的分析结果。从中可看出,所有元素的分析结果与标准数据相对比,标准偏差都低于10%,检测结果准确可靠。
表2 标准物质检测结果
2.2 差异性分析
对黄骅冬枣和沾化冬枣的多元素分析结果表明(表3),两个产地冬枣的元素分布各具特征性。与沾化冬枣相比,黄骅冬枣中K、Na、Mn和Ba的含量较高,其中钾和钠的含量与产地土壤盐渍化程度较高有关。对两产地冬枣中10种元素含量进行了T检验,结果表明:Fe、B、Mg、Mn和Zn含量在两地间有显著性差异,其中Fe差异性最大,F值为37.53;其次为B和Mg元素。从识别冬枣产地的角度,这些存在显著差异的元素是较为有效的特征元素。
表3 黄骅冬枣和沾化冬枣元素含量及差异性分析
2.3 聚类分析
无监督模式的聚类分析方法,在计算过程中不指定分类依据,主要通过样品数据之间的距离,将相似的样本聚类结合。首先,利用系统聚类分析法中的R型聚类,对样本的变量,也就是元素种类进行分析。它的分析对象为变量,计算各个变量之间的距离,使具有共同特征的变量聚合在一起。这种方法可以观察变量之间的相互关系,识别具有共同特征的变量。
图1 冬枣中10元素R型系统聚类分析树形图Fig.1 Dendrogram of 10 elements in Ziziphusjujuba by R-type hierarchical cluster analysis
图1为对冬枣样本数据进行的R型系统聚类分析的树形图。在该分析过程中,利用Euclidean方法计算变量之间的距离,利用Ward方法计算小类之间的距离。从图1可以看出,冬枣中10种元素聚为两类,第一类包括Na、Ca、Ba、Mg、K和Cu元素,第二类包括Mn、Zn、Fe和B元素,两类元素之间的关联系数为485.70。第二类元素组中,Mn和Zn元素首先聚类,然后依次与Fe和B聚在一起。与前面的差异性分析结果相对照,我们发现这组元素都属于不同产地间具有显著性差异的元素,进一步证明了这些元素间具有较显著的共同特征。
分别利用全部元素数据和差异性元素数据进行了Q型系统聚类分析,结果列于表4中。从中可以看出,与利用全部元素分析的结果相比较,仅利用差异性元素进行的聚类分析,整体正确率更高,特别是利用Ward法和Chebychev类间算法的结果,正确率为84.06%,在所有聚类结果中正确率最高。
表4 Q型系统聚类分析结果
2.4 判别分析
针对训练集样本,利用冬枣中全部元素和特征元素进行了Fisher线性判别分析(LDA),并且通过交叉验证对方法的准确性进行了考察,结果见表5。利用全部元素进行的判别分析中,回代检验和交叉检验的分类正确率分别为96.0%和88.0%。仅利用特征元素的分析结果中,虽然回代检验的正确率为94.0%,略有下降,但是交叉检验的正确率提高到92.0%。后期利用验证集样本对该判别模型进行了外部检验,利用全部元素和特征元素的判别正确率均为89.5%,说明特征元素能够代表大部分的特征信息。其中镁元素对于两个判别式的影响最大,是重要的产地判别元素。
表5 基于Fisher判别分析的训练集冬枣样本分类结果
2.5 偏最小二乘判别分析(PLC-DA)
偏最小二乘法综合了主成分分析、相关分析和多元线性回归分析的优点,易于辨识系统信息与噪声。在该分析法中,每一个样本都被赋予一个分类变量,黄骅冬枣样本为1,沾化冬枣样本为-1。然后建立分类变量和自变量间的回归模型,根据分类变量的预测值判断样品的归属,预测值大于0的为黄骅样本,预测值小于0的为沾化样本。采用逐一剔除法交叉验证回归模型的准确性。在对全部数据分析中,前3个主成分的累积方差贡献率为58.43%,其得分的三维图(见图2)可看出两产地的样本有比较明显的聚类趋势,仅有少量样本容易混淆。
图2 冬枣样本前三个主成分得分图Fig.2 Scores plot of the first three principle components of Ziziphusjujuba
针对训练集样本,利用全部元素数据和特征元素数据进行的偏最小二乘判别分析结果列于表6中,可看出仅利用特征元素的回代检验正确率接近利用全部元素的分析结果,而交叉检验的正确率高于全部元素分析结果。后期利用验证集样本对该判别模型进行了外部检验,利用全部元素的判别正确率为89.5%,利用特征元素的判别正确率为94.7%。进一步证实了特征元素对于冬枣的产地溯源是有效的。同时,该结果与Fisher判别分析的结果相比,准确率更高。
表6 基于PLC-DA的训练集冬枣样本产地判别结果
黄骅冬枣和沾化冬枣中Mg、B、Mn、Fe和Zn元素含量存在较大差异,是重要的具有产地特征的元素。利用无监督模式的R型系统聚类分析结果表明Mn、Zn、Fe和B元素具有相近的特征,进一步证实了这些元素在产地判别中更为重要。
利用Q型系统聚类、Fisher判别和PLS-DA分别对全部元素和产地特征元素进行了产地鉴别分析,结果表明仅利用产地特征元素的鉴别正确率高于全部元素的分析结果。该部分研究证实了筛选特征元素进行食品产地溯源是一种有效的方法,不仅极大减少了分析检测工作量,还能提高鉴别正确率,摒弃受人为和气候等影响较大的元素。也证实了元素与产地土壤的相关性分析是筛选具有产地特征元素的有效方法。
Q型系统聚类、Fisher判别和PLS-DA三种算法的预测准确率可看出,具有监督模式的Fisher判别和PLS-DA算法准确率远高于无监督模式的系统聚类法,更适于产地溯源分析。由于PLS-DA算法善于在自变量相关的情况下辨识信息与噪声,模型准确率更高。
该研究具有一定代表性,可以应用于冬枣产地鉴别的工作。同时,由于样本的年份范围较窄,样本地域分布有限,还应进一步增加样本数量和种类,不断修正鉴别模型,以扩大模型的应用范围。
[1]马庆华. 不同产地冬枣遗传品质差异及其栽培技术研究[D]. 北京:北京林业大学,2007:2-5.
[2]Ariyama K,Horita H,Yasui A. Establishment of an inorganic elements measuring method for determining the geographic origin of Welsh onion and preliminary examination[J]. Bunseki Kagaku,2003,52(11):969-978.
[3]Ariyama K,Shinozaki M,Kawasaki A. Determination of the geographic origin of rice by chemometrics with strontium and lead isotope ratios and multielementconcentrations[J]. Journal of Agricultural and Food Chemistry,2012,60(7):1628-1634.
[4]王睿,王强,王存,等. 基于金属元素组成的新疆石榴产地识别分析[J].食品科学,2015,36(6):202-205.
[5]项洋,郝力壮,牛建章,等.稳定性碳、氮、氢同位素在牦牛产地区分中的应用[J].食品科学,2015,36(12):191-195.
[6]Schwägele F. Traceability from a European perspective[J]. Meat Science,2005,71(1):164-173.
[7]Moreda-Pineiro A,Fisher A,Hill SJ. The classification of tea according to region of origin using pattern recognition techniques and trace metal data[J]. Journal of Food Composition and Analysis,2003,16(2):195-211.
[8]Li GC,Wu ZJ,Wang YH,et al. Identification of geographical origins of Schisandra fruits in China based on stable carbon isotope ratio analysis[J]. Europe Food Reseach Technology,2011,232(5):797-802.
[9]Coetzee PP,Steffens FE,Eiselen RJ,et al. Multi-element analysis of south African wines by ICP-MS and their classification according to geographical origin[J]. Journal of Agricultural and Food Chemistry,2005,53(13):5060-5066.
[10]Ariyama K,Aoyama Y,Mochizuki A,et al. Determination of the geographic origin of onions between three main production areas in Japan and other countries by mineral composition[J]. Journal of Agricultural and Food Chemistry,2006,55(2):347-354.
[11]Costas-Rodríguez M,Lavilla I,Bendicho C. Classification of cultivated mussels from Galicia(Northwest Spain)with European protected designation of origin using trace element fingerprint and chemometric analysis[J]. AnalyticaChimicaActa,2010,664(2):121-128.
[12]Kaoru A,Tanashi N,Tomoaki N. Effects of fertilization,crop year,variety,and provenance factors on mineral concentrations in onions[J]. Journal of Agricultural and Food Chemistry,2006,54(9):3341-3350.
[13]Zhao HY,Guo BL,Wei YM,et al. Effects of wheat origin,genotype,and their interaction on multielement fingerprints for geographical traceability journal of agricultural and food chemistry[J]. Journal of Agricultural and Food Chemistry,2012,60(44):10957-10962.
[14]Sun HW,Xia LY,Liang SZ,et al. The correlation of inorganic anion contents in rice and its soils based on four geographical origin[J]. Food Analytical Methods,2014,7(9):1791-1797.
[15]Zhao HY,Guo BL,Wei YM,et al. Determining the geographic origin of wheat using multielement analysis and multivariate statistics[J]. Journal of Agricultural and Food Chemistry,2011,59(9):4397-4402.
[16]Zeng YW,Wang LX,Du J,et al. Correlation of mineral elements between milled and brown rice and soils in Yunnan studied by ICP-AES[J]. Spectroscopy and Spectral Analysis,2009,29(5):1413-1417.
[17]Mariavittoria Z,Christophe R. Quétel,Eduardo P,et al. Soil properties,strontium isotopic signatures and multielement profiles to authenticate the origin of vegetables from small scale regions:illustration with early potatoes from southern Italy[J]. Rapid Commun Mass Spectrom,2011,25(19):2721-2731.
[18]Shen SG,Xia LY,Xiong Na. Determination of the geographic origin of rice by element fingerprints and correlation analyses with the soil of origin[J].Analytical Methods,2013,21(5):6177-6185.
[19]宋海燕,秦刚,陆辉山,等.基于可见/近红外透射光谱的山西老陈醋产地的判别分析[J]. 中国食品学报,2010,10(4):267-271.
[20]陈军辉,谢明勇,傅博强,等. 西洋参中无机元素的主成分分析和聚类分析[J]. 光谱学与光谱分析,2006,26(7):1326-1329.
[21]王一兵,陈植成,吴卫红,等.基于模糊聚类分析和曲线拟合的FTIR不同产地鸡骨草、毛鸡骨草鉴别分析[J]. 光谱学与光谱分析,2010,30(4):937-942.
[22]董顺福,刘洁,董宏博,等. 丹参中11种中药金属元素含量测定及聚类分析研究[J]. 光谱学与光谱分析,2006,26(11):2150-2153.
[23]钱丽丽,李平惠,杨义杰,等.不同产地芸豆中矿物元素的因子分析与聚类分析[J]. 食品科学,2015,36(14):102-106.
[24]周群,孙素琴,梁曦云. 枸杞产地的红外指纹图谱与聚类分析法研究[J]. 光谱学与光谱分析,2003,23(3):509-511.
[25]GuicenMaab,YingbinZhangab,JianyangZhangab. Determining the geographical origin of Chinese green tea by linear discriminant analysis of trace metals and rare earth elements:Taking DongtingBiluochun as an example[J]. Food Control,2016,59(1):714-720.
Identification of Ziziphus Jujuba origin by multi-element analysis
XIA Li-ya1,GAO Wei1,LI Ya-ping2,YIN Jie-xuan1,ZHANG Xiao-yu1,LI Xiao-yang1
(1.College of Quality & Technical Supervision,Hebei University,Baoding 071002,China; 2.College of Engineering,China Agricultural University,Beijing 100083,China)
In order to explore the feasibility of using the feature elements between origins to identify origins,the contents of 10 elements in Ziziphusjujubas which collected from different producing areaswere measured,and the data were analyzed bydifference analysis,cluster analysis,Fisher discriminant analysis and partial least squares discriminant analysis(PLS-DA). The results showed that there were significant difference in the contents of Mg,B,Mn,Fe,Zn and other elementsfrom the two places of origin,and R-type hierarchical cluster analysis of 10 elements indicated that B,Mn,Fe and Zn element clustered together with similar behaviors.The correct classification rate of geographic origin made by Fisher discriminant analysis,Q-type hierarchical cluster analysis and PLS-DA based on feature elements were closed to the result of total elements. The highestclassification rate was made by PLS-DA based on feature elements,which gave an overall correct classification rate of 94.0% and cross-validation rate of 94.0%. The correct rate of Q-type hierarchical cluster analysis was lowest,which was only 84.06%. This study confirmed that the feature elements between origins was effective in predictions of geographic origin,and supervised modes Fisher discriminant analysis and PLS-DA were superior to unsupervised mode Q-type hierarchical cluster analysis at origin traceability.
Ziziphus jujuba;element;discriminant analysis;partial least squares
2016-06-28
夏立娅(1978-),女,博士研究生,副教授,研究方向:食品品质评定及原产地鉴别,E-mail:xialiya@126.com。
国家自然科学基金资助项目(31501447);河北省自然科学基金资助项目(B2013201235);河北大学自然科学研究项目(2014-02);大学生创新训练计划项目(201610075038)。
TS207.7
A
1002-0306(2016)24-0000-00
10.13386/j.issn1002-0306.2016.24.000