张 莉,孟 靖,2,苟春林,刘 志,袁玉伟*
(1.上海交通大学 分析测试中心,上海 200240;2.上海交通大学 药学院,上海 200240;3.宁夏农产品质量标准与检测技术研究所,宁夏 银川 750002;4.浙江省农业科学院农产品质量标准研究所,浙江 杭州 310021;5.农业部农产品信息溯源重点实验室,浙江 杭州 310021)
枸杞为茄科(Solanaceae)枸杞属(Lycium)植物,全球约有80多个品种,在我国有7个品种和3个变种,是我国传统药食同源植物[1]。现代研究表明,枸杞中含有多糖、黄酮、氨基酸、甜菜碱、类胡萝卜素、酚酸、脂肪酸等有效成分[2],有抗氧化、抗衰老、增强免疫力的作用[3],并具有滋补肝肾、益精明目的功效。枸杞耐盐耐旱,广泛分布于我国的西北地区,包括宁夏、内蒙古、新疆、甘肃、青海、河北等省。据青海省商务厅和宁夏自治区林业局2015年的数据,两省的枸杞种植面积分别达到45万亩和85万亩,年综合产值超过80亿元。同时,枸杞也是我国重要的地理标识产品,已注册的有宁夏枸杞、中宁枸杞、巨鹿枸杞、靖远枸杞、瓜州枸杞、精河枸杞、民勤枸杞、柴达木枸杞等。然而一些不法商贩为了追求更高的利益,以次充好,使用虚假标签,破坏市场秩序。为使枸杞产业健康发展,维护企业品牌和消费者权益,亟需建立有效的枸杞质量控制和产地溯源分析技术。目前国内外学者通过色谱技术、质谱及其联用技术、红外光谱技术、矿质元素分析技术等分析不同产地枸杞中化学成分和痕量元素的组成及含量,找出地域差异性特征,对枸杞进行质量评价和产地溯源。本文对近年来枸杞特征组分检测与溯源鉴别技术的研究进展进行了综述,为我国开展枸杞原产地保护的溯源和鉴别提供方法借鉴。
分光光度法通过测定物质在一定波长范围的吸光度,对该物质进行定性和定量分析。分光光度法的使用范围广,分析成本低,操作简单、快速。枸杞含有大量糖类,总糖量约占46.5%,枸杞多糖是一种水溶性多糖。作为枸杞的主要活性成分,多糖具有免疫调节、抗肿瘤、降血脂、降血糖、降血压和抗疲劳等作用,研究最为广泛。中国药典中采用紫外分光光度法测定枸杞多糖含量。刘万仓等[4]通过水提醇沉法、脱蛋白制得宁夏中宁、银川和青海精制枸杞多糖,采用紫外分光光度法在490 nm处测得其含量为2.92%~7.55%,不同产地枸杞的多糖含量差异较大,平均回收率为98.8%。
表1 分光光度法在各产地枸杞检测中的应用实例Table 1 Application of spectrophotometry in the detection of wolfberry from different origins
*no data
此外,分光光度法还可对枸杞中的总黄酮、类胡萝卜素这类抗氧化物质进行检测。李红英等[5]采用分光光度法在510 nm处测定了宁夏、新疆、河北和青海等地枸杞的黄酮含量。宁夏同心和宁夏银川南梁地区枸杞中的黄酮含量较高,平均含量为669.5 mg/100 g。孙波等[6]通过紫外分光光度法在465 nm处检测了宁夏、内蒙古、新疆和黑龙江产地枸杞的β-类胡萝卜含量,发现宁夏中宁县枸杞的β-类胡萝卜含量最高,达到12.70 mg/g。分光光度法在各产地枸杞检测中的应用实例见表1。
色谱技术具有强大的分离功能,且仪器成本较低,操作简便,能够在简单预处理条件下实现复杂基质中多目标组分的同时定量分析。传统分光光度法不具备色谱的分离功能,因此对复杂体系中特征组分的分析能力较弱。色谱法的准确度更高,在食用农产品、食品和药品的绝大多数领域中均有应用,是较为普适的分析手段。
枸杞中含有大量有效成分,可通过色谱柱将其分离后,再进行定性或定量分析。枸杞中的多糖、黄酮、氨基酸、甜菜碱、类胡萝卜素及酚酸类等成分均可采用色谱法检测,色谱技术是当前用于枸杞质量控制的主要分析技术。
1.2.1高效液相色谱高效液相色谱(HPLC)通过物质在固定相和流动相之间的分配或通过物质吸附作用不同进行分离,通过标准品可对待测组分进行定量或半定量分析。有学者采用HPLC测定了枸杞中维生素C[15]、东莨菪素及东莨菪苷[16]等的含量。枸杞中含有的色素主要为类胡萝卜素,对眼部疾病如视网膜病变、黄斑变性等有一定功效。曲云卿等[17]采用分光光度法、HPLC法测定了8个产地枸杞干果中的类胡萝卜素总量,以及玉米黄素、β-胡萝卜素和玉米黄素双棕榈酸酯的含量,在20 min内实现了对3种类胡萝卜素的定性定量,回收率为90.8%~103.9%。结果表明,类胡萝卜素含量为0.41~2.10 mg/g,青海枸杞中含量最高,惠农最低,且玉米黄素双棕榈酸酯>玉米黄素>β-胡萝卜素。聚类分析结果显示,中宁、固原、青海的枸杞可分为一类,新疆、甘肃、南梁、惠农、内蒙古的分为一类。氨基酸与食品的风味和营养价值密切相关,是衡量食品营养品质的重要指标之一。吴有锋等[18]配制了17种氨基酸的混标溶液,以 2,4-二硝基氟苯为衍生试剂,采用柱前衍生高效液相色谱法测定了6个产地的柴达木枸杞,回收率达90.28% ~102.85%。测得不同产地枸杞的氨基酸平均含量为6.945%~8.035%,产自德令哈的含量最高,格尔木最低。同一产地的枸杞,10月采摘的枸杞中氨基酸含量大于8、9月份。
1.2.2离子交换色谱离子交换色谱利用被分离物质在离子交换树脂上离子交换能力的不同而实现分离。适用于离子化合物和易电离分子的分离。甜菜碱能够促进脂质代谢,是枸杞中的主要生物碱和活性成分之一。庄红艳等[19]通过阳离子交换色谱测定了宁夏、甘肃、内蒙枸杞样品中甜菜碱的含量,发现宁夏样品中含量最高,达到8.94 g/kg,平均回收率达88.8%;但是该研究的样品数量较少。
1.2.3凝胶渗透色谱凝胶渗透色谱又称凝胶过滤色谱、分子排阻色谱。与其他液相色谱不同,其原理为不同大小的溶质分子通过具有分子筛性质的固定相进行分离。柱内填充的凝胶颗粒具有大小不一的孔径,大分子因不能通过凝胶颗粒的孔径而先被洗脱出;小分子则需流过较多的凝胶孔隙,所需时间较长,后被洗脱。凝胶渗透色谱主要用于分离大分子物质。韩红[20]采用凝胶渗透色谱测得内蒙古、宁夏、青海不同采摘时期枸杞的多糖含量为12.35~18.84 mg/g,以内蒙古秋果含量最高。相比于传统化学显色法[21],凝胶渗透色谱法测定枸杞多糖含量的准确度更高。
1.2.4指纹图谱色谱指纹图谱在中药质量控制中得到广泛应用[22-23],是近年来中药研究的热点,可用来鉴定药材真伪,评价药材的均一性、道地性。但指纹图谱是一种整体、综合的评价方法,适用性较差。张自萍等[24]采用ODS色谱柱,建立了宁夏、新疆、河北不同品种(宁杞Ⅰ号、宁杞Ⅱ号和大麻叶)15个样品的黄酮类HPLC指纹图谱,共得到16个特征峰,以16号芦丁峰为内参峰,所有组分在55 min内洗脱。宁杞Ⅰ号中芦丁和绿原酸的峰面积高于其他两个品种,且来自宁夏固原黑城乡、中宁恩和乡、银川南梁农场以及新疆样品的芦丁和绿原酸含量较高,说明不同品种和产地具有特征差异性。廖国玲等[25]采用NH2色谱柱,建立了不同产地的“宁杞Ⅰ号”宁夏枸杞中甜菜碱提取物的HPLC指纹图谱,得到8个特征峰,5号峰甜菜碱峰为内参峰,所有组分在40 min 内全部洗脱。并以其他产地和品种的枸杞作为参比,发现内蒙样品与指纹图谱相关性高,不同品种的相关性低。Liu等[26]建立了中国16个不同产地和品种的枸杞多糖高效排阻色谱、柱前衍生/高效液相色谱、红外光谱、紫外光谱的指纹图谱。通过多种指纹图谱的建立,并结合化学计量学,筛选出4种单糖(半乳糖醛酸、葡萄糖、半乳糖和阿拉伯糖)化学标志物,可区分不同产地的枸杞。黑龙江和山西枸杞多糖的结构性质与其他产地样品不同。这表明样品来源的多样性对于产地溯源工作有重要影响。色谱在枸杞特征组分和产地检测中的应用实例见表2。
表2 色谱在枸杞产地检测中的应用实例Table 2 Application of chromatography in detection of wolfberry from different origins
(续表2)
SampleMethodAnalyteOriginContent differenceReferenceHPLC酚酸青海、内蒙古、甘肃、新疆、宁夏不同产地各酚酸含量不同[31]HPLC甜菜碱宁夏(同心、中宁、惠农、银川)2.21 mg/g(惠农) ~2.298 mg/g(中宁)[32]HPLC甜菜碱宁夏、甘肃、青海0.300 4%(宁夏平罗)~0.588 0%(宁夏中宁)[33]HPLC东莨菪内酯宁夏、青海、甘肃、新疆、河北7.7 μg/g(新疆)~21.59 μg/g(宁夏)[34]HPLC法荜枝苷26.1 μg/g(内蒙古)~43.3 μg/g(宁夏)[35]HPLC玉米黄质棕榈酸二酯中国三地、意大利市售28~54 mg/10 g[36]枸杞叶片HPLC总黄酮青海各县0.127%(乐都县岗沟乡)~3.443%(都兰县香日德镇)[37]
质谱作为一种高灵敏度、高分辨率的检测仪器,弥补了传统紫外、荧光等检测器灵敏度低和选择性差的缺点,且能为化合物的结构解析提供重要信息。质谱与色谱分离技术的联用,能够更加准确地分析枸杞中有机物质的组成和含量,这对于不同产地枸杞标志化合物的分析非常重要。
1.3.1气相色谱-质谱联用技术气相色谱-质谱联用可测定易挥发、热稳定性好的物质。枸杞中含有的大量挥发性成分组成了其独特的风味,不同产地间风味亦有不同。曲云卿[38]采用顶空固相微萃取/气相色谱-质谱联用技术检测到8个不同产地枸杞样品中的133种挥发性物质,不同产地枸杞中所含的挥发性成分组成以及含量有很大差异,其中共有挥发性物质仅9种(1-甲基环庚醇、邻苯二甲酸二甲酯、邻苯二乙酸二乙酯、二氢猕猴桃内酯、己醛、月桂醛、β-环柠檬醛、β-紫罗兰酮和β-紫罗兰酮环氧化物)。经主成分分析(PCA)发现,1-甲基环庚醇、己酸、β-紫罗兰酮、二氢猕猴桃内酯、邻苯二甲酸二乙酯和β-环柠檬醛对枸杞风味的影响较大。也有学者通过衍生化测定枸杞多糖的单糖组成。陈艳蕊[39]通过气相色谱-质谱(GC-MS)测定了内蒙古、甘肃、青海、河北、新疆等地枸杞多糖中的单糖组成。枸杞多糖主要由D-阿拉伯糖、L-木糖、L-核糖、D-半乳糖、D-葡萄糖和D-甘露糖等单糖组成。除河北的枸杞只检出D-葡萄糖和D-甘露糖外,其他省份6种单糖均有检出,表明河北枸杞的多糖结构与其他产地枸杞存在差异,具有一定的地域特征。
1.3.2液相色谱-质谱联用技术Adams等[40]采用高效液相色谱与四极杆质谱和离子阱质谱联用技术分析了来自中国和泰国的8个枸杞样品中的阿托品。四极杆离子阱质谱具有多级质谱功能(MSn),通过离子累加和离子放大器检测后,具有很高的灵敏度。结果表明,各地样品均检出阿托品,最高浓度为19 ppm,远低于毒性剂量。
单四极杆质谱(Q)的性能稳定可靠,但只能得到低分辨数据;高分辨率质谱如飞行时间(TOF)质谱适用于对化合物分子量和二级结构进行精准分析[41]。而四极杆-飞行时间质谱(QTOF-MS)则将这两种质谱的优势相结合,在四极杆中选取离子通过飞行时间质谱进行分离分析,可实现精确的分子测定以及未知物质的结构鉴定,在代谢组学中广泛使用。Bondia-Pons等[42]利用液相色谱-四极杆飞行时间质谱(LC-QTOF-MS)技术对中国北方、西藏以及蒙古产的枸杞进行了非靶向代谢物分析,发现蒙古产枸杞富含类黄酮和酚酸类化合物,而柠檬酸则是我国枸杞的特征化合物。通过PCA和偏最小二乘-判别分析(PLS-DA),不同产地的枸杞可得到明显区分。Lam等[43]采用高效薄层色谱-1,1-二苯基-2-三硝基苯肼法(HPTLC-DPPH)测定了中国宁夏、新疆、内蒙古、甘肃和青海共50个甲醇枸杞提取物样品中的抗氧化物质,发现宁夏枸杞的平均抗氧化性显著高于其他地区,并通过电喷雾-四极杆飞行时间质谱技术(ESI-QTOF-MS/MS)鉴别出其中最强的抗氧化物质为2-O-β-D-吡喃葡萄糖基-L-抗坏血酸。Lu等[44]采用UPLC-QTOF-MS和流动注射质谱(FIMS)指纹图谱检测,并结合化学计量学方法区分了来自宁夏和其他各省的29个枸杞样本。结合PLS-DA分析后,UPLC-MS方法判别正确率大于90%,FIMS方法平均判别正确率为71%。
红外光谱和近红外光谱是前处理简单、测定快速以及重复性高的分析技术,在枸杞质量控制和产地溯源中应用广泛。但该技术易受到样品中水分含量的影响[45],且谱带复杂,谱峰重叠严重,往往需借助化学计量学方法进行分析,且不同的数据处理和建模方式对判别结果影响较大。
1.4.1傅立叶变换红外光谱Gao等[46]测定了宁夏中宁、宁夏非中宁、新疆、青海、甘肃共149个枸杞样本在4 000~400 cm-1波段处的傅立叶变换红外光谱(FTIR)。通过均一化对数据进行预处理,判别分析结果显示对中宁枸杞和非中宁枸杞的最佳识别率分别达到93.98%和90.91%,验证率均达到100%。
Yu等[47]采用氨基酸分析仪和FTIR光谱测定了宁夏、河北、新疆、青海和甘肃枸杞中的氨基酸。氨基酸分析仪的结果表明,所有枸杞样品中,天冬氨酸和谷氨酰胺的含量最高,甲硫氨酸的含量最低;中宁枸杞中天冬氨酸、谷氨酰胺和赖氨酸的含量比其他地区高。并通过结合偏最小二乘回归分析,快速、无损预测了中宁枸杞中的天冬氨酸、谷氨酰胺和赖氨酸。根据天冬氨酸含量(大于1.22 g/100 g)进行分类,对中宁枸杞的识别率为75%。
1.4.2近红外光谱Wang等[48]采用苯酚硫酸法和近红外光谱结合PLS模型测定宁夏、内蒙古、甘肃、河北、新疆等地枸杞中的枸杞多糖。当PLS模型预处理方法为标准正则变化(SNV),主成分为5,波段为12 000~7 463、7 002~5 568、5 087~4 003 cm-1时,建模效果较好。盲样t检验表明,近红外光谱法与传统化学方法检测枸杞含量并无显著性差异,可替代传统化学方法。Shen等[49]采用近红外光谱结合主成分分析、最小二乘法支持向量机(LS-SVM)分析了来自我国华北平原、黄土高原、东北平原和西北盆地的90个枸杞样品,并将样本在三维主成分空间中分为4类,其中LS-SVM算法的校正集和测试集准确率分别达100%和96.67%。
二维近红外光谱比一维光谱能够更有效处理复杂体系中的特征信息。Lu等[50]采用二维近红外光谱区分了产自内蒙古、宁夏、河北和新疆的枸杞样品。不同产地的样品在二维同步和异步光谱4 950~5 700 cm-1处有显著差异。
Yin等[51]通过近红外高光谱成像技术(NIR-HIS)结合提取的特征谱带和不同判别分析模型对宁夏中宁、内蒙古乌拉特前旗、新疆精河和青海都兰的枸杞进行了溯源。从枸杞像素光谱和空间分布的角度出发,绘制了主成分虚拟彩图,直观地显示了4个产地枸杞的差异;从枸杞样品的角度出发,基于PCA载荷和二阶导数谱提取的全谱和特征波长建立了不同的判别分析模型。在判别分析的建模方法中,极限学习机(ELM)的判别效果优于支持向量机(SVM)和神经网络-径向基函数(NN-RBF),校准率和预测率均超过90%。因此,应用近红外光谱进行产地判别时,建模方法对结果有较大影响。红外光谱与近红外光谱在枸杞产地检测中的应用实例见表3。
机器视觉是一种基于计算机图像处理的分析技术,具有检测速度快、重复性高的优点。陈晓峰等[56]采用机器视觉得到来自宁夏中宁、甘肃瓜州、青海柴达木枸杞的形态、颜色及纹理方面的54个特征,识别正确率高达100%。
电子鼻通过模仿生物嗅觉识别气味[57],实质上是阵列气体传感器,可检测复杂的挥发性成分。电子鼻得到的是样品整体信息,而不是成分的定性定量结果。Li等[58]运用电子鼻技术结合主成分分析、聚类分析和线性判别分析对来自中宁和非中宁的199份枸杞样品进行分析,并用气相色谱-质谱进行验证。3种模型中,聚类分析将中宁枸杞与非中宁枸杞分为两类,而非中宁产地的枸杞在线性判别分析中重叠较多,判别正确率分别为91.0%、98%和100%。
枸杞中含有丰富的矿质元素,这些矿质元素能够反映枸杞生长的土壤环境、矿质元素的种类和含量差异,具有一定地理标志特征,在枸杞产地溯源中应用较多。分析矿质元素的常用技术主要有原子吸收光度法(AAS)、电感耦合等离子体原子发射光谱法(ICP-AES)和电感耦合等离子体质谱法(ICP-MS)等。AAS法可检测多种微量金属元素,选择性强。但易受干扰,在进行多元素分析时,不同元素需更换光源灯,效率低。史秀红等[59]通过AAS,测定了宁夏、河北、山东、内蒙古、青海等地枸杞中的K、Na、Ca、Mg、Fe、Cu、Zn、Mn、Cr,并进行聚类分析和主成分分析,发现宁夏产地的枸杞与其他产地有明显不同。ICP-AES法可以同时测定多元素,耐盐性较强,大部分元素的检出限约在ppb级。刘毅等[60]采用ICP-AES法测定了不同产地枸杞中Pb、As、Hg、Cd、Cr、Cu、Fe、Mn、Zn 9种微量元素的含量,检出限为0.000 1~0.006 1 mg/L。其中河北青龙的枸杞检出Cd和Cr,且Mn和Zn含量最高;而内蒙巴彦淖尔的枸杞检出As和Hg,且Fe和Cu含量最高,结果表明不同产地枸杞的微量元素含量存在差异。ICP-MS法可实现多种痕量元素的同时检测,且线性范围宽。Zhang等[61]采用ICP-MS测定了宁夏、甘肃、新疆的122份枸杞样品中的K、Mg、Fe、Ca、 Zn、Cu、Mn、Al、Sr、Rb、Mo、Tb、Cd、Co、V、As、Cs、Pr、Dy和Gd元素,结果表明除了K元素,其他元素在不同地域间均有显著性差异。判别分析可将中宁枸杞与非中宁枸杞区分开,且对原始数据和交叉检验的判别率分别为95.7%和85.7%。但该方法的交叉检验判别率较低。矿质元素分析技术在各产地枸杞检测中的应用实例见表4。
表4 矿质元素分析技术在枸杞产地检测中的应用实例Table 4 Mineral element analysis in detection of wolfberry from different origins
由于中药组分的复杂性,且产地溯源分析需大量样品,庞大的数据需依靠化学计量学进行处理统计,实现数据结果的可视化。化学计量学应用在枸杞的特征组分鉴别和产地溯源中,可分为无监督模式的识别方法(主要包括聚类分析和主成分分析)以及有监督模式识别方法(偏最小二乘-判别分析、支持向量机等)。
3.1.1聚类分析聚类分析是在分类情况未知的情况下,根据研究对象的特征进行分类。按照该特征,计算样本间的马氏距离或欧式距离,距离近的先聚合,直至所有相似样品聚为一类。聚类分析是为了寻找数据集中的“簇”,即相似元素的集合。聚类分析在枸杞的特征组分分析、指纹图谱及无机元素分析中应用较多,可对不同产地的枸杞进行比较。
3.1.2主成分分析主成分分析通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,将原来的多个指标转变为少数几个能反映总体的指标(主成分),实现数据的降维。既不丢掉主要信息,又消除了变量之间共线性的问题。在每个主成分之间互不相关的前提下,保留了原始变量的大部分信息,使分析得到简化。枸杞的指纹图谱、无机元素分析往往为高维数据,采用主成分分析进行降维十分必要。
图1 PLS-DA区分宁夏和其他产地的枸杞[43]Fig.1 Distinguish Ningxia and other origins wolfberries by PLS-DA[43]
3.2.1偏最小二乘-判别分析偏最小二乘回归是多因变量对多自变量的回归建模。偏最小二乘-判别分析(PLS-DA)是一种基于PLS回归的有监督判别分析方法,根据已知样品集的特点,制定合适的判别标准,建立一种定性分析模型,并应用于未知样品判定。 PCA 是无监督分析,反映了数据的原始情况,能够了解数据的整体情况。但是,当各组之间差异较小而组内差异较大时,则很难得到正确结论。 PLS-DA 通过人为加入分组变量,能够弥补 PCA的不足,使得组间差异得到强化。采用PLS-DA对UPLC-MS数据进行判别,可观察到宁夏和其他产地枸杞的区分度较好(图1)[43]。
3.2.2支持向量机支持向量机是用于多元函数估计或非线性分类的学习算法[66]。在高维或无限维空间中构造一个或一组超平面,可用于分类、回归或异常值检测。支持向量机可用较少的训练变量或样本学习高维特征空间。杜敏等[54]通过近红外光谱结合多类支持向量机算法,对青海、宁夏、内蒙的枸杞样品表面各个部位进行建模,除枸杞子顶端部位外,其他部位的模型外部验证率均大于97%。
色谱分析、质谱及其联用技术、红外光谱技术、矿质元素分析技术等为研究各产地枸杞差异以及枸杞产地溯源的主要方法,每种分析方法有其优势与局限性。虽然,已有学者利用色谱技术开展了许多成分分析工作,且单一成分指标能在一定程度上评价不同产地信息,但由于实际样品受到土壤环境、气象因素、加工贮藏方式等影响波动较大,可信度低于多指标分析。且色谱技术前处理相对复杂,分析时间长,精度和灵敏度均较低;结合质谱技术虽能提高灵敏度,但质谱仪价格较为昂贵,且对复杂组分分析的难度较大。红外光谱前处理简单,可进行多组分测定,快速高效,但傅立叶变换红外光谱的识别率不够高,在定量方面的准确度低,且需大量样本进行建模;近红外光谱也存在建模过程较复杂,样本需求量大的问题,主成分数和判别方式的选择对建模结果的影响较大。矿质元素分析是目前应用较多的方法,但矿物元素易受到枸杞的生长环境、种植技术和气候因素的影响,需综合考虑各方面因素,保证结果的可靠性。一些新兴技术如机器视觉和电子鼻技术也不断涌现,具有一定的应用前景,但现阶段研究较少。未来应将多种方法结合并利用大数据分析,取长补短,提高枸杞产地溯源的准确性。
近年来,稳定同位素质谱已在葡萄酒、蜂蜜、茶叶、奶粉等多种食品、农产品产地溯源中得到应用[45,67-68]。物质的类型(如C3或C4植物)与产地的环境因素(如海拔、温度、土壤环境等)对稳定同位素的含量影响较大,而加工方式等对其影响较小。未来可将稳定同位素质谱技术、有机成分分析技术及多元素矿质元素分析等技术相结合,建立更加准确可靠的枸杞多变量数据库,并采用化学计量学方法构建不同的判别模型,用于产地溯源。
此外,还有一些亟需注意和解决的问题:①确保样品来源的真实性,这是进行产地溯源和评价的前提,同时将样品信息尽可能完善,如品种、产地信息、气候条件、光照、降雨等;②通过大数据挖掘,找到一种或几种更具有特异性,受影响因素小的特征因子,建立真正的“溯源指纹谱图”;③采用化学计量学方法,构建多变量数据库,测试不同模型的稳健性和可靠性。