刘雯雯,韦 婉,2,陈 岩,赵 洁,傅曼琴,王 旭,*
(1.广东省农业科学院农业质量标准与监测技术研究所,广东 广州 510640;2.广东海洋大学食品科技学院,广东 湛江 524088;3.广东省农业科学院蚕业与农产品加工研究所,广东 广州 510610)
陈皮为芸香科植物橘(Citrus reticulataBlanco)及其栽培变种的干燥成熟果皮[1],根据品种和产地不同主要可分为陈皮和广陈皮。其中陈皮一般指大红袍(Citrus reticulataDahongpao)、温州蜜柑(Citrus reticulataUnshiu)、福橘(Citrus reticulataTangerina)等的干燥成熟果皮,产地为四川、浙江、福建、广西等;广陈皮一般指茶枝柑(Citrus reticulataChachi)的干燥成熟果皮,产地为广东[2]。陈皮含有丰富的黄酮类化合物如橙皮苷、柚皮苷等,萜类化合物与挥发油如柠檬烯、β-蒎烯、柠檬苦素等,以及生物碱类如辛弗林等[3]。现代药理学研究表明,陈皮具抗菌抗炎、理气健脾、燥湿化痰等多种药理作用[4-5]。
目前,市场对陈皮的需求不断增加,陈皮的品质和价格主要受产地、品种、采收期和陈化时间等因素影响。普遍认为广东陈皮与其他产地陈皮相比具有更优越的品质,以新会陈皮最为道地。“陈久者良”的理论使得高年份陈皮价值高于低年份陈皮,陈化时间长短引起价格的差异可高达20 倍[6]。个别不法商贩为获取更大的利益,用外地柑皮冒充新会陈皮、将低年份的陈皮浸泡上色当作高年份陈皮出售的乱象时有发生。传统的陈皮鉴别主要是通过感官分析比较果皮厚度和颜色以及对光透视时油室大小和密集程度等方面的差异,根据经验判断陈皮的真假优劣或大致产地、品种及陈化时间[7]。然而,经验鉴别法易受主观因素的影响,并且采收期、干燥方式的差异等因素也会使陈皮的性状发生较大变化[8]。因此,为准确评估陈皮质量和价值,亟需建立有效的陈皮溯源技术,确定其地理来源、品种、采收期和陈化时间。本文分析总结了代谢组学、光谱、DNA分析、元素分析、智能感官技术在陈皮产地溯源与鉴伪研究的发展现状和存在的主要问题,并以此为基础展望未来研究的发展重点。
代谢组学通过分析和比较生物体中的代谢物描述生物样本之间的异同[9],按照研究策略的不同可以分为靶向代谢组学和非靶向代谢组学。常用的仪器平台包括色谱仪、质谱仪、色谱-质谱联用仪等。通过分析比较陈皮指纹图谱、化学成分等差异并结合化学计量学方法可实现陈皮产地溯源和鉴伪,相关研究成果见表1和表2。
表1 代谢组学技术应用于陈皮产地溯源研究总结Table 1 Summary of metabolomic technologies applied to trace the geographical origin of CRP
表2 代谢组学技术应用于陈皮品种、采收期和陈化时间鉴伪研究总结Table 2 Summary of metabolomic technologies to identify the variety,harvest period and aging time of CRP
指纹图谱作为一种综合的、可量化的色谱鉴定手段,通过分析指纹图谱之间的规律性,可确认陈皮化学成分信息[10]。陈彤等[10]利用气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)联用仪建立8 个产地陈皮的挥发油指纹图谱,采用主成分分析(principal component analysis,PCA)方法研究图谱中左旋-α-蒎烯、β-蒎烯等7 个共有特征峰,PCA图显示新会、四会、四川、南丰和桂林这5 个产地的样品各自聚类,得到较好的区分。杨雪燕等[11]也建立了具有16 个共有特征峰的新会陈皮挥发油指纹图谱,PCA和层次聚类分析(hierarchical cluster analysis,HCA)结果表明新会陈皮与其他产地陈皮区分效果良好。为进一步提高产地鉴别准确率,胡继藤等[12]采用人工神经网络(artificial neural network,ANN)解析5 个不同产地陈皮的高效液相色谱(high performance liquid chromatography,HPLC)指纹图谱中6 个共有成分峰数据,可实现100%识别新会陈皮。指纹图谱也可用于鉴别陈皮品种,郭念欣等[13]分别建立广陈皮和陈皮的HLPC指纹图谱,通过比较特征峰的保留时间、峰面积等以及软件计算各样品间的相似度,初步区分了广陈皮与陈皮。徐展翅等[14]研究也指出广陈皮的HPLC指纹图谱与其他5 个品种(大红袍、温州蜜柑、年橘、贡柑、蕉柑)陈皮的指纹图谱具有特征性差异,可用于区分广陈皮与普通陈皮。在差异分析的基础上,采用化学计量学方法解析图谱数据能提高鉴别准确率和挖掘特征成分。胡继藤等[12]采用ANN方法分析陈皮HPLC指纹图谱,实现了茶枝柑、温州蜜柑、大红袍3 个品种陈皮的鉴别,准确率为90%。Tistaert等[15]利用判别偏最小二乘(discriminant partial least squares,DPLS)方法挖掘出陈皮不同于其他柑橘果皮的多个特征成分(如川陈皮素、橘皮素、橙皮苷等),所构建的陈皮鉴别模型准确率可达98.3%。另外,Yi Lunzhao等[16]通过偏最小二乘线性判别分析(partial least squares-linear discriminant analysis,PLS-LDA)方法分析不同采收期陈皮HPLC指纹图谱中18 个共有特征峰数据,鉴别青皮和大红皮准确率为93%。
黄酮类成分是陈皮的重要功能性化学成分,主要由黄酮苷类和多甲氧基黄酮类组成[17]。其中的橙皮苷、川陈皮素和橘皮素是陈皮质量评估的重要指标,通过比较这3 个成分的含量比值并结合HCA和PCA方法可初步区分广陈皮与其他陈皮[18]。Liu Ehu等[19]在橙皮苷、川陈皮素和橘皮素的基础上进一步测定了柚皮苷、七甲氧基黄酮和五甲氧基黄酮的含量,通过对陈皮中这6 种特征黄酮类成分含量进行HCA可明显区分茶枝柑品种陈皮与九月黄、温州蜜柑、早橘品种的陈皮。在常见黄酮类成分之外,高分辨质谱法结合化学计量学方法能挖掘出新的特征成分并构建鉴别模型。如在品种鉴别方面,基于液相色谱-高分辨质谱的非靶向代谢组学方法结合正交偏最小二乘判别分析(orthogonal partial least squares-discriminant analysis,OPLS-DA)等筛选出了茶枝柑品种陈皮不同于其他品种陈皮的特征成分[20-22],主要包括六甲氧基黄酮、甜橙黄酮、野漆树苷、芦丁、香叶木素-6-8-C-葡萄糖苷、木犀草素-6-8二-C-葡萄糖苷、2,3,4,5,7-五甲氧基黄酮、4’-羟基-5,6,7,8-四甲氧基黄酮等,构建的OPLS-DA模型能鉴别出茶枝柑品种陈皮。同样的方法也被用于鉴别陈皮和橘红,筛选出咖啡酰奎宁酸、柚皮苷、柚皮黄素等12 个特征成分[23]。而在产地、采收期和陈化时间鉴别方面,黄芳等[24]研究表明甜橙黄酮、辛弗林、羟基四甲氧基黄酮、柚皮苷、枸橘苷等9 个特征成分在区分不同产地陈皮间起到重要作用,LDA模型鉴别新会陈皮的准确率为94.4%;汪鹏[20]研究结果显示以多甲氧基黄酮类、柠檬苦素类为主的27 个特征成分可用于鉴别青皮和大红皮;Luo Yan等[22]发现陈皮中柚皮苷、5-羟基-7,8,2’-三甲氧基黄酮、去甲基川陈皮素等31 个成分含量与陈化时间相关,结合OPLS-DA构建模型可区分3、5、10 a以及15 a以上的广陈皮。
陈皮中含有丰富的挥发性成分,主要包括单萜烯、倍半帖烯、含氧化合物等[25]。陈明权等[26]通过比较陈皮挥发油中α-蒎烯与β-蒎烯的比值差异可简单快速区分新会陈皮,并且α-蒎烯与β-蒎烯的比值受采收期、陈化时间等因素影响较小。曹烙文[27]利用全二维GC-MS法全面分析陈皮挥发性成分,研究发现薄荷烯酮、二氢香芹醇、反式-2-十二烯醛等13 个成分在新会陈皮与其他产地陈皮间存在差异,且薄荷烯酮只在新会陈皮中被检出。部分挥发性成分被视为潜在的品种特征成分,如Duan Li等[28]研究显示广陈皮中2-甲氨基苯甲酸甲酯、α-甜橙醛、莰烯含量明显高于陈皮,而乙酸香叶酯、β-榄香烯、δ-榄香烯仅在陈皮中检出;Zheng Yuying等[29]筛选出2-甲氨基苯甲酸甲酯、对伞花烃-8-醇、D-柠檬烯、4-萜醇等特征成分用于区分广陈皮与其他陈皮;Lv Weisheng等[30]建立的以2-甲氨基苯甲酸甲酯、柠檬烯、松油醇、蒎烯等为特征成分的挥发性有机物指纹图谱能实现广陈皮鉴别。据此认为2-甲氨基苯甲酸甲酯可能是区分广陈皮与其他陈皮的一个关键特征成分[31-32]。利用挥发性成分差异还可能鉴别采收期和陈化时间,Zheng Guodong等[33]评估了不同采收期广陈皮中主要活性成分的动态变化情况,其中侧柏烯、蒎烯、D-香茅醇、芳樟醇、香叶醇、D-柠檬烯等22 种挥发性成分含量与采收期相关,结合PCA方法可初步区分青皮、微红皮和大红皮。梁天一等[34]利用气相色谱-离子迁移谱(gas chromatography-ion mobility spectrometry,GC-IMS)研究发现不同陈化时间陈皮中左旋玫瑰醚、2-庚酮、松油醇、2-十一碳烯醛等成分含量差异较明显,陈化1 a和12 a的陈皮在PCA图中容易区分。市场普遍认为陈化3 a以上的柑皮才能称作陈皮,Ou Xiaoqun等[35]比较分析了新皮(<3 a)和陈皮(>4 a)中月桂烯、4-蒈烯、松油烯等31 个挥发性成分含量差异,并利用ANN算法建立了新皮和陈皮的鉴别模型,准确率达到96%。
光谱信息可反映样品中化学成分结构和含量,产地、品种、采收、陈化等因素均会引起陈皮的化学成分组成发生变化,因而不同产地、品种、采收期或陈化时间的陈皮的光谱特征存在差异,通过化学计量学方法解析光谱信息可以实现陈皮产地溯源和鉴伪。近红外光谱、拉曼光谱、太赫兹时域光谱、高光谱成像和荧光光谱技术已应用于陈皮的产地溯源以及品种、陈化时间鉴别,相关研究成果见表3和表4。
表3 光谱技术应用于陈皮产地溯源研究总结Table 3 Summary of spectroscopic technologies applied to trace the geographical origin of CRP
表4 光谱技术应用于陈皮品种和陈化时间鉴伪研究总结Table 4 Summary of spectroscopic technologies applied to identify the variety and aging time of CRP
近红外光谱技术常用波长范围在750~2 500 nm之间,波数为4 000~12 000 cm-1,光谱图中的谱峰吸收强度与化合物中共价键的数量和化学环境密切相关,因此通过分析近红外光谱能够获得化合物结构和组成信息[36]。郭念欣等[37]采用PCA、判别分析(discriminant analysis,DA)方法直接分析陈皮近红外光谱的原始光谱数据,能准确鉴别产自广东的陈皮。但原始光谱中易存在谱峰重叠、基线漂移等干扰,选用合适的化学计量学方法对光谱进行预处理,可以消除干扰,提高模型的稳健性和预测性能。余梅等[38]比较了一阶导数(firstorder derivative,1st der)、标准正态变量变换(standard normal variate,SNV)等8 种单一预处理及预处理组合的形式对陈皮内侧和外侧近红外光谱数据进行处理的效果,结果表明陈皮外侧光谱数据经2 个预处理组合优化后,结合PCA建立的模型可区分四川、福建、广东3 个产地的陈皮,准确率为100%。建模算法的优化也是提高模型分类性能的关键,Pan Shaowei等[39]分别采用SNV和Savitzky-Golay滤波(SG)预处理陈皮外侧近红外光谱数据,并比较了随机森林(random forest,RF)、K近邻(K nearest neighbor,KNN)、LDA 3 种建模算法的鉴别效果,其中SG-LDA模型性能较优,新会陈皮鉴别准确率为96.99%。近红外光谱技术在陈皮品种鉴别方面也具有应用潜力,杨桂玲等[40]基于陈皮10 360~9 681 cm-1波段的近红外漫反射光谱,结合1st der和矢量归一法(vector normalization,VN)预处理光谱数据和聚类分析(cluster analysis,CA)可将22 个品种的陈皮分成4 类。闫珂巍等[41]通过SNV预处理陈皮近红外光谱数据后采用PCA建立广陈皮与川陈皮鉴别模型,准确率达到90.91%。董怡青等[42]对陈皮外侧11 190~5 800 cm-1波段的近红外漫反射光谱数据进行预处理后,结合PCA方法可实现假冒陈皮(砂糖橘皮、沃柑果皮等)100%鉴别。近红外光谱技术还能实现快速、无损检测陈皮陈化年份,并展现出较好的鉴别效果。在进行无损检测时,由于陈皮的内侧和外侧结构和化学成分组成有差异,光谱采集到的信号和受到的干扰也有所不同。Pan Shaowei等[39]采集广陈皮外侧900~1 700 nm光谱数据,通过SG预处理和LDA建模,可准确区分3、5、8、10 a的广陈皮,准确率为100%。余梅等[43]研究结果表明基于陈皮内侧近红外光谱数据构建陈化年份鉴别模型的分类精度优于陈皮外侧数据,能实现100%鉴别5、10、15、20、25 a的陈皮。Li Pao等[44-45]研究也指出基于陈皮内侧近红外数据建模的分类精度更高,构建的LDA模型在鉴别4 个陈化时间陈皮时的准确率大于96%,融合分析陈皮内外侧光谱数据可提高鉴别准确率至100%。除了应用LDA建模外,陈皮红外光谱数据结合支持向量机(support vector machine,SVM)和KNN构建鉴别模型能区分1、3、5、7、10 a的广陈皮,准确率为96.50%[46]。
拉曼光谱技术是基于拉曼散射效应分析与入射光频率不同的散射光谱,得到相应分子振动、转动方面的信息,进而获得结构、对称性、化学键等相应分子信息。不同化合物具有不一样的拉曼光谱特征,通过分析其拉曼峰位、峰强、线型、线宽及谱线数目可以从分子水平上进行定性和定量分析[47]。杨方等[48]采用表面增强拉曼光谱技术对8 个不同陈化时间的陈皮进行分析,研究发现与金膜-银纳米颗粒基底相比,金膜或银纳米颗粒基底可获得增强的拉曼光谱信息,基于峰值变化信息推测7 a及以上的陈皮相比5 a及以下的陈皮产生了某些新成分,展示了拉曼光谱技术应用于陈皮陈化时间鉴别的可能性。李静敏等[49]研究显示广陈皮外侧拉曼光谱中768、869、1 598、2 124 cm-1特征峰随年份单调变化,利用这4 个拉曼特征峰和PCA回归法建立广陈皮年份鉴别预测模型,初步实现了3、7、10 a广陈皮的鉴别,但预测准确率仅为76.92%。
太赫兹波是指频率在0.1~10 THz的电磁波,波长在0.03~3 mm之间。太赫兹时域光谱技术是利用透射式或反射式方法得到携带样品信息的时域谱,时域谱经过傅里叶变换后获得样品相关光学参数[50]。余静孝等[51]分析不同产地陈皮太赫兹时域光谱的吸收系数谱,比较多种预处理以及3 种建模算法对产地鉴别准确度的影响,结果表明吸收系数谱经SG预处理后,结合LDA提取光谱特征和SVM构建模型,能准确鉴别产自新会不同区域的陈皮。在吸收系数之外,太赫兹时域光谱的其他光学信息参数亦可用于陈皮鉴别。Liu Yao等[52-53]分别利用吸收系数谱和折射率谱进行陈化时间鉴别,研究显示基于吸收系数谱的鉴别模型性能优于基于折射率谱的鉴别模型,比较4 种建模算法,卷积神经网络(convolutional neural network,CNN)表现出更好的分类效果,区分1、3、5、10、15、20 a新会陈皮的准确率最高为95.63%。而通过原位法获取光谱数据可实现无损鉴别,但准确度有所下降。杨少壮等[54]研究了吸收系数、折射率、复介电常数虚部、介质损耗角正切值应用于陈化时间鉴别中的可行性,通过PCA方法对4 种光学参数进行数据降维和SVM构建分类模型,区分3、5、10、15、20 a陈皮的预测准确率为94%。
高光谱成像技术将光谱与图像相结合,探测目标的二维几何空间和光谱信息,结合空间维和光谱维数据共同组成三维观测数据立方体,已逐渐应用于农业、食品等领域[55]。张悦等[56]将高光谱成像技术应用于陈皮产地溯源,采集不同产地陈皮的可见-近红外和短波红外波段范围内高光谱数据,利用图分割算法提取数据以及1st der方法预处理和PLS-DA建模,可实现快速无损鉴别6 个产地的陈皮,其中省级产地鉴别准确率为98.41%,新会不同区域鉴别准确率为99.05%。鲍一丹等[57]利用高光谱成像技术进行陈化时间鉴别,采集4 个年份的陈皮在380~1 023 nm及874~1 734 nm的内、外侧高光谱图像,通过偏最小二乘回归(partial least squares regression,PLSR)系数法提陈皮年份相关的特征波段,并基于特征波段和非线性极限学习机(extreme learning machine,ELM)方法建立陈皮年份鉴别模型,准确率可达98.33%。
荧光光谱技术利用化合物的光致发光现象产生的荧光特性和强度,进行化合物的定性和定量分析,在药材产地溯源方面已有相关应用[58]。Lan Wei等[59]开发了一种基于纳米颗粒、光谱拼接和化学计量学的简单荧光检测方法用于陈皮品种和陈化时间鉴别,研究选取纳米金颗粒和碲化镉量子点作为纳米传感器,分别与陈皮水提取物混合产生荧光猝灭光谱后,采用光谱拼接策略获得包含陈皮样品自体荧光和荧光猝灭光谱不同组合的拼接光谱。结合PLS-DA构建模型可100%区分茶枝柑品种陈皮与其他品种陈皮,并且对1、5、10、15、20 a陈皮的区分准确率为98.04%。
不同品种来源植物的DNA序列会存在差异,通过测定分析特征DNA片段可实现植物品种鉴别[60],DNA分析技术应用于陈皮品种鉴伪的研究总结见表5。单核苷酸多态性(simple nucleotide polymorphish,SNP)是指基因组上的单个核苷酸发生变异(包括转换、颠换、缺失和插入)形成的遗传标记,是品种鉴别的常用技术。Wang Hongtao等[61]通过对陈皮与柑橘果皮的DNA的内源转录间隔区(internal transcribed spacer,ITS)序列进行扩增、测序和SNP分析,发现了陈皮共有的2 个特异性SNP位点,并以此为基础利用多重等位基因特异性PCR区分陈皮与其他柑橘果皮。Li Shangzhen等[62]研究也发现了陈皮DNA的ITS2区域的3 个特异性SNP位点可以应用于区分4 个品种的陈皮。不同于SNP技术以核苷酸变异作为标记,DNA条形码技术是利用生物体内一段某个品种特有的、且在种内稳定遗传DNA序列对品种进行快速鉴别,ITS2序列是陈皮品种鉴别常用的DNA序列,成树森等[63]通过PCR扩增和测序分析陈皮DNA的ITS2序列,对广陈皮基原植物、广陈皮药材以及橘、柠檬、柚、黄皮4 种近缘种植物进行鉴定,结果表明ITS2序列作为DNA条形码可识别广陈皮基原植物、药材及其他近缘种植物。Yu Xiaoxue等[64]在ITS2序列分析的基础上,结合二级结构比对区分茶枝柑、大红袍、温州蜜柑品种的陈皮。Wang Peng等[65]研究结果也显示茶枝柑品种陈皮DNA的ITS2序列及二级结构与其他3 个品种的陈皮存在明显差异。
表5 DNA分析技术应用于陈皮品种鉴伪总结Table 5 Summary of DNA-based technologies applied to identify the variety of CRP
矿质元素是参与植物代谢的重要物质,植物体内的矿质元素主要来源于周围环境,并且其组成与环境中的矿质元素有较强的相关性[66]。由于不同生长地域环境中的土壤、水及空气中矿质元素组成及含量都有其各自的特征,因此植源性食品中的矿质元素组成可以反映出生长地域的特殊性,进而用于产地溯源研究[67]。目前,利用元素分析进行陈皮产地溯源的研究较少,李富荣等[68]通过分析广东、福建、重庆3 个产地陈皮的矿质元素组成特征,明确了26 种矿质元素含量在广东与福建、重庆之间存在着显著差异,基于差异元素含量构建的LDA和OPLS-DA模型产地鉴别准确率最高可达100%,并确认了Sc、B、Y、Co、Nd、La、Pr、Be、Gd、Dy、Sm、Mo、Fe等矿质元素含量在陈皮产地溯源中发挥了重要作用。
智能感官技术作为新兴的快速分析技术,采用电子传感器模拟生物的嗅觉及味觉系统,从而使样品的检测客观化、智能化[69]。其中的电子鼻和电子舌技术应用于陈皮品种和陈化时间鉴伪的研究总结见表6。电子鼻主要由一组交叉敏感的气体传感阵列和适当的模式识别系统组成,利用多个气敏传感器模拟人类的嗅觉系统,将气味分子转化为不同的电信号识别混合气体[70]。Li Shangzhen等[62]采用可响应酚类和醛类挥发性成分的电子鼻,分析其对茶枝柑、大红袍、温州蜜柑、福橘4 个不同品种陈皮的信号变化,结合PCA方法可将茶枝柑品种陈皮与其他品种的陈皮区分开。类似地,陈林等[71]使用电子鼻表征陈皮挥发性成分的整体信息,研究结果表明不同品种陈皮的挥发性成分存在相似性和差异性,通过判别因子分析(discriminant factor analysis,DFA)方法可初步鉴别出茶枝柑品种的陈皮。电子鼻技术结合ANN模型还能快速鉴别不同品种和不同陈化时间的陈皮,对茶枝柑品种的鉴别准确率为94.67%,对3 个陈化时间的鉴别准确率为96%[72]。电子舌主要由交互敏感传感器阵列、信号调理电路以及模式识别算法构成,通过模拟人类的味觉感受机制分辨和定量溶液中不同的味觉或化学成分,结合化学计量学分析数据可反映样品整体质量信息[73]。Shi Qingrui等[74]采用电子舌分析陈皮提取液化学成分,通过离散小波变换对原始信号进行特征值提取和数据压缩,对比了7 种建模方法对4 个陈化时间陈皮的鉴别效果,结果表明ELM模型性能最优,鉴别准确率可达95%。此外,通过电子鼻和电子舌技术分析圈枝柑陈皮和驳枝柑陈皮气味和滋味成分的差异,结合化学计量学方法能区分2 种栽培方式的陈皮,并筛选出β-月桂烯、柠檬烯、β-反式辛烯、γ-松油烯等主要挥发性风味化合物,以及羟甲基糠醛、橙皮素、橙皮素等关键风味化合物[75]。
表6 智能感官技术应用于陈皮品种和陈化时间鉴伪研究总结Table 6 Summary of intelligent sensory technologies applied to identify the variety and aging time of CRP
产地溯源和鉴伪的化学计量学本质上是应用数学、统计学、计算机及其他相关学科的理论和方法,从化学测量数据出发,通过信息提取和分析研究对象的化学特征,进一步将数据与产地、真伪信息进行关联分析[76]。在陈皮产地溯源和鉴伪研究中,常用的化学计量学方法包括PCA、HCA、LDA、OPLS-DA等,根据是否需要样本的先验知识,可分为无监督算法和有监督算法。PCA和HCA属于无监督算法,该类算法在分类前无需知道样本的类别属性,直接训练样本来获得分类信息,可用于初步概括各组样本间的总体分布情况、自然聚集状态和发现异常样本等。有监督算法是在给定样本分类信息的情况下,通过对样本进行训练或学习构建一个最优的分类模型,随后再利用这个模型完成对未知样本的判别,如LDA、OPLS-DA等。近年来,SVM、ANN等有监督的机器学习算法也逐渐被应用于产地溯源和鉴伪研究,SVM是通过建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化,从而对分类问题提供良好的泛化能力。ANN是通过模仿大脑神经网络结构和功能而建立的,由大量的节点之间相互联接构成,可用来对数据之间的复杂关系进行建模。ANN依靠训练数据来学习,并随时间推移提高自身准确性。对陈皮产地溯源和鉴伪研究而言,如何选择合适的算法以达到最优的分类效果是其中的关键问题。即使是分析同一数据,不同算法的分类效果也各有差异,如Pan Shaowei等[39]采用LDA、RF、KNN分析陈皮的近红外光谱数据以进行产地鉴别,结果显示,LDA分类效果优于RF和KNN。因此,建议在研究中采用多种算法分析数据,比较评估不同算法的分类性能,以确定合适的算法保证产地溯源和鉴伪的准确性。
近年来,国内外学者对陈皮产地溯源与鉴伪技术进行了大量研究,这些技术具有不同的优缺点和应用场景,为了未来更有效地开展相关领域的研究,表7对不同技术的优缺点和应用场景进行了汇总对比。
表7 不同陈皮产地溯源与真实性鉴别技术比较Table 7 Comparison of different techniques for geographical origin traceability and authenticity of CRP
代谢组学技术应用范围广,在产地、品种、采收期、陈化时间鉴别中都具有良好的表现。其中的指纹图谱技术通过分析比较图谱的整体特征能初步区分新会陈皮、广陈皮等,但在多产地、多品种鉴别方面效果欠佳[10,14]。通过定性/定量分析不同陈皮的化学成分,能找出鉴别的关键特征成分和研究其变化规律,但不同的样品前处理方法能获得化学成分组成可能不一样[77],一定程度上会影响分析的重现性和准确性。非靶向代谢组学技术能获取全面、丰富的信息,可是海量的信息对数据处理要求高,而且分析设备昂贵、仪器操作复杂。光谱技术可实现快速、无损检测,其中近红外光谱技术应用较广,检测成本低,结果重现性较好,但其灵敏度不高,可能检测不到某些含量很低的关键溯源和鉴伪成分;拉曼光谱技术可与近红外光谱技术互补,但荧光背景对其有干扰;太赫兹光谱技术具有高穿透性、信噪比高等优势,然而测量频率范围较窄;高光谱成像技术分辨率高,但图像数据冗杂不便于实时分析;荧光光谱技术灵敏度高,只是目前研究仍较少。并且由于光谱数据量大且复杂,数据预处理和模型构建算法的选择对鉴别结果准确性的影响较大[53,56,78]。DNA分析技术不受环境、栽培、陈化等因素的影响,在品种鉴别方面具有独特优势,同时具有重复性和稳定性高、实验操作标准化等特点,可是当前可供选择的分子标记较少,多用于种属水平鉴定,种下品种鉴定准确性略差[20]。元素分析技术检出限低、准确度高,能够综合分析多个元素,但实验操作要求较高,在陈皮鉴别方面应用较少。智能感官技术具有操作简单、响应速度快等优点,然而专属传感器的种类有限、交叉响应特征信号分析较难,传感器也容易受检测环境影响。
综上所述,在陈皮产地溯源和鉴伪领域,代谢组学、光谱、DNA分析、元素分析和智能感官技术都发挥了重要作用。其中代谢组学技术具有广泛的适用性,能获取丰富的信息,并能筛选出多种关键特征成分,有助于研究陈皮的化学成分组成和时空变化规律,但对新特征成分的鉴定和影响机制分析还需深入探究。光谱技术以近红外光谱为主,具有快速检测和操作方便的优势,但其数据冗杂,预处理和建模方法的选择对鉴别准确率影响较大,且需要大量已知化学值的样品构建模型,模型共享和转移存在难度。DNA分析技术在陈皮品种鉴别方面具有较大潜力,然而现在已筛选出的分子标记相对单一,多品种鉴别效果需要加强。元素分析技术利用矿质元素相对稳定且与产地环境相关性强的特点进行溯源,可是现有研究仅分析了不同产地陈皮矿质元素组成差异,未明确矿质元素从土壤环境到陈皮的迁移转化规律。智能感官技术分析速度快,但现有传感器仅对部分气味和滋味敏感,影响其在陈皮鉴别中的进一步应用。
现有研究多集中于陈皮产地溯源和品种鉴别,取得了较好的鉴别效果,但大部分研究仍局限于省级区域溯源以及茶枝柑和其他陈皮品种的鉴别,缺乏精细的小尺度地域溯源和多品种鉴别。采收期鉴别研究也较少,尚未建立有效的鉴别技术。陈化时间鉴别一直是研究热点,多种技术均有应用,但当前样本数量较少、陈化时间各异,所建立的鉴别方法在预测未知陈皮样品时准确性可能降低。
由于陈皮的自身复杂性和多变性,以及当前产地溯源和鉴伪技术有效性与准确性的不足,还需对其进行更深入的研究。为此,本文在总结前人研究的基础之上,尝试给出如下可能的研究重点:
1)对于特征化学成分和元素指标,系统研究产地、品种、采收、陈化等多因素对特征指标变化的影响以及主要迁移、转化机制,阐释特征指标来源和评估其用于陈皮鉴别的有效性和稳定性,并结合功能性成分定量分析,开展陈皮质量评价;
2)对于光谱、图像、传感信号等数据,优化识别算法,研究合适的数据预处理和模型构建方法,提升鉴别模型适用性;
3)对于采收期和陈化时间鉴别,需要合理设计实验,控制单一条件,排除产地环境、栽培方式、加工条件等其他因素的干扰;
4)扩大陈皮样本范围,强化样本代表性,建立和完善陈皮鉴别模型以及形成陈皮相关数据库;
5)联合使用多种技术和融合多源数据,筛选和扩充可代表产地、品种、采收期或陈化时间特征的鉴别指标,结合多元统计分析,提高鉴别精度。
本文通过对陈皮产地溯源和鉴伪技术的研究现状进行分析总结,讨论了各种技术的优缺点和存在问题,展望了未来研究方向,以期为陈皮产地溯源和鉴伪技术的进一步研究提供理论支持。