基于电子鼻技术的不同产地当归快速鉴别研究

2019-10-19 21:29拱健婷邹慧琴王佳宇吴浩忠王大仟李佳慧刘长利李莉
中国医药导报 2019年28期
关键词:当归支持向量机电子鼻

拱健婷 邹慧琴 王佳宇 吴浩忠 王大仟 李佳慧 刘长利 李莉

[摘要] 目的 建立不同產地当归的气味指纹图谱,挖掘其气味的差异性并据此建立判别模型,并建立一种快速、准确、可靠的鉴别不同产地当归药材的方法。 方法 采用电子鼻对不同产地当归样品进行气味分析,提取传感器信号的最大值、平均值、最大斜率和积分值作为特征参数,分别利用主成分分析法和支持向量机对特征参数进行数据分析并建立判别模型,并考察组合特征对不同产地当归的鉴别效果。 结果 主成分分析无法有效区别当归产地。支持向量机能够实现当归产地的快速准确鉴别,当采用单一特征作为特征参数时鉴别效果一般,在测试集上的平均正判率为86.03%;当采用组合特征作为特征参数时效果较好,两特征组合、三特征组合平均正判率分别为86.76%、89.71%,四特征组合正判率最高,为91.18%。 结论 电子鼻技术可以准确鉴别不同产地当归样品,为中药材产地快速鉴别提供新技术和新方法,不同模式识别算法和特征参数的筛选与优化为电子鼻的数据挖掘在中医药研究中的应用提供更多思路。

[关键词] 电子鼻;当归;产地;主成分分析;支持向量机;特征组合

[中图分类号] R282.5          [文献标识码] A          [文章编号] 1673-7210(2019)10(a)-0039-05

Rapid identification research on Angelica sinensis from different producing areas based on electronic nose technology

GONG Jianting1,2   ZOU Huiqin3   WANG Jiayu4   WU Haozhong3   WANG Daqian1,2   LI Jiahui3   LIU Changli5   LI Li1,2

1.Beijing Institute of Chinese Medicine,Beijing   100035, China; 2.Beijing Chinese Medicine Hospital, Capital Medical University, Beijing   100010, China; 3.School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing   102488, China; 4.Changchun Medical College, Jilin Province, Changchun   130031, China; 5.School of Traditional Chinese Medicine, Capital Medical University, Beijing   100069, China

[Abstract] Objective To establish a fast, accurate and reliable method for identification of Angelica sinensis of different origin, based on the odor fingerprint of Angelica sinensis of different origin, and the discrimination model was established based on the difference odor. Methods Odor analysis of Angelica sinensis samples from different habitats was carried out by electronic nose. The maximum, average, maximum slope and integral values of sensor signals were extracted as characteristic parameters. Principal component analysis and support vector machine were used to analyze the characteristic parameters. The discriminant model was established. And examine the identification effect of combination characteristics on Angelica sinensis from different habitats. Results Principal component analysis could not distinguish the origin of Angelica sinensis. Support vector machine could quickly and accurately identify the habitat of Angelica sinensis. When a single feature was used as a feature parameter, the identification effect was general, and the average positive detection rate on the test set was 86.03%. When combined features were adopted as the feature parameters, the effect was better. The average positive detection rate of the combination of two features and three features was 86.76% and 89.71% respectively, and the positive detection rate of the combination of four features was the highest, which was 91.18%. Conclusion Electronic nose technology can accurately identify Angelica sinensis samples from different regions, providing new technologies and methods for rapid identification of the origin of traditional Chinese medicine. The selection and optimization of different pattern recognition algorithms and characteristic parameters provide more ideas for the application of electronic nose data mining in traditional Chinese medicine research.

[Key words] Electronic nose; Angelica sinensis; Habitats; Principal component analysis; Support vector machine;Feature combination

当归来源于伞形科植物Angelica sinensis(Oliv.)Diels.的干燥根[1],始载于《神农本草经》[2],为中医药临床常用大宗中药材。当归主产于甘肃,目前云南、四川、湖北、青海、陕西、湖南、贵州等地亦有栽培[2-3]。道地性是当归质量评价的重要内容之一,可从源头保证临床疗效,而产地作为中药道地性的重要影响因素之一,随着地理区域的改变,光照、环境温度、降水量、土壤条件等生态因子会影响药材质量[4]。目前药材产地区分主要依靠传统性状鉴别[5]和指纹图谱技术[6]、分子鉴定技术[7],前者主观性和经验性较强,不利于推广应用,其余两种技术存在操作复杂、成本较高等局限性。因此,探寻准确而快速鉴别不同产地当归的新方法十分必要。

电子鼻是一种智能仿生仪器,基于特定的气敏传感器阵列能够分析、识别和检测复杂气味并全面地反映整体气味特征[8]。与传统检测方法相比,电子鼻具有检测速度快、操作简单、灵敏度高等优点,在食品、工业、农业、环境监测、医药等领域极具开发潜力[9]。近年来电子鼻也逐渐应用到中药产地区分中,借助电子鼻技术成功鉴别出喜马拉雅紫茉莉[10]、黄连[11]、砂仁[12]、枳壳[13]的产地。此外,严辉等[14]发现我国不同产地当归药材挥发油含量为0.28%~0.55%,王洮惠等[15]研究表明甘肃渭源、岷县、四川3个产地当归挥发油含量和组成存在显著差异,运用电子鼻技术区分当归产地具有可行性。本研究分别选取当归气味响应曲线中的最大值、平均值、最大斜率、积分值作为特征参数,应用主成分分析和支持向量机建立判别模型,优选不同特征参数和分类器的最优组合,并考察组合特征对当归产地的鉴别效果,实现当归产地的快速、准确鉴别,为电子鼻技术应用于中药研究领域提供参考。

1 材料与方法

1.1 材料

2017年10~12月,收集产自甘肃岷县的3批当归样品和青海西宁、四川北川、湖北神农架、云南曲靖当归样品各1批,经北京市卫生局临床药学研究所李莉研究员鉴定为伞形科植物Angelica sinensis(Oliv.)Diels.的干燥根。

1.2 实验仪器

研究选用法国Alpha M.O.S. α-FOX3000电子鼻测定当归气味,仪器主要由HS-100自动进样系统、气体传感器阵列以及模式识别系统组成,其12根金属氧化物气敏传感器。见表1。

1.3 试验方法

当归粉碎过2号筛,精密称取0.3 g置于10 mL顶空进样瓶,放入电子鼻自动进样器样品盘中。电子鼻孵化温度设定为35℃,搅拌速度250 r/min,孵化时间360 s,进样体积1500 μL,注射温度45℃,数据采集时间120 s,采集周期1 s,延滞时间600 s。各批次样品平行采集气味16次。

1.4 统计学方法

以12根传感器的最大响应值、平均值、最大斜率、积分值建立当归产地鉴别模型,数据采用SPSS 21.0和Python 2.7软件进行分析。

2 结果与分析

2.1 不同产地当归气味雷达图分析

采用电子鼻对5个产地当归进行分析,不同产地当归挥发性气味的电子鼻传感器响应雷达图轮廓存在一定差别,最大斜率作为当归特征参数时甘肃产当归与其他样品差距较大(图1)。但从整体来看各产地样品在气味组成上比较一致,无法使用雷达图直观区分不同产地当归,需用统计学方法对其进行处理。

2.2 主成分分析

主成分分析是电子鼻构建判别模型时常用的统计方法,能消除数据中相互重叠的信息,实现用少数关键变量表征原变量的数据特征[16-18]。分别利用12根传感器的最大值、平均值、最大斜率、积分值作为特征参数进行主成分分析。以最大值作为当归的特征参数时,主成分分析区分效果较好(图2a);四川产当归均可以区分开,但其余4个产地样品有重叠;平均值作为当归的特征参数主成分分析区分效果最差(图2b);甘肃和四川产当归可以区分开,但云南、湖北、青海样品有部分重叠,最大斜率、积分值作为当归特征参数主成分分析区分效果次之(图2c~d)。在分类过程中主成分分析侧重于提取样本的描述特征,所以使用主成分分析直接处理当归产地的判别问题效果不理想。图2是当归取不同特征参数的主成分分析图,第1主成分和第2主成分累积方差百分比均大于90%,即前两个主成分可以表征原始数据特征。

2.3 支持向量机

支持向量机是Vapnik和Corinna Cortes于1995年首先提出的[19],基于“结构风险最小化”原理,拥有坚实的理论基础和良好的泛化能力,在解决小样本、非线性和高维模式识别方面具有许多特有的优势[11,20]。对每个产地分别随机抽取70%样本构成训练集,30%构成测试集以评估所建支持向量机判别模型的性能,采用网格搜索方法寻找支持向量机最优参数,最终确定参数为:核函数为径向基核函数,核函数系数为0.4,惩罚项系数C为100,最大迭代次数为500次,训练停止误差为1e-5。

支持向量机判别模型经训练样本训练之后,对测试样本进行预测,4种特征参数的训练集正判率均高于90%,从大到小依次为:最大值>平均值、积分值>最大斜率;最大值作为特征参数时的测试集正判率最高(表2)。综合来看,用平均值、最大斜率、积分值表征电子鼻测試信号时其鉴别能力基本相同,而用最大值表征时鉴别能力效果较好。

2.4 多特征融合的支持向量机判别模型

电子鼻中气敏传感器的响应是样品多种成分的综合反映,单一特征既不能全面有效地表征电子鼻对检测样品的响应信息,也不能准确体现样品的差异性,降低了电子鼻检测结果的准确率[21]。在用各自单一类型特征结合支持向量机判别分析鉴别不同产地当归的基础上,保持训练集和测试集不变,尝试将特征组合以构建电子鼻响应信息的表征模式提升鉴别效果。为了排除随机性影响,分别求取单特征、组合特征的平均预测准确率。结果显示:四特征组合>三特征组合>两特征组合>单特征,提示特征组合的效果优于单特征,特征组合支持向量机鉴别正确率总体上也有较为明显的提高。此外,三特征组合测试集正判率为89.71%,效果相对于单特征和两特征组合正判率分别提升3.68%和2.95%。因此,在用电子鼻鉴别产地时可以考虑采用三特征组合或四特征组合建模。

3 讨论

在不同产地的当归区分研究中发现,傳统的线性模式识别方法主成分分析对云南曲靖、湖北神农架、青海西宁3个产地区分效果不佳,采用更先进的模式识别算法支持向量机进行建模分析提高电子鼻的识别能力,测试集识别准确率均大于86%优于主成分分析。由此来看,电子鼻技术联合模式识别算法可以鉴别当归产地,为中药材产地快速、客观、绿色的鉴别提供新技术和新方法。

信号的准确表征或提取有用信号是实现电子鼻准确检测的重要一环,研究为探索有效表征不同产地当归气味信息的特征参数,提取了4种不同特征参数对不同产地当归进行主成分分析及支持向量机判别,以最大响应值作为特征参数时的区分效果较好,平均值作为特征参数主成分分析区分效果最差,最大斜率作为特征参数支持向量机判别效果最差,可见不同的特征参数适合不同的模型。

此外,对比了单一特征、组合特征表征电子鼻响应信息时的鉴别效果,结果显示,组合特征的鉴别效果优于单特征值,四特征组合的鉴别效果更佳,用多特征融合模式可更有效地表征电子鼻对当归产地的响应信息,有利于提高当归产地的鉴别正确率,为电子鼻信号表征提供了一种新思路。

[参考文献]

[1]  国家药典委员会.中华人民共和国药典[S].一部.北京:中国医药科技出版社,2015:133.

[2]  张瑛,王亚丽,潘新波.当归历史资源分布本草考证[J].中药材,2016,39(8):1908-1910.

[3]  南海军,滕希峰,王峰.不同产地当归药材中藁本内酯含量调查分析[J].食品与药品,2015,17(6):393-395.

[4]  廖保生,宋经元,谢彩香,等.道地药材产地溯源研究[J].中国中药杂志,2014,39(20):3881-3888.

[5]  陈有智,罗文蓉.侯嘉.不同产地当归的鉴定学研究[J].西部中医药,2012,25(5):25-30.

[6]  胡传芹,徐嘉良.不同产地当归指纹图谱及聚类分析[J].中国食品学报,2017,17(12):272-278.

[7]  朱田田,晋玲,张裴斯,等.基于ISSR的甘肃不同产区栽培当归遗传多样性研究[J].中草药,2015,46(23):3549-3557.

[8]  Gardner JW,PN Bartlett. Electronic Noses:Principles and Applications [D]. New York:Oxford University Press,1999.

[9]  邹慧琴,刘勇,闫永红,等.电子鼻技术及应用研究进展[J].传感器世界,2011,17(11):6-11.

[10]  林辉,赵婷,邹慧琴,等.基于电子鼻技术的不同产地栽培及野生喜马拉雅紫茉莉的鉴别研究[J].中华中医药杂志,2014,29(6):1834-1837.

[11]  陶梦琳,顾文涛,汪子青,等.基于支持向量机的黄连饮片产地识别研究[J].中草药,2015,46(21):3173-3178.

[12]  刘梦楚,邹晓红,蓝伦礼,等.基于电子鼻及顶空-气质联用技术结合化学计量学区分不同产地的砂仁[J].中国实验方剂学杂志,2017,23(6):35-42.

[13]  周华英,李钟,骆德汉.基于仿生嗅觉技术的不同产地枳壳鉴别研究[J].中草药,2017,48(19):4068-4072.

[14]  严辉,段金廒,钱大玮,等.我国不同产地当归药材质量的分析与评价[J].中草药,2009,40(12):1988-1992.

[15]  王洮惠,程自银.不同产地当归挥发油的成分研究[J].药物生物技术,2013,20(6):535-537.

[16]  Eriksson L,Johansson E,Kettaneh-Wold N,et al. Multi- and megavariate data analysis part 1:Basic principles and applications [J]. Umea,Sweden:Umetrics AB,2006.

[17]  Costache GN,Coloran P. Combining pca-based datasets without retraining of the basis vector set [J]. Pattern Recognition Letters,2009,30(16):1441-1447.

[18]  徐锐,张雪绒,郭巧生,等.9个产地夏枯草主要化学成分的比较分析[J].成都医学院学报,2017,12(5):551-554,566.

[19]  Cortes C,Vapnik V. Support-vector networks,Proc. of the 25th Machine Leaning,1995,20:273-297.

[20]  吴莎,刘启安,李云,等.最小二乘支持向量机和偏最小二乘法在栀子中间体纯化工艺近红外定量分析中的应用[J].中草药,2015,46(7):990-997.

[21]  殷勇,郝银凤,于慧春.基于多特征融合的电子鼻鉴别玉米霉变程度[J].农业工程学报,2016,32(12):254-260.

(收稿日期:2019-03-27  本文编辑:刘永巧)

猜你喜欢
当归支持向量机电子鼻
电子鼻咽喉镜在腔镜甲状腺手术前的应用
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
药用植物当归早期抽薹研究进展
飞到火星去“闻味儿”——神奇的电子鼻
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
电子鼻在烤鸡香气区分中的应用
电子鼻快速检测煎炸油品质