CHENG Shaoming,WANG Jun*,WANG Yongwei,MA Yanghui
(1.College of Bio-systems Engineering and Food Science,Zhejiang University,Hangzhou 310029,China; 2.College of Information,Zhejiang University of Science and Technology,Hangzhou 310023,China)
Research on Distinguishing Tomato Seedling Infected with Early Blight Disease Using Different Characteristic Parameters by Electronic Nose*
CHENG Shaoming1,WANG Jun1*,WANG Yongwei1,MA Yanghui2
(1.College of Bio-systems Engineering and Food Science,Zhejiang University,Hangzhou 310029,China; 2.College of Information,Zhejiang University of Science and Technology,Hangzhou 310023,China)
In order to improve the calculation efficiency,we shouldminimize the number of features and try not to lose useful information for classification under the premise of the original features.This paper use themaximum value,average value of all data,maximum curvature of response curve and the intact integral value of response curve as the feature parameters for distinguishing infection early blight disease of tomato seedlings.The results show that the distinguished effect using average value of all data and the intact integral value of response curve as the feature parameters is the best,and that usingmaximum value is better.The worse is usingmaximum curvature of response curve.
characteristic parameter;tomato seedling;early blight disease;electronic nose
电子鼻是通过气体传感器和模式识别技术的结合,模拟生物嗅觉系统来进行气体检测和识别的仪器。它主要由传感器阵列和自动化模式识别系统所组成。与普通的化学分析仪器不同,电子鼻系统检测到的不是被测样品中某种或某几种成分的定性与定量结果,而是给予样品中挥发性成分的整体信息。由于电子鼻系统检测具有方便、快速、无损等特点,目前电子鼻在食品质量控制[1-10]、环境检测[11-13]、作物病虫害检测[14-15]、人体疾病检测[16-17]等方面有不少成功的应用。
电子鼻检测的原始特征的数据很大,为提高计算效率,在尽可能保持较多原有信息的前提下,对原始特征进行合理的选择,然后对选取的特征进行降低维数的处理。在电子鼻响应信号的模式识别中,特征选择的方法采用以下几种:(1)基于原始曲线的基本特征选择方法,在原始响应曲线上选择稳定值、最大值,平均值、特定时间间隔的响应值;(2)特定时间间隔的曲线包围面积;(3)采用适当的模型拟合原始响应曲线,以模型参数为抽取特征等。
本论文利用最大值(Max)、全段数据平均值(Mean)、响应曲线最大曲率(kmax)、响应曲线的全段积分值(IV)等作为特征参数,研究番茄苗早疫病病害区分效果,找出合适的特征数据,实现对番茄苗早疫病不同病害程度较好的分类结果。
1.1 实验材料
将浙杂809番茄种子播在塑料盆钵(Φ8 cm× 12 cm)中,在塑料温室中进行培育,每盆1株苗,定期浇水施肥,待苗长到35 d,苗高25 cm~30 cm时用于实验。
1.2 实验装置
1.2.1 番茄苗挥发物电子鼻检测的采样装置
图1为番茄苗采样系统的示意图,整个系统由空气过滤器、活性碳、特氟隆管、出气口、玻璃容器(40 cm高×10 cm直径)、密封板、番茄苗和支架台8个部分组成。工作时,被采气体通过出气口4,特氟隆管3,活性炭2及空气过滤器1进入到电子鼻。
图1 静态顶空采样系统示意图
1.2.2 电子鼻
实验采用的电子鼻系统是德国AIRSENSE公司的便携式电子鼻PEN2(Portable Electronic Nose)。该系统主要由传感器阵列、采样通道、内置泵、控制单元和计算机等部分组成。表1是PEN2电子鼻系统中各个传感器性能指标。
表1 PEN2电子鼻的各传感器性能特点
1.3 试验方法
1.3.1 番茄苗样本处理
将准备好的番茄苗进行早疫病病菌接种,按照每株番茄苗接种病菌的叶片数量不同将番茄苗分成4个处理,即每株番茄苗接种1个叶片、2个叶片、4个叶片和未进行接种作为对照组,分别记为zby1、zby2、zby4和control;每个处理作16个重复。接种后,将番茄苗放置于温度35℃、湿度90%的环境中培养24 h,以使病菌快速入侵番茄苗叶片。
1.3.2 电子鼻测试
在进行电子鼻实验前,四组番茄苗分别置于顶空采样装置中,顶空产生时间为30 min后进行电子鼻测试。电子鼻测试时的参数设置见表2。
表2 电子鼻参数设置
1.4 数据分析方法
图2为电子鼻各传感器对感染早疫病病害番茄苗所产生挥发物的响应曲线。10条曲线代表10个传感器的响应,其中,横坐标为采样时间,纵坐标为阵列的响应信号(G/G0是传感器接触到样品挥发物后的电阻R与传感器在经过洁净空气时的电阻R0的比值)。
图2电子鼻传感器对番茄苗挥发物的响应特性
图3 是在传感器响应曲线上分别取最大值、全段数据平均值、响应曲线最大曲率、响应曲线的全段积分值等作为特征参数的示意图。
图3 电子鼻响应信号曲线特征选择时的示意图
图4 不同特征参数区分不同程度病害的PCA图
2.1 主成分分析
对4组不同处理番茄苗样本(每株番茄苗接种1个叶片、2个叶片、4个叶片和未进行接种作为对照组分别记为zyb1、zyb2、zyb4和control)分别利用最大值(Max)、平均值(Mean)、最大斜率值(kmax)和全段积分值(IV)作为特征参数进行主成分分析,图4是番茄苗接种早疫病病菌的取不同特征参数的主成分分析分析图。从结果可知,最大值和最大斜率值作为特种参数时的第1主成分分析值(横坐标PC1)与第2主成分的分析值(纵坐标PC2)之和小于85%,平均值和全段积分值作为特征参数时的第1主成分的分析值与第2主成分的分析值之和在85%以上。
从图4可看出,利用全段平均值和全段积分值作为早疫病病害番茄苗的特征参数时,PCA分析图区分效果较好,对照组、2叶片和4叶片基本可以区分开,但对照组和1叶片有部分重叠;利用最大值时的区分效果次之(图4a),1叶片和4叶片、2叶片和对照组可以很好的区分开,但1叶片和对照组、2叶片和1叶片及4叶片有部分重叠;利用响应曲线的最大斜率值的区分效果最差(图4c),4种处理很难区分。
2.2 线性判别分析
对四组不同处理番茄苗样本分别利用最大值(Max)、平均值(Mean)、最大斜率值(kmax)和全段积分值(IV)作为特征参数进行线性判别分析,图5是番茄苗接种早疫病病菌的取不同特征参数的LDA分析图。从结果可知,第1主成分的分析值(横坐标LD1)与第2主成分的分析值(纵坐标LD2)之和已达85%以上,表明LDA第1主成分、第2主成分的结果可以代表电子鼻响应信号对番茄苗挥发物的区分情况。
从图5可知,利用全段平均值和全段积分值作为早疫病病害番茄苗的特征参数时,LDA分析图区分效果较好;这可能与利用全段平均值和全段积分值作为特种参数时所综合的是早疫病病害番茄苗挥发物的全部信息,而不是某一刻的早疫病病害番茄苗挥发物的信息有关。利用最大值时的区分效果次之(图5(a)),1叶片和对照组及2叶片有部分重叠;利用响应曲线的最大斜率值的区分效果最差(图5(c)),对照组和4叶片基本能区分开,但其他处理间都有重叠现象。
2.3 神经网络模型分析
将不同病害的番茄苗分别每组随机抽取10个样本作为训练集(共40个样本),用于对番茄苗病害程度的训练,剩余每组6个样本(共24个样本)作为预测集。分别用最大值(Max)、全段数据平均值(Mean)、响应曲线最大曲率(kmax)、响应曲线的全段积分值(IV))作为特征参数进行建模,分别采用BP神经网络BPNN(Back Propagation Neural Networks)和遗传算法BP神经网络GABPNN(Genetic Algorithm Back Propagation Neural Networks)两种识别模式对进行实验数据进行识别。
图5 不同特征参数区分不同程度病害的LDA图
研究中,以10个传感器响应数据作为输入,番茄苗样本作为输出,输出层选择为1。通过反复测试来调整隐含层神经元数来优化网络结构,得到较好网络结构为10(输入)-20(隐含)-1(输出),设定目标误差为0.001,网络学习速率为0.01,训练迭代次数为1 000次。模型的实现是采用MATLAB语言编程,调用遗传算法工具箱实现。遗传算法的参数设置:种群规模为50,遗传代数设定为100,交叉概率为0.9,变异概率为0.09,适应度目标选择为BP神经网络模型设定的目标误差0.001。
表3是选用不同特征参数时利用BP神经网络(BPNN)和遗传算法BP神经网络(GABPNN)两种识别模式的预测结果。
表3 各特征选择方法预测模型的结果
从表3可知,全段数据平均值和响应曲线的全段积分值作为特征参数时的训练集和预测集的正确率较好,其次为最大值方法,预测结果最差的是响应曲线最大曲率方法,造成这种分析结果可能是由于实验用的电子鼻对样本的测试响应信号比较平稳,对于一个样本响应曲线最大曲率方法提取的特征点会在响应曲线的不同时刻,这相比于稳定状态的分析效果要差,而全段数据平均值和全段积分值方法可以提取电子鼻信号的稳定信息所以预测结果较好。
对比BP神经网络和GABP神经网络两种模型结果,GABP神经网络分析的预测正确率均要高于BP神经网络,说明经过遗传算法优化后的BP神经网络模型的预测结果要好于BP神经网络。这是由于遗传算法的局部搜索能力较差,仅仅用遗传算法训练网络比较费时,并且在进化到一定代数后,搜索效率会变得很低,此后适应度值基本没什么变化。因此以遗传算法得到的最好学习结果为基础,再进入BP学习过程,这样不仅能发挥BP神经网络强大的非线性映射能力,而且使BP神经网络具有更快的收敛性和更强的学习能力,从而使遗传算法BP神经网络模型的预测结果更好。
(1)利用4种不同特征参数进行早疫病病害番茄苗的PCA和LDA,结果表明采用全段平均值和全段积分值作为特征参数时的区分效果较好,最大值作为特征参数时的区分效果次之,响应曲线的最大斜率值作为特征参数时的区分效果最差。
(2)利用BP神经网络和经过遗传算法优化后的BP神经网络2中模式识别进行预测,结果表明利用经过遗传算法优化后的BP神经网络的预测结果均好于BP神经网络的预测结果。
(3)不论哪种识别模式,利用全段数据平均值和响应曲线的全段积分值作为特征参数时的训练集和预测集的正确率最高,其次利用最大值作为特征参数,预测结果最差的是利用响应曲线最大曲率作为特征参数。
[1]Pang L J,Wang J,Yu H C,et al.Discrimination of Storage Age for Wheat by E-Nose[J].Transactions of the ASABE,2008,51: 1707-1712.
[2]Cheng SM,Wang YW,Wang J,et al.Detection of Eggshell Crack Using Electronic Nose[J].Transactions of the ASABE,2010,53: 789-794.
[3]于慧春,王俊,张红梅,等.龙井茶叶品质的电子鼻检测方法[J].农业机械学报,2007(7):103-106.
[4]Zhang H M,Wang J.Detection of Age and Insect Damage Incurred by Wheatwith an Electronic Nose[J].Journal of Stored Products Research,2007,43:489-495.
[5]Gomez A H,Wang J,Hu G X,et al.Discrimination of Storage Shelf-Life for Mandarin by Electronic Nose Technique[J].LWTFood Science and Technology,2007,40:681-689.
[6]Wang Y W,Wang J,Zhou B,et al.Monitoring Storage Time and Quality Attribute of Egg Based on Electronic Nose[J].Analytica Chimica Acta,2009,650(2):183-188.
[7]柴春祥,陈庆森,刘勤生.鸡肉新鲜度电子鼻评价特征值的确定[J].食品与发酵工业,2007(11):5-8.
[8]周亦斌,王俊.基于电子鼻的番茄成熟度及贮藏时间评价的研究[J].农业工程学报,2005,21(5):113-116.
[9]程绍明,马杨珲,周博,等.基于电子鼻的番茄种子不同储藏时间的鉴别研究[J].传感技术学报,2011,24(7):941-944.
[10]庞林江,王俊,路兴花.电子鼻判别小麦陈化年限的检测方法研究[J].传感技术学报,2007,20(8):1717-1722.
[11]Sohn JH,Hudson N,Gallagher E,et al.Implementation of an E-lectronic Nose for Continuous Odour Monitoring in a Poultry Shed[J].Sensors and Actuators B:Chemical,2008,133:60-69.
[12]DeVito,Massera E,Piga M,et al.On Field Calibration of an Electronic Nose for Benzene Estimation in an Urban Pollution Monitoring Scenario[J].Sensors and Actuators B:Chemical,2008,129: 750-757.
[13]Laura C,Selena S,Paolo C,et al.Massimiliano G.Electronic Nose for the Continuous Monitoring of Odours from a Wastewater Treatment Plant at Specific Receptors:Focus on Training Methdos[J]. Sensors and Actuators B:Chemical,2008,131:53-62.
[14]程绍明,王俊,王永维,等.基于电子鼻信号判别番茄苗机械损伤程度[J].农业工程学报,2012,28(15):102-106.
[15]程绍明,王俊,马杨珲,等.基于电子鼻系统的番茄苗不同种类损伤的区分效果研究[J].传感技术学报,2012,25(9): 1184-1188.
[16]Dummer J,Storer M,Swanney M,et al.Analysis of Biogenic Volatile Organic Compounds in Human Health and Disease[J].Trends in Analytical Chemistry,2011,30(7):960-967.
[17]Bernabei M,Pennazza G,Santonico M,et al.A Preliminary Study on the Possibility to Diagnose Urinary Tract Cancers by an Electronic Nose[J].Sensors and Actuators B:Chemical,2008,131:1-4.
程绍明(1974-),男,博士,讲师,浙江大学,主要研究方向为农产品品质检测,chengshaoming@zju.edu.cn;
王俊(1965-),男,浙江大学教授、博士生导师。入选教育部新世纪优秀人才支持计划和浙江省“151人才工程(重点和第一层次)”。先后主持国家高技术研究发展计划(863计划)1项、国家自然科学基金项目5项、高校博士学科点基金2项、浙江省科技厅重大招标项目2项、其他省部级项目10余项。已获国家发明专利15项。在国家级学报和境外学术刊物上已发表100余篇论文,其中SCI收录60余篇。发表的SCI收录论文中被引用300余次。研究方向之一为电子鼻电子舌技术的农产品品质检测,jwang@zju.edu.cn。
基于电子鼻技术的不同特征参数对番茄苗早疫病病害区分效果影响的研究*
程绍明1,王俊1*,王永维1,马杨珲2
(1.浙江大学生物系统工程与食品科学学院,杭州310029;2.浙江科技学院信息学院,杭州310023)
电子鼻检测的原始特征的数据量很大,一般在进行降低维数的处理前需要对原始特征进行合理的选择。选用最大值(Max)、全段数据平均值(Mean)、响应曲线最大曲率(kmax)、响应曲线的全段积分值(IV)作为4种不同特征参数对感染早疫病病害的番茄苗进行区分效果研究,结果表明在进行PCA和LDA区分时,利用全段数据平均值和响应曲线的全段积分值作为特征参数的效果较好,其次为最大值方法,最差的是响应曲线最大曲率方法;利用BP神经网络(BPNN)和遗传算法BP神经网络(GABPNN)两种识别模式进行预测时,利用全段数据平均值和响应曲线的全段积分值作为特征参数的训练集和预测集的正确率较好,其次为最大值方法,预测结果最差的是响应曲线最大曲率方法。
特征参数;番茄苗;早疫病;电子鼻
TP242.64
A
1004-1699(2014)01-0001-05
2013-10-18修改日期:2013-12-16
C:7230J
10.3969/j.issn.1004-1699.2014.01.001
项目来源:国家自然科学基金项目(30071246,31370555);浙江省自然科学基金项目(Z5100155)