基于人工神经网络的烤烟评吸质量评估模型及实现

2018-02-27 13:15陈伟周浩潘文杰熊永华
湖北农业科学 2018年24期
关键词:评估模型相关分析人工神经网络

陈伟 周浩 潘文杰 熊永华

摘要:为提高烤烟评吸质量评估的效率,采用Spearman相关分析和偏相关分析确定影响烤烟评吸质量的7种化学成分,利用BP人工神经网络建立7种化学成分和烤烟评吸质量之间的人工神经网络模型,最后通过人工神经网络对不同烤烟样品评吸质量进行预测。结果表明,利用人工神经网络评价烤烟评吸质量与人工法具有较好的相关性和较低的误差。利用C++语言设计的烤烟评吸质量评估软件可以方便地进行烤烟评吸质量模型的训练和评吸质量的评估,具有较好的实用性。

关键词:人工神经网络;相关分析;烤烟评吸;评估模型

中图分类号:TS41+1;TS47         文獻标识码:A

文章编号:0439-8114(2018)24-0108-04

DOI:10.14088/j.cnki.issn0439-8114.2018.24.030           开放科学(资源服务)标识码(OSID):

Abstract: In order to improve the smoking quality evaluation efficiency, Spearman correlation analysis and partial correlation analysis were used to determine the seven chemical components which affected the smoking quality of flue-cured tobacco. The artificial neural network between seven chemical components and smoking quality was established using BP artificial neural network. Finally, the artificial neural network was used to predict the smoking quality of different flue-cured tobacco samples. The results showed that the use of artificial neural network to evaluate the smoking quality of flue-cured tobacco had a good correlation with the artificial method and a low error. Flue-cured tobacco smoking quality evaluation software designed in C++ language can facilitate the training of tobacco smoking quality model and the evaluation of smoking quality, and it had good practicability.

Key words: artificial neural network; correlation analysis; tobacco smoking; evaluation model

烤烟评吸质量是反映烤烟综合性状的指标,其与多种因素有关,如烤烟化学成分、烟气成分、主观感受等。目前对烤烟评吸质量的评判往往采用人工评定法,即通过多位专家对不同样品进行试吸,根据不同的评吸环节给出各环节的质量分数,最终将各环节的质量分数相加确定出不同样品的评吸质量[1]。但人工评定的效率较低,难以对大范围的烤烟进行有效的评定。

由于烤烟化学成分复杂,多种化学成分间还存在相互作用,所以难以通过固定的数学模型确定烤烟化学成分与评吸质量之间的关系[2]。人工神经网络在处理复杂系统模型时不用考虑模型变量间的内在作用规律,通过对一定数量测试样本的学习和训练,可以按照提供样本的规律实现满足要求的输出,因此人工神经网络广泛用于开发基于经验的农业模型,例如农作物的产量预测、质量评估等[3-5]。

通过相关分析确定与烤烟评吸质量具有联系的化学成分指标,通过这些化学成分指标,利用BP人工神经网络建立化学成分与烤烟评吸质量的人工神经网络模型。利用该人工神经网络模型对多组不同的烤烟样本评吸质量进行预测,通过与实际评吸质量的对比,表明相比于传统的人工评吸法,利用本研究方法建立的烤烟评吸质量模型具有较好的相关性和准确性,对烤烟质量的评定具有一定的参考意义。利用C++语言开发出的烤烟评吸质量评估软件可以实现人工神经网络模型的训练、导入等功能,能够方便地对烤烟评吸质量进行评估,具有较好的实用性。

1  数据来源与分析方法

1.1  数据来源

数据来源于某省不同烟草产区、不同烟草品种的烤烟化学成分含量及烤烟评吸质量,数据涵盖范围广,代表性强。所选取的烤烟化学成分包含总糖、还原糖、钾、氯、总碱、总氮、蛋白质、淀粉、锰、铁、铜、锌及其他微量元素。评吸质量通过多位专家对不同烤烟样品进行试吸,给出对应的分数,最后将不同专家分数平均后确定最终的烤烟评吸质量。

由于烤烟生产过程是一个多输入多输出的复杂农作物生产过程,具有多变量、非线性、不确定性等特点[6];烤烟生物质量综合效益的影响因素涉及领域广阔,同时评价指标众多,各类指标之间量纲差异较大,难以直接建立烤烟生物质量效益综合生产目标与其影响因素之间的机理模型。

1.2  分析方法

烤烟评吸质量与烟叶化学成分含量存在一定的相关性[7,8],但烤烟中化学成分与评吸质量的关系复杂,对于各项化学成分与评吸质量之间的关系,在一定范围内可以简单分类为正相关、负相关和无相关。

斯皮尔曼相关系数(Spearman correlation coefficient)利用单调方程评价两个统计变量的相关性,Spearman相关系数的计算方法见公式(1)。

由于斯皮尔曼相关系数不表示变量之间的线性关系,仅表示变量之间的单调性关系,对于存在相关性但是没有线性关系的统计变量能够更好地找出其中的相关性关系。

当研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视作常数(保持不变),即暂时不考虑其他要素影响,单独研究两个要素之间的相互关系的密切程度,所得数值结果为偏相关系数。

2  BP人工神經网络模型建立

BP(Back propagation)人工神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络,它能通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果。其基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。

在BP人工神经网络中,为了保证消除指标之间的量纲影响,利用线性函数归一化方法,通过查找各指标的最大值和最小值,将所有指标的数值映射到区间[0,1]内,以减少不同的量纲对BP人工神经网络模型的影响。归一化所采用的线性函数见公式2。

其中,y为归一化后的值,x为归一化前的值,Min和Max为该项指标的最小值与最大值。通过公式(2)可以消除不同指标的量纲的影响。

在得出评吸质量后,为了能够更为直观地与实际评吸质量对比,需要将结果进行逆归一化。逆归一化见公式(3)。

其中,y为逆归一化后的值,x为逆归一化之前的值,Min和Max为评吸质量的最小值与最大值。

BP人工神经网络的拟合结果的精度与网络结构有很大的关系。1989年,Hornik等[9]证明只需要一个拥有足够多节点数量的隐含层,神经网络就可以以任意的精度逼近任意复杂度的连续函数。但是目前对于隐含层节点数量的设定仍然是一个未解决的问题。

本研究利用基于黄金分割的网络隐含层节点数优化算法[10]确定隐含层节点数量的大致范围,通过对不同隐含层节点数量进行测试、对比,最终确定的BP人工神经网络隐含层的节点数量为12。此外,输入层的节点数量为7个,输入量为7种化学成分。输出层节点数量为1个,输出量为烤烟评吸质量。所采用的传递函数为Sigmoid函数,即公式(4)。

在确定了BP人工神经网络的结构后,利用C++语言设计了BP人工神经网络的相关算法。BP人工神经网络模型的参数设定为:网络目标误差为10-5,学习率为0.1。在BP人工神经网络中,网络目标误差设置过小容易导致网络不收敛或网络过拟合,过大容易导致网络欠拟合。学习率设置过小会导致收敛速度较慢,学习率设置过大可能导致网络振荡无法收敛。当BP人工神经网络输出和实际值的误差小于目标误差后,算法自动结束,此时各个神经元之间的连接权重和神经元输出的阈值即为所得到的BP神经网络模型。

利用C++语言实现的BP人工神经网络算法的主要步骤如下:

步骤1:初始化。随机初始化神经网络中所有节点的阈值和节点之间的权重。

步骤2:将样本数据输入到神经网络中,根据步骤1中随机初始化的阈值和权重,分别计算不同样本的输出值。

步骤3:根据步骤2中BP人工神经网络输出的样本值和实际值进行计算,得出其均方根误差,判断此时的均方根误差是否已经满足BP人工神经网络的性能要求。若此时均方根误差大于设定值,则进行步骤4,否则,进行步骤5。

步骤4:根据步骤3中的均方根误差,从输出层开始反向、依次计算BP人工神经网络中输出层、隐含层的梯度项,并依次对网络中节点的阈值和节点之间的权重进行更新。

步骤5:算法停止迭代,记录、保存当前的节点阈值和节点间的权重,完成BP人工神经网络模型的建立。

3  质量评估系统的实现

为了能够方便地完成对烤烟评吸质量的评估,需要利用计算机高级语言将本研究所利用的方法开发成计算机应用程序。

利用C++语言,基于MFC类库,实现了烤烟评吸质量评估应用程序。该应用程序由三个部分组成,如图1所示。第一部分为数据库。数据库由SQL Server 2012开发,用于存放烤烟化学成分和对应的评吸质量数据。第二部分为核心功能部分,包含实现七个主要功能的相关函数。第三部分为人机交互界面,可以方便、直观地完成各项功能,如图2所示。

应用程序的主要功能如下。

1)导入样本数据。导入数据功能运用ODBC(Open database connectivity)结构,在服务器端配置好ODBC数据源后,可以很方便地访问SQL 2012数据库并对数据进行读、写操作。

2)导出样本数据。为方便对数据进行管理,应用程序可以将导入的数据导出保存为.xls文件。

3)样本数据归一化。利用线性函数归一化方法,将所有指标的数值在程序内映射到区间[0,1],在人机交互界面中,数值的大小不会发生变化,以保证原始数据具有较好的可读性,方便用户操作。

4)训练神经网络模型。完成导入数据和归一化处理后,可以利用BP人工神经网络建立评估模型。在神经网络模型训练的过程中,程序会自动等待训练结束,并在结束时进行提示。

5)保存神经网络模型。由于利用BP人工神经网络训练模型需要耗费一定的时间,为了提高程序运行效率,程序可以将当前训练得出的BP人工神经网络模型保存为本地的模型文件方便后续使用。

6)导入神经网络模型。如果已经存在BP人工神经网络的模型文件,则可以直接导入该模型,避免由于多次训练模型造成的时间浪费。

7)评估烤烟评吸质量。当软件已经训练得出BP人工神经网络模型或通过导入功能直接导入神经网络模型后,输入对应的化学成分指标就可以直接评估得出评吸质量并将结果显示在人机交互界面中。

利用该应用程序进行烤烟评吸质量评估的大致流程如图3所示。通过该计算机应用程序可以从数据库中导入化学成分和评吸得分的数据,将这些数据归一化后训练得出化学成分和评吸质量之间的BP人工神经网络模型,并可以将这些模型保存在计算机上。同时,也可以导入模型并进行烤烟评吸质量的评估。

4  结果与分析

4.1  相关分析结果

在SPSS 23.0软件中,利用Spearman相关分析和偏相关分析相结合的方法,对不同的化学成分和烤烟评吸质量进行了相关性分析。分析结果见表1。从表1可以看出,总糖、还原糖、淀粉与烤烟评吸质量之间具有一定的正相关关系;钾、氯、总碱、总氮与评吸质量之间为负相关关系,而其他的化学成分与评吸质量之间的相关性较弱。考虑到模型的精简性,最终选取了总糖、还原糖、钾、氯、总碱、总氮、淀粉这7个化学成分指标作为BP人工神经网络模型的输入。

在本研究中,可用的样本总数为40。将其中的30个作为训练样本,剩下的10个作为验证样本。

4.2  BP人工神经网络评估结果

为了确定BP人工神经网络模型的性能,本研究使用了4个统计学标准:BP人工神经网络模型的预测值与期望输出值之间的误差(Δ)及相对误差(δ)、线性回归的均方根误差(RMSE)和两者间的相关系数(r)。

将10个验证样本用于烤烟评吸质量的评估,这些样本的实际评吸质量和利用应用程序得出的评估质量以及它们的误差如表2所示,两者的散点图如图4所示。

从表2可以计算得出,利用BP人工神经网络模型评估得出的评吸质量与实际的评吸质量之间的平均绝对误差为-0.073,平均相对误差为-0.081%,相关性为0.524,均方根误差为1.326 5。这表明利用BP人工神经网络模型评估得出烤烟评吸质量和专家评吸得出的评吸质量之间具有较小的误差和较好的相关性,通过本研究方法建立的模型在烤烟评吸质量的评估上具有可靠性。

5  小结与讨论

采用相关分析和BP人工神经网络的方法对烤烟评吸质量进行评估。基于对烤烟化学成分和评吸质量之间的偏相关分析,首先筛选出影响烤烟评吸质量的主要化学成分,之后利用BP人工神经网络建立了烤烟评吸质量评估模型。总体而言,本研究表明BP人工神经网络是评估烤烟评吸质量的有效、可靠的方法。利用该方法得到的评估质量与专家得到的评吸质量之间的误差较小,且具有一定的相关性,通过对烤烟样本进行常规化学成分检测就可以有效对其评吸质量进行评估,可以提高评估效率。利用本研究方法开发的计算机应用程序具有使用方便、流程简单的特点,可以将本研究所采用的建模方法推广与应用。

烤烟特定化学成分与烤烟评吸质量之间的关系需要更多、更全面的数据作为进一步研究的基础,如何更准确地选择影响烤烟评吸质量的主要因素是进一步研究的方向之一。

参考文献:

[1] 聂  铭,周冀衡,杨荣生,等.基于MIV-SVM的烤烟评吸质量预测模型[J].中国烟草学报,2014,20(6):56-62.

[2] 段俊杰,蒋美红,王  岚,等.基于化学成分的烟叶质量神经网络预测[J].西南农业学报,2012,25(1):48-53.

[3] DAHIKAR S,RODE S. Agricultural crop yield prediction using artificial neural network approach[J].International Journal of Innovative Research in Electrical, Electronics, Instrumentation and Control Engineering,2014,2(1):683-686.

[4] ZENG W Z,XU C,ZHAO G,et al. Estimation of sunflower seed yield using partial least squares regression and artificial neural network models[J].Pedosphere,2018,28(5):764-774.

[5] ALVAREZ R. Predicting average regional yield and production of wheat in the Argentine Pampas by an artificial neural network approach[J].European Journal of Agronomy,2009,30(2):70-77.

[6] WU J,YANG S X,TIAN F C. An adaptive neuro-fuzzy approach to bulk tobacco flue-curing control process[J].Drying Technology,2017,35(4):465-477.

[7] 許安定,杜国伟,刘洪斌.基于CART模型的烤烟评吸质量影响因子研究[J].西南农业学报,2013,26(4):1356-1361.

[8] 李洪勋,潘文杰,李建伟,等.烤烟内在化学成分含量与感官评吸指标的关系分析[J].湖北农业科学,2013,52(8):1836-1841.

[9] HORNIK K,STINCHCOMBE M,WHITE H. Multilayer feedforward networks are universal approximators[J].Neural Networks,1989,2(5):359-366.

[10] 夏克文,李昌彪,沈钧毅.前向神经网络隐含层节点数的一种优化算法[J].计算机科学,2005,32(10):143-145.

猜你喜欢
评估模型相关分析人工神经网络
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
基于支持向量回归机的电能质量评估
城乡居民医疗费用的相关性与回归分析
基于声发射和人工神经网络的混凝土损伤程度识别
波信号的解调和人工神经网络的损伤识别算法