马立艳 陈桂芬
摘要:为提高基层企业管理效率,根据吉林省东丰县开发区2015年企业调查数据,使用粗糙集与RBF神经网络算法结合算法对企业工业生产总值、用电量、用工量等3个主要影响因素进行分析,并根据各参数之间差异划分企业等级。研究结果表明:根据算法对数据分类结果,该结果与东丰县开发区企业分级情况比较接近,说明基于粗糙集RBF神经网络算法, 是一种在企业绿色发展分级方面有效的评价方法;通过2种算法之间的可视化图形对比,得出粗糙集RBF神经网络算法较 BP神经网络算法分类效果更加明显; 因而,基于 粗糙集RBF神經网络算法对东丰县开发区进行企业划分准确性强、效率高、易于推广,为东丰县开发区关于企业管理工作起到技术指导作用。
关键词:东丰县开发区;绿色发展;BP神经网络;RBF神经网络;粗糙集
中图分类号:S-3文献标识码:ADOI:10.19754/j.nyyjs.20190615002
引言
企业是开发区生存与发展的重要基础,企业的绿色发展是开发区健康发展的重要保障,确保开发区可持续发展的核心基础保障,经济发展、绿色发展、科技发展成为开发区企业发展的3个重要因素[15]。以往对于企业的评估中,企业经济发展作为评估企业的重中之重,然后系统分析企业经济总值、纳税值等情况[16],根据单一的经济数据决定企业在园区内的帮扶力度和去留等工作,然而企业的规模、发展都不是均一的,是随着社会因素的总体影响的,使用单一的帮扶企业政策既不能满足多数企业的需求,甚至会使高能耗、高污染的企业在开发区中密集出现。于是,各地开发区纷纷提出了绿色企业,根据企业多种变量来确定最适合区内发展的企业,目标是在降低能耗、提高科技的前提下,企业经济展情况最佳。
随着科技在开发区管理中应用的不断进步,为有效提高开发区管理能力,数据挖掘被广泛应用到企业管理中,神经网络是数据挖掘算法最广泛使用的分类方法之一,已经在模式识别、智能机器人、预测评估、经济等领域广泛的领域解决了实际问题,其适用于非线性数据的处理,其主要功能有自学习、联想储存、高速寻找优化解等,典型算法有:BP神经网络、RBF神经网络等。本研究根据东丰县开发区企业的多样性和差异性,利用数据挖掘中的BP神经网络、RBF神经网络,对研究区域的人员投入、经济产出、能源消耗3种主要影响开发区进行了分别研究,分析研究结果,为开发区企业绿色发展情况划分起到指导作用。
1关键技术及算法介绍
1943年神经网络初期模型MP被提出,独立神经元能够实现执行逻辑功能。
W.S.McCulloch和W.Pitts建立MP模型,实现了单独神经元能执行相关逻辑功能。直到1986年,神经网络逐步发展成为BP算法, BP神经网络能够解决实际问题。1988年,Broomhead和Lowe用径向基函数(Radial basis function, RBF)提出分层网络的设计方法[5]。
BP神经网络是一种多层的前向型神经网络,被称为误差反向传播神经网络,在BP神经网络中,信号是前向传播的,而误差是反向传播的,BP网络通常由有一个至多个隐层以及一个输出层构成,能够对具有有限性个不连续点的函数进行逼近。人工神经网络常用来解决非线性分类问题,它通过对训练样本的学习,自动提取合理的的规则,对测试样本具有良好的预测能力。但是,BP神经网络算法也存在局限性,对输入样本的预处理功能不强,易在局部极值点滞留,导致网络收敛迟缓、或过早收敛等情况出现[6]。
BP神经网络的性能指标为下:如公式1(节点之间权值为w,节点的阈值为b,输出层节点数目为n,输出层结果为d):
E(w,b)=∑n-1j=0(dj-yj)2(1)
RBF神经网络同时前馈型神经网络。它以任意精度逼近任意的非线性函数,且具有全网络逼近能力[2],其性能极其优良。它的网络和模糊逻辑能够实现合作,真正提高算法的泛化能力。RBF神经网络的激活函数可表示为:如公式2
f(x)=∑n-1j=0(dj-yj)2(2)
RBF神经网络与BP神经网络存在以下区别:RBF在泛化能力上高于BP神经网络,在同精度的情况下,BP结构更简单[3,13];RBF神经网络精度高于BP神经网络,RBF神经网络以完全接近真实程度,随着训练样本增多的前提下,其隐藏层增多,且明显神经元高于BP神经网络,使得网络结构复杂,复杂程度也增大,运算量也随之增加;RBF神经网络可以实现完全逼近能力,且收敛速度快;结构不同,RBF神经网络通过不停调整全职直接逼近最小误差,BP神经网络是通过梯度下降来接近预期目标;RBF具有最逼近性能和全域最优特性,训练速度较快,BP神经网络速度较慢,学习速度基本是固定的,需要较长的训练时间;局限性不同,BP神经网络在计算过程中容易产生极小值现象,RBF会完全逼近真实值,不会陷入局部极小值[4,11]。
粗糙集理论能够对不确定、不完整的数据进行有效处理的一种数学方法[8,9]。它建立在分类的基础之上,对精确、不确定的数据处理比较客观,在处理过程中,无需前期验算信息,仅需要提供户数据集合[10]。针对该理论对原始数据中不确定、不完整的能力,使得其与处理不确定问题的理论形成互补[1]。
2粗糙集RBF神经网络在企业分级上的应用2.1实验数据来源
实验数据来自吉林省东丰县经济开发区,该区成立于2005年11月。经过多年的发展,现已形成了以中小企业创业孵化基地、以梅花鹿特色产业、鑫达冶金铸造产业、低碳产业孵化为特色的“三园一基地”的模式,开发区建筑面积为4.34km2,总面积约为13.41km2,共设置可租借使用厂房8栋24500m2,目前,开发区区内企业达到220户,其中工业企业82户。收集整理该开发区2016年部分企业的生产总值、能耗情况、用工情况等数据(表 1),为建立企业绿色发展评价模型工作提供基础数据。
2.2结果与分析
企业绿色发展状况企业人员、企业用电总量、企业生产等因素的影响,部分影响因素无法通过直观数据得到。生产总值等于0时说明企业可能已经停工或搬迁,企业发展情况受生产总值的直接影响容易产生异常,为了使得数据更加准确剔除生产总值为0的数据。
针对东丰县开发区企业状况数据,对企业数据中的企业人员、企业用电总量、企业生产总值3个指标分别进行归一化处理。对开发区管理系统中的生产总值、用电量、用工情况分摊至单位使用土地面积,利用粗糙集理论进行处理,并实现数据的归一化。由多年工作在基层开发区工作人员根据工作、研究经验分析總结,得出该基层开发区在单位土地面积的工业生产总值、用电量、用人工量权重,因为以上属性之间依赖度较高,所以去除任一属性,分类情况都需要重新确定,在综合考虑属性之间的重要度,得到工业生产总值、用电量、用人工量的综合属性值为0.55、0.25、0.2。
根据前期对数据的处理,利用最终权重对RBF神经网络算法进行分析,借助数据归一化处理更能有效的处理开发区管理数据。考虑开发区企业绿色发展情况将将开发区企业绿色发展等级划分为4个等级,用S代表企业绿色发展等级区间,其中一类企业得分为<0.8,二类企业得分为≥0.8、<1.5,三类企业得分为≥1.5、<3.5,四类企业得分为≥3.5。 在上述基础上,利用BP神经网络算法和粗糙集RBF神经网络算法对东丰县开发区2015年企业绿色发展情况情况数据进行对比分析。
从表2可知,BP神经网络所得分类结果中一类企业1个,二类企业4个,三类企业11个,四类企业6个。粗糙集RBF神经网络所得分类结果为一类企业3个,二类企业3个,三类企业9个,四类企业7个。两种算法均无孤立点现象出现。
从表3可以看出2015年粗糙集RBF神经网络与BP神经网络分类精度是95.45%、86.3%,从结果可以看出粗糙集RBF对属性数据能得到精准划分,无孤立点现象出现,分类误差率底,对开发区企业绿色发展情况分级具有实用价值。
可视化的图形模式分析。通过粗糙集RBF神经网络与BP神经网络对分类结果分别以可视化图形模式进行对比分析。对比结果如图2所示,从图2可以明显看出:2种分类结果于专家给定数据吻合度较高,粗糙集RBF神经网络算法分类效果较BP神经网络算法明显,尤其是在分级内的吻合度更高一些,RBF神经网络分类与专家给出的实际情况相符,说明粗糙集RBF神经网络算法更能够高效、精准的进行企业绿色发展等级的划分。
3结果与讨论
本文分别通过运用BP神经网络和粗糙集RBF神经网络算法,对东丰县的企业绿色发展数据进行等级划分,在综合考虑了影响企业分级的各类数据权重问题,验证了神经网络算法在开发区企业绿色评价上的可行性。经过对比分析可以看出,粗糙集 RBF神经网络算法能较好地实现企业绿色发展的评价。
提出改进的RBF神经网络,将粗糙集与RBF进行有效结合,两者的结合能够具有互补性,数据结构在具有完整性的同时提高精度。
基于粗糙集RBF神经网络算法属性权值因子的提取和确定,通过对各属性权重的综合测定,确定该基层开发区企业发展管理数据工业生产总值、用电量、用人工量的综合权重为0.55、0.25、0.2。
将改进的RBF神经网络算法与BP神经网络算法运用在2015年开发区企业发展管理数据进行对比分析,RBF神经网络算法能较好的实现企业管理数据的分析,其中粗糙集RBF神经网络、BP神经网络在15a数据的准确率分别为95.45%、86.3%,结合可视化的图形模式对比分析结果更加明显。
上述分析结果表明,对企业绿色发展情况的划分使得开发区发展趋于向上,对区域经济、生态效能的提高具有长久的现实意义。本实验在企业数据应用上仅选择1a数据,其结果只说明了算法的应用性,本文将要继续通过更多的实验结果进行验证。
参考文献
[1] 贾晨光,陈桂芬.基于粗糙集C4.5算法的应用[J].中国农机化学报,2016,37(7):149-153.
[2] 朱玉荣,吕建新.基于RBF神经网络的柴油机故障诊断[J].农机化研究,2012(5):212-215.
[3] 王启. 人工神经网络在函数逼近中的应用研究[J]. 电脑开发与应用, 2012, 25(7):85-86.
[4] 孙红辉, 张清华, 宋贤征. 基于RBF神经网络的柴油机故障诊断[J]. 小型内燃机与车辆技术, 2009, 38(1):70-72.
[5] 王晶晶. 一种改进的Elman神经网络算法的研究[J]. 华中师范大学学报(自然科学版), 2016, 50(3):349-352.
[6] 吴洁, 曲畅, 王华. 基于BP神经网络的脑卒中患者分类方法研究[J]. 无线互联科技, 2016(24):140-142.
[7] 马斌, 张丽艳. 一种基于径向基神经网络的短期风电功率直接预测方法[J]. 电力系统保护与控制, 2015, 43(19):78-82.
[8] 杨玉琴, 陈桂芬, 郭宏亮. 大数据处理技术在土壤肥力评价中的研究[J]. 中国农机化学报, 2016, 37(4):233-236.
[9] 蔡丽霞, 陈桂芬. 基于数据挖掘算法土壤肥力状况的分析研究[J]. 中国农机化学报, 2014, 35(3):252-255.
[10] 于合龙, 刘杰, 马丽. 基于 Web 的设施农业物联网远程智能控制系统的设计与实现[J]. 中国农机化学报, 2014, 35(2):240-245.
[11] 陈军令. 基于径向基神经网络的财务预警研究[D]. 中南大学, 2013.
[12] 吴浩亮, 孟令启, 王建勋. 基于RBF神经网络的中厚板轧制宽展模型[J]. 机械设计, 2010, 27(4):21-24.
[13] 胡劲松, 杨世锡. EMD方法基于径向基神经网络预测的数据延拓与应用[J]. 机械强度, 2007, 29(6):894-899.
[14] 曾庆谦. 基于神经网络的船舶运动姿态建模预报[D]. 哈尔滨工程大学, 2008.
[15] 邹鹏. 基于数据仓库的辽宁省中小企业产业集群战略设计[D]. 沈阳理工大学.
[16] 诸克军. 经济管理中软计算的理论与方法[M]. 华中科技大学出版社, 2009.
作者简介:马立艳(1987-),女,研究方向:人工智能与计算机农业应用;陈桂芬(1956-),女,教授,研究方向:人工智能与数据挖掘、精准农业。