方文超
(广东工贸职业技术学院,广东广州510510)
基于改进型BP神经网络的管理信息系统开发风险评价模型*
方文超
(广东工贸职业技术学院,广东广州510510)
BP神经网络能较好处理非线性化数据,但传统BP神经网络存在着局限性,为了提高神经网络运算的精确度,通过权值和学习率共同优化,并采用贝叶斯正则化算法训练神经网络,形成了基于改进型BP神经网络的管理信息系统开发风险评价模型,经测算,该模型输出值与实际值高度吻合,模型可接受度较高,并且与传统BP神经网络相比,改进型BP神经网络的相对误差更小。
改进型BP神经网络;管理信息系统;开发风险;评价模型
管理信息系统是企业信息化的重要组成部分,其作用日趋显著。管理信息系统开发风险的评价直接影响到开发活动的开展和实施,因此,如何评价管理信息系统开发风险成为近年来研究的热点。由于管理信息系统开发风险较多,评价结果一般都是非线性的,因此传统评价方法难以准确有效反映相关开发风险,采用能够处理非线性化数据变得尤为重要,而神经网络(Neural Network)正是处理非线性化数据的一个重要工具,其在制造业、农业、医药学、建筑学等众多领域有着广泛的应用[1-4]。神经网络是通过计算机模拟生物体的神经元活动规律,对相关数据进行学习,揭示数据之间的联系,是一项新兴的计算机数据处理技术。神经网络有着泛化能力,自适应性,具有高度鲁棒性,分布存储和并行处理等特点,融合计算机学科、生物学、控制学、数学等多学科的技术,是当代人工智能发展的亮点。
在管理信息系统风险评价模型的研究上,学界主要使用层次分析法(AHP)、Petri网、结构方程等研究方法[5-7],使用BP神经网络研究的文献较少,使用改进型BP神经网络的研究更为鲜见。因此,采用改进型BP神经网络进行评价模型构建是一种新的研究思路,探索一种新的研究方法,具有一定的现实意义和实践意义。
BP神经网络(Back Propagation Neural Network)是最普遍使用的神经网络,其原理是指通过信号正向传播和误差反向传播确定权值,这个过程会循环执行直到找到合适的值,或误差少到可接受程度,或到达预先设定学习次数而终止。在BP神经网络中,以三层前馈网为最常见。
参考相关研究,建立以下模型[8]:
设输入向量X=(x1,x2,x3,…,xn),隐层输出向量Y=(y1,y2,y3,…,yn),输出层输出向量为A= (a1,a2,a3,…,an),期望输出向量为R=(r1,r2,r3,…,rn),输入层到隐层之间的权值矩阵用B表示,B =(B1,B2,B3,…,Bm),其中列向量bi为隐层第i个神经元对应的权向量;隐层到输出层之间的权值矩阵用C表示,C=(C1,C2,C3,…,Cl),其中列向量Ci为输出层第i个神经元对应的权变量,如图1所示。
图1 BP神经网络图
对于输出层,有
对于隐层,有
在(1)、(3)中f(x)均为单极性Sigmoid函数:
当实际输出与期望输出不等时,产生误差E,
把(5)式代入到隐层,可得
再把(6)式代入到输入层,可得
BP算法需要调整误差,使误差尽可能地减少,因此可得
以下是推导三层BP算法权值调整的过程。
对于输出层,由(8)可得
对于隐层,由(9)可得
对输出层和隐层各设定一个误差变量,令
由(2)和(12),把(10)推导为
由(4)和(13),把(11)推导为
结合(14)和(15),可得
以下是误差对各层的传递:
对于输出层,可得
对于隐层,可得
把(17)和(18)代入到(14)和(15),可得
把(20)和(21)代人到(14)和(15),三层前馈网的BP学习算法权值调整公式为
因此,BP神经网络的算法由学习率η、误差变量δ和输入变量X(或Y)决定。
但是由于传统的BP神经网络存在着容易形成局部最小化和收敛速度慢的缺点,所以近年来学界提出了不同的方案,本文采用权值和学习率共同优化改进传统BP算法,并使用贝叶斯正则化算法(Bayesian regularization algorithm)训练神经网络。具体如下:
权值调整为
学习率调整为
正则化是指通过调整神经网络的训练性能函数以达到网络泛化能力[9]。一般地,神经网络训练性能函数采用均方误差函数Ed:
具体而言,正则化就是在(26)式增加一项网络权值平方和Ep,即把原来性能函数调整为新的函数Eu:
而贝叶斯正则化算法的本质是通过在网络训练中自适应调整变量φ,λ的值以使其性能达到最优。
根据改进型BP算法,综合考虑开发风险评价因素,构建管理信息系统开发风险评价模型,如图2所示:
图2 基于改进型BP神经网络的管理信息系统开发风险评价模型
步骤1:建立风险评价体系。课题组对广东省制造业和IT行业企业信息部门进行多次访谈,并对相关企业进行走访和深度访谈,设计和发放相应问卷,结合现实情况,查阅相关文献,选择现有管理信息系统的数据作为参照来源,综合评价现有管理信息系统的运行情况与先前风险评价之间的关系,建立风险评价体系。
步骤2:收集资料。课题组从行业专家、学者、开发人员、管理人员等收集第一手数据,并通过文献、数据库、网络等渠道收集第二手数据,务求实现资料收集的多方位性、全面性和及时性。
步骤3:确定输入层神经元个数及参数。根据评价体系,结合步骤1的工作,参考相关文献[10-13],确定输入层神经元个数为6,分别是性能风险、成本风险、环境风险、进度风险、产品风险、过程风险。
步骤4:确定输出层神经元个数。输出层神经元个数为1,输出值(设为a)的取值范围是:0.7<a<=1.0为低度风险,0.4<a<=0.7为中度风险,a<=0.4为高度风险。
步骤5:确定隐层神经元个数。根据神经网络的原理,如果隐层神经元个数过多,会出现所谓的“过度学习”问题;如果隐层神经元个数过少,也会出现泛化能力下降的可能。因此,采用试凑法进行隐层神经元个数的设定,即先通过,(m为隐层神经元个数,n为输入层神经元个数,l为输出层神经元个数,g为1-10的整数)等公式进行初值测算,设置一个相对较小的初值,并逐步增加神经元个数,经过多轮试凑,最终确定隐层神经元个数为16。
步骤6:选定输入、输出样本。为了使样本尽可能反映管理信息系统开发风险评价的本质,课题组先后多次走访广东省制造业和IT行业企业,邀请业内专家进行指导,设计第一轮问卷,向部分企业进行问卷发放和回收,在此基础上,对第一轮问卷进行修改,设计了第二轮(即修订版)问卷,全面向相关企业信息部门进行发放和回收,得到了所需要的样本。修订版问卷的发放数为62,回收有效问卷为56。设定训练样本数为42,测试样本数为14。
步骤7:样本数据归一化处理。由于样本数据量纲不同,以及BP神经网络使用的是Sigmoid函数的输出值在[0,1]或[-1,1],所以必须对样本数据进行归一化处理,即通过以下公式把数据转化为[0,1]区间:
其中,s为转化为[0,1]区间的值,ti为输入或输出值,tmin为每组输入或输出值的最小值,tmax为每组输入或输出值的最大值,设a=0.85,b=(1-a)/2
步骤8:权值和学习率共同优化的改进算法,通过运用(24)和(25)两个公式对权值和学习率进行调整和优化,并使用贝叶斯正则化算法训练BP神经网络,以期改进窗体神经网络的局限性,为模型提供更为准确的输出结果。
步骤9:输出评价结果。通过编写MATLAB程序,输入样本,得到相应的运算结果,并由此得到评价结果。
通过构建模型,设定输入层神经元个数为6,输出层神经元个数为1,隐层神经元个数为16,训练样本数为42,测试样本数为14,运用MATLAB程序,得到训练结果和测试结果,并与实际值进行比较,见表1和表2所示,由于篇幅所限,仅显示部分数据,下同。
表1 部分训练结果与实际结果比较
表2 部分测试结果与实际结果比较
如表1、2所示,无论是训练样本还是测试样本,模型计算的数值与数据数值的相对误差很小,两者评价结果是一致的。而且,经过对56个样本的比较,也得出上述相同的结论,即该模型计算的数值与实际数值吻合度较高。
为了测算出改进型BP神经网络与传统BP神经网络的效果差异,本文分别从改进型BP神经网络与传统BP神经网络两个角度对同一样本进行训练与测试,得到以下比较结果(如表2所示):
表3 改进型BP神经网络与传统BP神经网络效果比较
由表3可知,与传统BP神经网络相比,改进型BP神经网络测试值与实际值的误差更小。
构建管理信息系统开发风险评价模型,有助于及时发现管理信息系统开发风险,也为进一步采取风险防范措施提供可能性。通过算例分析,改进型BP神经网络模型与实际数值吻合度较高,可接受度较高,而且其相对误差优于传统BP神经网络。并且,基于改进型BP神经网络的管理信息系统开发风险评价模型使用相对简便,能够有效缩短运算时间,能较好为开发风险提供更准确的评价,在管理信息系统的开发具有广泛的适用性,为管理信息系统风险评价提供了一种新的方法。
[1]高霁,曹国强.机械优化设计中BP神经网络的应用研究[J].机械设计与制造,2004(5):53-55.
[2]石建勋,等.基于BP神经网络方法计算灌区农业耗水量的研究[J].工程勘察,2011(5):41-46.
[3]傅旭春.用神经网络法预测药物在体透过人皮肤的渗透性[J].浙江大学学报(医学版),2003(2):69-71.
[4]黄凤洁,等.基于BP神经网络的城市燃气管网泄漏定位[J].山东建筑大学学报,2011(5):436-439.
[5]李煜华.管理信息系统的模糊综合评价模型研究[J].哈尔滨工业大学学报,2004(8):1128-1131.
[6]张李义,李雅烽.基于Petri网的信息系统开发风险管理与决策方法[J].武汉大学学报(工学版),2002 (1):84-88.
[7]张薇.基于结构方程模型的信息系统开发风险评价研究[J].现代情报,2011(1):47-51.
[8]施彦,韩力群,廉小亲.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009:23-75.
[9]陈黎霞,炳南.基于Bayesian正则化算法的非线性函数拟合[J].河南科学,2005(1):23-25.
[10]Rees J,Allen J.The State of Risk Assessment Practices in Information Security:An Exploratory Investigation[J].Journal of Organizational Computing and Electronic Commerce,2008,18(4):255-277.
[11]Yang F,Shao P,LiD.Research on Risk Managementof Flexibility Information Systems[J].Management Science and Engineering,2011,5(3):83-86.
[12]百度百科.软件项目风险管理[EB/OL].http://baike.baidu.com/view/1317106.htm.
[13]Finne T.Information Systems Risk Management:Key Concepts and Business Processes[J].Computers&Security,2000,19(3):234-242.
An Evaluation M odel of M anagement Information System Development Risks Based on Im proved BP Neural Network
FANGWen-chao
(Guangdong College of Industry and Commerce,Guangzhou 510510,China)
BP neural network can dealwith nonlinear data rightly,but traditional BP neural network has limitations.In order to boost the precision,a new evaluation model ofmanagement information system development risks based on improved BP neural network is established through the co-optimization of weight and learning ratio as well as the application of Bayesian regularization algorithm in training neural network.After calculation,the cutput value of thismodel accordswith the actul value,thismodel has a high acceptability.Besides,compared with traditional BP neural network,the relative error of improved BPNeural Network is smaller.
improved BP neural network;management information system;development risks;evaluation model
F270.7
B
1673-5382(2014)03-0079-05
(责任编辑 侯中岩)
2014-03-01
广东省高职教育商业类专业教学指导委员会项目(编号:YSYJZW2013YB03;YSYJZW2013QN09).
方文超(1983-)男,广东省广州人,广东工贸职业技术学院讲师,高级工程师,经济师.