基于BP神经网络的广东省第三产业就业人口数量预测研究

2017-10-23 12:50刘天麒
无线互联科技 2017年19期
关键词:BP神经网络预测

刘天麒

摘 要:宏观经济政策的制定必然要参照各次产业发展水平,故研究产业发展规模变化趋势就显得十分必要。文章通过BP神经网络,对广东省第三产业就业人口数量进行分析,并以2016年的《广东省统计年鉴》提供的数据为依据建立预测模型,结果表明:该模型最大误差为5.26%,满足预期要求,实际值和预测值的拟合关系较为理想,证实了所述方法的有效性。

关键词:BP神经网络;广东省第三产业;就业人口数量;预测

近年来,随着我国经济实力的发展和产业结构的迅速升级,第三产业从业者数量在我国就业人口数量中所占比重逐渐增大,第三产业的兴旺已成为现代经济发展的重要特征。鉴于第三产业在国民经济中的重要地位,本文以广东省第三产业就业人口数量作为研究对象,使用反向传播(Back Propagation,BP)神经网络方法,研究了广东省第三产业就业人口数量的预测模型。

目前国内关于就业人口数量的建模方法较多,应用较为广泛的有灰色理论及神经网络建立的就业预测模型[1],以及利用BP神经网络预测大学生就业模型[2]。关于第三产业的相关建模方法也较为多见,但都集中在对第三产业GDP的建模研究,如采用时间序列法[3]、回归分析法[4]对GDP进行建模,甚少涉及就业人口的建模研究。因此,本文利用BP神经网络方法,结合广东省近12年来第三产业就业人口数量,建立预测模型,以期为广东省第三产业的未来发展趋势提供理论依据。

1 BP神经网络模型原理

1.1 BP神经网络的结构

BP神经网络是一种单向传播的多层前馈网络,在当前人工神经网络算法中得到广泛应用。它包括输入层、隐含层和输出层,同层节点之间互不相连,而层与层之间全互联。输入层和输出层的节点个数由输入、输出向量的维数决定,隐含层节点个数没有确定的标准,需通过反复试验确定。理论表明,三层BP神经网络能以任意精度逼近任何连续函数,其拓扑结构如图1所示。因此,本文采用三层BP神经网络对广东省第三产业就业人口数量进行预测分析。

1.2 BP神经网络的算法

BP算法也称误差反向传播算法,它通过对各层之间神经元连接权值的反复学习,减小误差,得到最终的神经网络模型。对于如图1所示的三层神经网络,其算法计算步骤[5]如下:

(1)采用最小随机数方法初始化所有的加权系数;

(2)提供输入向量[x1,x2,…,xn]和输出向量[y1,y2,…,ym]作为网络训练样本;

(3)计算各神经元的实际输出,如式(1)

(1)

(4)计算实际输出值与期望值的误差,如式(2)

(2)

(5)修正输出层的权值Wim及隐含层的权值Wni;

(6)判断是否满足误差要求(J≤ε),若满足则结束,不满足则返至第3步,直到满足误差要求。

图1 BP神经网络拓扑结构

2 BP神经网络在广东省第三产业就业人口预测中的应用2.1 样本选取与预处理

本文以广东省2004—2015年的就业人员年末人数为建模样本,进行预测研究,样本数据如表1所示。

为了提高样本数据对网络的正确应答能力,需要将构造样本中原始数据作归一化预处理,采用线性归一处理方法,即:

(3)

式中:i=1,2,…,,n;xi代表第i个样本的取值大小;min(x)为所有样本数据中的最小值;max(x)为所有样本数据中的最大值。x'i的取值范围为0~1。人口预测完毕后,再将归一化后的数据按照反归一化处理。

数据来源:《广东省统计年鉴》,2016年版,广东省统计局编,中国统计出版社出版。

2.2 预测广东省第三产业就业人口的神经网络结构设计

本文利用SPSS软件对构建的BP神经网络进行训练,从2004年开始进行样本输入,每4年样本作为一组,样本数据共分为9组,每组中:前3年的数据作为输入,第4年作为输出。9组样本数据中,前6组用于训练神经网络,后3组用于检验预测结果,训练数据和检验数据如表2—3所示。

模型选用常见的3层结构,分别为输入层、隐含层和输出层。输入层有3个神经元,输出层有1个神经元,隐含层神经元经试算为20个。通过对BP神经网络模型相关参数的不断试验和调整,最终确定了隐藏层采用logsig传递函数,输出层采用purelin传递函数,网络训练算法采用traingd,选择5 000作为最大训练次数,0.001作為目标误差值,0.05作为初始学习率。在构建BP神经网络预测模型前,需要按照公式(3)对所有输入数据进行归一化处理,输出数据后再进行反归一化处理。实际值与预测值对比如表4所示。

由表4可知,所建立的BP神经网络在预测2007—2012年广东省第三产业就业人口数量时,最大误差不超过5.26%,表明预测值与实测值之间有着很好的拟合精度,说明该模型可以良好地预测广东省第三产业就业人口数量。

2.3 BP神经网络对广东省第三产业就业人口数量的预测

通过BP神经网络预测模型,对广东省2013—2015年第三产业就业人口数量进行预测,预测结果为2013年人口数量为2 150.82万人,2014年人口数量为2 238.15万人,2015年人口数量为2 272.47万人,预测值与实际值对比如图2所示。

从图2可以看出,预测值与实测值都较为均匀地分布在1∶1线附近,两者之间的决定系数R2=0.986 5,表明预测值与实测值之间有着很好的拟合精度,再一次验证了BP神经网络良好的预测能力。

3 结语

(1)本文以2004—2012年广东省第三产业年末就业人数为依据,利用神经网络建立了BP神经网络预测模型。

(2)利用SPSS软件对所建立的模型进行学习训练,并对2013—2015年广东省第三产业就业人口数量进行了预测。

(3)结果表明,本文所建模型行之有效,在广东省第三产业就业人数预测方面具有较好的拟合度,具有广阔的应用前景。但是,BP神经网络是一个复杂网络,由于其涉及隐含层节点个数难以确定、易陷入局部极小点等问题,在之后研究中,需要不断完善该模型,以增加预测精度。另外,要训练出更为精准的BP神经网络模型,亦需要多年数据的支撑,以进一步提高本文方法的适用性。

[参考文献]

[1]何运村,张柱华.灰色理论及神经网络在就业预测中的应用研究[J].计算机与数字工程,2008(8):154-156.

[2]马丹丹,于占龙,刘越.BP神经网络在大学毕业生就业率预测中的研究与应用[J].佳木斯大学学报,2014(5):751-753.

[3]李战江,曹海燕.使用ARIMA模型对内蒙古GDP进行时序建模及预测[J].内蒙古农业大学学报(自然科学版),2008(2):173-175.

[4]王建府.沪津GDP增长回归模型比较及发展前景研究[J].科技情报开发与经济,2005(3):121-123.

[5]吴昌友.神经网络的研究及应用[D].哈尔滨:东北农业大学,2007.

猜你喜欢
BP神经网络预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
不可预测