□ 樊 丹 史晋娜 张利凤
了解 专业人才队伍的现状,需要对人才需求量的未来状态进行较为精准的把控。在当前研究对象日益“灰色”的前提下,依据有限已知信息的综合分析来预测研究对象的未来状态是预测科学的重要研究内容,也是难点内容之一。[1]因此,要清晰地掌握人才需求量的未来发展状态,就需要找到合适的人才需求量预测模型,进行较为精确的人才需求量预测。
关于预测模型方面的研究,经典的方法多为单一预测模型。帕恩德(Payandeh)描述了对数回归模型的潜在假设和困难,并利用两组数据进行研究并证明了简单的非关联模型和对数线性多元回归模型的优越性。[2]陈新等从路面管理的实际出发,建立了预测沥青路面状况的马尔可夫链模型,并依据路面病害调查结果对转移概率曲线进行了分析。[3]张梦琪(Zhang M)等通过考虑短期和长期的时间依赖,引入降维方法提出了一种基于隐马尔可夫模型(Hidden Markov Model)的预测股票市场价格趋势的方法。[4]徐(Hsu)以全球集成电路(IC)行业的需求和销售为基础,通过比较灰色模型(GM)、时间序列和指数平滑的经验结果来探索哪种预测模型最适合集成电路行业,实证结果表明,相对于中长期预测GM 更适合短期预测。[5]谢梓彬根据预测的流量和有功功率,提出一种估算水电站水库水位的方法,该方法对水库水位具有较好的预测精度。[6]
值得注意的是,单一预测模型在进行预测,特别是进行中长期预测时,可能会与现实情况存在较大偏差,不能满足预测的精度要求。近年来,众多学者逐渐开始倾向于构建组合的预测模型,[7-10]得到了较好的预测效果。樊相如等以高科技企业产品销售的非平稳随机过程为研究内容,对灰色预测和马尔可夫预测模型进行优势互补,建立灰色-马尔可夫模型,提供了一种当历史数据较少时的销售额预测的方法。[11]张崇欣等以系统生产能力为因变量建立多元线性回归方程,紧接着运用回归方程预测结果的残差建立BP 神经网络模型,修正后的模型的预测精度显著提高。[12]洛佩兹-桑切斯(Lopez-Sanchez)等利用广义神经网络对扰动和未建模的动态影响进行估计,以严格的收敛分析推导出了自适应律,并通过实验验证了新控制方案的功能与性能均有所改善。[13]何刚等基于Simpson 公式改进的GM(1,1)灰色系统和神经网络组合模型对国内生产总值进行预测研究。[14]
从这些研究结果可以看出,因灰色预测模型易于操作等特点,较多的研究文献将灰色预测模型与其他预测模型进行“串联”式组合,以此来提高预测精度。但这部分模型是否可以达到我们所要求的预测精度,是否适合用来预测人才需求量还尚未可知。因此,解决以上问题并找到适合人才需求量“灰色”要素的预测模型成为了我们研究的目标。蔡彦等将灰色系统和回归分析模型串联组合后对广东省高校人才需求进行了预测。[15]卞永峰等运用灰色GM(1,1)系统模型和趋势外推模型对山西省2012—2016 年紧缺科技人才需求量进行预测,并运用组合预测模型对预测结果进行修正分析得出紧缺科技人才的供求缺口。[16]王梦运用ELM 网络模型,对企业2010—2019 年的实际人才需求量与预测人才需求量进行了对比分析。[17]在上述的 研究中,大多是对单一模型进行简单的组合或针对单一变量进行预测,并未考虑针对不同变量进行不同方法的修正和优化,也未充分考虑进行单一变量预测时的不确定性和随机性。
与传统研究不同的是,人才需求量的预测研究包含两个基本特征:(1)人才需求量易出 现短期波动,传统的灰色GM(1,1)模型预测时产生的误差较大;(2)人才需求量与其影响因素间存在着复杂的非线性关系,仅对人才需求量进行BP 神经网络预测容易较快产生收敛,无法达到很好的预测效果。为解决这些问题,我们首先对灰色GM(1,1)与BP 神经网络模型进行了残差修正处理、对数平滑处理、神经网络输入因素方面的修正与优化,建立了改进的灰色-BP 神经网络组合模型。紧接着,以成都市2003—2018 年会展人才需求量及其7 个关联度高的影响因素(第三产业增加值、租赁和商务服务业从业人数、会展核心企业数量、重大会展活动数量、展览总面积、展会直接收入、展会拉动收入)的数据作为数值测验样本,对成都市2019—2025 年的会展人才需求量进行了预测。
本文的其余部分组织如下。第二节针对灰色GM(1,1)不同的发展系数,进行了残差修正处理、对数平滑处理等方面的改进与优化。同时,针对神经网络模型容易较快收敛的缺点,将人才需求量及其影响因素共同作为输入层进入神经网络测试,构建出改进的灰色-BP 神经网络组合模型,给出改进的灰色-BP 神经网络预测模型的预测基本思路。第三节,以成都市2019—2025 年的会展人才需求量及其7 个关联度较高的影响因素作为测试数据,分别对比了改进前的无偏灰色GM(1,1)模型、误差修正后的无偏灰色GM(1,1)模型、优化后的灰色-BP 神经网络模型的预测精度,并且应用预测精度相对较高的模型对成都市2019—2025 年的会展人才需求量进行了模拟预测。第四节,对本文进行了总结。
因人才需求量与其影响因素间大多存在着非线性关系,同时,各影响因素之间存在着较密切的关联,应用通常的单一模型无法对这样的关系进行准确的预测。本文对灰色GM(1,1)与BP 神经网络模型进行了残差修正处理、对数平滑处理、神经网络输入因素方面的修正与优化,构建灰色-BP 神经网络组合模型。优化灰色-BP 神经网络预测模型的基本思路主要分三步:
第一步 无偏灰色GM(1,1)的误差修正
对无偏灰色GM(1,1)模 型进行误差逆向修正,并对BP 神经网络模型进行输入层方面的优化,构建出灰色-BP 神经网络预测模型。
第二步 误差修正后的灰色GM(1,1)模型的预测精度比较
运用误差修正后的GM(1,1)模型,实现人才需求量θ与其影响因素X1,X2,…,Xn的预测。
第三步 优化灰色-BP 神经网络模型的预测精度比较
将人才需求量与其影响因素的历史数据与预测数据共同引入BP 神经网络的网络输入层,进行真实值与期望值的训练学习,实现人才需求量的预测,对比分析误差修正GM(1,1)模型与灰色-BP 神经网络模型对人才需求量的预测精度。测模型拓扑结构如图1 所示。
图1 灰色-BP 神经网络拓扑模型
根据不同的发展系数分别用不同的方法对数据进行误差修正(误差逆向修正、平滑处理),以此来提高结果的预测精度。
(1)误差修正算法
为了提高对人才需求量的预测精度,可以对数据进行误差修正,以此来减小预测误差。
①将获取到的原始序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n))生成一次累加序列:
②建立灰微分方程:
其中,a称之为发展系数,b称之为灰作用量,参数a、b的估计运用最小二乘法来进行。
③若发展系数a≤0.1,由残差序列得到残差灰色预测模型:
④残差修正的灰色预测模型:
⑤若发展系数a>0.1,将获取到的原始序列进行对数平滑处理:
⑥得到对数平滑修正的灰色预测模型:
(2)预测精度检验
残差检验、后验差检验及关联度检验是比较常见的测评精度方法,本文采用残差检验与后验差检验方法对灰色无偏GM(1,1)预测算法的精确度进行测评(见表1)。
表1 残差与后验差预测精度
残差检验的平均绝对误差百分比(MAPE),具体的计算公式为:
APE 与MAPE 数值越小,代表算法的预测精度越高。
后验差比值(PC R)与误差概率(EP)的具体计算公式为:
其中:S1为原始序列的标准差,
在进行人才需求量预测时,仅通过人才需求的影响因素数据作为输入变量进行网络的训练与学习,无法充分反映影响因素与人才需求变量之间的非线性关系。基于此,本文对BP神经网络算法进行输入变量的优化,它的学习算法有如下步骤:
(1)输入层i的优化设计
从输入层部分进行优化,将预测变量与其影响因素共同引入网络输入层,即输入标量为作为原始数据进行训练与学习,将会较大程度地提高预测值与真实值的吻合度。
(2)神经网络参数赋值
随机设置输入层i与隐含层j,隐含 层j与输出层k之间的起始连接权值为wij、wjk;设置隐含层及输出层的起始输出阈值αj、βk,给参数wij、wjk、αj、βk赋予(-1,1)区间的随机值。
(3)计算网络的输入与输出值
其中,f(x)为BP 神经网络中的激活函数,本文采用单极性的Sigmoid 函数:
(4)训练网络整体误差判别
随着训练次数的增加输出误差会逐步缩小,训练网络整体误差为:
若误差E在预先设定的误差范围之内,说明网络预测结果已经达到最优值,否则,返回进行下一步的训练与学习,直到训练次数达到之前设置的参数。
成都市会展业以品牌化、专业化、国际化为发展方向,逐步推进由规模数量型向质量提升型的转变。紧随着成都市的国际性、专业化大型展会招引,一批具有全球影响力的重大展会项目聚集在这里。但目前成都市会展人才的存量与结构是否能满足“十四五”期间成都市由会展大都市向国际会展之都转变的发展需求,还是一个亟待探讨的问题。在此背景下,有必要对成都市会展业的人才需求趋势进行较为深入的研究,同时,也可用来检验误差修正预测模型的有效性与推广力。
为确保数据的可得性与客观性,会展人才需求量(Aa)、第三产业增加值(Ba)、租赁和商务服务业从业人数(Bb)、会展核心企业数量(Bc)、重大会展活动数量(Bd)、展览总面积(Be)、展会直接收入(Bf)、展会拉动收入(Bg)8 个测度指标的初始数据来源于历年的《成都统计年鉴》《中国展览年鉴》等年鉴。
对误差修正前后的无偏灰色GM(1,1)模型拟合数据进行残差与后验差预测精度比较(见表2)。
表2 误差修正前后真实值与拟合值对比
表2 给出了灰色GM(1,1)模型误差修正前后会展人才需求量及其7 个影响因素预测的残差及后验差检验结果。因会展人才需求量Aa、租赁和商务服务业从业人数Bb、重大会展活动数量Bd 的发展系数|a|≤0.1,所以采用残差修正来改进误差。残差修正前后变量Aa、Bb、Bd 的平均绝对误差(MAPE)均有所减少,误差减少百分比分别为:14.84%、16.17%、12.20%;误 差修正前后变量Aa、Bb、Bd 的平均绝对误差(MAPE)均在15%以内,根据灰色模型残差预测评定属于II 级(见表1)。因第三产业增加值Ba、会展核心企业数量Bc、展览总面积Be、展会直接收入Bf、展会拉动收入Bg的发展系数|a|>0.1,所以采用对数平滑修正来改进误差。平滑修正前后变量Ba、Bc、Be、Bf、Bg 的平均绝对误差(MAPE)均有所减少,误差减 少百分比分别为:28.57%、62.41%、6.35%、52.96%、41.62%。平滑修正前变量Bc,Bf,Bg 的平均绝对误差(MAPE)均大于25%,根据灰色模型残差预测评定属于不合格(见表1)。平滑修正后,变量Bc、Bf、Bg 的平均绝对误差(MAPE)均在25%以内,根 据灰色模型残差预测评定属于III 级(见表1)。
无偏灰色GM(1,1)模型虽根据发展系数的不同对数据进行了残差逆向(|a|≤0.1)或平滑处理(|a|>0.1)的修正处理,误差修正前后的无偏灰色GM(1,1)模型的平均绝对误差(MAPE)均有所降低,但预测精度未通过I 级检验(见表1),预测结果并不理想。原因可能是:人才需求量与其影响因素间存在着非线性变化趋势,仅对灰色GM(1,1)模型进行修正,有着单一模型无法实现的预测精度,需要继续对修正后的灰色GM(1,1)预测模型进行再次优化,构建出误差修正的灰色-BP 神经网络模型对数据进行组合预测。
(1)输入层与输出层设计
选取成都市的会展人才需求量及其影响因素(第三产业增加值、租赁和商务服务业从业人数、会展核心企业数量、重大会展活动数量、展览总面积、展会直接收入、展会拉动收入)的灰色预测值作为改进BP 网络模型的输入层,输出层为会展人才需求量,建立一个4 层的BP 神经网络,网络初始结构为8-11-1-1。
(2)BP 网络的参数设定及训练学习
本次网络学习的学习速度设置为0.05,训练的最大步数设定为300,网络目标误差为1×10-10。根据以上参数的设置进行了多次BP神经网络的训练学习,在进行了59 步训练学习后,预测精度达到了期望值,此时的误差减少至9.95×10-11。BP 神经网络的训练图如图2所示。
图2 BP 神经网络训练①
(3)预测精度比较
将2014—2018 年的成都市人才需求量及其影响因素 数据引入已训练好的BP 神经网络模型,进行2014—2018 年人才需求量预测精度的比较(见图3 与表3):
表3 误差修正与优化灰色神经网络预测模型预测精度比较
图3 绝对误差百分比(APE)对比
表3 给出了误差修正前后灰色GM(1,1)模型(单一模型)与 优化灰色-BP 神经网络模型(组合模型)对会展人才需求量预测的绝对误差(APE)和平均绝对误差(MAPE)结果。误差修正前无偏灰色GM(1,1)模型的绝对误差(APE)分别为:2.41%、0.85%、4.24%、7.72%、0.08%,平均绝对误差(MAPE)为3.06%。误差修正后无偏灰色GM(1,1)模型的绝对误差(APE)分别为:1.74%,1.57%,5.00%,8.54%,0.85%,平均绝对误差(MAPE)为3.54%。误差修正后无偏灰色GM(1,1)模型在2016 与2017 年的绝对误差(APE)均超过5%,预测精度仍不够理想。优化灰色-BP 神经网络模型的绝对误差(APE)分别为:0.05%,0.02%,0.04%,1.26%,0.33%,平均绝对误差(MAPE)为0.34%。灰色-BP 组合预测模型2014—2018 年绝对误差(APE)和平均绝对误差(MAPE)均低于5%,符合残差检验的I 级标准(见表1),预测精度比较理想。可以看出,优化灰色-BP 神经网络模型的2014—2018 年人才需求量预测值与真实值的误差更小,预测精度更高,2019—2025 年人才需求量的数据预测将会更加可靠。
采用优化灰色-BP 神经网络模型对2019—2025 年成都市会展人才需求量进行预测,2019—2025 年成都市会展人才需求量预测值及年增长率见表4 和图4。
表4 成都市2019—2025 年会展人才需求量预测值
图4 会展人才量需求趋势
表4 及图4 给出了优化后的灰色-BP 神经网络模型对2019—2025 年成都市会展人才需求量的预测数值及年增长率变化趋势。2019—2025 年成都市会展人才的需求量分别为:5 740、6 987、6 687、7 047、7 682、9 091、8 774,成都市会展人才需求量在“十四五”期间(2020—2025 年)仍会出现较大幅度的增长,“十四五”期间将新增人才需求量5.2 万人。会展人才需求量年增长率分别为:9.75%,21.72%,-4.29%,5.38%,9.01%,18.34%,-3.49%。人才需求量的年增长率虽在2021 与2025 年呈现出负增长,但2019—2025 年期间的其他年份基本保持了4.00%以上的年增长率。
中国综合国力的快速提升需要对人才需求量的现状及未来发展趋势进行精准的把控,研究人才需求量的预测模型是十分必要的,但人才需求量本身更多涉及到不确定的内在因素。因此,本文建立了改进的灰色-BP 神经网络预测模型,以成都市会展人才需求量及其影响因素数据作为数值测试样本,以此来检验模型是否可以达到我们所给定的预测精度标准。在本文中,我们考虑到灰色GM(1,1)模型发展系数的特殊性,以成都市会展人才需求量及其影响因素数据作为数值测试样本,预测模型检验的结果如下:(1)误差修正前后的无偏灰色GM(1,1)模型的MAPE 均有所减少,预测精度有所改进,但部分变量预测精度仍未达到理想效果。(2)组合模型相比单一模型有一定的优势。优化后的灰色-BP 神经网络模型预测精度比无偏灰色GM(1,1)模型、误差修正无偏灰色GM(1,1)模型更有优势,更适合进行会展人才需求量的预测。(3)由于优化后的灰色-BP 神经网络组合模型相比误差修正无偏灰色GM(1,1)模型,预测精度有显著的提高,预测模型达到了我们所给定的预测精度标准。
这项研究可以向以下两个方面进行扩展:(1)改进其不确定性。因BP 神经网络模型自身的局限性,需要在不断的尝试中得到较为理想的拟合数据,使得灰色-BP 神经网络模型预测结果具有一定的不确定性,需要对灰色-BP 神经网络模型预测过程中的不确定性方面进行适当调控与改进。(2)提高其预测精度。当元素的影响因素较多时,仅使用单个序列进行无偏灰色模型预测,数据预测值与真实值可能会出现较大的误差,需要找寻更适合的改进方法,以此来逐步提高模型的预测精度。以上两个方面将成为灰色-BP 神经网络组合预测模型未来的研究方向。
注释:
① R 值越接近1,表示拟合线与直线Y=T 之间的重合度越高,(d)中R=1,因此拟合线与直线Y=T重合。