基于改进布谷鸟-BP算法的空调电商销量预测

2021-09-05 03:18魏贝贝卢明银
上海管理科学 2021年4期
关键词:因子分析

魏贝贝 卢明银

摘 要: 空调行业一直处于双寡头格局,从双十一的价格战到目前的疫情影响,中小企业的电子商务销量预测面临着更加严峻的考验。为降低传统预测模型的低拟合度,提高预测精度,提出了布谷鸟算法与BP神经网络算法相结合的预测方法。首先对影响空调销量预测的主要因素进行了降维处理,其次运用布谷鸟算法对BP神经网络算法的权值和阈值进行优化,同时在布谷鸟算法中引入了细菌觅食算法的群体信息共享机制,加快算法的收敛。通过与不同预测方法的结果对比,该方法的预测误差更低,可以为空调电子商务销量预测提供良好的科学依据。

关键词: 因子分析;布谷鸟算法;BP神经网络算法;销量预测

中图分类号: TT-9

文献标志码: A

Air Conditioning E-commerce Based on ImprovedCuckoo-BP Algorithm Sales Forecast

WEI Beibei LU Mingyin

(1.School of Mining Engineering, China University of Mining and Technology,Jiangsu Xuzhou 221100, China; 2.School of Mining Engineering, China Universityof Mining and Technology, Jiangsu Xuzhou 221100, China)

Abstract: The air-conditioning industry has always been in a duopolistic pattern. From the price war of the Double Eleven to the current epidemic, the forecast of SMEse-commerce sales is facing a more severe test. In order to reduce the artificial interference and the low fitting degree of the traditional prediction model and improve the prediction accuracy, it will propose a prediction method combining the cuckoo algorithm and the BP neural network algorithm. First of all, the main factors that affect the sales forecast are processed for dimensionality reduction. Secondly, the cuckoo algorithm is used to optimize the weights and thresholds of the BP neural network algorithm. At the same time, the cuckoo algorithm introduces the group information sharing mechanism of the bacterial foraging algorithm to speed up the convergence of the algorithm. Compared with the results of different prediction methods, the prediction error of this method is lower, which can provide a good scientific basis for the sales forecast of e-commerce of air conditioners.

Key words: factor analysis; cuckoo algorithm; BP neural network algorithm; sales forecast

2019年網购零售额达106324亿元,比上年增长16.5%,网络零售在促进消费结构升级、拉动内需等方面起着越来越重要的作用,京东、苏宁易购、天猫等电商平台成为了推动消费升级的主力军。与此同时,企业运营问题面临着更大的挑战。由于客户在多个平台的选择性广,且企业无法直接接触客户,特别是B2C模式更增加了订单预测的难度。如果生产过多,引起库存积压,占用大量财务资金影响企业正常运转,生产过少,缺货状态下只能形成越卖越差的恶性循环,而且一旦预测不准确,频繁的变更订单需求,势必会影响采购、生产环节的工作安排,导致工厂间产能、物料的不均衡,因此保证订单预测高准确率和低波动率显得尤为重要。

人工神经网络( Artificial Neural Networks,简写为 ANNs ),是应用于计算机视听、语音分析、数字水印、图像识别等各行各业的数学模型,具有自学习能力、较强的非线性拟合能力、高速寻优能力;但也有易陷入局部最优,收敛性不强的缺点。本文以X空调公司为研究背景,运用改进的布谷鸟算法优化BP神经网络算法中初始化时的权重和阈值,提高BP神经网络的泛化能力和收敛性,从而更加准确地预测电商月度销量和分机型销量,降低牛鞭效应,也使工厂在淡旺季切换之际对物资、人员规划有充足的准备,达到减员提效,提高线上占有率的目的。

1 电商销量预测的关键因素

通过对100名X公司电商运营人员及日常网购人员的问卷调查分析,将影响空调业电商销量的因素归纳为以下几点:

为避免数据冗余,通过spss软件进行了因子分析,将相关性较高的因素进行聚类以降低问题的复杂性,聚类结果如表2、表3、表4所示。

从表2中可以看出,KMO为0.714,大于0.6,且Bartlett球形度检验中P<0.05,说明研究数据适合进行因子分析。从表3、表4中得出,3个因子总共提取出11個分析项中88.377%的信息量,因此将影响因素划分为三个类别,如表5所示。

2 改进布谷鸟- BP神经网络算法

2.1 改进布谷鸟算法

Yang XS与Deb S通过模拟自然界中布谷鸟产卵、孵化过程,在《Cuckoo Search via Levy Flights》一文中提出了布谷鸟算法(简称CS)。 布谷鸟自身不筑巢、不孵卵、不育雏,而是抓住机会叼走他鸟巢中的蛋,并在巢内产卵,让其他鸟类代其孵化,雏鸟为了更好地生存会模仿宿主雏鸟的叫声以获得食物。布谷鸟一般在一个鸟巢中只寄生一枚蛋,当宿主鸟发现外来鸟蛋后,要么舍弃该鸟巢,重新选择位置筑巢,要么抛弃布谷鸟蛋,即鸟窝、卵蛋代表解。卵蛋能否被宿主鸟成功孵化是一个优胜劣汰的过程,也是衡量解好坏的唯一标准。

在算法设计中,布谷鸟通过莱维飞行在D维空间中寻找最优解,同时考虑群体间缺乏信息共享,因此引入了细菌觅食算法(Bacterial Foraging Optimization Algorithm)中的群聚策略,假设群体最优值对各位置释放信息素,吸引布谷鸟朝最优解方向移动:

Xt+1,i=Xt,i+αlevy(β)+ρattractexp(-ωattract(θi-θbest)2)(1)

式中,Xt表示第t代第i个解;α表示随机搜索范围的步长因子,⊕表示点对点乘法。莱维飞行通常使用Mantegna算法模拟,步长s数学表达式如下:

s=u|v|1/β(2)

其中,u服从N(0,σ2),v~N(0,1),σ={Г(1+β)sinπβ2β Г1+β22β-12}1β

宿主鸟按一定概率舍弃鸟窝,采用偏好随机游走生成新的解:

Xt+1,i=Xt,i+αsH(Pa-r)(Xj,i-Xk,i)(3)

其中,Xj,i,Xk,i是通过随机位置变换随机选择的两个不同的解,s是步长,H(v)是单位解约函数,r是从均匀分布中抽取得随机概率。

同时,在CS算法中,每个解以随机概率消失的同时也增加了淘汰最优解的概率。本文中结合了BFOA的趋化策略,增加其局部搜索能力,并对每次趋化步骤中的平均适应度值排序,较差的半数鸟巢以一定概率发生迁移,以降低最优解被随机淘汰的可能性。具体步骤如下:

Step 1.初始化种群N、最大进化代数T、步长因子a,发现概率Pa、趋化步骤的步数M等,并随机产生初始种群。计算所有个体的适应度,记录全局最优适应度值Gbest和全局平均适应度值Gave。

Step 2.判断是否达到最大迭代次数或设定精度,若终止条件不满足, 则重复Step 3 - Step 5,否则进行Step 6;

Step 3.通过莱维飞行更新鸟窝位置,若f(xi)f(xb)或完成最大飞行步数,采用贪婪策略,保留父代解,进行Step 4;

Step 4.计算趋化步骤中布谷鸟的平均适应度值得到布谷鸟能量,并排序,对于获取能力差的半数鸟巢,生成一个随机概率r,并将它与固定迁移概率Pa进行比较,若r< Pa则利用式(3)进行随机迁移,并返回Step 2;

Step 6. 将改进布谷鸟算法更新后的权值、阈值作为神经网络算法中的初始值进行训练,达到迭代次数后或达到精度,结束运算,输出预测值。

2.2 BP神经网络算法

BP(Back Propagation)神经网络应用于各行各业,是1986年由Rumelhart和McClelland提出的概念,通过误差反复训练神经网络模型,使预测结果最接近实际结果。BP神经网络共包含三层结构:输入层、隐藏层和输出层,其中隐含层节点的选择是影响模型性能的重要因素,增加节点数有助于获得更低的误差,但也增加了训练复杂性低和训练时间。一般BP神经网络分为两个步骤:首先,输入值通过前向传播算法获得预测值,并判断预测值与实际值的差异是否满足精度要求。其次,误差在不满足精度要求的前提下,按原路逆向传播到各层级,各层级运用梯度下降法更新权值和阈值,以使误差信号最小。

本文中BP神经网络的激活函数设置为:

sigmoid(z)=1+11+e-1(4)

改进CS算法的目标函数和BP神经网络的损失函数设置为:

Et=1n∑ni=1(t,i-yt,i)2(5)

其中:y(x)=∑ni=1(ωixi+εi)(6)

ωi:第i个因素的权重;εi:阈值。

2.3 实例验证及参数选择

本文取X公司以2010—2019年的冷冻年为例,选取2010年9月—2018年12月共100个月的数据作为训练样本,为验证“双十一”、“618”大促节点数据,选取2019年1月至2019年12月全年数据作为为测试样本。

运用Matlab 2013软件中进行模型的求解其中,相关参数设置如下:CS算法中种群规模n=25,最大迭代次数t=200,步长因子α=0.2,迁移概率Pa=0.25,引力深度度ρattract=0.1,引力宽度ωattract=0.2。BP算法设计为3层网络结构,输入层n=3,输出层m=1,隐含层P=n+m+rand(1,10)=8,预测结果如图1和表6所示。

通过图1可以看出,改进CS-BP神经网络算法相比另两种方法预测精度更高,均平方误差达到0.52%;而CS-BP算法误差为0.73%,传统的BP算法误差为0.89%,优化率分别为28.76%、41.57%。因此,改进BP-CS算法对于提高电子商务订单的销量预测准确率具有较大实践意义,同时也简化了神经网络结构,加快了收敛速度。

3 结语

空调行业有明显的淡旺季之分,尤其是相对于中小企业,四、五月份会面临巨大的材料采购、产能缺口压力,准确的销量预测至关重要。本文通过因子分析归纳了影响空调行业电商预测的主要因素,同时在CS算法中结合了BFOA算法的优势,对BP算法中的参数进行初步拟定。根据X公司2019年的预测结果表明,优化后的CS-BP算法预测准确率更高,具有可靠性和有效性,也可为其他公司、其他行业的预测方法提供良好的借鉴。

参考文献:

[1] 杨光,汪长波,黄涤,王金燕,刘海明.基于无偏灰色PSOMarkov优化模型的加油站便利店零售销量预测方法研究[J].数学的实践与认识,2019,49(20):44-52.

[2] YANG X S, DEB S. Cuckoo search via Lévy flights. Proceedings of world congress on nature and biologically inspired computing (NaBIC 2009). IEEE Publications, USA, 2009: 210-214.

[3] ROBERTO ANTONIO VZQUEZ. Training spiking neural models using cuckoo search algorithm[C]// Proceedings of the IEEE Congress on Evolutionary Computation, CEC 2011, New Orleans, LA, USA, 5-8 June, 2011. IEEE, 2011.

[4] PASSINO K M.Biomimicry of bacterial foraging for distributed optimization and control[J].IEEE Control Systems Magazine (S0272-1708), 2002, 22(3): 52-67.

[5] 焦李成. 神经网络系统理论[M]. 西安电子科技大学出版社, 1990.

猜你喜欢
因子分析
基于GPS数据的旅游时空行为评价研究
中国创业板生物制药类上市公司成长性评价体系实证研究
中国各地区主要空气污染物结构的因子分析
我国31省城镇居民消费水平(2007)
基于因子分析法的二胎概念股投资价值分析
基于主导产业视角的战略性新兴产业识别以及实证研究
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
实证分析会计信息对股价的影响
京津冀一体化下物流网络节点城市选址规划