基于灰色神经网络在新零售目标产品预测中的研究

2021-10-14 03:28龚谊承程明辉曾庆蓉
科技与创新 2021年19期
关键词:遗传算法灰色神经网络

汪 想,龚谊承,程明辉,曾庆蓉

(1.武汉科技大学汽车与交通工程学院,湖北 武汉 430065;2.武汉科技大学理学院,湖北 武汉 430065)

随着中国经济的不断发展,人们对目标产品的需求发生了显著变化。性价比不再是人们的唯一诉求,人们更加愿意关注个性化、时尚化及美观化,并将其作为对目标产品的重要需求。

同时,随着新零售行业的不断发展,新零售产品的种类呈爆发式增长,新零售产品类别不断细化。这也导致商家对目标产品的分类管理十分困难。如何根据层次复杂、种类繁多的历史数据,对目标产品的需求进行精准预测,成为目前绝大部分零售商家关注的主要问题。

本文首先通过逐步回归分析筛选出影响目标产品销量的主要因素,接着通过灰色神经网络对目标产品的销量进行预测。由于灰色神经网络的初始权值与阈值随机选择,导致网络在学习与进化过程中较容易陷入局部最优解。故引入遗传算法对灰色神经网络进行优化,以提高模型预测的准确度。

1 研究方法

1.1 逐步回归理论

逐步回归理论(Stepwise Regression Theory)是运用回归原理并进行双检验的一种理论。从本质上来说,逐步回归是从一组候选变量中构建回归模型,并识别出显著变量的过程。

具体按如下3 步展开:①引入变量。对未引进变量进行F 检验,若显著则引进。②剔除变量。对引进的自变量进行F 检验,若不显著则剔除。③重复步骤①及步骤②,直至既没有显著的变量选入方程,也没有不显著的变量从方程中剔除为止,保证最后所筛选出的变量集达到最优。

1.2 灰色系统理论

灰色系统理论(Grey System Theory)是一种研究贫信息、小样本、不确定性问题的一种理论。从本质上来说,主要是依据对少量确定信息的开发与提取,获取有效信息,并以此为基础达到对系统运行行为、演化过程的明确描述与有效监控。

1.3 灰色神经网络

灰色神经网络(Gray Neural Network)是一种基于灰色理论构建的神经网络,适用于不确定系统行为特征值发展变化的预测。通过灰色神经网络将初始样本分为5 部分:标签价、销售价、折扣、库存量、销售特征,然后综合这些因素对销量进行预测。

对初始样本中的skc 进行分类以及合并,选取累计销售额前10 的skc 作为目标skc。将得到的目标skc 和日期代入模型,具体模型如下:

涉及n个参数的灰色神经网络模型的微分方程表达式为:

式(1)中:y1为系统输出参数;a,b1,b2,…,bn-1为微分方程系数;y1,y2,…,yn为系统输入参数。

式(1)的时间响应式为:

式(2)可作如下转化:

将变换后的式(4)映射到一个拓展的BP 神经网络中就得到了n个输入参数,1 个输出参数的灰色神经网络,网络拓扑结构如图1 所示。

图1 灰色神经网络拓扑结构图

1.4 遗传算法

遗传算法(Genetic Algorithms)是一种随机搜索最优化方法。它将自然界生物进化的原理结合优化参数形成的编码串联群体。按照所选择的适应度函数,通过选择、交叉和变异操作对个体进行筛选。使适应度值好的个体被保留,适应度差的个体被淘汰。这样反复循环,直至满足条件。具体按如下5 步展开:①种群初始化,并对个体进行评价。②选择操作。从旧群体中,以一定概率选择个体到新群体中,个体适应度值越好,对应的概率越大。③交叉操作。从群体中任选两个个体,随机交换一点或多点染色体。④变异操作。从群体中任选个体,选择染色体中的一点进行变异以产生适应度值更好的个体。⑤终止条件判断。满足则结束,否则返回步骤②。

2 本文的分析思路与框架

基于灰色系统理论(GST)、灰色神经网络(GNN)、遗传算法(GA)的理论基础,本文具体做了如下6 步工作:①对原始数据进行预处理。包括对异常值N/A 和空值的剔除、对skc 的销售数据进行分类及整合、筛选出累计销量前10 的skc 作为目标skc、对目标skc 相关销售数据进行标准化处理。②确定灰色神经网络结构。根据逐步回归分析确定输入数据为5 维,输出为1 维,所以灰色神经网络结构为1—1—6—1,即LA 层有1 个节点,输入为时间序列,LB 层有1 个节点,LC 层有6 个节点,第2~6 个分别输入标签价、销售价、折扣、库存量、销售特征的5 个因素的归一化数据,输出为预测销量。③按照5∶1 的比例划分训练集与测试集。④运用遗传算法优化灰色神经网络,确定最优的初始权值与阈值。⑤基于训练集和测试集对灰色神经网络进行训练,直至满足条件。⑥利用训练好的灰色神经网络对目标skc 的销量进行预测,并对预测结果的误差进行检验。

3 数据概述及预处理

本文所使用的数据集来自MathorCup 官网赛题(http://www.mathorcup.org/detail/2294)。包含了某新零售公司于2018—2019 年留存的16 539 种skc 的相关销售数据,共6 个变量(前5 个为特征变量,最后一个“tiny_class_code”为标签变量)。

为了方便后续的机器学习,对原始数据进行如下3 步预处理:①对原始数据进行筛除。检测出原始数据中存在的异常值N/A 及空值,并进行剔除。②选取目标skc。筛选出2018—2019 年累计销量前10 的skc 作为目标skc,并对目标skc的相关销售数据进行分类与整合,同时将各目标skc 所对应的产品年份(year_id)作为目标skc 的销售特征。③数据标准化处理。为消除量纲的影响,对提取的目标skc 相关数据进行Z 标准化处理,如式(5)所示。

式(5)中:u为所有目标skc 的均值;σ为所有目标skc 的标准差。

4 灰色神经网络求解结果

4.1 灰色神经网络的构建

首先建立多元线性回归模型,对自变量X1,X2,…,X6与因变量Y进行多元线性回归:

式(6)中:Y为目标skc 的销量;X1,X2,…,X6为影响因素(标签价、销售价、折扣、库存量、小类编码、销售特征);ε为误差项。

由于建立回归模型时,并不是每一个因素对Y的影响程度都很大。我们应用逐步回归分析法对因素进行筛选。利用MATLAB 从目标skc 中随机抽取了36 个样本。然后利用这36 个样本的指标值通过SPSS 软件进行求解,得到相关因素对目标skc 销量的五元线性回归方程。如式(7)所示。

其中最后筛选和剔除后剩下的影响因素为:标签价x1、销售价x2、折扣x3、库存量x4以及销售特征x5。

为表明选取的影响因素与目标skc 的销量具有显著联系。本文利用MATLAB 对五元线性回归方程进行显著性检验。结果如表1 所示。

由表1 可得:相关系数R2=0.903 192 107 016 042,说明五元线性回归方程十分显著,F值对应的概率P<α,拒绝H0,根据F检验,五元线性回归模型成立。

表1 统计检验表

4.2 灰色神经网络求解

由于灰色神经网络的初始权值与阈值随机选取,在网络学习进化时很容易陷入局部最优解,会对预测精确度产生较大影响。

本文决定采用遗传算法对灰色神经网络进行优化,即利用遗传算法来优化a、b1、b2、b3、b4、b5这6 个参数。

遗传算法对目标skc 的样本个体进行实数编码,将个体对应的灰色神经网络预测误差作为个体适应度值。经过不断调试,设置种群规模为25,迭代次数为100。遗传算法优化得到的最佳初始参数值如表2 所示。

表2 目标skc 最佳初始参数值

将最佳初始参数值赋给灰色神经网络,利用遗传算法优化的灰色神经网络模型对目标skc 的销量进行预测。首先取前30 周的数据作为训练集训练网络,网络学习共100 次,然后用后6 周的数据评价网络的预测性能。将得到的预测值与真实值以折线图的形式进行对比,并对预测值的误差进行检验。结果如图2 所示。

图2 目标skc 预测结果

4.3 灰色神经误差分析

为了证明模型预测的准确度,本文对灰色神经网络模型的预测误差进行R2检验。结果如表3 所示。

表3 R2 误差检验表

从表3 中可看出,R2的值基本处于0.5~1 之间。故该灰色神经网络模型的拟合优度非常优异,模型的预测结果十分准确。

5 结语

针对新零售行业目标产品需求的精确预测。首先,本文构建了基于逐步回归的多元线性回归模型,用于目标产品销量影响因素的筛选及分析,得到影响目标产品销量的因素有标签价、销售价、折扣、库存量、销售特征。其次,本文基于灰色系统理论构建了灰色神经网络,用于目标产品销量的预测,由于灰色神经网络的初始权值与阈值随机选取,在网络学习进化时很容易陷入局部最优解,会对预测精确度产生较大影响,故本文采用遗传算法对灰色神经网络进行优化。最终依据误差检验结果,该模型所得目标产品销量的预测值与真实值之间的误差非常微小,预测误差在0.05~0.1 之间,预测准确度较高。该模型十分适用于新零售行业目标产品需求的精确预测。

猜你喜欢
遗传算法灰色神经网络
基于神经网络的船舶电力系统故障诊断方法
基于改进遗传算法的航空集装箱装载优化
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
基于改进遗传算法的航空集装箱装载问题研究
基于遗传算法的高精度事故重建与损伤分析
浅灰色的小猪
物流配送车辆路径的免疫遗传算法探讨
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
灰色时代