基于GM(1,N)-Prophet组合模型的电商行业销售预测研究

2021-06-06 13:09:22张筠汐
关键词:京东灰色销售

黄 莺,张筠汐

(西南民族大学计算机科学与工程学院,四川 成都 610041)

销售预测是指企业根据产品历史销售数据,利用一定的方法和原理,对未来一定时间内的销售量进行估计和预测.通过销售预测企业能够实现对生产和库存的高效管理,避免资金浪费和库存积压,提高企业的运作效率以更好地应对市场变化.电子商务平台突出优势就在于高效的物流和应对市场变化的灵活性,故对销售预测的准确性要求更高.

目前国内外主要的销售预测方法大致可归为为三类:统计方法、人工智能方法,以及混合模型方法.赵玉欣、童广印、洪鹏等人基于统计方法的预测结果,提出此方法具有快速、直观、易使用等特点,但是对于具有高度变异性和不规则性的数据预测来说,统计分析方法并不能解决非线性的问题,常常面临滞后性问题,预测结果的满意度不高,适应性不高.人工智能的预测方法大大改进了预测精度,董晓慧、王文、周进、丽君等人发现基于人工智能方法对于非线性、季节性、周期性的问题有良好的适应性,可应用于短期或动态预测,但是由于处理数据的复杂性导致人工智能方法的预测过程耗时,通用性也不高.实际应用中,预测通常包含了线性和非线性的时序特征,单一方法难以捕捉到其中的潜藏的变化归纳,因此各种组合模型被学者们不断尝试,以优化预测结果.刘卫校、黄鸿云等人的研究就发现基于神经网络和时间序列算法理论混合模型在预测精度和预测速度上都有不同程度的提升,适用性也更广泛.

本文基于多维灰色GM(1,N)与Prophet时间序列的组合模型,对京东平台的办公行业2019~2020年销售额序列进行销售预测,通过优化销售影响因素并对比两种模型的预测误差、实验数据证明,GM(1,N)-Prophet组合模型在电商平台的行业销售预测中预测精度的优化能力.

1 理论基础

1.1 销售预测指标因素的构建

不同行业销售预测影响因素有很多,不同因素对于销售的重要程度也不一样,找出预测对象的关键影响因素,提高销售预测的精准度,进而实现电子商务平台营销策略的精准投放.

影响因素的选取问题实际上是建立用户对电商平台的评价与消费行为之间的联系.张晓华在探究消费者对C2C社交电商信任度影响因素的过程中,选取消费者对商品的信任、消费者对商品销售者或分享者的新闻、消费者对销售过程的信任、消费者自身的因素四个一级指标,其中消费者对商品销售者或分享者的信任包括与销售者的熟悉程度、与销售者的地理距离、与销售者的年龄、职业、爱好的相似性这三个二级指标,消费者对销售过程的信任包括是否在知名电商平台交易、推广过程中其他用户的互动及购买行为、支付方式、物流方式这四个二级指标[5].叶阿真基于逻辑回归理论对淘宝商店销售影响因素进行了分析,发现网上销售的主要依赖指标包括搜索占比、商城占比、点击率、商品数量、直通车[3].

本文参考已有研究成果中采用的指标,再基于电商信任度理论,以京东平台办公行业为研究对象,从浏览加购、搜索点击、成交转化、店铺商品这4个一级指标中选取浏览量、访客指数、关注人数、加购人数、搜索点击指数、成交单量指数、行业店铺数、曝光店铺数、曝光商品数9个二级指标作为影响因素,具体指标与因素之间的划分关系如表1所示.

2 销售预测模型构建

2.1 数据来源与处理

本文研究在线产品办公行业的销售变化情况并对未来行业销售情况进行预测,文中选取2019~2020连续两年京东平台办公行业月均销售金额作为研究对象.数据来源于某电商公司对京东办公行业销售数据的统计,时间跨度为两年,共包括24个数据点,具体数据见图1.

表1 在线商品销售影响因素及其指标划分Table 1 Influence factors and index division of online merchandise sales

图1 2019~2020年京东办公行业各月销售额动态变化图Fig.1 Dynamic changes of monthly sales of JD office industry from 2019 to 2020

2.2 灰色关联分析

灰色关联分析具体步骤如下:

1)确定分析数列

将2019~2020年京东平台办公行业商品成交金额作为参考数列(母序列),记为将该时间段内的影响指标因素作为比较数列,记为.其中,浏览量为X1,访客指数为X2,关注人数为X3,加购人数为X4,搜索点击指数为X5,成交单量指数为X6,行业店铺数为X7,曝光店铺数为X8,曝光商品数为X9.

2)数据无量纲化处理

处理方法如下列公式(1):

3)计算关联系数

4)计算关联度

关联度计算公式如(3)所示:

由灰色关联分析得到销售预测模型的关键性指标,计算结果如表2所示:

表2 灰色关联度排序结果Table 2 Sorting results of grey relational degree

根据数据显示,九个影响因素对销售量都有较大影响,将关联度进行排序得到X4>X8>X7>X6>X1>X9>X2>X5>X3,选择灰色关联系数大于0.60的影响因素作为GM(1,N)模型的输入.

2.3 基于多维灰色GM(1,N)模型的预测过程

多因素灰色GM(1,N)模型是将随机无规律的原始数据转化为具有规律性变化的生成数据列,再根据生成数据列建立白色化形式的微分方程,求解后经累减还原可求得原数据的预测值.

选取通过灰色关联分析得出的销售的关键影响因素,构建行业店铺数、曝光商品数、曝光店铺数、访客指数之间的GM(1,4)模型.建模过程如下:

1)构建原始数列

2)计算紧邻均值等权数列

3)计算灰方程参数

GM(1,N)的灰微分方程为:

4)计算预测累积序列

5)计算预测序列

将式(7)通过累减还原得到原始数列在GM(1,N)模型下的预测值原始数据与预测值之间的残差为ε0(k),残差越小,说明预测的精度越高.

可解得:β=-570950,-4767,1031010,2.多维灰色GM(1,N)模型的销售预测平均相对误差为8.560%.

2.4 基于Prophet时间序列的预测结果优化

Prophet是一个基于自加性模型的预测时间序列数据的模型,本质是对时间序列数据曲线拟合.按照分解时间序列趋势的方法,主要由趋势性、节假日、周期性三部分构成,模型基本表示形式如式(10)所示:

式中y(t)表示时间序列在时间t的观测值,其他字符含义如下所示:

①g(t)表示趋势项,用于拟合时间序列中的非周期性变化.该部分通常在非线性增长后达到饱和值,从数据变化点检测趋势走向,基本趋势是logistic增长模型,基本形式如下:

②s(t)表示周期项,用于拟合时间序列中的周期性变化.主要由傅里叶级数来近似表达周期性分量,a n、b n为平滑参数.其基本形式如下:

③h(t)表示节日项.由于节假日的周期性不稳定,因此不能通过周期性模型来刻画.这里认为每个节假日是相互独立的,基本形式如下:

其中,Z(t)为指示函数,L为节假日的个数,k表示节假日的影响范围.

④ε是残差值.服从正态分布,代表模型未预测到的波动.

为调整趋势的变化对模型预测带来的影响,对模型进行拟合.默认下,指定参数为0.5.拟合结果如图2所示.

图2 拟合模型图Fig.2 Fitting model diagram

在模型中设定电商的主要活动节假日,指定区间为2019年1月~2020年12月,如表3所示.

表3 电商主要活动与节假日Table 3 Major E-commerce Activities and Holidays

利用Prophet模型进行趋势分析,图3给出了分析结果,从上至下依次是京东平台办公行业2019~2020年销售额数据被模型分解的增长趋势、每周趋势、年度趋势.由图可知,京东平台办公行业在3月、6月、11月有明显的峰值,其他时间段内也有较明显的小峰值,从周趋势上来看,工作日的销售额要高于非工作日.

图3 增长趋势、每周趋势、年度趋势图Fig.3 Growth trend,weekly trend and annual trend chart

对数据进行预测,预测结果如图4所示,图中蓝色曲线代表预测值,黑点代表实际值,浅蓝色表示置信区间上下限值.

图4 销售额预测图Fig.4 Sales Forecast Chart

对Prophet模型进行平均绝对百分误差分析(MAPE),分析结果如下图5所示,从图中可以看出,MAPE值随着时间的增长,增长到一定程度后略有下降至平稳状态,在预测未来3周的时间里,MAPE的值小于0.5,之后增加到大于0.5,在预测未来12周的时间里,MAPE的值均小于0.5,达到0.075.

图5 Prophet模型MAPE分析图Fig.5 MAPE analysis diagram of PROPHET model

基于本文提出的GM(1,N)-Prophet组合模型,用该组合模型拟合京东平台办公行业2019年~2020年销售额数据集,对两种算法预测精度进行对比.这里分别采用百分比误差、相对误差,作为评价指标.结果如表4所示.

表4 预测模型误差比较Table 4 Error comparison of prediction models

由表可知,Prophet模型对于GM(1,N)模型有明显的优化程度,Prophet模型其预测曲线十分接近于真实值.

3 结果与讨论

本文以灰色系统理论和Prophet时间序列理论为基础,以京东平台办公行业2019~2020年销售额为数据来源,以行业店铺数、曝光商品数、曝光店铺数、访客指数为指标,构建了GM(1,N)销售预测模型,在此基础上,对节假日和季节性影响因素,引入Prophet时间序列模型,优化了GM(1,N)的预测精度,验证了该组合模型在预测精度上的优化能力,据此得出如下结论:

①在选取销售预测的关键影响因素时,灰色关联分析可反映两个系统之间的因素影响的相对强弱关系,其根据序列曲线的几何形状的相似程度来判断联系紧密程度,弥补了传统数理统计方法对于数据量少、样本不服从典型的概率分布的缺陷.

②对于销售历史数据量少,主要因素影响多的销售预测问题上,多维灰色GM(1,N)模型具有一定的适用性,能够反映销售历史数据的变化,对未来销售情况做出短期预测,但该模型在预测精度上有较大误差,难以达到对行业长期销售情况精准预测的要求.

③应用Prophet时间序列模型进行二次修正,引入节假日和季节性影响因素.两种算法模型进行对比,相对误差分别为8.560%、3.108%,Prophet模型在预测精度上有明显进步,对于需要考虑到节假日和季节性影响因素的销售预测具有普遍适用性,但对于长期预测的精度问题,由于历史数据量少的原因,仍然存在预测精度不高的情况.

④销售预测一定程度上反映了行业和企业对于市场变化的灵敏程度,本文所使用的组合模型预测方法也并非是十分完美的方法,也存在着预测精度上的缺陷,但对于行业和企业来说都具有十分重要的参考价值,对于管理决策有极大帮助.

猜你喜欢
京东灰色销售
做“最懂产业的云”,京东云首发云操作系统
智能制造(2021年4期)2021-11-14 18:56:41
浅灰色的小猪
这四个字决定销售成败
13年首次盈利,京东做对了什么?
商周刊(2017年6期)2017-08-22 03:42:50
给人带来快乐的袜子,一年销售1亿美金
流行色(2017年2期)2017-05-31 01:43:44
灰色时代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色时髦观
Coco薇(2017年2期)2017-04-25 17:57:49
感觉
在超市快送上超越京东
创业家(2015年6期)2015-02-27 07:53:34
小黑犬