连锁零售企业应急需求预测

2015-08-18 14:09:56郑作文薛红张鹏
现代商贸工业 2015年17期
关键词:支持向量机粗糙集

郑作文 薛红 张鹏 等

摘要:突发事件发生时,如何提高应急物流能力是连锁零售企业亟待解决的问题。将粗糙集理论引入连锁零售企业应急需求的预测中,建立基于粗糙集与支持向量机的连锁零售企业应急需求预测模型。首先利用粗糙集约减数据,剔除冗余信息,然后把它们作为支持向量机的输入矢量来预测应急需求。结果表明,与传统支持向量机模型相比,新的模型预测精度更高,更能有效预测应急需求。

关键词:粗糙集;支持向量机;应急需求预测;连锁零售企业

中图分类号:F25

文献标识码:A

文章编号:16723198(2015)17005503

0引言

连锁零售企业的需求预测是指对消费者所需购买的商品数目进行预测。当实际上需要的商品数目和预测数目有较大差异时,连锁零售企业供应链会受到极大扰动,并且会提高成本,竞争力会降低。如果产品受季节、广告和特卖活动等其他因素影响较大时,精确快速的物资需求可以高效提示企业产品需求量的变化,这能够显著减少零售企业的库存量,使成本更低,企业在市场中的竞争力有效提高。所以当发生了突发事件时,如何能够快速精确预测连锁零售企业应急物资需求量对于企业供应链的稳定和优化具有重大意义。

现在国内外对物资需求预测的方法主要包括回归分析法和时间序列法,对它们的研究已经比较成熟,由于能够快速得到结果,所以很多研究员都喜欢这种方法,可是由于它们的模型一般不够复杂,且假定实验条件相对理想,仅考虑了小部分影响因素,因此预测出来的结果精度不高,效果不够理想。除此以外,还有部分研究员利用人工神经网络、專家系统模型等其他方法进行预测,其中通过人工神经网络建立模型来进行预测,最后的结果更加精确,所以越来越多的学者开始利用人工神经网络来对物资需求进行预测。但是由概率统计学可得,神经网络学习算法仅仅是根据经验风险最小化原理(empirical riskminimization)来进行学习,但没有有效降低期望风险;除此以外,由于没有准确的理论知识来对神经网络结构进行确定,它只能通过多次试验得出的经验来确定。

最近贝尔实验室的Vapnik等提出了支持向量机(support vector machine,SVM),它是一种新的机器学习算法。SVM不仅能将结构风险减至最小,而且还最大化地缩小了VC维和经验风险之间的界限,与神经网络学习方法相比较,它的预测效果更好,能更好的代替神经网络方法,应用前景更加优越。当要处理大规模数据时,由于存在过多的冗余信息,这会极大降低支持向量机算法的运算速度,导致训练消耗更多的时间。为了将SVM算法应用于对实时性要求较高的连锁零售企业应急需求预测这个课题上,由于粗糙集算法具有属性约简的特点,本文引入粗糙集算法用于对与连锁超市应急物资需求量相关的各种历史数据进行约简,把和决策信息关系不大的属性消除,极大地减少了SVM的输入变量,因此使得SVM算法速度更快,预测结果更准确。

1基于粗糙集与支持向量机的预测模型

1.1粗糙集属性约简

由粗糙集理论可得,把客观世界简化成一个信息系统,用A=〈W,Q,V,f〉来表示它,其中:W=x1,x2,…,xn是论域;Q=S∪D是属性有限集,上式中S=s1,s2,…,sm是条件属性集;V=v1,v2,…,vm是属性的值域集,上式中vi是属性ci的值域:f:W×S→V为信息函数,由上式可得出论域W与条件属性集S到值域集V的映射。一个决策属性的决策表的一般表达形式如表1所示,下表中f(xi,sj)=uj,i,fxi,d=vi,并且uj,i的值和对象xi和条件属性si相对应,vi的值和对象xi与决策属性d相对应。

表1决策表的一般表达形式

假定B是Q的随便一个属性子集,可得下式的等价关系I(B)={(x,y)∈W×W:f(x,a)=f(y,a),a∈B}。假定(x,y)∈I(B),那么x,y相对于B是不可分辨的;假定R为等价关系族,如果I(R)=I(R-{r}),那么在R中r能够被消除;如果P=R-{r}相互独立,那么P是R中的一个约简。对于R中无法消除的关系,我们把它称为核,核所组成的集合称为R的核集。

由上可得,粗糙集属性约简过程如下所示:

(1)通过论域中的决策属性和条件属性建立决策表。

(2)找出决策表中的条件属性和决策属性,然后根据粗糙集算法离散化这些变量。

(3)求出新决策表,然后对它属性简约,最终得到约简的决策规则。

1.2支持向量机的基本原理

支持向量机(Support Vector Machines,简称SVM)是一种新的机器学习算法,由Vapnik等人提出,在时间序列预测和优化控制等领域得到广泛的应用。SVM先分解非线性函数样本集,然后把它们转化成向量形式,与高维空间相映射,经过线性回归后再映射回原空间。由上可得,它就是一个对非线性数据进行线性回归变换,最开始一般用来解决寻优分类问题。

通过下图1详细说明了SVM的计算原理,假设有实心点和空心点这两类样本,H是最优分类线,它两边的H1、H2分别代表2类中离分类线H最近且平行于分类线的直线,H1与H的距离和H2与H的距离都被称作分类间隔,用margin表示。假定分类线H不但可以准确分开2类样本,还要使margin最大,那么距离最优分类线H最近的样本向量就称为支持向量。此外如果要使H能保证经验风险最小,要求margin最大也就是要保证推广性的界中的置信区间最小,这样也就能够最小化真实风险。

图1支持向量机原理图

1.3支持向量机的基本算法

SVM的原理就是找到一个非线性映射j,它能将数据x映射到高维特征空间并进行线性回归。现在给定训练数据xi,yi,i=1,2,…,l,其中xi∈Rn是第i个样本点的n维输入值,yi∈R为对应的目标值,l为训练样本输目。SVM算法的目标就是求出函数fx,它可以尽量逼近全部样本点。由上可得,支持向量机的估计函数即:

fx=+b

(1)

式中:fx是目标函数;w,b是目标函数的法向量及偏移量;jx是特征映射函数。

那么标准支持向量回归算法就能描述成下面的问题,即

式中:b是通过支持向量计算求出;核函数Kxi,x是满足Mercer条件的任何对称的核函数对应于特征空间的点积。一般支持向量机使用的核函数包括多项式核函数,线性核函数和径向基核函数(RBF)等,本文采用径向基核函数。

2基于粗糙集和SVM的短期应急需求预测

首先找出历史数据,然后构建属性值决策表A=〈W,Q,V,f〉,其中Q=S∪D。条件属性S指历史负荷和影响因素信息,决策集D指预测日的应急需求值。因为粗糙集算法是对离散数据进行分析,所以首先要离散化原有数据,构造一个新的信息决策表,然后再采用增量约简算法进行属性约简,最后可求出推理规则集。

由于支持向量机算采用了RBF核函数,它的参数c值可以极大影响SVM计算结果,所以c值通常大于10小于100,如果c值超过100时,就会产生欠学习现象,所以本文假定c=95。

图2是基于RS预处理的SVM预测系统。

图2基于RS预处理的SVM预测系统

3应急物资需求量预测的仿真实验

在进行连锁零售企业应急物资需求预测的分析中,主要利用北京城区应急物资需求的数据进行预测。

3.1模型參数选择

粗糙集理论是一种刻画不完备、不确定信息的数学工具,在保留关键信息的前提下,对数据进行化简,使其属性达到最小约简,求得知识的最小表达。

影响应急物资需求的因素有很多,所以首先要采用粗糙集属性约简法约减这些影响因素。首先将原始数据制成决策表,然后离散化样本数据,同时不降低数据的原始分类能力。本文采用等频率离散化方法,首先把连续属性值分成k个区间内数值相等的离散区间。现在假定有l个数值,可以求出每个区间有l/k个数值,本文中k=3。在保证决策表决策属性和条件属性间不变化依赖关系前提下,消除多余的条件属性,约减后求出的核属性为x1,x2,x3,x4,x5,x6,此时约减后求出的指标就是支持向量机模型的输入数据。

本文将数据进行粗糙集算法属性约简后,得到最优属性集,如表2所示。

表2应急物资需求量与影响因素数据统计

其中①为受灾程度,②为受灾时间,③为零售企业门店位置,④为商品消耗周期,⑤为门店商品库存,⑥为应急物资需求量。将表2中1~13组样本作为训练样本,14~18组样本作为检验样本。

3.2应急物资需求预测

要建立应急物资需求预测模型,必须求出适当的核函数基宽γ和惩罚参数C等,这样可以有效提高模型预测精确度,使模型更有效。本文采用交叉验证网格搜索方法来确定优化参数。首先把训练样本集随机分成K个集合,然后训练它里面的K-1个集合,求出一个决策函数,再利用决策函数测试余下的那个集合,循环测试K次后,当预测完全部子集后把测试错误的平均值定位推广误差,这样就能避免人为选取C和γ所产生的主观误差。

对参数优化后再根据已定的输入和输出参数构建建模数据Xi,Yii=1,2,…,K,求出输入参数X和输出参数Y之间的非线性映射关系:Yi=fXif:Rn→R。根据支持向量机预测理论通过求解一个二次规划问题即可求出αi、α*i和b,即可求出所需要的预测模型。最后把检验样本代入进行预测,其结果见表3所示。

表3预测结果

基于粗糙集-支持向量机的应急物资需求预测结果如图3所示。由表3和图3可见,采用基于粗糙集与支持向量机的预测模型对连锁零售企业应急物资需求进行预测,达到了很高的预测精度,其最大误差为5.71%,最小误差为0.60%,平均误差分别为2.84%。

图3基于粗糙集-支持向量机的应急物资需求预测结果

4结束语

本文针对支持向量机在处理数据时无法将数据简化的问题,提出了基于粗糙集与支持向量机的连锁零售企业应急物资需求预测方法,在支持向量机对样本数据进行处理之前,利用粗糙集数据属性约简的能力对原始数据样本集进行预处理,以实现与支持向量机的优势互补。结果表明,这种预测方法具有很好的精确性和有效性,具有较高的参考价值。

参考文献

[1]Martin Christopher. Logistics and Supply Chain Management[M].北京:电子工业出版社,2010.

[2]洪菁,赵毅,陈强.基于模糊粗糙集的瓦斯涌出量预测模型的研究[J].微计算机信息,2007,23(32):259261.

[3]王巍,刘德胜.基于支持向量机理论的煤矿瓦斯涌出量预测研究[J].煤矿机械,2011,32(2):7880.

[4]常甜甜.支持向量机学习算法若干问题的研究[D].西安:西安电子科技大学,2010.

[5]汤建国,祝峰,佘堃.粗糙集与其他软计算理论结合情况研究综述[J].计算机应用研究.2010,27(7):24042410.

[6]Ashish Agarwal ,Ravi Shankar. Modeling supply chain performance variables[J]. Asian Academy of Management Journal,2005,10(2):47–68.

猜你喜欢
支持向量机粗糙集
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
优势直觉模糊粗糙集决策方法及其应用
基于改进支持向量机的船舶纵摇预报模型
中国水运(2016年11期)2017-01-04 12:26:47
基于SVM的烟草销售量预测
软件导刊(2016年11期)2016-12-22 21:52:38
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
价值工程(2016年32期)2016-12-20 20:36:43
基于熵技术的公共事业费最优组合预测
价值工程(2016年29期)2016-11-14 00:13:35
多粒化粗糙集性质的几个充分条件
基于支持向量机的金融数据分析研究