朱慧君,朱家明,刘弘扬
基于数据挖掘下的销售额影响因素及营销策略的计量分析
朱慧君,朱家明,刘弘扬
(安徽财经大学,安徽蚌埠 233030)
针对批发分销商的状况,使用描述统计、多元统计分析以及欧几里德贴近度判别分析、微分增量分析等方法,分别构建方差分析和判别分析等模型,使用Matlab、Spss、Excel等软件编程,得到批发分销商目前的经营状况、各类商品间的相关作用、多种因素中销售区域对销售额影响最大以及影响销售区域和途径的主要商品类别等结论。
数据挖掘;多元统计;pearson相关分析;欧几里德贴近度;SPSS;Matlab
当今社会环境下,商业企业信息化建设显示了与以往不同的发展趋势,逐步演变成“数据集中,决策科学”的发展局面。对此,商业企业如想要提高经营业绩,保持企业利润的持续增加,就必须要清楚地掌握并分析商业企业发生的各种业务,将企业信息系统中存储的数据发挥出作用,对企业所积累的资料数据进行整理、分析,希望能通过数据挖掘或多元统计的技术,透过相关变量的分析,找出顾客区隔、消费行为、业务成本与效率等对企业极为重要的资讯,为企业管理提供决策支持,从而提高企业经营的竞争力和商业智慧(详细数据见2014安徽财经大学数学建模模拟赛)。
提供一个关于批发分销商的销售数据,其中的六个变量给出了六大类商品类别每年的年度销售额(货币单位m.u.),另外两个变量提供了销售途径和销售区域。
(一)商品销售额的数字特征
首先对原始六大类商品销售数据进行处理,利用EXCEL软件可求得六大类商品销售额的数字特征(如表1)。
表1 六大类商品销售额的部分数字特征
从表1中可以得知:保鲜品、杂货产品、洗涤剂及纸制品、熟食产品在不同区域或不同途径销售时最低销售额低至3m.u;对各均值进行比较可知六类商品在不同区域或不同途径销售时保鲜品销售额最大,可达12000m.u;其次是杂货产品,销售额可达5796m.u;从各商品销售额的标准差可知,是熟食品的销售相对其他商品较稳定。
(二)不同区域与途径下六类商品均值分析
将六类商品按区域与途径一一对应的方式分为六个部分,并将每一个区域对应一个途径的六类商品分别加总求均值得表2。
表2 不同区域对应不同途径的六类商品均值
根据表2分别作出对应的散点图(图1、图2、图3)。
图1 区域一两种途径六类商品平均销售额
图 2 区域二两种途径六类商品平均销售额
图3 区域三两种途径六类商品平均销售额
综合图可知,在区域一和区域三中,保鲜品的销售额最大,故该区域对保鲜品的需求较多,批发商可以根据市场需求增加供应寻求利润最大。在区域二中,杂货品的销售额最大,故批发商可在区域二中多增加杂货商品的供应量。
从图4中可以得知:利用途径一销售时,冷冻品、洗涤剂及纸制品、熟食品这三类在三个不同区域的销售额差别很小,即这三类商品受区域的影响较小。其次,从图中可知区域三中六类商品的销售额较少于其他两个区域的销售额,故批发商在选择途径一进行销售时,选择在区域二销售更多商品收益会更多。
图4 六类商品利用途径一在三个区域的平均销售额
从图5中可知:利用途径二进行销售时,区域二和区域三中保鲜品、乳制品以及熟食品销售额差别很小;区域一与区域二中冷冻产品、洗涤剂及纸制品的销售差异较小。
图5 六类商品利用途径二在三个区域的平均销售额
(三)Pearson相关分析
利用Pearson相关分析来求解六类商品之间的相关程度或关联程度。设六类商品中任意两个商品的销售额分别为列向量,,则有:
对于随机变量X和Y的相关性求解公式为:,其中Cov(X,Y)代表X与Y的协方差,Var(X)和Var(Y)代表X和Y的方差。当相关性为1时,X与Y的关系可以表示为Y=aX+b,其中a>0;当相关性为-1时,X与Y的关系可以表示为Y=aX+b,其中a<0。如果X与Y相互独立,那么相关性为0。
利用spss软件可以求得Pearson相关系数矩阵,列成表格如表3。
表3 各变量Pearson相关系数
并用F检验求得各变量之间相关分析是否显著的P值如下表4。
表4 显著性分析
结合表3和表4可知:
对于保鲜品和乳制品:
即两者具有显著的正相关性,但相关程度较弱。
对于保鲜品和杂货商品:
即两者相关关系不显著。
同理可知:杂货商品与冷冻品、洗涤剂与熟食品之间的相关关系也不显著;
对于保鲜品与冷冻品:
故将具有非常显著的正相关性。
对于保鲜品与洗涤剂及纸制品:
,
即具有较显著的负相关性,但相关程度较弱。
对于牛奶和杂货商品、牛奶和洗涤剂:
故具有非常显著的正相关性,且相关程度较强。
对于杂货商品与洗涤剂及纸制品:
即具有非常显著的正相关性,且相关程度很高,达到90%。
(四)批发分销商目前经营状况
该批发分销商业务范围有以下六类商品:保鲜品、乳制品、杂货产品、冷冻开支、洗涤剂和纸制品 、熟食产品,有不止一种的销售途径,且销售区域不单一,销售网点较多,有利于扩大需求,提高销售额。同时,产品的多样化能够更好地满足顾客的需求。其次,从六类商品的销售额可知:保鲜品、牛奶、杂货商品销售较好,但保鲜品的销售情况稳定性较差。
(一)正态性检验
对两种途径下,三个区域的总销售额做正态性检验,结果见表5。
表5 正态性检验
表5是各水平结合下数据的正太分布检验,通过S-W方法,从表中可看出仅有途径二在销售区域一中的销售额数据有:p=0.582>0.05,接受原假设,服从正态分布。
(二)方差齐次性检验
对数据做方差齐次性检验,检验结果如表6。
表6 方差齐次性检验
从表中可知:p=0<0.05,故各组方差不满足齐性检验,则多重事后检验选择egual variances not assumed 中的Dunnet C检验方法。
(三)方差分析
对数据进行方差分析,得到主体间效应检验结果如表7。
表7 检验结果
从表7中方差分析结果可知:
1.途径的主效应达到显著:
2.区域的主效应也达到显著:
3.途径*区域的交互效应未达到显著:
故综上所述,不同销售途径、不同销售区域会显著的影响六大类商品的销售额,但两者的交互作用对六类商品的销售额没有显著影响,且相比较途径与区域的影响可知,区域是影响六大类商品销售的主要因素。
(一)欧几里德贴近度判别分析模型
1.建模准备
(二)模型的建立与求解
2.销售区域判别模型
(-1 -2 -3)
G1=(10760.455 7286.71 10425.295 2010.3 4368.975 1562.92)
G2=(11371.965 7619.89 12287.005 4406.89 5034.585 1487.905 )
G3=(11571.58 4832.56 6536.76 3140.705 2169.57 1384.085)
T(X,G1),T(X,G2),T(X,G3)
3.建立贴近度函数
4.销售途经判别模型
(1- 2-)
H1=(12674.02667 7922.15 10720.52667 2717.836667 4236.95 1762.296667)
H2=(9795.306667 5237.29 8778.846667 3654.093333 3478.47 1194.31)
5.微分增量分析
将数据代入程序一(见附录)检验得,影响销售区域一的主要商品类别有第一、四类,影响销售区域二的主要商品类别有第二、四、六类,影响销售区域三的主要商品类别有第二、三、六类,影响销售途径一的主要商品类别有第一、二、五类,影响销售途径二的主要商品类别有第三、六类。见表8。
表8 影响销售区域和销售途径的主要商品类别
批发分销商的销售策略应以顾客需要为出发点,可以根据所积累的资料利用数据挖掘或多元统计的技术获得顾客需求量以及购买力的信息、商业界的期望值,有计划地组织各项经营活动,通过相互协调一致的产品策略、价格策略、渠道策略和促销策略,为顾客提供满意的商品和服务而实现企业目标的过程。经营策略是在竞争的环境中考量本身的优劣。据调整,管理也必须根据企业体质、不同的阶段,会有不同的管理模式。
针对本文对该批发分销商的不同销售区域以及销售途径下六类商品年度开支的数据分析,在现行市场环境条件下,不同销售途径、不同销售区域会显著的影响六大类商品的销售额,但两者的交互作用对六类商品的销售额没有显著影响,且相比较途径与区域的影响可知,区域是影响六大类商品销售的主要因素,所以该批发销售商可以适当扩张销售区域,对于不同区域内的顾客,可根据其消费行为进行针对性的宣传。根据不同销售区域和销售途径下影响的主要商品类别,批发分销商可以针对主要商品采取相应的批发分销量控制,投入适当的精力,以提高业务效率,降低业务成本。如销售区域一内的主要影响商品类别有保鲜品和冷冻开支,区域二内的主要影响商品类别有乳制品、冷冻开支和熟食产品,因此,在区域一内可以适当改变乳制品、杂货产品、洗涤剂和纸制品、熟食产品的批发销售量,在区域二内适当改变保鲜品、杂货产品、洗涤剂和纸制品的批发销售量,以达到最大的销售额令批发销售商获得较高利润。
综上所述,将数据挖掘或多元统计的技术应用于商业领域,利用企业所积累的资料,透过相关变量的分析,找出顾客区隔、消费行为、业务成本与效率等对企业极为重要的资讯,为企业管理提供决策支持,从而提高企业经营的竞争力和商业智慧。
[1]姜启源,等.数学模型[M].北京:高等教育出版社,2003.
[2]吴礼斌.经济数学实验与建模[M].天津:天津大学出版社,2009.
[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.
[4]梅长林,范金城,数据分析方法[M],北京:高等教育出版社,2006.
[5]杨桂元,朱家明.数学建模竞赛优秀论文评析[M].合肥:中国科学技术大学社,2013.
2014-11-23
安徽省大学生创新项目:项目编号:AH201310378642;国家自然科学项目.项目编号:11301001;安徽财经大学教研项目. 项目编号: acjyzd201429;安徽财经大学卓越人才教育培养计划.项目编号:aczyrcpy201404;精品资源共享课.项目编号:aczygxkc201407
朱慧君(1996-),女,安徽东至人,研究方向:工商管理.
F713.32
A
1672-4658(2015)01-0089-05