汪亚楠 朱家明
【摘要】针对某批发分销商销售状况,综合使用多元统计、多因素方差分析、相关系数法、逐步回归判别分析等方法,分别建立分销售商的销售状况的评价、方差分析和逐步回归模型,运用Matlab编程,得出该批发分销商的目前经营状况和各变量间的关联程度,检验不同销售途径和不同销售区域以及两者之间的交互作用对商品销售额影响的显著性差异,判别分析影响销售区域和销售途径的主要商品类别,并为批发销售商提供智慧的经营销售策略。
【关键词】批发分销 灰色相关度 方差分析 显著性检验 多重共线性 逐步回归判别分析 Matlab
当下中国进入高速发展的数字信息时代,运用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。同样,将数据挖掘或多元统计的技术及数据分析应用于商业领域,利用企业所积累的资料,透过相关变量的分析,找出顾客区隔、消费行为、业务成本与效率等对企业极为重要的资讯,为企业管理提供决策支持,从而提高企业经营的竞争力和商业智慧。本文根据提供的关于批发分销商的销售数据以及查找相关文献,对销售状况及其内部规律进行研究,为决策者提供更科学的销售方案。
一、销售状况的描述统计及评价
(一)研究思路
根据该批发分销商的销售数据资料,为描述统计数据资料的基本分布状况、变量之间的相关程度,给出该批发分销商的目前经营状况的评价。先利用Excel对六大类商品销售额进行简要统计描述,得出六大类商品销售状况;再计算出销售途径及区域与商品销售额间的相关系数分析各变量间的关联程度,画出相应图表进行比较分析,得出批发分销商目前经营状况。
(二)研究方法
为描述统计该批发分销商的基本销售状况,从集中趋势(均值)和离中趋势(标准差)和相关性(相关系数)三大部分进行研究。
(三)结果的分析
1.六大类商品销售额的基本分布状况。根据题目提供的数据资料,利用Excel中数据分析工具进行分析,得六大商品销售状况如表1:
表1 六大类商品销售额的总数据资料描述统计表:
由表1可知:就集中趋势看,保鲜品、杂货产品、乳制品三种商品销售额较大,销售状况较佳,尤其是保鲜品格外突出,以平均销售额12000.3遥遥领先;就离中趋势看,熟食产品、洗涤剂和纸制品、冷冻开支三种商品虽然销售额不大,销售额标准差较小,即销售情况较稳定,保鲜品标准差最大,销售情况最不稳定,最值相距甚大。
2.变量之间的关联程度——相关性分析。利用灰色关联度分析变量之间的相关程度如表2:
表2 各变量间相关程度表
结合相关系数判定表2,可以看出销售途径与销售区域、乳制品、杂货产品、洗涤剂之间有可接受的弱相关性;销售区域则与其他商品均无明显相关性;乳制品与杂货产品、洗涤剂和纸制品、熟食产品之间也有可接受的弱相关性;冷冻开支与熟食产品之间也有可接受的弱相关性。
二、销售途径及销售区域对六大商品销售额的影响——方差分析模型
(一)研究思路
由上述销售状况的统计描述知,不同销售途径和销售区域下六大类商品的销售额不同,本文首先运用排列组合将两种不同销售途径与三种不同销售区域进行组合得到6种不同的组合水平,运用EXCEL对给定中数据按不同的组合水平分类筛选,得到各种水平下六大类商品销售额,并计算得6种不同水平组合下六大类商品销售额的均值,用此均值代表各种水平下六大类商品销售情况。再对筛选后的数据进行正态检验,最后以销售途径与销售区域为双因素建立双因素方差分析模型,运用Matlab编程计算得到两因素及两者交互作用是否对六大类商品的销售额具有显著影响,找到影响六大类商品销售的主要因素。
(二)数据处理
定义:6种不同的组合水平:影响因素有销售途径和销售区域两个。其中不同途径(用C表示)有C1、C2两种,不同销售区域(用R表示)有R1、R2、R3三种。由排列组合的知识可得,共有6种不同的组合,即可得到6种不同的组合水平(详见表3)。
{1}数据筛选与处理
通过运用EXCEL对附件中数据按不同的组合水平分类筛选,得到各种水平下六大类商品销售额,并计算得6种不同水平组合下六大类商品销售额的均值(详见表3),用此均值代表各种水平下六大类商品销售情况。
表3 不同组合水平下六大类商品销售额的均值
②对数据进行正态检验和方差齐次性检验
对6个组合水平的总体数据分析,由中心极限定理可知,组合水平(C1,R1)、(C1,R3)、(C2,R3)的总体样本量比较大(样本数量超过50),由中心极限定理知,其近似服从正态分布。而对一些小样本,即组合水平(C1,R2)、(C2,R1)、(C2,R2)的总体样本(样本数量不超过50),通过Matlab分别进行正态性检验和方差齐次性检验,得数据均满足正态性和方差齐性假设。
(三)研究方法
有以上分析知各水平数据均服从正态分布,根据方差分析的方法,借助双因素方差分析模型,用Matlab编程对不同组合水平的y值进行方差分析,以得到的p值作为判断标准。这里取0.05为临界值:若p<0.05,有显著差异,则此因素显著影响y值;若p<0.01,有高度显著差异,则此因素高度影响y值。
(四)结果的分析
利用Matlab软件的方差分析工具求解得两因素对六大类商品销售额的作用情况如表4所示:
表4 因素Channel与因素Region对六大类商品销售额的作用情况汇总表
由上表可知,销售途径会显著影响保鲜品、乳制品、杂货产品、洗涤剂的销售额,销售区域不会显著影响六大类商品的销售额,两者的交互作用对六大类商品销售额也没有显著性影响。
三、影响销售区域和销售途径的主要商品类别
(一)研究思路
为研究影响销售区域和销售途径的主要商品类别,以六大类商品销售额为自变量进行定量分析,分别设销售区域和销售途径为因变量,建立逐步回归模型。利用matlab处理数据进行逐步回归,找出对因变量销售区域、途径显著影响的变量,即可求出影响销售区域和销售途径的主要商品类别。
(二)研究方法—多元逐步回归模型
Step1:首先引入logistic回归模型,以xi i=1,2…6分别表示保鲜品、乳制品、杂货产品、冷冻开支、洗涤剂和纸制品与熟食产品六个影响因素,y1,y2分别表示销售途径和销售区域。用logistic方程来表示因变量与自变量的关系。
Step2:逐步回归寻找影响因变量的主要自变量:由解释变量间的相关系数矩阵得,相关系数较高,证实确实存在多重共线性,故采用逐步回归方法消除多重共线性。若方程中已引入(m-1)个自变量,再考虑引入自变量xj,记引入xj后方程的回归平方和为S1,残差为S2,之前含(m-1)个自变量方程的回归平方和S1(-j),则xj的偏回归平方和为U=S1-S1(-j),检验统计量为:Fj服从Fα(1,n-m-1)分布。
图3 销售途径与六大类商品销售额回归结果
如果Fj>Fα(1,n-m-1),则xj选入方程;否则不如选。在logistic回归模型中,当自变量的显著性水平小于0.05时,将该变量剔除出模型,即该变量不会显著性影响因变量。
(三)研究结果
1.运用matlab中的stepwise函数进行逐步回归得:
{1}Y1表示销售途径时,使用matlab得回归结果如图4所示。
由图3可知,自变量x3,x6被剔除,而x1,x2,x4,x5保留下来,则这些变量对因变量影响显著,所以保鲜品、乳制品、冷冻开支和洗涤剂与纸制产品是影响销售途径的主要商品类别。
{2}Y2表示销售区域时使用matlab得回归结果如图5所示:
图4 销售途径与六大类商品销售额回归结果
由图4可知,上述6个变量均被剔除,即6个变量都不能对因变量起到显著影响,即对于销售区域来说,上述6个商品类别均不是影响它的主要商品类别。
2.研究结果的分析—智慧的经营销售策略。根据上述回归结果可知分销商的销售途径会受到保鲜品、乳制品、冷冻开支和洗涤剂与纸制产品4个商品类别的影响,而销售区域不会受到6种商品类别的显著影响。故分销商决策销售途径时只需考虑保鲜品、乳制品、冷冻开支和洗涤剂与纸制产品,对另外两种商品可以适当的忽略其影响。而决策销售区域时,分销商就可以不考虑这六种商品的影响,而根据其他因素,例如市场的销售状况、销售区域经济状况等来决定自己的销售区域。
四、总结
通过多元统计及数据分析表明,销售途径和销售路径及商品的销售额存在着不同程度的相互作用,弄清三者之间的关系,权衡轻重并制定出合理的销售方案,有利于分销商提高商品销售额,为销售提供智慧的策略建议。
参考文献
[1]杨桂元,黄己立.数学建模[M].合肥:中国科技大学出版社,2008.
[2]张焕明.统计学实验教程[M].天津:天津大学出版社,2009.
[3]吴礼斌,闫云侠.经济数学实验与建模[M].天津:天津大学出版社,2009.
[4]李子奈,潘文卿.计量经济学[M].高等教育出版社,2010.
[5]谢俊,面向大规模定制的供应链的分销模式与协调机制研究[J].上海交通大学,2008.
[6]蒋琦玮.不确定环境下供应商选择优化方法研究[D].中南大学,2011.
[7]李武.供应商选择群决策建模与多源多时段采购优化[D].华中科技大学,2009.
[8]游怡.我国商品零售价格分类指数的主成分分析[J].统计与决策,2014(10).
基金项目:大学生创新训练项目(项目编号:201410378195);大学生科研创新基金项目(项目编号:XSKY1563);安徽财经大学教研项目(项目编号:acjyzd201429)。
作者简介:汪亚楠(1993-)女,安徽安庆人,安徽财经大学统计与应用数学学院本科生,研究方向:统计学;朱家明(1973-),男,安徽泗县人,副教授,硕士,安徽财经大学数学建模实验室主任,研究方向:应用数学与数学建模。