基于二分类Logistic回归模型的企业网络营销统计分析

2012-07-30 12:32
统计与决策 2012年23期
关键词:信度渠道变量

郑 峰

0 引言

无论是供应商还是实体渠道零售商,都存在建立在线渠道的动机。其中,Chiang和Arya研究表明,在一定的条件下,供应商直营在线渠道可以使供应商与分销商都获利,原因在于双渠道的结构降低了供应链双边际效应产生的效率损失。Zhu和Kraemer基于动态能力理论和资源基础理论,通过对260家制造业企业数据的考查,发现电子商务能力与信息技术基础设施结合起来能产生互补性,从而为企业绩效做出贡献,而且电子商务能力与企业绩效的某些指标显著相关。Logistic模型是一种用于分析定性变量的回归模型,尤其是二值的被解释变量,可以计算和预测其属于某一类别的概率。为此本文选用二分类logistic回归模型,以企业实际中选择网上直销渠道的结果作为研究样本来进行研究。

1 研究假设与模型构建

1.1 研究假设

一些国际知名的外资企业在家电及3C领域有非常久远的发展历史,有固有的管理模式和营销渠道。传统的观点认为企业成立时间越久远,其现有的销售渠道越成熟,因此不会轻易转变到网上直销的销售模式,因此提出假设1:成立时间越长的企业越不会选择网上直销的销售模式。

一些国际知名的家电及3C企业,进入中国大陆市场的时间并不长,在从试探性发展转换到重点发展的过程中,网络营销渠道规划上有一定保留。因此提出假设2:进入中国时间越短的企业越不会选择网上直销的销售模式。

产品深度指每一个产品大类里拥有产品的数目,如电视机这个大类中,又可以细分成很多个型号。一般认为,对于产品深度深的企业,为了节省产品营销成本,会选择网上直销的销售模式。因此提出假设3:产品深度越深的企业越会选择网上直销的销售模式。

产品宽度指家电及3C产品大类,表示企业在3C及家电行业里经营范围的宽度。对于产品种类很宽泛的企业,为了节省产品营销成本,会选择网上直销的销售模式。因此提出假设4:产品宽度越宽的企业越会选择网上直销的销售模式。

越是单价高的产品,企业越会采用网上直销的方式,以便尽量减少多层次分配渠道,降低中间费用,以及分摊的物流费用,以增加价格上可能取得的优势。因此提出假设5:对于主营产品售价越高的企业越会选择网上直销的销售模式。

企业销售渠道指标主要考虑企业传统的分销网络的发展状况,包含企业的分销点在地理空间上分布的广度与深度。一般认为企业的传统销售渠道越是发达,越不需要选择网上直销的销售形式,因此提出假设6:传统分销渠道越不发达的越会选择网上直销的商务模式。

除了家电及3C产品外,还经营其他的产品域,如西门子做工业领域设备。一般认为企业经领域越广泛越要依靠网上直销这个强大的营销方式。因此提出假设7:其他领域的产品越广泛的越会选择网上直销的商务模式。

1.2 基于二分类logistic回归的决策模型

二分类Logistic回归模型采用的是逻辑概率分布函数,设Y=1的概率为p,则Y=0的概率为1-p。由于因变量Y只有两个值,可以把它看成概率为贝努利(Bernoulli)试验的结果。对p/(1-p)取自然对数得In(p/(1-p)),即对p作logit转换,记为logitp,则logitp的取值范围介于-∞到﹢∞之间。以logitp作为因变量,建立线性回归方程:

logitp=α+β1x1+β2x2+…+βnxn

对其进行变形可得:在拟合时采用最大似然估计法进行参数估计。模型中参数α是常数项,表示自变量取值全为0时,比数(Y=1与Y=0的概率比)的自然对数值,参数βi称为Logistic回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起比数比自然对数值的变化量。

采用二元因变量模型的最大似然估计,假定获取的样本数据为(xj1,xj2,…xjn;Yj),其中j=1,2,…m,则

Yj的概率密度函数进一步可以表示为:

F(Yj)=πjYj(1-πj)1-Yj

其中Yj=0,1;j=1,2,…m

Yj的极大似然函数为:

则对数似然函数为:

同时检验

可得到参数估计值即为α,β1,β2,…,βn

2 logistic回归分析与检验

2.1 数据样本来源及处理

根据中国互联网研究中心进行的大样本调查列出消费者所消费的种类与服务中,选出液晶电视、数码相机、手机、电脑,空调、冰箱、洗衣机等消费类电子产品,本文从家电及3C行业中选取了20家知名的国内外企业,这些企业的主营产品覆盖了各类家用电器、通讯、电脑及各类消费类电子产品。搜索了公司网站上关于描述在线渠道实施的新闻稿或文章,或利用在线客服、电话、E-MAIL等通讯工具进行咨询。根据企业网上直销渠道选择行为的影响因素的研究假设,对这20家知名企业初步数据进行整理编码。对所有的定序变量,采用李克特量表(Likert scale)的5级量表形式,即对量表中每一统计变量分成五个等级,包括"非常好"、"好"、"一般"、"差"、"非常差"分别记为5,4,3,2,1。企业是否选择网络直销渠道为二分类变量:企业有直销网络渠道的用“1”来表示,企业没有直销网络渠道的用“0”来表示。具体的数据样本与统计变量结果如表1所示。

表1 有序变量打分表

2.2 测量模型

设定模型的估计按照Anderson和Gerbing建议,通过验证性因子分析来设定一个可接受的测量模型。表2显示的是测量模型的结果,综合统计指标判定整个测量模型拟合是良好的。

表2 测量模型拟合统计

2.3 数据信度检验

利用样本数据进行分析之前,还要对测评指标体系进行检验,如果测评指标建立有偏差,则检验的结果客观性也不强,为此本文采用信度分析对样本进行打分的一致性检验。信度分析的主要的作用是检验结果的一贯性、一致性、再现性和稳定性。通常认为,信度系数应该在0~1之间,在探索研究中α系数至少应达到0.7才能接受。

通过SPSS软件对变量打分表进行信度分析,得到结果如表3所示。

表3 数据信度检验

如上表2所示,Cronbach's Alpha=0.746>0.7,由于本研究属于实物研究范围,因此该信度值在可接受范围,根据收集到的数据进行的编码打分表格为稳定可靠的,能够用于后续一系列的统计分析中。

2.4 logistic回归分析结果

采用logistic回归模型中的“Enter”模型,对于样本数据进行分析,所谓“Enter”指使所选变量全部进入回归方程;剔除变量基于Waldχ2检验结果。表3给出基于logistic回归模型的分析结果。

表4 回归分析结果

表4输出了得到的模型中各自变量的偏回归系数及其标准误、Wald统计量、P值、OR值(即Exp(B))。各自变量回归系数表示自变量xi每改变一个单位比值,自然对数值改变量,而Exp(B)即OR值,表示自变量xi每变化一个单位,企业选择直销网络渠道的概率和不选择直销网络渠道的概率的比值是变化前的相应比值的倍数,即优势比。7个变量在Wald检验中,企业成立的时间,其他领域,价格水平,传统的销售渠道的显著性较高;而进入中国的时间长短,产品深度,和产品宽度三个变量显著性不明显,也就是说企业是否选择网上直销的通路与进入中国时间的长短,家电以及3C产品的宽度与深度,这三个因素关系不大,因此前面提出的假设2、假设3、假设4就不成立。

在模型中剔除这些变量,根表3中据输出的关系,可建立如下Logistic回归模型方程:

logit(P)=-4.589-0.961×成立时期+1.075×价格水平+1.856×传统渠道-1.123×其他领域

根据上述模型可以看出:企业的历史越悠久,建立网络渠道的可能性会降低,这与我们假设1是一致的。在样本统计中,可以看到许多成立在近30年的企业他们几乎与网络渠道的发展同时崛起,作为市场的新生力量,他们与成立时期很长的一些大企业相比更倾向于选择建设网络渠道,因为网络渠道的投入成本相对较低,其信息流动性强,可以帮助企业不受时空的限制快速拓展市场,也大大提高了分销的效率。企业主营产品的价格水平每增加一个等级,选择企业直销网络渠道的机会也将大幅增加,可看出价格因素也对企业的直销网络渠道建立有比较重要的影响,因此假设5成立。企业的直销网络渠道建立与其传统渠道有着密不可分的关系,网点分布、物流配送、售后服务等在网络渠道中涉及到的问题,要依赖于企业的传统渠道,传统渠道的广泛性和深入性将直接影响企业的网络渠道控制能力,从而影响一个企业的多渠道决策,因此假设7不成立。企业除了家电及3C产品之外涉及的其他领域的多少,与企业是否选择直销网络渠道成负相关关系。这与我们的假设6刚好相反,企业除了家电及3C产品零售之外涉及的其他领域的越多,企业选择直销网络渠道的可能就越少。这一项说明最适合网上直销的是家电及3C这类标准化的产品,其他的产品由于不便于网上表达清楚,因此不适合网上直销。检验结果如下表5所示。

表5 检验结果

3 结束语

对于企业是否应该采用网上直销的销售模式,在学术界以及企业界一直存在着很大的争论。本文根据国内外著名的20家家电以及3C企业的销售渠道的实际选择行为,进行分析,因而减少了主观因素的影响。通过二分类Logistic回归模型分析,表明企业选择网上直销渠道的行为受到企业成立时间的长短,企业除了家电及3C产品之外的其他经营领域的多少,企业产品价格的高低,企业的传统渠道发达与否等因素的影响。同时也否定了一些选择网上直销的传统观念,例如企业经营产品的范围越广,企业选择网上直销的可能越小,企业的传统渠道越发达企业越有可能选择网上直销。这些都很好地解释了为什么网上直销出现这么多年,仍然没有如预期的那样取代传统的销售渠道。

[1] Arya A.The Bright Side of Supplier Encroachment[J].Marketing Sci⁃ence,2007,26(5).

[2] Hangjung Zo,Ramamurthy,K.Consumer Selection of E-commerce Web Sites in a B2C Environment:a Discrete Decision Choice Model[J].IEEE Transactions on Systems,Man and Cybernetics,Part A(Sys⁃tems and Humans),2009,39(4).

[3] 杨升荣,徐飞,陈洁.基于离散选择模型的在线渠道消费者品牌选择行为,上海交通大学学报,2009,43(4).

[4] 王济川,郭志刚.Logistic回归模型——方法与应用[M].北京:高等教育出版社,2001.

[5] 刘敏.电子商务发展测度与预测方法[M].北京:经济科学出版社,2008.12.

[6] 胡引霞,滕春贤.基于电子商务的供应链与供应链竞争研究.运筹与管理,2010,19(3).

猜你喜欢
信度渠道变量
聚焦“五个一” 打通为侨服务渠道
《广东地区儿童中医体质辨识量表》的信度和效度研究
抓住不变量解题
也谈分离变量
平衡损失函数下具有时间效应和通胀因子的信度估计
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
中文版脑性瘫痪儿童生活质量问卷的信度
渠道
分离变量法:常见的通性通法
渠道与内容应当辩证取舍