刘洪伟,詹明君,高鸿铭,朱 慧,梁周扬
(1. 广东工业大学 管理学院,广东 广州 510520;2. 广州大学 管理学院,广东 广州 510006)
当今信息化时代下,消费者消费能力的提升使得消费者的需求呈现更大的差异性,许多成熟产品(或品牌)的竞争优势受到众多新生产品(或品牌)的冲击。产品市场的竞争形势愈加激烈,有效且直观的市场结构分析对学者和行业从业者是一项急迫且艰巨的任务[1-2]。一般来说,对于产品市场结构的分析主要取决于两个因素:竞争程度或产品间替代性衡量标准,以及产品间相似性分析的数据简化技术[3]。由于意识到从整个庞大市场进行分析的局限性,市场细分的研究工作很早便得到关注。随着点击流数据可用性的提升,学者和从业者从消费者行为数据的角度进行研究并取得许多进展,而这些研究多从供应侧的角度出发考虑消费者的人口统计学特征,消费心理因素和情境因素[4-5],难以识别和跟踪消费者的异质性偏好和兴趣。而消费者的行为流是其对于信息的获取、认知和处理的外在表现,可见从需求侧的角度出发,考虑消费者的行为反馈在市场结构分析中的作用是至关重要的[6]。因此,在市场结构分析领域中,消费者在购物时的行为反馈值得更深层的挖掘和应用。
消费者的产品选择行为通常具有时序依赖性,贝叶斯推断[7]不仅能估计出决定性反馈行为变量参数的概率分布,而且其依赖于主观先验信息的特点同时解释了消费者的异质性;此外,多维标度分析(Multidimensional Scaling,MDS)可在不破坏原有数据结构的情况下将对象进行降维并可视化[8]。因此,本文基于贝叶斯推断、K-means聚类算法和MDS法对消费者的行为流数据进行分析,依据先验信息识别对市场结构分析起决定性作用的消费者反馈行为,并对产品的市场结构进行划分和可视化分析,直观地对样本数据提供的产品市场的竞争形势进行展示。
在传统的实体店中,零售商的管理决策主要集中于库存产品的供应选择,货品摆放位置以及摆放方式的优化上;同样地,在线上商店中,管理者则需要制定产品分类和排序的最佳策略以提升产品销量。因此,不管是线下还是线上环境,管理者必须定期制定产品营销或管理策略,这直接取决于他们对产品关系的理解[9]。产品之间的关系在于它们之间的替代性和互补性[6],而市场结构分析则揭示了产品之间的这两种特性,从而解释企业或其产品在市场中的竞争特性和竞争强度。因此,产品竞争市场结构的分析为新产品设计与开发、竞争性广告制作、产品定价、产品定位和传播策略等提供了必不可少的启示和指导作用[10]。
如何界定和识别产品市场的边界对于其市场结构的理解具有重要影响[11],即对产品市场进行划分有助于更好地理解其市场结构。对于某一特定类别的产品,其市场竞争形势可以体现为一系列的产品子市场,每一个子市场中的产品或品牌存在较为密切的竞争关系。而以品牌为粒度划分市场是较为常用的方式[11],但考虑到品牌之间的替代性,这种划分方式具有较大的局限性。尽管许多研究对于产品市场结构的分析已有显著性的成效,但是这些研究多从供应侧的角度进行分析。显然,最终产品的供应备选项由供应侧决定,他们可以利用营销组合来通知和影响消费者,但产品的销量是由消费者(即需求侧)对产品的感知和回应所决定[6]。由于消费者的异质性难以识别,现有市场结构分析模型大多假设结构只存在于市场层面。所以对于消费者层面的考虑是欠缺的,而且有充分的理由相信产品结构在个人层面的存在性[6]。因此,分析市场结构不仅需要考虑供应侧提供的服务,消费者的真实反馈对市场结构的影响也不容忽视。互联网的发展和传播使得用户更频繁地在论坛、博客或电商平台的产品评论处发表自己的意见和建议,同时他们的评论内容也更易于发现和传播[12]。Urban 和Hauser[13]发现了此类用户生成内容的巨大潜力。许多学者也开始挖掘用户口碑或评论对市场结构分析的潜能,从而可以“听取”消费者的想法[14-16]。
一般情况下,消费者在做出最后的购物决策前都会经历需求认知、信息获取以及信息处理的阶段。因此,相比于依据供应侧提供的营销服务以及产品的最终销量(即消费者的购买与否行为)分析市场结构,消费者在购物过程中对产品所做出的行为反馈也反映了其兴趣。同时,消费者在处理信息的过程中所受的外在因素或刺激因素会导致这一过程变化,因而消费者的真实行为反馈对产品市场份额的影响不可忽视。此外,消费者的决策与其所处的情境和历史经验息息相关。相比于传统的商业时代,当今的工业4.0时代使得我们可以通过服务器端或实验的方式收集关于用户行为的详细信息,即点击流数据[17]。点击流数据[17]所记录的内容可以捕获消费者的历史行为流数据[4-5,18],并能最大程度地还原其真实购物历程,隐式地反馈消费者对产品的兴趣[19],为基于消费者影响的市场结构分析提供了坚实的数据支撑。点击流数据的应用和研究已经非常广泛,包括网页的浏览和导航、互联网广告以及网上购物和电子商务[17]。Moe[20]将点击流数据按照特定类型对网页进行分类,通过观察消费者的导航模式将消费者划分为直接购买型、深思熟虑型、享乐浏览型和知识构建型消费者。Montgomery[18]同样基于页面的分类识别消费者的浏览行为模式,并通过建模对购买转换率进行了预测。在前人的研究基础上,学者们结合点击流数据进一步挖掘消费者的兴趣模式[21],识别消费者的兴趣状态[19,22],对消费者的购买预测进行研究。这些研究主要基于点击流数据探究购买决策的影响因素,以促进购买转换。而较少有文献进一步结合这些数据研究购买对象的市场分布情况。对商家而言,考虑消费者的真实行为反馈对产品竞争市场结构进行分析,对产品的定位和开发具有重要作用,不仅可以提升自身竞争力,同时可为消费者提供更优质的产品和服务。基于此,本文基于消费者行为流数据对产品市场进行细分和可视化,分析产品市场结构。
消费者当前阶段的购买决策受先验信息影响,而消费者历史行为流痕迹在提供先验信息的同时,还反映了消费者在购物过程中的真实动态兴趣变化。首先,通过考虑消费者的历史信息,即先验知识,本文采用贝叶斯推断识别行为流数据中的决定性反馈行为,基于决定性反馈行为构建产品−行为介入矩阵,然后采用K-means聚类算法对产品市场进行划分,并进一步地采用多维标度分析对已划分子市场进行降维可视化,直观有效地绘制出产品市场的结构和竞争形势,研究框架见图1。
图1 本文研究框架Fig.1 The research framework
本文所采用的行为流数据来自于国内知名的某大型综合网上购物商城,该数据集由每个用户的网络日志组成,每一个数据条目代表消费者执行的一个特定的行为,并且这个行为一旦发生便会被记录。原始数据集共包括78 746个不同的消费者于2016年2月1日至2016年4月15日期间所产生的13 199 934条行为记录。其中,行为对象包含399个品牌,共19 508个产品,从属于8个不同的类别。此外,由于商业隐私保护的缘故,品牌和产品的名称及其所属类别都进行了脱敏处理。
为了分析产品间的竞争关系,考虑到不同类别之间的产品存在着不可竞争性(例如手机和衣服不存在可比性),本文随机选取某一类别的数据作为样本并对该类别下的产品进行分析(我们同时对其他类别进行了鲁棒性分析,并验证了分析方法的普适性和有效性)。最终,所选取样本类别数据的时间区间为4月1日至4月15日,共15天,其中包含了34 922个不同的消费者所产生的3 013 837条行为记录,行为对象包含51个品牌,共2 496个产品。该样本类别的变量统计性描述如表1所示。
根据表1可知,产品的点击量和浏览时间的极差值非常大,同时这些变量的标准差较大,进一步证明了不同产品的点击量和浏览时间具有较大的分散程度,间接反映了消费者的异质性。此外,结合加入收藏夹和竞争优势的数据,可以看出,加入收藏夹与购买结果不存在必然关系,但加入收藏夹的最高累计数目占竞争优势的最高累计值的74.39%,这在一定程度上反映了该行为对产品竞争优势提升的积极作用。由此初步可见,消费者的行为反馈在一定程度上反映了同一类别产品在市场中的竞争形势差异以及产品子市场的存在可能性。然而通过简单的数据统计和分析无法直观和清晰地刻画产品市场的竞争形势,为此,本文进一步对该样本类别市场进行细分和可视化。为了表达的通畅性,后文中竞争优势和市场份额将交替使用。
表1 样本类别的变量统计性描述表1)Table 1 Statistical description of variables from sample category
在当下信息过载的电商环境下[23],消费者的信息获取成本不断提升,这意味着消费者在完成购买任务前不可避免地需要花费时间成本进行搜寻、处理、接收和更新信息这一系列过程,换而言之,消费者的历史经验为其未来的购物提供了信息指引。因此,消费者的产品选择行为通常具有时序依赖性,即消费者在购物过程中的每一个反馈行为都与前面的行为相关联,并且对消费者的后续行为决策存在影响。例如,在正常情况下消费者对某产品的购买行为发生在对该产品的信息搜寻前提下。因此假设消费者不会对一无所知的产品感兴趣并进行购买。相比于经典估计方法,贝叶斯推断考虑并依赖于先验信息,而且估计结果是一个分布而不是一个特定最优值[7]。虽然贝叶斯推断的先验分布确定具有主观性,由于消费者体验或经验的差异性,他们对于先验信息的理解不同会导致先验分布不同,从而得到异质的后验分布,这恰恰为消费者的异质性进行了解释。结合消费者的历史行为流数据,消费者对每个产品所执行的行为都有不同的介入程度,从而得到一个产品−行为介入度矩阵[24]。
消费者在电商平台的反馈行为隐性地反映了消费者对特定产品的偏好程度,而消费者的偏好异质性程度不一,导致每个产品在市场中具有不同的竞争力。因此,假设整个市场中有n个产品,为了表达每一个体产品在市场中的竞争优势y(即所占的市场份额),我们构建了一个产品−行为介入度矩阵,见式(1)。
其中,x,x,···,x表示消费者在电商平台的k个反馈行为因素 X(即消费者在电商平台进行网购活动时留下的行为痕迹),每个因素根据消费者的行为介入可表示为xi=(xi1,xi2,···,xik),i=1,2,···,n。
因此,利用正态回归模型,每一个体产品的竞争优势可表示为如式(2)所示。
具体地,
其中θ=(β,σ2)是未知的参数向量, In为单位矩阵。同时,Nn(µ,A)表示n维正态分布,其中µ是一个均值向量, A是一个协方差矩阵。误差项ε服从标准正态分布,且εi(1 ≤i ≤n)独立同分布。
为了估计参数θ=(β,σ2),需为这些未知的参数向量提出一个无信息先验假设
根据多元正态分布的性质,该模型的后验分布可通过贝叶斯推断得出
给定预测变量X=x∗,根据贝叶斯统计的多变量模型知识,后验预测分布p(y˜|y)为
需要注意的是,基于上述所得的后验样本(β,σ2),用于预测的后验样本可以通过正态分布N(x∗β,σ2)对y˜进行取样。
图2 参数后验分布估计Fig.2 Parameter posterior distribution estimation
表2 后验估计均值表1)Table 2 Mean of posterior estimation
如何界定和识别产品市场的边界对于其市场结构的理解至关重要。为有效划分产品竞争子市场,由于K-means聚类算法的高可用性及复用性,本文采用K-means算法进行聚类,并通过轮廓系数(Silhouette Index, SI)选取最佳的簇数,即K值。轮廓系数的值越高意味着簇越紧凑,聚类效果越好。因此,为防止过拟合或欠拟合的情况发生,预先设定K值取值范围为[2,6],并通过轮廓系数评价市场的簇数优劣,确定最终竞争子市场的数目,轮廓系数值随K值变化的结果如图3所示。从图3可以看出,轮廓系数的值从K = 2到K = 3时上升,当K > 3的时候则开始下降,可见轮廓系数在K = 3的时候取得最大值。根据肘方法(Elbow Method),可知K = 3时轮廓系数的取值为曲线的肘部,并且达到最大值,从而最佳的簇数应为3,即将整个市场划分为3个竞争子市场效果最佳。
图3 竞争市场不同簇数(K)的轮廓系数(SI)取值曲线Fig.3 Curve of SI values on different cluster numbers of competitive markets
为了量化和分析产品和品牌在整个市场的竞争形势,在给定最佳簇数为3的情况下,本文采用非监督学习聚类K-means算法,结合决定性行为反馈变量,通过MDS分析对样本类别产品市场进行降维可视化,结果如图4所示,其中横纵坐标 D1和 D2表示MDS分析通过降维后的两个维度。
识别产品市场结构以及产品间的竞争关系对于管理者制定和调整营销策略具有重要意义。图4(a)展示了本文选取的样本类别中的总体产品市场细分情况,可以清晰直观地看出3个子市场 S1,S2以及S3中的产品分布情况(分别以圆圈,加号以及圆点进行了标记),其中每一个点代表一个特定的产品。需要注意的是,该感知图描绘的是所有产品在整个市场中的相对位置,而每对产品间的相对距离刻画了它们之间的竞争强度。换句话说,在图中,产品间相互竞争的强度与其相对距离呈负相关关系,例如图中的圆圈标记产品与圆点标记产品则难以形成竞争关系。为有效说明,图4(b)提取了第3个子市场(即S3,圆点标记产品构成的子市场)并通过气泡图来描绘该子市场的竞争形势,其中气泡的大小代表产品市场份额的高低。由图4(b)可以看出,气泡大小随着维度D1呈现总体递增的形势,揭示了非监督学习下消费者决定性行为反馈对产品市场份额的综合正向作用。对比于市场层面的产品市场结构分析,消费者的购买行为为产品销量的外在表现形式,而其他行为反馈同时考虑了未达成购买任务下产品的被选择程度,间接反映了消费者行为反馈对市场结构的影响。由此可得,消费者决定性行为反馈对于产品市场份额释放出积极信号。此外,显然从气泡大小可以看出右下角的4个产品在 S3市场中占据主导优势,其他产品市场份额则相对较低,此现象与帕累托法则(Pareto rule)相匹配[25]。为了更好地说明这一点,表3以降序的形式列出了S3市场中市场份额占有排名前列的产品。
图4 产品竞争市场结构可视化Fig.4 Product competitive market structure visualization
表3 S 3市场中排名前列的产品市场份额表1)Table 3 Market share of top ranked products in S 3 market
从表3可知,S3市场包含514个产品,其总市场份额占据整个市场的98.83%,其中42.96%由排名前10的产品所贡献。由此可见, S1和 S2市场的市场份额占比非常小。具体地,总体产品市场的2 496个产品中,约有79%的产品的相对竞争优势很小。此数据揭示了产品市场结构中的二八效应以及构建产品子市场的必要性,有助于管理者调整产品的营销策略,例如移除那些从未被点击浏览或被考虑购买的产品以提高成本效益或聚焦于提升自身在子市场中的竞争优势。
此外,排名前4的产品从属于同一个品牌519,这反映了产品竞争在品牌内部的存在性。意识到这个问题有助于管理者更全面地优化其对于产品在品牌间和品牌内的管理策略。此外,为进一步了解品牌之间的竞争关系,本文以品牌为单位绘制了 S3市场的结构图,如图5所示,其中横纵坐标 D1和 D2同样表示MDS分析通过降维后的两个维度。
图5 S3市场的品牌竞争结构Fig.5 Brand competitive structure of S3 market
图5中气泡的大小和颜色深浅表示品牌占有的市场份额高低,其中颜色最深的气泡显然为品牌519。图中气泡之间的相对距离用以刻画品牌间竞争关系的紧密程度。例如,虽然品牌691和891的市场份额远小于品牌519,但它们的竞争关系非常紧密,而其他品牌与品牌519形成的竞争关系则相对较弱。然而,单独位于图中右下角的品牌为品牌231,与其他品牌具有较远的相对距离,即与其他品牌竞争关系较弱,虽然如此,品牌231也占据一定的市场份额,这也许反映了品牌231是一个新的品牌趋势并获得了消费者的良好反馈。及时发现这种特殊情况,对于品牌自身,如何把握自身的品牌优势是关键;而对于竞争对手或新兴品牌,了解其他品牌的优势,制定有效策略对其发展也至关重要。因此,进一步了解品牌的定位,有利于对产品市场结构有更深的了解并对管理策略的调整和制定具有指导意义。
总体来说,识别行为流数据中具有决定性作用的消费者反馈行为因素,并基于这些因素对产品市场进行细分和可视化对管理者了解产品和品牌的定位以及在子市场中的竞争形势具有重要的帮助,从而启发管理者对产品开发或现有的产品定位策略做出调整,以优化其决策。例如,品牌231是一种新的产品定位并获得了很好的市场成效,具有借鉴意义;而根据帕累托法则,主导品牌可通过考虑移除不具竞争力的产品,将成本投入主导产品中优化管理策略,进而提升效益。
本文结合行为流数据,基于消费者行为反馈对产品市场结构进行分析。通过构建消费者−行为介入矩阵,识别决定性反馈行为因素,即消费者点击和加入收藏夹行为。在此基础上,选取最佳的产品市场簇数,将整个产品市场细分为3个竞争子市场。在给定最佳簇数为3的情况下,对3个子市场进行可视化分析。通过消费者的行为反馈,结果揭示了非监督学习下消费者决定性行为反馈对产品市场份额的综合正向作用。同时表明,少数产品在市场中占据主导位置的二八效应,以及产品竞争在品牌内部的存在性。尽管有些品牌的市场份额差异较大,但它们之间仍存在着强烈的竞争关系。此外,个别品牌与其他品牌之间的竞争关系相对较弱,但仍占有一定的市场份额。相比于管理者从企业自身的角度营销产品,消费者行为反馈作为积极信号,这些发现有助于进一步了解产品的竞争优势和市场结构,为老产品定位调整以及新产品开发和定位设计的营销策略制定提供了容易实现且有效的启示,在提升自身竞争力的同时为消费者提供更优质的产品和服务。
因此,首先,管理者如仅从企业自身的角度以及产品的销量对产品或品牌制定营销策略,忽略了消费者的影响。考虑消费者对产品或品牌的真实反馈,可进一步客观清晰地了解产品的竞争优势和市场结构。其次,消费者的购物具有时序依赖性,因此消费者的行为反馈受消费者的历史先验信息的影响。在此基础上,识别具有决定性作用的反馈行为非常关键,这些行为从侧面反映了消费者对产品的介入程度。
然而,消费者的偏好和产品的市场份额在不同的时期存在变化的可能性,从而导致市场的动态变化。结合本文的市场细分结果,不难发现这3个子市场可以体现产品的动态发展趋势,因此考虑不同时期的对应数据将可获得对于市场的动态性更有效的解释。此外,在营销的研究中,仍然存在着许多主观影响因素,例如网页刺激、促销活动、价格影响等。本文尚未结合这些主观因素进行分析,具有一定的局限性。因此同时考虑消费者的反馈行为因素(客观痕迹)与页面刺激因素(感知痕迹)是一个挑战,但也为未来的研究提供了方向。在当下的消费时代,从消费者的偏好和需求出发,了解并探讨消费者的整个购物过程,将对新老产品的调整和开发管理带来重要的指导意义。