基于点击流与PROMETHEE多属性决策法的电子商务消费者购买意愿预测

2020-11-30 06:54何锐超刘洪伟高鸿铭范梦婷詹明君
广东工业大学学报 2020年6期
关键词:会话复杂度排序

何锐超,刘洪伟,高鸿铭,范梦婷,詹明君

(广东工业大学 管理学院,广东 广州510520)

在线购物是众多消费者网络行为的出发点与归宿,而了解用户的兴趣并预测消费者的购买意愿是网站实现个性化的基础[1]。电子商务的发展使得消费者可以轻易接触到丰富的商品,同时也导致企业之间的竞争越来越激烈。因此,实时了解消费者的兴趣度变化,有利于提高个性化推荐结果的准确性,避免重复推荐,提高消费者的购买体验。

传统的消费者购买意愿研究主要基于问卷调查的方式[2-3]。然而,其数据在真实性与客观性上都存在缺陷,而且没有考虑消费者的兴趣会随着时间的推移而逐渐改变。互联网上存在着大量隐式反映消费者兴趣的数据。而点击流数据因为兼顾了消费者的异质性、消费者需求的完整性以及动态性[4],因此利用点击流技术对用户行为进行有效的建模受到越来越多学者的关注。

为此,本文结合电子商务消费者的实际点击情况,基于消费者兴趣漂移理论,构建适合网络消费者点击行为的购买意愿预测模型并分析各影响因素的重要程度。在测量方法上,本文选择Brans教授提出的PROMETHEE(Preference Ranking Organization Methods for Enrichment Evaluation)偏好顺序结构排序评估方法,该方法是建立在级别优先关系(Outranking Relation)上的排序方法。该方法以方案各个属性的两两比较为基础,并根据偏好临界值确定方案之间的偏好性,并认为方案之间可以存在偏好的不可比性和弱偏好关系[5],解释消费者在商品选择过程中的犹豫心理。

PROMETHEE方法是一种建立在级别不劣关系下的多属性决策方法[6]。级别不劣关系认为,方案与方案之间存在偏好的不可比性和弱偏好性。其中,不可比性认为:按照不同的排序标准对方案进行优劣比较,则会出现某些方案不能绝对排序的情况。另外,该方法设置了6种典型的属性偏好函数。在对消费者的偏好建模时,允许消费者针对两个不同的商品或者商品属性有严格偏好、弱偏好与无差异等多种偏好关系。通过两两比较,根据优势度概念,并从两个侧面对方案进行比较。一个侧面为某方案优于其他方案的程度,以流出量 Φ+表示;另一个侧面为其他方案优于该方案的程度,用流入量 Φ-表示。最后PROMETHEE方法在方案排序上存在3种方法,并对排序存在矛盾的部分解释为严格偏好、弱偏好与无差异,这一点与消费者的犹豫心理相似。该排序方法易于理解,思路清晰,有利于决策者进行分析。,

因此,本文提出一种基于点击流和PROMETHEE多属性决策法的电子商务消费者兴趣与购买意向的测度方法。该方法首先针对点击流数据构建一个完整的指标体系,并采用真实的京东购物网站上消费者的点击流数据,最后利用PROMETHEE偏好顺序排序方法进行计算与排序,预测消费者的购买意愿。

1 文献综述

1.1 消费者购买意愿

购买意愿指的是消费者愿意采取特定购买行为的概率[7]。消费者通过信息搜索累积其购买兴趣并在方案评估中产生偏好,最终在购买决策阶段明确其购买意愿。因此,购买意愿是衡量消费者是否会产生进一步购买行为的重要指标。

传统测量消费者购买意愿的方法主要为显式反馈,如:问卷调查等方法。但是,因为由于消费者购买意愿无法观测,较难使用统一的量表准确地测量每个消费者在不同商品上的购买意愿,从而导致消费者购买意愿的相关研究在指标设置与理论选择上存在较大的差异[8]。随着数据挖掘技术的提升,隐式反馈方法受到越来越多的学者的关注,较多学者从基于社交网络[9]、商品评论[10-11]等角度,动态地预测消费者的购买意愿。然而,以上研究方法较多地从他人对消费者的影响的角度对消费者的购买意愿进行研究,较少考虑消费者自身兴趣度的变化[12]。点击流数据包含着每一个消费者在购物网站中的浏览痕迹,利用点击流技术对用户行为进行有效的建模,有利于兼顾每个消费者自身的特性,更好地挖掘消费者实时的购买意愿[13]。

1.2 点击流研究

点击流指的是消费者在网站上点击行为的序列[4]。消费者注意力有限,袁兴福等[14]提出,会话划分是消费者序列行为建模的重要工作之一。以会话为基础,当前关于点击流的研究可以分为单一会话研究与多会话研究[13]。其中,单会话研究主要专注于会话类别的分类[12,14-15],而多会话研究主要研究消费者的行为规律与购买意愿。Montgomery等[16]通过消费者访问的页面类型,重复访问次数以及人口统计学特征,发现消费者累计的访问次数越多,则越有可能购买,而且模型中的记忆成分是预测消费者浏览与购买行为重要因素。刘洪莲等[17]通过停留时间等指标,发现消费者在信息浏览与决策会话中行为规律的差别。OsnatMokryn等[18]利用产品的流行趋势以及消费者访问时间的变化,预测匿名消费者的购买意愿。Jenkins等[19]开发了一个ClickGraph算法,通过将消费者的商品点击序列绘制为一个有向图网络,并通过循环神经网络技术预测匿名消费者下一次点击的商品。

以上研究关注消费者点击流指标比较单一,较多仅关注消费者的网站访问频率与停留时间。然而,不同消费者的不同的点击流行为类别,也会从不同侧面反映消费者的兴趣程度,如点击、浏览、收藏以及加入购物车等[20-21]。当前关注到该问题的研究如Houda Zaim等[22]通过模糊多属性方法探究消费者在网页上的浏览行为规律。但是,该研究尚未细化到消费者的行为类别,因此,本文将通过建立一个针对点击流的指标体系,并利用PROMETHEE多属性决策方法探究消费者在每一个会话中的购买意愿,动态识别消费者的兴趣变化过程。

另外,以上关于多会话的研究较少解释消费者会话与会话之间的依赖关系,忽略了消费者兴趣的动态性。消费者兴趣漂移理论认为,消费者会受到长期兴趣与短期兴趣的影响[23]。其中,消费者受到短期兴趣的影响最大,而长期兴趣对消费者的影响会随着时间的推移而逐渐减弱[24]。因此,本文借鉴兴趣漂移理论的研究范式,引入遗忘函数以解释消费者点击会话之间的依赖关系[25]。

综上所述,本文将根据以往点击流的研究,构建指标体系,并利用PROMETHEE方法评估消费者在会话内的购买意愿。最后,利用遗忘函数探究会话间的依赖关系,改进现有的点击流多会话研究。

2 消费者购买意愿预测模型构建

2.1 点击流会话构建

2.2 消费者购买意愿评价指标体系构建

点击流数据可以从不同侧面反映消费者当前的兴趣状态,周翔[26]将消费者点击行为划分为浏览广度、浏览深度以及浏览复杂度3个维度。因此,本文在深入研究京东消费者的点击流行为的基础上,结合消费者点击行为类别,构建了包含3个一级指标和8个二级指标的消费者购买兴趣度评价指标体系,如表1所示。

表1 点击流购买意愿评价的指标体系Table 1 Index system for evaluating purchase intention of clickstream

2.2.1行为复杂度

选取行为复杂度为一级指标(B1)。复杂度的主要度量手段为频率,如浏览详细页面的频率(店铺、商品等)。在点击流数据库中,消费者的点击行为可以分为点击、浏览(浏览详细页面)、收藏、加入购物车等。以上行为都在不同程度地反映着消费者针对每一个商品不同的兴趣度,而且随着消费者行为复杂度的不断累积,消费者对商品的不同信息的收集量越来越多,则消费者购买意愿越明确。因此,选取点击频数、浏览频数、收藏频数以及购物车频数作为二级指标,解释行为复杂度,表达式如式(2)所示。

2.2.2 行为广度

选取行为广度作为一级指标。消费者会根据一定的维度在一个会话中浏览商品信息。在该维度内,浏览的商品越多,则说明消费者在对该维度内的信息了解越透彻,越有利于消费者做出决策,同时反映了消费者对该维度的忠诚度。因为本文利用的数据为京东商城的点击流数据,京东商城中商品较多根据品牌分类,较少利用店铺进行分类。因此,本文以商品品牌为分类维度,并以品牌浏览次数与浏览频数为二级指标,对消费者在同一会话中所浏览的品牌进行对比,计算方式见式(3)、式(4)。

其中,行为广度以品牌为基础,因此 brandt表示在会话s内消费者第t次点击的品牌。

2.2.3行为深度

选取行为深度为一级指标(B3)。消费者在需求触发阶段,信息浏览往往比较随意,其浏览频率比较高,收集的信息量比较多;但是,在商品选择与评价阶段,消费者的浏览频率下降,而浏览时长增加。因为消费者在商品选择与评价阶段能更有效地分配其信息搜索的时间,消费者需要更详细的信息辅助其进行最终的购物决策[24]。因此,消费者在购物网站上停留的时长是评估消费者行为深度的有效指标。在点击流行为类别中,消费者通过点击商业陈列页面以及浏览商品详细页面才可以了解更多商品信息,因此,本文以点击时长以及浏览时长作为二级指标解释行为深度:

其中,c∈{1,2},分别代表点击与浏览行为。综上,点击流购买意愿评价的指标体系如表1所示。

2.3 多会话指标累积兴趣度计算

本文将兴趣漂移理论引入到点击流研究领域。兴趣漂移理论主要研究消费者的兴趣变化过程,即消费者短期兴趣与长期兴趣的依赖关系。

针对消费者会话内的点击行为(即短期兴趣),本文采用会话内相同商品序列指标值合并的方法,计算在同一会话中针对消费者所浏览的所有商品的兴趣度,计算方法如式(2)~式(5)所示。

针对消费者会话间的点击行为(即:长期兴趣),本文采用采用遗忘函数对会话间的消费者兴趣度进行衰减运算,遗忘因子K计算方法如式(6)所示。

其中,Bimpcs为考虑兴趣依赖后当前会话的兴趣值;n表示会话数量,n∈{2,···,s}。

综合消费者的短期兴趣与长期兴趣之后,本文将采用PROMETHEE方法预测消费者的购买意愿。

2.4 PROMETHEE购买意愿预测模型构建

本文采用PROMETHEE多属性决策方法中优先度的计算方式与偏好函数描述消费者在商品浏览时的方案比较行为,进而预测消费者的购买意愿。该决策方法可分为以下4个步骤。

2.4.1确定权重

本文选取熵权法(Entropy Method)计算消费者点击流指标体系的常权向量。熵权法是一种常用的客观赋权方法,它仅依赖于数据本身的离散性。若消费者在某点击指标上离散性越强,则说明指标对消费者购买意愿的区分度越强。本文以 ωimsc表示在会话s针对指标i的熵权值,为常权值。

2.4.2 确定优先指数

对商品点击流指标值进行两两对比,构建优先指数矩阵,使得优先指数不仅仅针对与单会话内的指标值,如式(8)、式(9)所示。

其中,dmic(ps,p′s)表 示的是在会话s内商品p相对于商品p′在指标Bmc中的兴趣度差值。Fmic(·)为优先函数。Πmic(ps,p′s)则 是优先指数,取值从0(会话s内商品p在指标Bmc上 优于或与商品p′无 差别)到1(会话s内商品p在指标Bmc上 严格优于商品p′)。

考虑到行为复杂度指标(B1)中的收藏以及购物车频率均为0、1变量,因此,优先函数F1c(·)如式(10)所示。

另外,消费者的其他点击行为指标为连续变量,且随着消费者兴趣度的增加,消费者将对少数商品进行对比,点击频率将下降。因此,优先函数Fmc(·)为非线性的指数函数,如式(11)所示。

其中,z为 函数参数,本文设z=2。

2.4.3计算流入流出量

2.4.4 排序

针对考虑兴趣依赖关系后的每个会话内商品的流入量与流出量,本文综合对比PROMETHEE的两种排序方法。PROMETHEEⅠ对流入流出量进行不完全排序,解释消费者在商品选择时的犹豫心理;PROMETHEEⅡ对净流量进行完全排序,有利于商品推荐。

3 算例分析

3.1 会话内产品依赖关系计算

本文选取ID号码为295193的消费者。该消费者自2016年4月1日00:00:00至2016年4月16日00:00:00共计有1 600次点击浏览记录,根据面向时间阈值T的启发式会话划分方法,可以将该消费者的点击流数据划分为37个会话。其中,消费者在会话22中购买了商品ID为103652的商品。会话22的累计购买兴趣数据如表2所示。

从表2可见,该消费者在会话22中,购买了ID号码为103652的商品。该商品的点击频率在该会话中最高为28次,然而其点击时长为357 s,小于商品75877。较难判断消费者最感兴趣的商品是否为ID号码为103652商品。可见,仅仅依靠会话中的累计兴趣度较难发现消费者对不同商品的偏好程度。根据表格2,可以计算出不同计算指标的熵权值如表3所示。

3.2 会话间产品依赖关系计算

本文通过累计兴趣度的方法,计算出会话内产品的依赖关系后,利用式(6)计算出消费者会话间的遗忘因子,以此计算会话间商品兴趣的衰减过程。因此,当消费者295193浏览至会话22时,已经历过21次兴趣衰减的过程。在数值上,会话22中消费者浏览商品的兴趣度如表4所示,而考虑会话间依赖关系的兴趣度权重如表5所示。

3.3 单会话购买意愿预测

表6表示的是不考虑会话间依赖,仅考虑会话22中消费者的点击数据下的多属性评价结果。从表6中可见,综合考虑PROMETHEEⅠ与PROMETHEEⅡ方法的评价结果,可以确定各方案的优异排序:商品75877>103652 >81462,而其他商品不存在严格偏好关系,代表了消费者在会话22中对其他商品存在着犹豫与对比的心理。其排序如图1所示。

但是,在会话22中,消费者真正购买的商品为103652,并非75877。这一点符合了Park等[27]的研究结论:在同一购物网站中的用户若停留的时间越长且浏览的页面越少,则越有可能购买,即:消费者在决策阶段总浏览频率会下降,而总浏览时长不变。因为消费者需要集中精神对意向产品进行比较。因此,仅凭消费者的购物会话数据较难识别消费者的真实购买意愿。因此,需要考虑会话间的依赖关系。

表2 会话22的累积兴趣度表Table 2 Cumulative interest table for session 22

表3 二级指标熵权值表Table 3 Table of initial entropy weights for secondary indicators

表4 考虑会话间依赖的会话22累积兴趣度表Table 4 The cumulative interest degree of session 22 considering inter-session dependencies

表5 考虑会话间依赖的二级指标熵权值表Table 5 Initial entropy weights of secondary indicators considering inter-session dependencies

表6 会话22的PROMETHEE决策法的样本流量值表Table 6 Sample flow value of PROMETHEE decision method for session 22

图1 会话22的商品购买意愿排序Fig.1 Sorting of product purchase intentions for session 22

3.4 考虑会话间依赖关系的购买意愿预测

表7表示的是考虑会话间依赖关系的消费者购买意愿预测结果。结果显示,消费者在会话22中浏览的商品呈现严格偏好关系,预测消费者购买意愿最高的商品103652为消费者最终购买的商品。

因此,通过考虑会话间依赖的多会话购买意愿预测方法考虑了消费者的全局信息,有利于进行商品推荐。

3.5 灵敏度检验

PROMETHEE-GAIA平面方法是Stewart[28]提出的对多属性指标体系评价结构的灵敏度分析方法。该方法通过利用主成分分析方法对决策分析方法进行降维分析,并使用方差极大旋转方法获得属性的最大分离。另外,本文GAIA图的绘制过程使用的软件为DecisionLab,并绘制图2与图3。

图2与图3中,方框代表的是商品,其中灰色方框代表消费者尚未购买的商品,红色方框中的商品103652为消费者在该会话中购买的商品。菱形的方框代表的是指标体系,不同颜色代表了不同的一级指标。其中,紫色的向量代表的是行为复杂度一级指标,蓝色的向量代表的是行为广度一级指标,绿色的向量代表的是行为深度一级指标。最后,红色的向量代表的是决策轴,即综合决策结果。最优决策方案(商品103652)与决策轴方向一致。

表7 考虑会话间依赖的会话22的PROMETHEE决策法的样本流量值表Table 7 Sample flow value table of the PROMETHEE decision method for session 22 considering inter-session dependencies

图2 指标体系未调整前的GAIA平面图Fig.2 The GAIA before adjustment of the indicator system

图3 行为深度一级指标调整后的GAIA平面图Fig.3 The GAIA after behavioral first-level index adjustment

从图3中可见,汇总后的行为深度(B3)指标与决策轴方向一致,行为复杂度(B1)偏斜程度减少,行为广度(B2)的偏斜程度基本不变。

从图2中可见,行为复杂度(B1)的指标向量与决策轴的偏斜程度最小,可见行为复杂度对消费者的购买行为预测性最强,行为广度(B2)次之。但是,行为深度(B3)的指标向量与决策轴的偏斜程度较大,而且点击时长与浏览时长分别位于决策轴的两侧。这说明了点击时长与浏览时长在数据上存在互补。另外,注意到消费者针对某些商品的浏览时长与点击时长为0,然而其浏览频率或点击频率较高。针对以上不合理的情况,本文对行为深度中的点击时长与浏览时长汇总为访问时长,并得到图3。

4 结论

本文提出了一个基于点击流与PROMETHEE多属性决策法的电子商务消费者兴趣评估与购买意愿预测模型,本模型主要分为2个步骤:(1) 对消费者点击流中的会话数据进行有效累计;(2) 使用PROMETHEE多属性决策方法测度消费者在每一个购物会话中对不同商品的购买意愿。最后,根据消费者的真实购买记录,验证了本方法的可行性与有效性。

本文主要从3个方面做出了贡献:

(1)传统的点击流消费者行为研究关注的指标比较单一。因此,本文在周翔学者的研究基础上,构建了一个完整的指标体系,并发现:行为复杂度,行为广度以及行为深度是衡量消费者购买意愿的重要因素。其中行为复杂度最重要,行为深度次之。另外,商品品牌也是消费者进行商品对比的重要指标,不同的消费者会对不同的品牌有不同的忠诚度。

(2)基于消费者点击行为的特点,选用PROMETHEE多属性决策方法中的偏好函数描述消费者在商品对比过程中的心理过程,通过不完全排序发现消费者兴趣度相似的产品,挖掘消费者的犹豫心理,使得消费者购买兴趣度研究更具有实用价值。

(3)本文以会话为划分点击流数据的基础,并说明利用点击流数据预测消费者购买意愿时,应该注意以会话为研究基础,动态汇总与识别消费者兴趣度的变化过程。针对消费者的每一次点击会话,都应预测其购买意愿,以识别消费者当前最感兴趣的商品并识别消费者最关注的商品属性。

猜你喜欢
会话复杂度排序
排序不等式
QQ和微信会话话轮及话轮转换特点浅析
恐怖排序
一种低复杂度的惯性/GNSS矢量深组合方法
节日排序
求图上广探树的时间复杂度
基于集群节点间即时拷贝的会话同步技术研究①
某雷达导51 头中心控制软件圈复杂度分析与改进
出口技术复杂度研究回顾与评述
年龄大小的种种说法