融合两阶段过程模型和改进Bass模型的网络社交平台上产品信息扩散研究

2022-02-16 08:46唐中君韩中亚
运筹与管理 2022年1期
关键词:发布者群体阶段

唐中君, 韩中亚

(北京工业大学 经济与管理学院 北京现代制造业发展研究基地,北京 100124)

0 引言

网络社交平台是产品信息的重要传播渠道。产品信息的扩散程度是衡量产品营销活动成败的关键[1]。目前,网络社交平台上产品信息存在投放多扩散范围小的问题,造成了大量的资源浪费。为了制定合理的营销策略,提升营销效率,节约营销成本,需要提前预测产品信息在网络社交平台上的扩散量,从而有必要提出并验证有效的产品信息扩散模型。

预测产品信息在网络社交平台上的扩散量至少需要考虑两方面特性。一是扩散过程及其影响因素。产品信息扩散包括制定转发决策和产生转发行为两个阶段;决策受转发动机的影响,不同的转发动机,决策阶段的影响因素也显著不同,从而对扩散过程的研究需要考虑转发动机对决策阶段的影响。二是产品信息在网络社交平台上的扩散周期短,扩散速度快,难以获取较多的自身历史扩散数据,传统的以时间序列为代表的预测方法难以有效预测产品信息在网络社交平台上的扩散量,需要建立因果模型。

文献中,未曾发现针对产品信息扩散的上述两阶段过程特性的研究,但有针对创新产品采纳(需求扩散)的两阶段过程模型。针对产品采纳的两阶段过程模型可分为消费者个体的两阶段采纳过程模型和消费者群体的两阶段需求扩散过程模型。关于前者,Kalish[2]从个体层面出发将采纳过程分为感知和购买两个阶段,分别考虑口碑和价格因素,在效用理论的基础上建立了一个两阶段采纳过程模型。关于后者,Chanda和Das[3]以多代高技术产品为对象,考虑营销和口碑因素对积极感知群体形成阶段的影响,并考虑价格因素对购买群体形成阶段的影响,构建了针对消费者群体的两阶段需求扩散过程模型;Dimara和Skuras[4]认为在不断更新换代的创新产品领域,感知阶段分为感知产品存在和评估产品信息两个阶段,应将两阶段采纳过程拓展为感知、评估和购买三个阶段。这些两阶段过程模型考虑了动机以外的其它影响因素,为产品信息扩散两阶段过程研究提供了借鉴,但未曾考虑动机;因此,有必要提出考虑用户转发动机的产品信息扩散两阶段过程模型。

未曾发现文献研究在网络社交平台上的产品信息扩散量预测的因果模型。用于预测的因果模型主要集中于产品需求预测领域。可用于产品需求预测的因果模型主要有联立方程模型[5]、Gamma模型[6]、Bass模型[7,8]。联立方程模型和Gamma模型未考虑用户决策过程,不便于考虑转发动机。Bass模型考虑了用户的决策过程[9,10],便于考虑用户转发动机。因此,选择该模型作为预测产品信息在网络社交平台上扩散量的基础模型。Bass模型在考虑消费者决策过程时,依据消费者制定决策时所用信息不同,将消费者分为创新者和模仿者;虽然便于考虑消费者的消费动机,但Bass模型没有考虑消费动机对决策过程的影响,没有从该影响对消费者分类。Bass模型假设模仿者所受的社会压力随着周围采纳者人数的增加而变大。产品信息在网络社交平台上的扩散过程不存在这样的正向社会压力增强效应,但是感知者对信息的转发兴趣存在衰减效应[11]。因此,需要对Bass模型进行改进。

未曾发现针对产品信息扩散,考虑用户兴趣衰减效应改进Bass模型的研究。一些文献针对新产品扩散,从消费者决策过程出发对Bass模型进行改进。其中,张旭等[7]基于口碑规模效应和比例效应改进了Bass模型。Lee等[8]考虑了从众效应和季节效应对消费者采纳新产品的影响,改进了Bass模型。唐中君等[12]考虑母电影对续集电影的溢出效应,基于Bass模型和三阶段过程模型,构建了续集电影需求扩散模型。文献主要考虑了从众效应,季节效应,口碑效应及品牌溢出效应等对产品扩散的影响,未曾考虑动机和兴趣衰减效应的影响。

本文在前述两阶段过程模型和Bass模型相关文献的基础上构建产品信息扩散模型。首先,考虑用户转发动机构建产品信息扩散两阶段过程模型。该模型包括用户个体和群体两阶段模型。然后,考虑用户兴趣衰减效应改进Bass模型。在此基础上,加入网络热度影响系数、明星效应影响系数、信息质量影响系数等变量,融合两阶段过程模型与改进Bass模型,提出产品信息扩散模型。接着,利用新浪电影2019年11至12月电影预告片转发数据验证模型的有效性,并与Bass模型进行对比。最后,对研究不足进行讨论。

1 产品信息扩散模型的构建

本节首先构建产品信息扩散两阶段过程模型,然后考虑产品信息在社交网络上扩散的兴趣衰减效应改进Bass模型,最后融合这两个模型,提出考虑用户转发动机和兴趣衰减的产品信息扩散模型。

1.1 产品信息扩散两阶段过程模型的构建

以往两阶段模型的构建多针对产品扩散,将产品采纳过程分为感知和采纳两个阶段,从消费者个体层面和群体层面分别考虑营销、口碑、价格等因素对产品扩散的影响。根据计划行为理论,在线网络用户在转发产品信息时存在意向-行为差距,转发信息过程可分为决策和转发两个阶段,考虑用户转发动机对决策过程的影响以及信息热度和产品信息质量对转发过程的影响,可以构建产品信息扩散两阶段过程模型。如图1所示,构建的产品信息扩散两阶段过程模型包括个体两阶段转发模型和群体两阶段扩散模型。

如图1(a),个体两阶段转发模型包括制定转发决策和产生转发行为两个阶段。在这两个阶段中,产品信息的感知者转化为潜在转发者,再转化为转发者。信息感知者是收到消息推送的在线网络用户,潜在转发者是具有转发意向,但尚未发生转发行为的用户,对同一条产品信息而言用户通常只转发一次。

在制定转发决策阶段,产品信息感知者转化为潜在转发者。因转发动机不同,对特定产品信息发布者而言,产品信息感知者分为粉丝型感知者和非粉丝型感知者。粉丝型感知者与产品信息发布者存在关注关系,因支持发布者而产生转发意向;非粉丝型感知者与发布者不存在关注关系,受网络中产品热度的影响产生转发意向。当产品信息发布者发布信息后,粉丝型感知者中的活跃粉丝会直接转化为粉丝型潜在转发者;非粉丝型感知者受到产品网络热度的影响,以一定比例转化为非粉丝型潜在转发者。

在产生转发行为阶段,潜在转发者会在信息热度、产品信息质量的影响下转化为产品信息的实际转发者。其中,信息热度指信息发布者对用户转发兴趣的影响力,它对应产品信息发布者的明星效应和潜在转发者的兴趣衰减效应;产品信息质量指产品信息中所体现出的产品质量,它对应产品信息中的产品属性质量。产品信息在网络平台上的扩散主要受到信息发布者明星效应、用户的兴趣衰减效应以及产品信息中的产品属性质量的影响[13,14]。其中,发布者明星效应指产品信息的发布者对用户的号召力;用户的兴趣衰减效应指用户对信息的转发兴趣随着时间衰减;产品属性质量指产品信息中体现出的产品各属性的口碑。

与消费者个体的两阶段模型相对应,如图1(b)是针对网络社交平台用户群体的产品信息两阶段扩散模型。其中两个阶段为产品信息潜在转发群体形成阶段和已转发群体形成阶段。各阶段的特点将在以下小结详细阐述。

图1 产品信息扩散两阶段过程模型

1.2 改进Bass模型

产品信息在社交网络平台上的扩散主要受到产品信息热度和产品信息质量两方面的影响,分别对应Bass模型中的外部影响和内部影响。然而,产品信息扩散过程中没有口碑信息的产生,并且信息感知者的转发兴趣存在衰减效应,需要对Bass模型进行改进。基于1.1的分析,我们作出以下假设:(1)产品信息在网络平台上的扩散受到产品信息热度和产品信息质量的影响。(2)产品信息热度的影响会随时间衰减。(3)产品信息质量的影响不随时间改变。参考文献[15],得到t时刻潜在转发者对产品信息的转发概率公式,具体见公式(1)。

(1)

式中,f0(t)表示产品信息在第时刻的转发速度,F0(t)表示t时刻产品信息的累计转发者数量占潜在转发者数量的比例,P0(t)表示t时刻还未转发产品信息的潜在转发者在t时刻转发产品信息的概率,p0表示产品信息发布者明星效应对用户转发行为的影响,q0表示产品信息质量对用户转发行为的影响,α为兴趣衰减参数。

对微分方程(1)进行求解,得到解析解式(2)。

(2)

结合式(1)和式(2),得到t时刻产品信息的转发者数量S0(t),具体见式(3)。其中,m0表示产品信息在社交网络平台上的潜在转发量。

S0(t)=m0(1-F0(t))P0

(3)

1.3 产品信息扩散模型的构建

基于图1(b)所示的群体两阶段扩散模型,可得图2所示的产品信息扩散模型的构建思路。该思路包括潜在转发群体形成以及已转发群体形成两个阶段。

1.3.1 转发潜量的形成

如图2所示,非粉丝、粉丝两类产品信息感知群体,以不同方式转化为潜在转发群体。因此,需要对这两种不同情形分别加以考虑。

图2 产品信息扩散模型的构建思路

(1)粉丝型潜在转发群体的形成

活跃粉丝感知群体M1是产品信息发布者关注者中的一部分,这类群体对发布者的动态非常关注,经常与信息发布者互动。本文假设活跃粉丝感知群体M1会全部转化为粉丝型潜在转发群体m1。

M1=m1

(4)

(2)非粉丝型潜在转发群体的形成

非粉丝型感知群体与产品信息发布者不存在关注关系,是网络中曾经转发过此产品相关信息的用户群体;产品网络热度表示网络中产品的关注度。考虑到非粉丝型感知群体向非粉丝型潜在转发群体转化具有时滞性[16],非粉丝型感知群体M2δ,由产品信息发布前δ时刻,网络中产品相关信息的转发群体直接转化而来。非粉丝型潜在转发群体m2由非粉丝型感知群体M2δ转化而来,转化过程受到产品网络热度β1(β1>0)的影响,β1越大,非粉丝型感知群体向非粉丝型潜在转发群体的转化数量就越多。非粉丝型潜在转发群体m2的关系表达式见(5)。

m2=β1M2δ

(5)

(3)产品信息潜在转发人数

产品信息的潜在转发人数m0由粉丝型潜在转发群体数m1和非粉丝型潜在转发群体数m2组成。由1.1小节可知,两类群体之间不存在交叉和相互转换的情况。从而产品信息发布者的潜在转发人数m0为:

m0=m1+m2=M1+β1M2δ

(6)

1.3.2 转发群体的形成

产品信息的潜在转发群体向转发群体转化的过程中受到信息热度和产品信息质量的影响,本文用信息热度系数和信息质量系数分别表示产品信息热度与产品信息中的产品属性质量对产品信息转发的影响。

(1)产品信息热度

①星效应明星效应指社会公众人物利用自身影响力为产品信息带来的关注度。产品信息发布者的明星效应越强,产品信息的转发数量就越多[17],因此产品信息发布者的选择对产品信息扩散极为重要。考虑到即使同一发布者,人们对其发布的不同类别产品信息关注度也不同,从而引入活跃粉丝转化率g(0

(7)

p0=β2g

(8)

式中M1表示发布者的活跃粉丝数量,n2表示发布者在一段时间内发布类似产品信息的总条数,ej表示第j条信息的转发量,β2为明星效应影响系数(β2>0)。

②兴趣衰减效应

用户对产品信息的兴趣源于信息的价值,信息对人的价值随着时间非线性衰减,所以用户对产品信息的兴趣随着时间非线性衰减[18]。参考文献[19],本文采用价值衰减函数γ(t)来体现用户对产品信息兴趣随时间衰减的特性,具体见式(9)。

γ(t)=e-αt

(9)

由式(7)和(8)我们可以得到产品信息热度系数R(t),具体见式(10)。

R(t)=p0γ(t)

(10)

(2)产品信息质量

产品信息的质量来自于信息中的产品属性质量,本文采用产品各个属性的口碑来表示产品信息质量,求得信息质量系数,具体见式(11)和式(12)。

(11)

(12)

式中n3表示产品信息中出现的产品属性数量,cj表示第j个属性的口碑评分,β3为信息质量影响系数(β3>0)。产品信息中表现出的产品属性的质量越好,产品信息质量对产品信息转发的影响就越大。

1.3.3 考虑用户转发动机和兴趣衰减的产品信息传播模型

综合(3)~(12)式,得到了产品信息投放前的,考虑用户转发动机和兴趣衰减效应的产品信息扩散模型,如式(13)所示。

S0(t)=(M1+β1M2δ)·

(13)

2 模型验证

2.1 数据获取

电影预告片在网络平台上的扩散是产品信息扩散的典型代表并具有独特性,新浪微博作为国内最大的娱乐平台是电影映前宣传的重要途径。本文通过Python对新浪电影2019年11~12月份的电影预告片转发数据进行全部爬取,共爬取到113部电影预告片转发信息,剔除数据不全、数据异常、数据量过少电影预告片48部,共得到65部电影预告片的转发数据。考虑到用户重复转发预告片的现象,对65部预告片数据进行除重,只保留用户第一次转发预告片的时间节点;考虑到人类的作息时间,将65部电影预告片中零点到七点的转发数据进行清除。通过新浪微博中的高级搜索和新浪娱乐指数收集65部电影预告所对应的网络热度数据、电影预告片质量属性数据。由于电影预告片的转发量会在发布后36~48个小时内迅速接近于零,因此本文只选取电影预告片发布后48个小时的转发数据。将60部电影预告片作为训练集,5部电影预告片作为测试集。

2.2 变量操作化

2.2.1 潜在转发群体形成阶段相关变量

(1)粉丝型潜在转发群体形成阶段相关变量

微博中粉丝型感知群体的活跃度随时间发生变化[20]。本文采用电影预告片发布者在一周内的最大活跃粉丝数量来表示的活跃粉丝型感知群体M1的数量,具体见式(14)。

M1=max{bj},j∈[1,n0]

(14)

式中n0表示一周内发布者发布的信息总数量,j表示第j条信息,bj表示发布者发布的第j条信息的转发量,bj越大表示发布者的粉丝群体越活跃,产品信息的粉丝型潜在转发群体数量越多。

(2)非粉丝型潜在转发群体的形成阶段相关变量

非粉丝型感知者来自网络中的非粉丝群体。本文采用电影预告片发布前6小时网络中电影历史信息的总转发数量表示非粉丝型感知群体M2δ,具体见式(15)。

(15)

式中n1表示初始时刻在线网络平台上此电影历史信息总数量,dj表示j条信息的转发数量。初始时刻电影历史信息的网络热度越高,非粉丝型潜在转发群体m2的值就越大。

2.1.2 已转发群体形成阶段相关变量

已转发群体形成阶段相关变量包括产品信息发布者的明星效应、产品属性的口碑以及兴趣衰减参数α。为了防止发布者明星效应值过小造成拟合误差较大,本文选取一周内发布者发布电影预告片平均转发量,并将其扩大100倍,具体见式(16);参考文献[21]将电影属性的口碑对应为导演、主演的评分,具体见式(17);兴趣衰减参数α由数据拟合得到。

(16)

(17)

其中,AC1、AC2、DI分别对应电影预告片中的男女主演和导演的新浪娱乐专业指数,考虑到一部电影预告片中可能存在多个男女主演的情况,本文在计算时选取专业指数最高的前两位主演。

2.3 验证结果分析

2.3.1 参数估计结果分析

表1 参数估计结果及显著性检验

基于训练集的拟合优度R2=0.9575,模型的拟合结果非常好。根据表1,产品网络热度系数β1值极小,说明预告片的非粉丝型感知群体中只有较小的比例会转化为非粉丝型潜在转发者;但是β1在p=0的水平上显著,说明非粉丝型潜在转发群体对预告片的转发量具有较大的贡献,这与现实情况相吻合。在电影预告片投放的初始时刻,微博中存在大量与此电影相关的信息,这些信息的发布者构成了电影预告片信息的非粉丝型感知群体,由于非粉丝型感知者的数量非常多,因此,虽然转化比例β1很小,但是其对结果的影响很大。明星效应影响系数β2在p=0的水平上显著,说明受到明星效应影响而转发预告片用户的数量占总转发数量的比重很大;β2>0,说明信息发布者的活跃粉丝转化率与其明星效应成正比,信息发布者的活跃粉丝转化率越高,发布者对此产品信息的明星效应就越强。信息质量影响系数β3在p=0的水平上显著,说明受到预告片质量影响而转发预告片用户的数量对总转发数量的贡献很大;β3>0说明电影预告片中的主演和导演口碑与预告片的质量成正比。兴趣衰减参数α>0,说明受到发布者明星效应而产生转发兴趣的用户,其转发概率随预告片的发布时间迅速衰减。

2.3.2 测试集拟合精度对比

由于测试集电影预告片与训练集电影预告片来自于同一网络平台,因此本文假定兴趣衰减参数和网络热度影响系数不发生改变。根据上述参数估计结果,针对5部电影预告片进行预测,并以Bass模型作对比模型,检验本文提出的模型,其中Bass模型的参数由预告片历史数据拟合得出。以下分别从电影预告片的潜在转发量,拟合优度,单位时间转发量进行对比。

(1)电影预告片潜在转发量预测精度比较

根据式(4)和表1中的参数,可得到测试集中5部电影预告片的潜在转发量,所建模型与Bass模型预测结果对比如表2所示。由表2可知,Bass模型预测的转发数量远低于实际转发数量,所建模型预测的转发数量略高于实际转发数量,并且相对误差远低于Bass模型,因此所构建模型比Bass模型更适用于本文所提出的场景。

表2 测试集电影预告片转发潜量预测结果

(2)拟合优度对比

由于Bass模型与本文所建模型都属于非线性模型,因此本文采用非线性拟合优度公式(18)比较两个模型的拟合优度,对比结果如表3所示,所建模型与实际数据的拟合优度优于Bass模型。

表3 拟合优度对比

(18)

(3)单位时间转发量预测精度对比

将表1中的参数和表2中的潜在转发量带入式(13),得到电影预告片单位时间转发数量。本文模型与Bass模型单位时间转发量预测结果对比如图3所示,相应的预测精度如表4所示。

表4 电影预告片单位时间转发量预测精度对比

图3(a)《半个喜剧》12月6日

图3(b)《被光抓走的人》12月11日

图3(c)《急先锋》12月5日

图3(d)《南方车站的聚会》12月9日

图3(e)《唐人街探案3》12月5日

由图3可知,电影预告片在投放初始时刻转发数量最大,投放6小时之后转发量迅速下降,18~24小时后转发量平稳在较小数值。与Bass模型相比,所建模型能更好的预测预告片转发量的变化趋势,对于电影营销人员选择电影预告片投放平台,以及制定后期的营销计划具有指导意义。

由表4可知,本文所建模型的均方根误差RMSE和平均绝对误差百分比MAPE均小于Bass模型,说明本文所建模型比Bass模型更适用于预测电影预告片信息在社交网络平台上的转发量。

2.3.2 影响系数对比分析

表5给出了测试集预告片电影的明星效应系数、信息质量系数以及内外部影响系数。根据表5,Bass模型中5部电影预告片的外部影响系数p值到达上界,内部影响系数q值到达下界,说明在原Bass模型的假设条件下,潜在转发用户主要受到外部影响的作用,内部影响可以忽略不计,这与现实情况不相符。本文所提出的模型中5部电影的明星效应系数p0和信息质量系数q0均在合理范围内,并且p0>q0,说明潜在转发用户在电影预告片发布的初始时刻主要受到发布者明星效应的影响,随着预告片发布时间的变长,明星效应对潜在转发用户的影响越来越小,电影预告片质量的作用越来越大,这与现实情况相吻合,验证了本文模型的合理性。

表5 测试集电影预告片影响系数对比

综合上述预测参数分析,拟合优度对比,预测精度对比,影响系数对比四个方面的结果,得到以下结论:(1)产品信息发布者的最大活跃粉丝数量、产品网络热度、产品信息发布者明星效应、产品信息质量、用户的兴趣衰减参数是影响产品信息转发的关键变量,其中信息发布者的最大活跃粉丝数量、产品网络热度、信息发布者明星效应、产品信息质量与产品信息转发量正相关,用户的兴趣衰减参数与产品信息转发量负相关。(2)发布者发布的类似历史信息平均转发量与发布者的明星效应正相关,产品信息中的产品属性质量与产品信息质量正相关。(3)本文所提出的模型在拟合优度和预测精度上均优于原Bass模型,能更好的预测产品信息在社交网络平台上的扩散量。

3 结论

产品信息在社交网络平台上的扩散具有不同转发动机,兴趣衰减效应,缺乏自身历史扩散数据的特点。结合这些特点,对产品信息在社交网络平台上的转发量进行预测,有利于商家合理地配置营销资源,提升营销效率,具有重要意义。目前未曾发现考虑用户转发动机和兴趣衰减的产品信息扩散研究。

本文考虑用户转发动机构建产品信息扩散两阶段过程模型;考虑产品信息在社交网络平台上扩散的兴趣衰减效应改进Bass模型;融合该过程模型和改进Bass模型,考虑信息发布者明星效应、产品信息质量对产品信息扩散的影响,构建了考虑用户转发动机和兴趣衰减的产品信息扩散模型。收集新浪微博官方电影宣传平台——新浪电影的预告片转发数据验证该模型,并与Bass模型进行对比分析。

验证和对比分析结果表明,本文所构建模型在转发潜量估计,拟合优度,预测精度等方面均优于Bass模型。相比Bass模型的整体潜量预估,所建模型依据用户转发动机的不同将潜在转发群体分为粉丝型和非粉丝型两类,提高了预测准确度,表明用户转发动机对产品信息扩散有显著影响。与Bass模型相比,所建模型考虑了用户对产品信息的兴趣衰减效应,更加适用于描述产品信息在网络平台上的转发特点,其预测结果更为准确,表明用户兴趣衰减效应对产品信息扩散均有显著影响。Bass模型需要自身历史数据确定模型参数;本文模型的明星效应和产品信息质量分别通过信息发布者最大活跃粉丝数量、类似历史信息平均转发量和产品属性口碑进行量化,这三者都可在产品信息发布前获取,从而所建模型能够实现在产品信息投放前期和早期对转发量的预测。总之,Bass模型适用于具有自身历史数据的长生命周期产品;本文所构建的模型考虑了用户转发动机和兴趣衰减效应,能够实现在产品信息投放前期和早期对转发量的预测,预测结果和可解释性均优于Bass模型,因此本文所构建的模型是对Bass模型的拓展。

本文考虑用户转发动机和兴趣衰减提出了产品信息扩散模型,并得到验证,但仍然存在不足。首先,在信息感知群体转化为潜在信息转发群体阶段,没有考虑同一产品历史信息转发者的转化。其次对潜在转发群体转化为实际转发群体阶段,本文假设动机不同的两类潜在转发群体所受的影响相同,没有分别加以考虑。这些不足有待进一步研究。

猜你喜欢
发布者群体阶段
关于基础教育阶段实验教学的几点看法
新加坡新法规引争议
通过自然感染获得群体免疫有多可怕
在学前教育阶段,提前抢跑,只能跑得快一时,却跑不快一生。
“群体失语”需要警惕——“为官不言”也是腐败
软件众包任务发布优先级计算方法
基于博弈论的社交网络转发控制机制
大热的O2O三个阶段,你在哪?
两岸婚恋迈入全新阶段
Luminate—“给图片用的AdSense”获1070万融资