在线付费阅读中群体感知价值差异研究*

2022-09-24 03:59王晓光
信息资源管理学报 2022年4期
关键词:意愿区间阈值

姜 崇 王晓光 简 华

(武汉大学信息管理学院,武汉,430072)

1 引言

伴随信息与通信技术(Information and Communication,ICT)的发展,不同领域在世界范围内加速数字化转变,进入数字时代。在数字技术的驱动下,以数字媒介为载体的数字阅读也在打破以纸张为载体的传统阅读模式的格局,促使读者阅读习惯、阅读方式和阅读场景随之变化。与纸质阅读相对,数字阅读是基于数字文本知识和数字媒介信息获取的一种阅读活动和文化现象[1]。数字阅读作为全新的信息获取方式和知识接受行为正在深刻改变现代生活方式。

伴随数字阅读的普及,数字阅读实体产业发展的需要、知识产权保护意识的增强、读者个性化高质量阅读需求的增长、人们对精神层面需求的增加等催生了数字阅读付费。付费阅读满足读者阅读需要,并以消费为前提,是尊重知识产权的表现。由于内容质量与收费不匹配、内容定价过高、早期互联网资源免费促使人们形成免费意识、公众知识产权意识薄弱等原因,我国国民数字阅读总体付费意愿偏低[2-3]。因此,付费意愿成为数字阅读研究集中关注的焦点之一,而感知价值则是影响付费意愿至关重要的因素。

感知价值是用户将所能感知到的利益与其在获得产品或服务时所付出的成本对比权衡后,对产品或服务效用的总体评价。由于不同阅读用户在认知结构、心理需求、社会价值观、知识体系和信念态度等方面存在很大差异性,阅读用户依据主观判断和知觉事物对其作出反应,造成行为决策差异化,导致付费意愿影响因素作用于不同阅读用户的影响程度大相径庭。因此,本文选择在线阅读平台付费阅读用户为研究对象,结合用户感知价值差异性,对用户进行分群,并从群体感知价值的角度出发,以量化的方式分析不同用户群体感知价值的差异。

2 相关研究

数字阅读作为新的阅读形式出现意味着社会的变革和文化的重构,以知识获取、信息搜寻、文化娱乐等为目的的读者行为构成了数字阅读的重要内容,而数字阅读付费对阅读意愿的制约与阻碍逐渐成为不容忽视的问题。因此,众多学者围绕跨媒介电子书、网络文学、知识付费社区等应用场景对知识付费、文化消费、支付意愿、付费行为等相关问题展开研究。

中国网民规模在2020年12月达9.89亿,手机网民规模达9.86亿[4]。2020年,中国成年国民数字化阅读方式的接触率达到79.4%[5],而中国电子书市场规模则是达到351.6亿元,用户规模接近4.94亿,其中86.3%的用户愿意为电子书付费[6]。藉由用户基数激增、支付方式变革、精神层面需求增加、信息过载、市场机制的推动以及用户付费意识的提高等原因,国内付费数字阅读出现了诸如打赏/赞赏、付费社群、付费问答等多种模式[7]。徐芳等[8]通过对比分析掌阅、QQ阅读、咪咕阅读、书旗小说和百度阅读五大主要移动阅读APP的付费模式认为,多元化付费方式、完善付费模式评价反馈机制以及开发高质量的内容产品,有助于进一步促进付费阅读的发展。数字阅读付费发展潜力巨大,但受限于产业规模,优质内容供给不足,发行平台的枢纽作用发挥不充分等原因,读者付费阅读意愿与阅读满意度有待进一步提升[9]。因此,用户付费阅读意愿的影响因素成为学者研究的重点。罗晓兰等[10]认为,借助社交媒体的社交影响所产生的分享阅读行为有助于促进阅读推广,知识焦虑则进一步激发用户知识付费意愿[11],以兴趣和情感为核心的网络社群聚合所诞生的网络阅读圈群,从用户的认知盈余空间切入,通过互联网知识共享平台向知识需求方分享知识的现象也恰好印证这一结论[12]。Bapna等[13]也证明人与人之间的关系可以通过主观规范影响付费意愿。说明在以内容为核心的前提下,社交关系有利于促进用户为阅读付费[14]。虽然这种类似“部落化”的方式有利于付费阅读的实现,但用户作为主观能动性的主体,用户的个体特征与生活方式[15]是付费意愿的出发点,用户的异质性在提升用户消费目标的过程中起到了关键作用[16]。Punj[17]通过调查发现,用户年龄、性别[16]都会对付费行为产生影响。大学生群体作为数字阅读的主流群体,付费意愿不仅受年龄和性别的影响,其他因素还包括学历、专业、家庭居住地、学校层次、生活费用、数字阅读历史、数字阅读时长等[18-19],而在心理层面,长久形成的免费心理所形成的心理惯性也可能是一种影响付费意愿的原因[20],其他诸如态度[21]、兴趣[22]、人格特征[23]同样可能影响用户的付费意愿。

虽然付费意愿影响因素众多,但已有研究发现,用户的感知价值直接影响用户对在线内容的购买意愿,并将用户的感知价值作为购买在线内容或服务的主干影响因素[24-25]。在移动商务环境下,用户感知价值对冲动性消费具有显著直接影响[26],调节并影响着用户消费动机和消费意图的形成[27],Liu等[28]通过实证表明,感知价值和用户间的互动共同增加了用户的消费意愿;在娱乐消费领域中,感知价值作为中介因素能够调节用户对知识产权电影的观看意愿[29];在移动社交媒体领域,感知价值通过强化用户网络自我形象表达与购买意愿之间的传导机制[30],显著正向影响用户的态度与预期满意度,从而影响调节用户网络口碑行为[31]。Kuo等[32]也证明了感知价值会对用户满意和购后意愿均产生正向影响。感知价值理论[33]最早由美国学者Zeithaml于1988年提出,感知价值有四层含义:①价值就是低廉的价格;②价值就是顾客想从产品中所获取的东西;③价值就是顾客付钱买回来的质量;④价值就是顾客的全部付出所能得到的全部,包括在时间、金钱和努力方面的付出。价值代表了效用(收益)与成本(代价)间的权衡,顾客会根据自我感受到的价值作出购买决定。Eggert等[34]在研究中指出,感知价值是消费者进行购买行为的主要驱动力,相比消费者的使用满意度更能激发购买行为[35]。价值感知也是用户在金钱与时间支出决策时的关键影响因素[36],甚至影响用户的情绪响应[37]。相关评论者的意见也会对用户付费决策产生正向影响[38],用户会通过感知有用性、认知需求等主观感受和所能获取到的实际效用进行博弈平衡,若期望与购买后的认知差距形成期望不确认,会直接影响消费者购买的意愿和行为[39]。

在多数情境下,用户对价格的感知更为直观,即Zeithaml感知价值理论的第一层定义,即价值就是低廉的价格。在阅读场景下,用户读书获得阅读内容的满足感,这一过程用户付出的成本是时间与金钱,符合Zeithaml感知价值理论的第四点定义,感知价值与感知成本之间的平衡则持续性影响用户的后续使用意愿[40]。因此,本文将感知价值狭义定义为感知价格与感知成本之间的平衡。Kim等[41]通过对比日本移动互联网和固定互联网下的消费者行为差异发现,感知价格是影响用户付费意愿的重要因素。随着知识付费同质化现象产生,用户对价格变得更为敏感[42-43],根据需求和用户个性特征进行个性化的在线定价方式逐渐流行,但这种动态定价策略往往会导致用户感知不公平,用户的付费意愿也会受到负面影响[44],研究表明,动态价格条件下用户感知价格公平感、付费意愿都较低[45],通过价格框架可以一定程度降低动态价格对用户付费意愿的负面影响[46]。

综上所述,学者更多从用户付费意愿影响因素角度出发,通过质性研究方式探寻不同影响因素对用户付费意愿的影响作用与机理研究,感知价值作为主干影响因素,对其研究主要集中于对价格和定价公平相关的定性分析。虽然众多研究都已证明感知价值对促进数字阅读付费起到显著正向影响,但针对感知价值影响程度具体大小,以及在不同人群中这种影响程度的一致性和差异性却鲜有研究。为从定量的角度研究用户群体间感知价值的差异性,本文研究设计思路为,首先考虑用户个体在个人属性与社会属性的差异性必然存在,但以用户个体为研究对象,研究规律缺乏普遍适用性,且以用户个体为单位计算感知价值会在现实应用场景中增加计算负担,降低效率。其次,用户个体之间虽然存在差异性,但个体之间的相似性也会构成用户群体并表达群体特征,用户个体对自我与他人的定义会对经济、社会和资源分配产生影响,区分为“我们”和“他们”,这是社会认知的基本方面[47],因此社会群体的形成是天然存在,并具备了去人格化的特征,也不可避免地出现群体间的差异与对抗现象[48]。因此,借助无监督聚类方式可以结合用户个人属性与社会属性的相似性将整体用户分成若干用户群体,通过分群的方式可以从分析个体微观差异转变为探讨以群体为单位的群体中观差异性的研究。最后,根据每个用户群体内用户数据来构建符合该群体特征的若干用户群体模型,比较用户群体模型之间的差异性,能够反映出用户群体之间所呈现的群体差异性,而非个体性差异。这不仅有利于从群体角度对用户行为进行群体建模,减少计算工程量,还可以针对不同群体所形成的用户模型,有针对性地对该群体拟定更契合高效的推荐营销策略。因此本文结合付费意愿影响因素,以在线阅读用户真实的付费行为数据为基础,定义感知价值并量化指标,对用户群体进行聚类并采用M5模型树数据建模,实证不同用户群体感知价值的差异性。

3 阅读用户群体聚类

用户在数字阅读过程中留下真实付费行为记录,是挖掘用户行为的宝贵资源。通过对真实付费行为数据的挖掘分析,对拥有相似付费行为和相似特征的用户群体的研究则可以从群体层面探寻群体行为模式,实现群体中观层差异化付费服务。相比通过调查问卷和访谈方式获得的数据,真实行为数据不会受到被调查者的主观影响。

3.1 数据来源

在线阅读中,网络文学、小说、电子书阅读是读者主要选择,本文的研究数据来源于追书神器APP在线阅读用户真实付费行为数据及用户数据,总计84694条。为保护用户隐私,全部数据均已进行脱敏和隐私保密处理。本文的研究目标是挖掘真实付费用户在阅读付费中的群体行为模式,探寻数据中隐藏的现象规律,目的在于强调用户群体的感知价值差异。

3.2 数据特征说明

首先,大量研究表明,用户的统计特征,包括用户性别(女性比男性更愿意付费[49])、网龄结构(年轻群体比中老年群体更愿意付费)、历史阅读经验(阅读经验更丰富比阅读经验较浅用户更愿意付费)等对付费意愿有着正向促进作用,阅读用户本身的个体因素特征对付费意愿具有很强的稳定性。

其次,本文研究重点是探讨感知价值在用户群体中的差异性,特征选择应围绕价值获取与消耗,以及影响价值获取与消耗的相关因素。因此,从消耗性特征、操作性特征和阅读性特征三大维度五个小类定义选择用户特征。在线阅读需要支付阅读虚拟币,虚拟币的消耗是产生周期性付费的前提。用户阅读的兴趣影响书籍检索与收藏行为,反映阅读用户内在精神需求的期望,促使阅读行为增加发生付费行为。内容质量是吸引用户为内容付费的根本驱动力,网络文学的持续更新与阅读用户追踪阅读直接导致阅读付费的发生和虚拟币的减少,推动阅读用户产生周期付费行为。

最后,价格作为感知价值的核心内容,针对不同的用户进行差别性定价,当用户通过对比历史价格发现当前定价存在不公平,将会影响用户付费意愿。由此阅读服务平台会通过优惠、折扣等形式促使用户产生付费意愿。但通过对感知价值的四层含义的理解,简单以价格来替代感知价值是片面的。因此本文对感知价值的量化定义如下:

Zeithaml的感知价值理论首先认为价值就是低廉的价格,用户付出的货币数量即感知价格在完成付费行为后,会变为感知成本。同时价值还包括从服务或产品中获取的东西或购买到的质量。用户在付费行为中收到阅读服务平台的比例回赠,获得较之付出价格更多的虚拟货币数量,是用户直接获得的附加利益,不同的付费价格获取的回赠收益不同。用比率的方式构造感知价值,可以表达用户付费与收益之间的博弈,在一定程度体现感知价值的内涵。与此同时,由于用户在付费行为中能够直接感知到价格和回赠收益,但价格与回赠收益之间的比率则是隐性的,用户凭借感觉与约束条件来选择策略,借助上述公式,量化表达了用户对付费行为决策的感觉属性。具体的特征说明见表1。

表1 特征选择与说明

3.3 数据集筛选

为保障研究的有效性,引入用户付费周期区分用户活跃度。选取用户行为数据时间跨度为10日,章回小说更新周期一般以日为计算单位,当用户在整个数据覆盖的时间周期内没有发生任何付费行为(付费小说内容需要发生付费行为才能阅读),则认为用户阅读行为不活跃,因此当用户付费周期超过10日即定义为不活跃用户。选择10日作为活跃度区分界限的原因为,首先受限于数据源本身时间跨度的客观影响,需要在时间跨度内做出活跃度区分,同时当用户付费为0则无法对其进行回归分析。其次,在章回小说以日为更新周期的现代社会环境下,连续10日没有发生付费行为进行付费阅读,从主观经验判断也并不属于付费活跃用户,具有一定现实原因。

为避免付费周期与感知价值之间存在相关性而影响对用户活跃度的区分,对感知价值(R)与付费周期(rechargetime)进行相关性检验,结果显示,Pearson(R,rechargetime)=0.11,Spearman(R,rechargetime)=0.24,Kendall(R,rechargetime)=0.199。从三项相关性系数检验可以看出,感知价值与付费周期的相关性较差,特征间相互独立,可以作为数据集合的筛选条件,区分活跃用户与不活跃用户。最终获得活跃用户付费行为数据31358条,不活跃用户付费行为数据53336条。

对不活跃用户付费行为数据进行分析发现,用户感知价值R均为0,同时在10日内没有发生付费行为。说明用户在早期购买虚拟货币时没有获得任何回赠,在阅读内容以日为单位更新的前提下,10日内无付费也可以反映用户阅读的积极性弱,消费意愿低。

不活跃付费用户本身形成一个用户群体,即由于用户对付费服务、感知价值等方面存在不满而拒绝再次付费的群体,存在付费用户流失的可能性。从统计结果看,活跃用户明显少于不活跃用户,一定程度反映该平台用户重复付费意愿较低、用户对付费服务的满意度和感知价值较弱,亟待改善。同时也反映通过对活跃用户群体感知价值差异性的研究来分析用户行为模式,从而改善付费服务策略,将活跃用户与不活跃用户比例正向转变的研究必要性。由于不活跃付费用户行为数据的R值均为0,无法对其进行回归分析。因此,文章选择活跃用户付费行为数据31358条来作为用户感知价值差异的研究数据。

3.4 用户聚类

本文采用K-means聚类算法,对活跃付费用户进行聚类。聚类模型的目标是将数据集中的样本划分为多个不相关子集,每个子集形成一个簇,聚类的结果希望簇内样本相似度高,簇间样本相似度低。在实际应用中,K-means算法[50-51]是最为常用的聚类算法之一,同时聚类结果往往具有显著成效。K-means算法在最小化误差的基础上将数据划分为预定的簇数K,采用距离作为相似度评估,通过选取的K个初始聚类中心,计算各样本与各聚类中心的距离并将样本分配给距离样本最近的簇,并利用加权平均值重新计算簇的聚类中心,通过迭代计算优化聚类结果,该过程在满足设定条件时终止。利用簇Ei(i=1,2,...k)的形心ei代表簇,用dist(x,ei)表示x∈Ei与簇中心ei之差,计算公式如下:

(1)

使用误差平方和SSE作为度量聚类质量的目标函数,表示簇内样本围绕簇中心的紧密程度。SSE越小,组内样本相似度越高。连续属性的SSE计算公式如下:

(2)

(3)

采用表1中用户个体因素、消耗性特征、操作性特征和阅读性特征四个维度的子类特征作为付费用户聚类模型使用特征。通过多轮实验发现,K值选择3时,聚类的效果最好,通过PCA主成分分析降维对聚类结果进行可视化,聚类结果见图1和图2。图2的坐标轴反应主成分特征主要为用户阅读消耗速率(currency_expend)=0.73,用户经验(exp)=0.269。通过K-means聚类算法将用户聚类为三个聚簇。

图1 用户聚类结果图

图2 用户聚类PCA降维分析图

3.5 用户群体定义

聚类算法将用户分为A、B、C三个聚簇,A类聚簇采用红色符号“.”表示,B类聚簇采用绿色符号“o”表示,C类聚簇采用蓝色符号“*”表示。A类聚簇数据21013条,B类聚簇数据10139条,C类聚簇数据206条。根据聚类特征对数据进行统计分析,经过对比分析发现,用户性别(gender)、用户付费价格(total_amount)、用户等级(Lv)、用户经验(exp)对用户群体具有较强的区分度。

根据统计分析结果发现,A类群体用户等级在4—8级,阅读资历较浅,付费价格集中在4—8元,男女比例均衡,需要服务平台发展培养,定义该群体用户为发展型阅读群体;B类群体用户等级在8—10级,用户阅读经验丰富,付费价格重心向高价移动,高价付费上限提高,占比数量提高,男女比例中男性占比提高,说明用户对服务平台已经产生使用习惯和信任感,定义该群体用户为成熟型阅读群体;C类群体用户等级辐射范围最广,但从经验值角度看,用户的阅读资历与A类群体相近,但该群体可以接受的价格上限更高,在75元到100元的充值用户最多,男女比率差异巨大,作为初入服务平台的新用户直接接受高价付费,行为偏向激进,定义该群体为激进型阅读群体。如表2所示。

表2 聚簇特征统计分析表

4 用户群体数据建模

4.1 数据预处理

异常值处理。在三类子集数据集合中,由于阅读服务平台开展优惠活动,出现付费1分钱,获得回赠50元高价值虚拟货币的特殊活动,从而出现离群点数据,且该数据属于特殊场景下数据,不利于本文对常态化感知价值的量化分析,因此作为异常值处理。处理方式采用人为提高付费价格,将1分钱修改为1元钱,从而将该类数据的度量缩小100倍。通过该方式处理,异常值可以回归到正常的付费范围中,同时又处于付费范围中边缘区域。经统计,A类21013条数据集中处理该异常值共599条,B类10139条数据集中处理该异常值313条,C类206条数据集中处理该异常值4条。

标准化处理。在选择的特征变量中,用户等级、用户周期收藏书籍数、用户周期检索次数、用户追更阅读比例五个特征的数量级与用户经验值的数量级相差较大,需要进行标准化处理,将用户经验值数据处理为0—1之间,避免低数值的特征权重受到压缩。

4.2 M5模型树建模

本文研究的目标在于实证不同阅读用户群体的感知价值的差异性,并希望准确计算出不同群体感知价值的阈值范围。M5模型树可以同时实现分类与回归思想,不仅可以对用户个体进行区分,也可对连续性数值进行回归计算,因此选择M5模型树对用户群体数据集进行建模。

M5模型树由Quinlan[52]提出,它基于二叉决策树,在末端(叶子)节点采用一系列线性回归函数,建立输入与输出变量之间的关系,因此可以用于定量数据。M5模型树生成需要两个不同阶段,第一阶段,将数据分成子集并假设将到达节点的类值的标准差作为该节点处误差的度量来创建决策树,计算作为在节点处每个属性结果的预期误差减少程度,用标准偏差减少(standard deviation reduction,SDR)[53]表示,定义如下:

(4)

其中T、Ti和SD分别表示到达节点的实例集合、具有潜在集合的第i个结果的实例子集和标准偏差。由于拆分过程,子节点中的数据的标准差变得比父节点的标准差更低。在扫描所有可能的分割后,M5模型树选择最大限度地降低预期误差的模型树[52]。第二阶段,为避免树结构复杂,泛化能力减弱,对过长的树进行树剪枝,并用线性回归函数替代子树,从而为每一个子空间建立线性回归模型。

本文将用户付费总量作为预测变量,将其余变量作为参数,训练预测模型。从相关性系数、平均绝对误差、标准差、相对绝对误差、相对均方根误差指标来判别算法构建模型的优劣。分别对A、B、C三类群体用户群体数据集合建模。

图3、图4、图5分别为A(发展型阅读群体)、B(成熟型阅读群体)、C(激进型阅读群体)三类用户的M5模型树结构图。

图3 A类用户群体M5模型树结构

图4 B类用户群体M5模型树结构

图5 C类用户群体M5模型树结构

分别针对三类用户的模型树进行分析,在A类用户模型树与B类用户模型树中,感知价值R对付费总量产生正向影响的叶子节点线性回归方程为LM13(A)、LM14(A)、LM7(B)和LM8(B),见表3,线性方程详细信息见附录。由于C类用户数据集有限,模型树中未产生正向影响叶子节点的线性方程,在后续的分析中会对这一类群体进一步分析说明。

表3 A、B模型树正向影响叶子节点线性回归方程

分别采用A、B、C三类模型树进行预测分析,预测结果见图6、图7、图8。横坐标为用户付费价格真实值,纵坐标为预测值,当预测值与真实值越接近,数据将越集中在对角线,预测效果最优。从预测效果图可以看出,B类用户模型预测效果最优,A类用户模型预测效果次优,C类用户模型预测效果最差,这与C类用户本身的数据集较小有较大关联。

图6 A类用户群体预测效果图

图7 B类用户群体预测效果图

图8 C类用户群体预测效果图

对A、B、C三类用户M5模型树的算法效果进行对比分析,结果如表4所示。

表4 A、B、C三类M5模型树算法模型评估指标对比

4.3 用户感知价值差异性分析

根据三类用户群体的M5模型树的模型结构分析如下:

在A类用户模型树模型中,感知价值R对预测变量的正向影响子节点线性方程分别为LM13和LM14。其中,LM13位于感知价值R≤0.361区间,LM14位于感知价值R>0.361区间,同时根据LM15线性方程中感知价值R对预测变量成负向影响,且LM15处于感知价值R>0.472区间,可以认为当感知价值R超过0.472时,感知价值R对预测变量的影响效果开始呈现负向影响。因此,A类用户群体感知价值区间初步确定为(0,0.361]、(0.362,0.472]。

在B类用户模型树模型中,感知价值R对预测变量的正向影响子节点线性方程分别为LM7和LM8。LM7位于感知价值R≤0.372区间,LM8位于感知价值R>0.372区间,同时LM9线性方程中感知价值R对预测变量开始呈现负向影响,且LM9位于感知价值R>0.722区间,因此,B类用户群体感知价值区间初步确定为(0,0.372]、(0.372,0.722]。

由于C类用户模型树模型中,所有子节点线性回归方程中感知价值R对预测值的影响都是负向影响,因此暂时无法确定准确的感知价值区间。同时,C类用户数据模型在进行评估指标评估中,各类评估指标较差,模型的有效性也较差。这与C类用户数据量不足有很大关系,需要采取其他方法来确定C类用户感知价值区间。

4.4 数据验证及阈值边界

M5模型树的模型结构初步确定不同用户群体的感知价值的阈值区间,但只能确定单边边界,同时还需要保证边界的有效性,因此需要新的方法来确定阈值区间的另一侧边界。

当用户感知价值获得满足时,直接的行为是付费行为,不同感知价值下的用户付费订单量反应了用户对感知价值的满意度。同时,用户付费订单量的分布曲线可以确定用户对感知价值的峰值点,借助峰值点对用户群体感知价值的阈值区间加以约束,从而确定另一侧边界,最终获得不同用户群体的感知价值阈值区间。

图9为对感知价值R与用户付费订单分布折线图按坐标尺度缩放后的分布折线图,从中可以看出存在多个峰值,说明面对不同的感知价值,用户进行付费行为是存在决策差异的。图10、图11、图12分别为A、B、C三类用户群体感知价值与用户付费订单量分布图。对比三类用户折线图分布情况存在较明显差异。在感知价值在(0,0.5)区间内,A类用户与B类用户的分布折线相似,但在(0.5,3)区间内,A类用户依然存在多个峰值点,而B类用户不再有相应峰值点。C类用户由于数据量有限,可以发现在(0,0.5)之间趋势先下降,只存在一个峰值。

图9 感知价值R与用户付费订单量分布图

图10 感知价值R与用户付费订单量分布图(A类)

图11 感知价值R与用户付费订单量分布图(B类)

图12 感知价值R与用户付费订单量分布图(C类)

通过感知价值订单分布图可以直观对比不同用户群体感知价值存在差异性,但无法确定感知价值阈值区间的边界。因此绘制感知价值R与用户付费订单量分布列表,从而进一步确定阈值边界。如表5所示。

表5 感知价值与订单量分布列表

P_N代表总数据中与感知价值R对应的订单数量,P_N(A类)、P_N(B类)、P_N(C类)分别代表A、B、C类用户数据集合中与感知价值R相对应的订单量。R_A、R_B、R_C分别代表A、B、C类用户M5模型树中根据线性回归方程获得的感知价值R的阈值边界。表5中加粗标记的数值与每一类用户感知价值订单分布折线图中峰值点对应。

在R_A一列中,LM11与LM12所在的边界范围内存在两个峰值点,对应感知价值R=0.273和R=0.296,两个峰值点恰好存在于A类用户第一个阈值区间(0,0.322]内,由于LM11和LM12线性模型中感知价值R对预测值成负向影响,且从LM11向LM12变化过程中感知价值R的权重在减小,可以认为,感知价值R开始从负向影响向正向影响转变,因此重新界定A类用户的第一个阈值区间为[0.237,0.361]。在LM14的边界区间内,当感知价值R=0.396时同样存在一个峰值点,同时LM14线性回归方程中,感知价值R对预测值成正向影响效果,因此将两个区间进行融合,最终获得A类用户群体的感知价值阈值范围为[0.237,0.472]。

在R_B一列中,LM4与LM5所在的边界范围内存在两个峰值点,对应感知价值R=0.273和R=0.296,两个峰值点同样恰好存在于B类用户第一个阈值区间(0,0.372]内,由于LM4与LM5线性模型中感知价值R对预测值预测不产生影响,但在事实数据中会产生峰值,因此重新界定B类用户的第一个阈值区间为[0.223,0.372]。在LM8的边界区间内,当感知价值R=0.3967时存在一个峰值点,在LM8的线性回归方程中,感知价值R对预测值成正向影响效果,因此将两个区间进行融合,最终获得B类用户群体的感知价值阈值范围[0.233,0.722]。

在R_C一列中,根据感知价值R的用户付费订单峰值点在R=0.396处,在C类用户M5模型树结构中并没有获取初始感知价值阈值范围,因此结合C类用户感知价值订单分布折线的趋势显示,C类用户群体的感知价值阈值范围推测至少应大于等于0.396,而上限的确定则需要更多的数据作补充。由于C类用户群体属于激进型阅读用户群体,同时受数据量限制,感知价值的阈值区间确定无法精准。

根据结果分析,A类用户感知价值的比率阈值范围[0.237,0.472]可以充分不必要的实现B类用户感知价值的比率满足,但B类用户会形成独立的区间[0.472,0.722]只对B类用户感知价值进行比率满足。同理,B类用户感知价值的比率阈值的子区间[0.396,0.722]能够实现C类用户的感知价值的比率满足,但当阈值超过0.722后,仅对C类用户群体产生积极作用。因此,每一类用户群体都会拥有独立区间仅对自我产生感知价值的比率满足,证明了群体感知价值的差异性。

5 结论

本研究在付费意愿影响因素的研究基础上,结合阅读用户个性化特点,采用K-means聚类算法,将用户群体分为发展型阅读群体、成熟型阅读群体和激进型阅读群体三类,并从感知价值的角度切入,结合感知价值理论,定义并构建了本文使用的感知价值指标,利用M5模型树算法对三类阅读用户群体进行数据建模,研究三类阅读群体的群体感知价值的差异性,并准确计算不同群体感知价值阈值区间。从用户群体的数据统计分析可以发现,在性别比例、用户付费价格、用户阅读经验方面存在显著差异。根据三类用户群体的模型树结构分析和用户付费订单的统计分析,确定发展型阅读群体(A类)的感知价值阈值区间为[0.237,0.472],成熟型阅读群体(B类)的感知价值阈值区间为[0.233,0.722],激进型阅读群体(C类)的感知价值在数据集合不足的情况下推测阈值范围应大于0.396。

本文在以往学者对感知价值研究主要关注感知价格和定价公平的基础上加入了反馈收益来量化感知价值,进一步拓展了对感知价值的研究范畴。在理论层面,本文不仅实证了感知价值对数字阅读付费行为产生的正向影响,同时借助真实的阅读付费行为数据对影响程度进行量化计算,从群体中观层面精确计算出不同用户群体感知价值阈值区间,通过定量研究实证了不同用户群体对感知价值的识别具有较大差异性,而且适用于不同群体的感知价值阈值区间存在着层次关系,进一步丰富了感知价值的研究内容和深度。在实践应用层面,针对个体进行计算建模不仅会增加计算工程,且个体产生数据体量小,难以构建足够精准的数据模型,导致数据模型数量巨大并难以有效控制与调整。本文利用个体间相似性进行分群,从群体层面对用户数据进行群体建模可以利用大量数据构建符合该群体的特征,并对比发现感知价值在不同群体中影响的差异性,精确的感知价值阈值区间有助于数字阅读服务平台结合不同用户群体来制定更具个性化和差异性的服务对策,以及促进用户付费的促销活动,实现收益提升。有限的群体用户模型利用大量相似用户数据做训练,能够保障模型的准确性和有效性,针对不同群体用户模型的优化与调整是相互独立且可以实时对比,更符合实际应用场景,具有较强的实践价值。

本文研究的局限性在于,随着数据集和聚类层级的变化,用户群体与阈值范围也会随之发生变化,受数据集大小与对用户活跃度的区分界限选择,导致激进型阅读群体(C类)的数据模型无法获得精准的阈值区间。未来的研究希望扩大数据规模并丰富数据特征,进一步分析激进型阅读群体感知价值的阈值区间,同时研究不同用户群体之间可能发生跃迁的影响因素,即如何促使发展型阅读群体用户转化为成熟型阅读群体用户,以及如何促使激进型阅读群体的付费习惯趋于稳定。本文的研究目的主要在于实证不同用户群体的感知价值是否存在明显差异性,实验的结果证实了这一假设,希望本文对相关研究起到抛砖引玉的作用,产生启发意义。

(附录链接地址:https://github.com/happyclame/Perceived-value)

猜你喜欢
意愿区间阈值
健全机制增强农产品合格证开证意愿
区间值序列与区间值函数列的收敛性
土石坝坝体失稳破坏降水阈值的确定方法
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
汪涛:购房意愿走弱是否会拖累房地产销售大跌
全球经济将继续处于低速增长区间
区间对象族的可镇定性分析
辽宁强对流天气物理量阈值探索统计分析
An Analysis on Deep—structure Language Problems in Chinese
一种改进的小波阈值降噪方法