眼动行为数据挖掘在提取网上购物决策因子中的应用

2014-04-08 07:53施笑畏黄瑶佳胡鸿韬宓为建牛延华
上海海事大学学报 2014年1期
关键词:实验者马尔科夫眼动

施笑畏, 黄瑶佳, 胡鸿韬, 宓为建, 牛延华

(1.上海海事大学 物流工程学院,上海 201306; 2.德马格起重机械(上海)有限公司,上海 201199)

0 引 言

随着互联网通信技术的迅速发展、电子商务规模的急剧膨胀以及近年来物流业的蓬勃发展,网上购物给顾客带来前所未有的便利,顾客足不出户就可分享到数以千计的商品和服务信息,并从中选择自己喜爱的商品或服务.但同时随着商品经济的繁荣,网络提供给客户的选择急剧增长,电子商务带来的便利性也被信息过载这个新困扰逐渐消耗.

个性化内容推荐系统是一个解决信息过载并为用户推荐个性化内容的高效系统,它根据用户需求及其相关浏览行为等进行分析,将用户感兴趣的内容推荐给用户,其核心和关键技术在于用户兴趣模型的建立.

从目前的研究成果来看,用户的需求可以表现为显性需求[1]和隐性需求[2].显性需求主要依赖用户对其兴趣的准确表达,而隐性需求主要是通过分析挖掘用户属性(如年龄、收入、文化水平、职业等)、人机交互行为的历史数据[3]及相关眼动特征[4]获得的.要想准确表达用户兴趣模型就必须同时考虑显性需求和隐性需求.另一方面由于网络海量信息的影响[5],用户的喜好会随时间和外界的影响发生变化.为挖掘用户的兴趣,提高用户兴趣模型的精度和效率以及用户网上购物的满意度,首先利用客户体验管理(Customer Experience Management,CEM)分析影响用户网上购物的因素,然后运用马尔科夫链分析用户的网上购物行为数据,并结合眼动数据,最终挖掘出主要影响因素以及各自所占的权重,为网上商家提供建设性意见并为用户的个性化兴趣建模提供相关理论依据.

1 网上购物决策因子研究的建立

比较购物是细分出来的网上购物领域中的一个专业搜索引擎.比较购物网站的搜索结果比通用搜索引擎获得的信息更加集中、全面.好的比较购物网站往往能及时且完整地抓取商品信息,使网络用户对市场上某类商品的价格变化、用户评论、店铺信用等一目了然.

目前,中国的比较购物环境尚未成熟,比较多的形式是“网上购物导航+网上购物社区”,购物搜索仅仅集成于此类网站中,暂可称这种模式是国内比较购物的雏形.现阶段比较购物主要体现在社区评价,以网上店铺与用户的社区互动为主.一些用户的体验、产品测评也多数发布在社区.一些网站虽然可以进行初步的商品对比,但模式机械、程序繁琐、推荐效果不理想,导致网站效率低下,成交额受到严重影响.要抓住顾客,就必须研究影响用户决策的主要因素,使推荐信息具有针对性,以简化用户决策流程,提高效率,因此迫切需要对影响用户网上购物决策的主要因素进行研究,这对网上商家来说更是刻不容缓.根据网络提供的信息,仅淘宝店铺而言,上海2009年就有288 600家之多[6],但正常营业的只有三分之一,大部分中小型网上商家人气不足、销量低迷.研究网上购物决策的主要影响因素,给网上商家提供理论依据及建设性意见,对网上商家乃至电子商务行业意义重大.

在事件的发展过程中,若每次状态的转移都仅与前一时刻的状态有关,而与过去的状态无关,或者说状态转移过程是无后效性的,则称这种状态转移过程为马尔科夫过程.购物网站打开后,客户就开始网上购物行为:眼睛扫视页面、注视产品图片、滚动页面、鼠标光标移动和点击等.这些行为没有规律可循,相互之间也没有太多的联系,完全是随用户个体的兴趣、需求、习惯等而改变,所以得到的数据都是动态的,且前后状况之间都没有关系,符合运用马尔科夫链分析的数据的特点.

本文用马尔科夫链分析用户的网上购物行为数据,得到用户各网上购物行为所占比例,研究的基本框架见图1.首先通过CEM得到用户的清晰反馈,初步得到影响用户网上购物决策的影响因子;其次以采集到的行为数据结合马尔科夫链算法挖掘主要影响因子;最后通过相关眼动参数和调查研究对主因子进行确认并分析主决策因子对网上购物的影响权重.

图1 网上购物决策因子研究框架

2 CEM下用户决策的影响因子分析

为研究用户网上购物过程中各影响因素所占比重,采用CEM[7]对各影响因素进行系统分类,再运用调查问卷对分类出的因素进行选择,从中找出最为重要的几个影响因素,分析筛选出重要因素.本次调查得到有效问卷123份,根据CEM汇总分析这些数据,得到影响用户网络购物决策的显性因素,具体情况见表1.

表1 CEM汇总分析

分析发现品牌形象不只是用户的关键体验,也是目前网购做得最差的地方,计算出来的满意度权重是-16分.另外,产品、价格、便利性也有一定的提升空间,所以品牌形象、产品、价格和便利性就是本次重点研究的影响用户网购决策的4个因素.

3 网上购物行为数据分析

3.1 用户决策数据获取

本文利用java等技术记录用户的浏览行为,其优点在于整个过程不需要用户的主动参与,不需要中断用户的浏览操作,也不会给用户带来不良的浏览情绪.通过Live Record对实验者在实验中的操作进行记录,可以发现用户在浏览时的行为主要包括以下几个方面:滚动页面、点击鼠标、移动光标、其他(主要指用户走神或与网上购物关联不大的行为).

马尔科夫预测法[8]的基本要求是状态转移概率矩阵必须具有一定的稳定性.因此,必须具有足够的统计数据,才能保证预测的精度与准确性.具有大量的统计数据是运用马尔科夫预测法的一个基本条件.本文随机选取48位调查者作为本次研究的实验者,在常用网上购物网站的日用品——洗发水网页上实现购买行为.分别进行2次及以上实验,得到实验者的行为数据,满足马尔科夫预测法的基本条件.汇总数据,将所有实验数据求平均,算出网上购物行为所占比例,见表2.

表2 网上购物行为所占比例 %

为得到实验者较为稳定的网上购物行为数据,进行多次实验并求其平均值,并将几次实验中各种行为之间的转化情况记录下来,见表3.

表3 实验中网上购物行为转化比例 %

3.2 基于马尔科夫链的用户行为预测

3.2.1 创建初始转移概率矩阵

设某一事件发展过程有E1,E2,…,En等n种可能的状态.记从Ei到Ej的状态转移概率矩阵为P,则

(1)

转移概率矩阵中

(2)

由表3可得该实验的一步转移概率矩阵

3.2.2 决定初始状态的市场概率矩阵

初始状态概率矩阵

(3)

3.2.3 建立马尔科夫链模型

由式(1)和(3)可得

(4)

运用马尔科夫链,得到用户进行网上购物操作中的各种行为终极状态所占的比例,见表4.

表4 网上购物行为终极状态所占比例 %

从实验录像中可以看出,实验者网上购物行为与购物时受到的影响有直接联系.每一个行为的产生都是由不同的因素所导致的,而同一个因素也可以导致不同行为的产生.[9]根据实验录像,将主要网上购物行为及其产生原因汇总于表5.

表5 不同因素导致的网上购物行为所占比例 %

将表4和5按乘法原理处理可以得到表6.从表6可得在影响网上购物的4个主要因素中,品牌形象所占比例最高,即在网上购物时优先选择信誉较高、可靠度高的网上购物网站,在购买产品时也会优先考虑该产品的品牌、知名度,因为用户觉得品牌是产品质量的保证.其次是价格,标有特价、折扣价的产品会更容易吸引用户的兴趣,会让用户去点击了解商品.如果该商品有较高的性价比,就比较会被用户放进购物车.再其次是产品(产品图片)的吸引力以及购买流程和付款收货的便捷程度.

表6 结合影响因素的网上购物行为终极状态比例 %

4 结论验证

4.1 结合眼动参数的结论验证

相关研究已经表明眼动特征能在一定程度上反映用户的兴趣点所在.[10]通过研究网络用户的眼动特征,包括瞳孔直径、第一次注视点、注视点分布、眼动轨迹[11]等从侧面验证网上购物者的兴趣所在,从而进一步提高本研究的正确性和精度.运用眼动仪收集本研究中测试者的眼动数据,记录测试者在发生网上购物行为时的眼动特征,结合实时录像分析测试者的兴趣.

眼睑情况[12]:记录眼睑变化及时间,同步比对影像,得到用户感兴趣的地方.注视情况[9]:记录注视变化及时间,同步比对影像,得到用户感兴趣的地方.瞳孔情况[13]:记录瞳孔直径变化及时间,同步比对影像,得到用户感兴趣的地方.影像记录:眼动仪在记录以上参数变化的同时,还记录每一秒用户的参数变化.分析最后生成的Excel表格中时间以及对应的参数变化和Live Record所记录的用户具体购物操作,就可以知道哪些地方是用户的兴趣点.利用SPSS对比眼睑和瞳孔情况,采用曲线估计分析眼睑和瞳孔数据.选取实验者在浏览和选购时的数据进行分析.运用SPSS可以得曲线估计图2和3.

图2 眼睑曲线估计

图3 瞳孔曲线估计

从图2和3可以看出,测试者在看见自己感兴趣的网页时会全神注视,同时瞳孔会保持张大的状态.同时可知:当单位眨眼数越小、瞳孔直径比正常直径大、一定时间内不滚动页面、眼睛注视同一片区域时,说明用户对该信息感兴趣.再根据影像记录,汇总引起实验者兴趣的是哪类影响因素,得出其主要影响因素是品牌及价格.

为验证本文分析的正确性,在人人网上发布网上购物决策影响因子调查问卷(问卷的对象是网上购物用户).实得有效问卷235份,经统计分析得到以下结论:品牌形象的权重为33%,价格的权重为20%,产品(产品图片)的权重为15%,便利性的权重为11%.由此可知,实验结论可较为准确地反映影响网上购物行为的因素权重.

在网上购物的缺点上,认为商品质量低劣的用户占56.25%,认为到货时间偏长和邮费贵的用户各占31.25%,认为网上购物存在欺诈行为的占25%.这也是网上购物用户一般在选购商品和服务时非常看重品牌形象的主要原因,他们认为品牌商品有品质保障并且售后服务到位.

5 结束语

根据实验分析得到影响网上购物的主要因素的权重:首要因素是品牌形象、价格,其次是产品(产品图片)、便利性,再其次是服务以及其他因素.虽本文将马尔科夫链算法与一些相关算法结合,但仍存在缺陷,数据分析存在一定的误差,值得用更为先进的技术手段进行进一步的研究.

参考文献:

[1]RYEN W W. The use of implicit evidence for relevance feedback in Web retrieval[J]. Lecture Notes in Comput Sci, 2002, 2291: 449-479.

[2]ZIGORIS P, ZHANG Y. Bayesian adaptive user profiling with explicit & implicit feedback[C]//Proc 15th ACM Int Conf Inform & Knowledge Manage, ACM, 2006: 397-404.

[3]付关友. 基于浏览行为分析的用户兴趣挖掘[D]. 重庆: 重庆大学, 2004.

[4]燕保珠. 眼动研究在网站可用性测试中的应用[D]. 北京: 北京邮电大学, 2011.

[5]施笑畏, 宓为建. 基于模糊逻辑的多级代理推荐系统[J]. 上海海事大学学报, 2011, 32(4): 71-75.

[6]王贤文, 徐申萌. 中国C2C淘宝网络店铺的地理分布[J]. 地理科学进展, 2011, 30(12): 56-61.

[7]SCHMITT B H. Customer experience management: a revolutionary approach to connecting with your customers[M]. New Jersey: Wiley, 2003: 234-238.

[8]GILKS W R, RICHARDSON S, SPIEGELHALTER D J. Markov chain Monte Carlo in practice[M]. London: Chapman & Hall, 1996: 56-60.

[9]HUANG J, WHITE R W, DUMAIS S. No clicks, no problem: using cursor movements to understand and improve search[C]//Proc SIGCHI Conf Human Factors Computing Systems, ACM, 2011: 1225-1234.

[10]BALL L J, LUCAS E J, MILES J N V,etal. Inspection times and the selection task: what do eye-movements reveal about relevance effects? [J]. Q J Exp Psychol, 2003, 56(6): 1053-1077.

[11]DIXSON B J. Eye tracking reveals men’s appreciation of the female form[J]. Human Natural, 2010, 21: 355-370.

[13]GLAHOLT M G, WU M C, REINGOLD E M. Predicting preference from fixations[J]. PsychNology J, 2009, 7(2): 141-158.

猜你喜欢
实验者马尔科夫眼动
基于三维马尔科夫模型的5G物联网数据传输协议研究
基于眼动的驾驶员危险认知
基于ssVEP与眼动追踪的混合型并行脑机接口研究
基于叠加马尔科夫链的边坡位移预测研究
探讨消毒供应室护理人员职业倦怠情况及对应的措施
喉气管狭窄外科治疗效果的分析
基于改进的灰色-马尔科夫模型在风机沉降中的应用
学不会珍惜
国外翻译过程实证研究中的眼动跟踪方法述评
马尔科夫链在教学评价中的应用