多重因素下基于多模态特征的网页广告效果

2018-06-20 09:34:44胡晓红任衍具
计算机应用 2018年4期
关键词:眼动降维网页

胡晓红,王 红,任衍具,周 莹

(1.山东师范大学 信息科学与工程学院,济南 250358; 2.山东省分布式计算软件新技术重点实验室,济南 250014;3.山东师范大学 生命科学研究院,济南 250358; 4.山东师范大学 心理学院,济南 250358)(*通信作者电子邮箱wanghong106@163.com)

0 引言

随着信息技术的飞速发展,网页因其信息量大、操作方便等优点在人们日常生活中占据了至关重要的位置,使人们的生活方式和企业营销策略等发生了巨大变化。而互联网广告作为网页的重要衍生产品也成为现代市场营销的主要组成成分,因此,互联网广告效果研究对改进网页界面设计、提高“三方”利润,以及增强用户体验等方面具有重要指导意义。

但是,内、外部的一些差异将会导致用户对广告、网页内容的接受程度、关注程度不一致,比如用户认知风格这种自身内部差异,以及广告布局、相关性这些外部差异。而现在的网络广告研究工作都是基于无差异假设的,很少注意到这些因素对广告效果造成的影响。

并且,虽然计算机视觉技术日益成熟,研究人员可以根据各种图像特征对图像进行压缩、识别、显著性提取等方面的工作,但这些研究工作主要集中在自然图像领域,网页领域相关方面的研究很少。而网络广告处于网页之中,网页与自然图像最大的不同在于,网页包含的刺激物种类更多,且网页信息是分段获取的,广告的形式、位置更是多种多样,因此用传统的自然图像中的显著性或注意力模型来处理网页及网页内的广告信息效果不好。

此外,衡量广告质量的指标对提高广告效益具有重要影响。普遍情况下,人们采用点击率、转换率等衡量指标,但像点击率这种衡量指标最大的缺点忽略了那些用户可能注意到但没有付出具体行为的广告,而转化率则将用户对网页的浏览和广告的浏览混为一谈。因此目前流行的衡量旗帜广告传播效果的方法欠妥,这驱使着我们找到一种新的指标,能够真实反映用户对网页广告的注意力程度。

因此可以看到这样几个事实:信息时代,人们的日常生活消费早已离不开网页这一主要信息获取方式;用户对广告和网页内容的了解方式与决策会因内、外差异受到影响;广告的衡量标准欠妥,对广告的推广与品牌延伸具有消极影响;大多数研究人员将计算机视觉的重点放在自然图像上,而对网页的研究很少;眼动技术发展迅速,获取眼动信息变得容易,且眼动信息更加真实。

本文旨在根据以上事实,通过“点、线、面”的思维方式进行分析,主要工作在以下四个方面:

1)收集具有用户认知风格与记忆力标签的大规模眼动行为数据集。

2)研究用户在整个网页上的注意力分布情况。对网页进行兴趣区域划分,针对广告布局的结果分析验证了广告的吸引力效应,并率先提出增强效应和抑制效应;针对认知风格的结果分析得到认知相同性与认知差异性。

3)分析认知风格和广告布局不同时,最常见的行为模式。利用频繁模式挖掘算法挖掘兴趣区域点击行为的关联规则,并提出DFBP(Directional Frequent Browsing Patterns)算法定向挖掘用户最常见的浏览模式。

4)提出将广告记忆力作为衡量广告质量的新标准。本文通过多模态特征融合的方式,利用频繁模式改进Random Forest算法,构建广告记忆力模型,用于替代传统的评估指标预测广告效果,更加科学、可信。

1 相关工作

针对互联网广告的研究大多集中于在线广告的精准投放、竞价系统与点击率预估等方面[1-3],甚少涉及到广告效果分析以及用户注意力。研究学者主要采用数学模型或者实验评估的方法进行论证。陈磊等[4]通过分析用户对广告的交互行为,总结与热门查询词相关的广告效果并排除用户对广告的排斥现象。王家卓等[5]对比广告链接和非广告链接的点击率,验证Jansen针对搜索引擎结果页(Search Engine Result Page, SERP)上赞助商链接和非赞助商链接相关性的7条假设,并得出不同结论。

然而,对用户自身差异如认知风格这种用户特征对于广告效果影响的相关研究甚少。不同的认知风格使得用户在加工信息(包括接收、存储、转化、提取和使用)时习惯采用的方式不同。Wedel等[6]就曾指出个体认知差异对产品回忆和品牌好感的影响,但该研究只使用传统实验场景,而非专业设备记录分析。因此,本文将引入场依存型(field dependence)和场独立型(field independence)这两个认知风格,用于区分用户在信息加工过程中是否容易受环境信息的影响。通过认知风格对用户分类,了解不同类型用户的浏览模式和关注热点区域,这不仅可以实现用户和网页间更好的互动效果,同时可以最大化利益,具有重要的研究意义和商业价值。

并且,虽然大多数研究都以点击率、转化率为金标准,但这种标准只专注于用户有意识的行为信息。消费者经常伴有无意识性的注意,这使得单纯使用点击率、转换率等行为性的衡量标准变得不再有效,竞价系统也不再科学。因此,通过对用户生理自然反映来测量注意力的方式变得更有说服力[7]。因此研究人员通过显著性模型或注意力模型预测人们在场景中关注的位置。这项工作不仅为设计人员提供了理论指导,并提高了人机交互的体验。Itti等[8]于1998年里程碑式地率先提出利用生物的中央周边滤波器结构,通过融合多通道显著性的方法组合低级特征,检测效果很好,但计算量大。随后,基于各种不同框架的显著性模型被提出。例如:Bruce等[9]结合信息论的知识提出AIM(Attention by Information Maximization)模型,张孝临等[10]在Itti模型[8]的基础上融合马尔可夫链,以及基于贝叶斯模型[11]或者图论[12]的显著性模型检测算法等。

但是分析可知,多数研究人员都将眼动数据作为基线,以接近人眼数据为理想结果。尽管研究工作进展迅速,但是各项研究水平距离真实效果仍有不小的差距,而且研究工作集中在自然图像方面,在网页领域相关研究较少,相应的表现似乎也并不优秀。Shen等[13]在2014年Webpage Saliency中sAUC(square Area Under Curve)达到0.720 6,虽然后续不少研究对此进行改进,效果却并未有很大的提升。

而现阶段眼动追踪技术发展迅速,已经摆脱繁重的机械设备,传统的研究内容也将从纯理论中解放出来。现在,可以直接通过眼动设备获取用户信息,预测用户的行为模式,提高渲染力。Wedel等[14]通过实验表明广告重复出现时扫描路径基本不发生改变。而从第一次到第三次呈现,注视时间几乎以50%的速度递减。Drèze等[15]研究知识经验对个体注意力的影响,研究显示,广告注意方式会随着个体经验的不同而不同。Chen等[16-17]通过眼动数据和鼠标数据相结合,预测用户对搜索结果的满意度。

因此,可以直接使用眼动仪获取眼动数据,研究用户的注意力等隐式信息,探索用户的简单无标记行为,深入了解用户心理行为,真实地反映互联网用户的兴趣区域及兴趣度,提高广告质量,使研究信息更加完善,更加直观了解不同类型受众的浏览模式,这对广告和品牌延伸效果具有重要的指导意义,并且能提高输出质量。

2 实验设计

由于本文增加了对用户认知风格的划分,但现有的公开数据集仅有眼动数据,所以我们进行了较大规模的数据采集工作。

2.1 实验对象

通过招募的方式随机抽取本校各专业本科生63名(18~21岁,平均19.7岁)自愿参加实验。所有被试裸眼或矫正视力均在1.0以上,无色盲色弱等眼疾患者,符合实验要求。完成实验后,均可获得少量报酬。

2.2 实验器械

实验所采用的是德国普升科技有限公司研发的SMI RED眼动仪(Version2.4),其采样频率为120 Hz。记录和分析过程使用其自带的IViewX、Experiment Center和BeGaze,实验数据的处理和分析使用Matlab及IBM SPSS Statistics。

2.3 实验材料

实验材料分为两部分:一部分为认知风格划分所需图形材料,另一部分为网页材料。

为了将被试按照不同风格划分开来,本文采取目前研究中采用较多的镶嵌图形测验(Embedded Figure Test, EFT)。

随机选取了七种不同类型的物品,如奢侈品、门票、家用电器等,覆盖范围广泛;模拟用户日常生活中选择的心态,每种类型有两种不同品牌;搜索引擎选择百度,因为它既是全球最大的中文搜索引擎,并且与大多数中文搜索引擎排版基本相同。为保证实验效果更加真实,让被试尽可能像往常一样自由浏览,如点击和滚动屏幕。为了较好地控制实验变量,保证被试看到的某一类型的SERP是一样的,从搜索引擎中爬取所要网页,作为实验网页素材,并只保留所要研究位置的商业推广。实验过程中,通过眼动仪记录被试的眼动信息,通过网页中嵌入的JavaScript代码获取用户的鼠标信息。采用2(认知风格)×14(搜索任务)×3(广告位置)的设计。

2.4 实验程序

实验分成三部分:

1)认知风格划分。测验要求被试者在较复杂的图形中找到并描绘出隐藏在其中的一个指定的简单图形,该测验一共25道题目,题型由易到难程度递增。

2)网页浏览。实验开始前,先进行标准校正,当被试达标则开始正式实验。用户根据屏幕中的提示,了解接下来需要进行的商品类型。如:屏幕提示产品类型是手机,这意味着用户将要以一位手机购买者的心态浏览某手机品牌的SERP。浏览过程与日常浏览网页一样。当遇到感兴趣的地方,用户可以点击该条目。为防止用户疲劳,每位用户最多随机展示6个SERP,用户可以根据自身状态随时停止实验进程。

3)广告记忆力划分。每个网页关闭后,进行广告再认测试,以检查被试对广告的记忆情况。记忆程度分四个等级:“A:肯定看到”“B:似乎已经看到”“C:似乎没有看到”和“D:肯定没有看到”。

2.5 实验数据集

本次实验共采集到323条数据,其中因为被试不规范操作丢失4条,共计319条。根据研究目的,主要统计了认知风格、问卷统计和广告位置三个变量的分布情况,具体如表1所示。

表1 实验数据汇总表

3 注意力分析

3.1 兴趣区域划分

表2~3展示了用户注意力在SERP上的大致分布情况。按照搜索引擎的普通设定,网页内含有10个结果链接(即10个条目)、广告以及右侧相关推荐。由于仅有部分用户投入少量注意力在右侧相关推荐区域内,因此右侧相关推荐区域不再细分。所以每个SERP将被划分成12个兴趣区域(Area of Interest, AOI),分别为1~10、AD和R,其中:数字1~10分别表示10个条目所在兴趣区域;AD表示广告所在兴趣区域;R表示右侧相关推荐所在兴趣区域。此处设定的指标为用户在该兴趣区域的注视时效(用户在该区域的总注视时间与用户浏览整个网页时间的比值),通过它可以间接观察用户的注意力情况。其中,C0和C1分别表示认知风格为场依赖型与场独立型,L1、L2和L3分别表示广告位于主体上方、下方和右侧。详情见图1。

图1 兴趣区域分割图

表2为不同兴趣区域用户的注视时效分布情况。C0和C1表示仅按照认知风格分类用户注意力的原始结果,并将此作为对比基线。虽然右侧是多部分组合而成,不方便分辨,但也可以看出一些较明显判断的结论,如:用户在1~10号位10个条目上的注意力是按其自上而下的排列顺序依次减少;广告部分相对吸引力较强;用户注意力改变情况和整体布局相关等。

(1)

其中:FT指注视时效;u为注视时效改变量差的均值。

3.2 针对位置的结果分析

3.2.1 吸引力效应

观察表2中广告兴趣区(AD)的注视时效。通过该列中每个列元素与该元素对应行的其他兴趣区域的注视时效对比,可以明显看出,在基线和L1、L2位置时,用户在广告区域注视时间普遍要比1~10号位注视时间长,注意力更多,且右侧相关推荐也呈现大比重现象。这说明,L1、L2位置的广告对用户有较强的吸引力。L3位置由于处于非主体区域(10个条目右侧),得到用户的关注度偏少。用户对广告具有一定的抵触心理,部分用户在浏览过程中甚至直接忽略该部分内容,因此此处吸引力较弱。

比较相同布局下不同认知风格对广告的注意力,可以看出,场独立型认知风格对广告的注视时间更多。

3.2.2 增强效应与抑制效应

当广告出现在10个条目上方,即L1位置时,此时1~10号兴趣区域内的注意力与基线相比明显减少。也就是说,广告位于L1位置,抑制用户在1~10号位兴趣区域内的注意力投入。但广告和右侧相关推荐呈现出注意力增强的效果。反观当广告位于L2、L3位置时,10个条目上的注意力分布呈现出增强效应,而广告与右侧相关推荐则表现出抑制效应。这说明广告位置不同对用户的注意力分布具有一定影响的。

不难思考其现实意义。当广告位于L1位置,即10个条目上方时,由于广告对用户具有吸引力效应,且广告首先被用户观察到,因此用户很容易将更多的注意力放在广告上。而一般广告具有较丰富图片和文字信息,观看过广告后对产品已有大致了解,因此,接下来部分注意力将相应减少。而当广告位于L2位置,即10个条目下方时,用户需要通过条目的阅读来了解产品,当浏览过程到L2时,用户对产品已然熟悉,所以对广告的注意力将大幅度减少。而L3位置,因为这部分的广告在本身就不主体区域,加上用户对广告的抵制心理,自然注意力放在主要搜索结果上的更多一些,广告上的注意力也呈现减少现象,但并不是很明显。

3.3 针对认知风格的结果分析

为了进一步了解认知风格对注意力的影响,本文采取最小显著性差异(Least-Significant Difference, LSD)法检验,目的是对每种情况下注视时效的均值逐对进行比较,以判断具体哪些水平间存在显著差异。具体内容见表3。

3.3.1 认知相同性

从表3可看出:广告兴趣区域所对应的整列均表现出在p<0.01的条件下,用户注视时效差异显著。也就是说无论是哪种认知风格,广告位置不同,都会对用户在广告区域的注意力造成显著改变。因此可以得出结论:广告位置不同时,两种认知风格对广告的注意力分布影响均表现出显著差异。

表2 不同兴趣区域注视时效汇总 %

表3 注视时效的多重均值检验结果 %

注:“*”表示0.01

3.3.2 认知差异性

采用LSD检验判断具体是哪些水平间存在显著差异。统计不区分认知风格时,不同位置之间均值差MD(I-J)显著的共有13处,其中按照认知风格划分后,场依赖型均值差显著的共有7处,场独立型共有11处。可以认为,场独立型认知用户受广告位置改变而产生的注意力改变更为显著,由此可以看出,认知风格不同对用户注意力的分布具有显著的影响;并且通过两两对比发现,L1处布局与其他两处布局,注意力分布差异较大;广告放置于L2、L3位置时,注意力分布差距较小。

3.4 结果分析

通过表2~3的统计汇总,可以看出广告位置不同和认知风格不同对用户注意力造成的影响是不同的。广告具有图片、文字甚至视频等多种刺激物,且言简意赅,因此广告对于用户具有一定的吸引力效应。但有趣的是,当广告位于主体右侧时,吸引力效应较弱,这和人们对于广告的抵触心理和日常习惯相关。右侧广告过于突出,且用户一般专注于自己所要了解的内容,因此注意较少。

而广告位置的不同,使得用户对整个结果页的注意力的分布情况有明显改变,表现为广告位于L1位置时的增强效应和L2、L3位置时的抑制效应。当广告位于上方,用户注意力明显被广告集中,导致用户对主体的注意力明显减少。而当广告位置换到主体下方时,用户对主体内容的注意力程度明显上升。

针对用户种类的不同进一步进行划分后还发现,即使认知风格不同,广告位置的改变都对用户注意力产生显著影响,将此定义为认知相同性。而通过LSD检验,发现场独立型认知用户对广告位置改变更为敏感,这种变化使得他们对整个浏览结果的注意力分布都与基线产生较大差异。结合3.2.1节中所提到的吸引力效应,不难看出,当广告位于主体上方时,广告对用户的吸引力过大,用户可以通过广告其丰富的刺激物对所搜索内容进行了解,下方主体内容的注意力相对减少。

4 用户行为模式分析

4.1 点击行为分析

通过采集鼠标行为信息可以得到众多特征,其中大部分特征都与眼动信息中的特征具有强相关性;且但相对于鼠标信息,眼动信息更科学、真实、即时,所以这里只选取具有较强代表性的点击特征。

点击行为相对于其他信息,具有更强的决策性,相对应地,用户的注意力度也更大。因此,用户的点击行为是一个很好的细粒度反馈,这对了解不同用户在不同布局下的决策行为具有重要作用。

图2 不同认知下点击行为的关联规则

图3 不同布局下点击行为的关联规则

图2和图3分别表示Apriori算法下计算出的搜索引擎结果页上各个兴趣区域的点击行为与不同认知风格、广告位置的关联规则(minSup=0.03,minConf=0.4)。为了方便展示,本文将关联规则中项目之间的连接可视化为一个有向图。首先,需要生成规则前因和后项的邻接矩阵,该矩阵为稀疏矩阵,矩阵里的元素值为前因和后项间的关联度。然后,使关联规则中的前因作为有向图的前驱,关联规则中的后项作为有向图中相应前因的后件。以图2中虚线连接线为例,表示{7}{2}→{Independence},{7}→{Independence},{7}{2}→{Dependence}都是满足阈值的关联规则。

分析图2,场独立型认知风格点击行为的频繁项集中项的维度要明显大于场依赖型认知风格。这说明场独立型用户在浏览网页时,主观能动性较强,不拘泥于一定范围,整体意识性强;场依赖型用户在此过程中有相对固定的浏览区域,模式也相对固定。

从图3可以看出:广告位于L1和L3位置时频繁项集中项的维度要明显大于广告位于L2;L1处的布局格式影响到的项最多,对广告的影响力也较大;L2处的布局格式影响到的项最少,但对广告的影响力较大。这与第3章中的结论相呼应。

4.2 浏览模式分析

尽管通过前面的研究已经足够了解不同认知风格的用户在不同布局下的注意力分布情况,但这些信息是无时序性的,属于结果型信息。时序信息对了解用户行为进程具有重要意义,研究与设计人员可以通过用户的时序型信息,预测用户的关注点并作出相应的决策,提升个性化效果。本文按照用户注视点进入兴趣区域的时间进行排序并分析。

针对研究的问题,即想要了解的是用户在不同布局下,浏览模式的不同。众所周知的是用户的大体浏览模式为自上而下,且上部有两种广告布局,相互影响较大。因此浏览的初始阶段对于研究用户的普遍行为模式是非常重要的。本文提出一种新颖的、定向定长的,适用于当前数据与研究需求的频繁浏览模式算法——DFBP。

算法1 DFBP算法。

输出 频繁浏览模式Q及其得分F。

为所有数据添加三个属性:被采纳长度l=(l1,l2,…,lp)以及与之相对应的支持度S=(s1,s2,…,sp),初始化l1=0,s1=0;

Fori=1 totDo

Forj=1 tolen(Gt) Do

计算序列首元素的支持度sj,若sj

剩余序列按照首元素值进行分类,创建相应的队列G1,G2,…,Gt,将序列按类别进入不同队列;

删除每个序列首元素;

更新序列的l和s属性,其中lj+1=lj+1,sj+1=s;

End For

End For

Fori=1 toNDo

maxFi=0

Forj=1 topDo

Fj=lj*sj

IFFj>maxFi

maxFi=Fj;

End For

IFli为l前8项之一

则该序列非频繁序列;

ELSE

输出频繁浏览模式Qi及其得分maxFi;

End For

表4为三种布局下用户最常见的五种浏览模式。观察L1布局下的浏览序列,发现用户浏览初期如果检测到广告时,将优先检测广告,然后按序浏览;如果用户初期未检测广告,将按顺序浏览条目。L2布局时广告位于下方,用户自然按顺序浏览。L3布局时广告位于右侧,用户通常按照习惯先观察条目,但通常右侧广告图片大、颜色鲜艳,刺激力度大,所以在1、2号条目后,用户注意力将被右侧广告吸引。观察三种不同布局可以看出,不同布局下用户浏览模式大致是呈现自上而下型;并且还可以发现,很多时候用户首先注视到的区域为2号位条目,之后反溯到1号位。结合实际,这种情况应该是由于用户在使用电脑进行搜索、浏览时,打开新网页会有一定的时间间隔,而这段间隔会使用户视线重置到屏幕中间区域,加之用户通过日常积累了解到结果主要在页面左侧排列,因此用户首先注视2号位的条目,了解后用户将重新按序阅读过程。

表4 频繁的浏览模式

5 广告记忆力分析

点击率是网络广告最基本的评价指标,但是随着网络广告的增多,以及人们对网络广告了解的深入,网民不会盲目点击广告, 除非个别富有创意和吸引力的广告,也有可能网民浏览广告后已经形成一定的印象而无须点击广告或者保存链接的网址,甚至以后经常直接到该网站访问等。因此,平均不到1%的点击率已经不能充分反映网络广告的真正效果。据现在的统计数字显示:网络广告平均点击率已从30%降低到0.5%以下。

所以对于品牌广告来说,广告的成功不仅取决于是否点击或者阅读广告后是否购买该商品,而更多地应该表现为用户是否注意到并记住该商品,形成品牌效应,创造独特良好的品牌或产品形象,提升较长时期内的离线转化率。因此,用户在浏览结束后对广告的记忆力度应当是衡量广告效果的一项重要标准。这样研究用户对广告的记忆力度便具有了极其重要的意义。

5.1 特征选择

本次实验共收集到四种类型的信息:鼠标行为信息作为显式信息,眼动信息作为隐式信息,广告自身信息(如,尺寸、位置),以及用户信息(如:认知风格、广告记忆力)。除记忆力划分信息将作为类标签,其余信息均可作为模型特征。

经过分析发现,鼠标信息中绝大多数信息与眼动信息具有正相关性。相比而言,眼动信息更真实,但点击率是网络广告最基本的评价指标,也是反映网络广告最直接、最有说服力的量化指标,所以这里抛弃除点击数据外的其他鼠标特征。

表5为本次实验初期提取出的会对用户观测度造成影响的29个特征。

表5 记忆力模型特征

为了消除因用户个人阅读风格,网页类型不同带来的差异,将对部分特征进行归一化。例如将眼睛在广告区域内的注视时间修改为:

(2)

其中:结束时间为用户浏览完一个网页所需要的时间。

5.2 降维

为了使眼动特征能够更容易处理、使用,并能够显示出重要的特征,去除噪声,本文使用主成分分析(Principal Component Analysis, PCA)算法提取眼动特征中最具有代表性的主成分因子。眼动特征分为两个集合,为了能够更好地区分不同集合的效应,将两个集合分开降维。

降维前对数据进行适应性分析,这里选择KMO(Kaiser Meyer Olkin)检验,检验结果均大于0.6,表示实验数据适用PCA降维。

图4~5为SERP和广告体的眼动特征经PCA降维后的结果,这里指定特征值大于1,图中实心点的即为满足条件的综合特征。可以看出SERP眼动特征集经过PCA降维后提取出4个主因子,而广告体SERP眼动特征集经过降维后提取出3个主因子,累计贡献分别为95.4%和85.6%。

图4 SERP内眼动特征PCA碎石图

为了验证降维工作的有效性,对比降维和不降维条件下的预测结果。本文降维后特征因子的选取条件是特征值大于1,对应表格中降维(4+3)的模式(两个特征子集分别提取了4个和3个主因子)。同时为了证明这种选取方法的有效性,尤其是在广告体眼动特征集中提取出的主因子差别不够明显的情况下,进一步计算了不同数量主因子的预测结果对比,这里仅以降维(4+4)为例。表6给出降维、不降维以及降维选择不同数量主因子条件下预测结果的对比情况。

平均绝对误差(Mean Absolute Error, MAE)是绝对误差的平均值,平均绝对误差能更好地反映预测值误差的实际情况。均方误差(Mean Squared Error,MSE)是指参数估计值与参数真值之差平方的期望值,它可以评价数据的变化程度。MAE和MSE的值越小,说明预测模型描述实验数据具有更好的稳定性。

图5 广告体内眼动特征PCA碎石图

方法准确率准确率MAE召回率召回率MAE原始0.9260450.0297940.8944930.057832降维(4+3)0.9196140.0284640.8980950.007448降维(4+4)0.9067520.0280510.9058850.040134

可以看出,虽然原始方法的准确性最高,但与本文的降维方法相比差距很小,不足1个百分点。而且使用降维方法后,不仅召回率有所提升,结果的稳定性也有可观的提升,召回率的MAE值更是明显下降了5个百分点。对比不同数量主因子条件下的预测结果,降维(4+4)的准确率表现不好,与前两者差距均超过1个百分点,降维(4+4)的召回率相比本文采用的降维(4+3)提升仅0.8个百分点,但召回率MAE值却高出3.3个百分点。因此,综合考虑,本文使用PCA的特征降维方法,以及主成分因子的选取方式不仅有较高的准确率又有较强的稳定性和良好的说服性。

5.3 记忆力模型

本文对训练数据使用了一系列先进的方法,包括支持向量机(Support Vector Machine, SVM)、多层神经网络(Multi-layer Perceptron, MLP)、分类回归树(Classification and Regression Tree, CRT)等。由于Random Forest既相对稳定又能够降低过拟合程度,有很好的预测记忆力度,因此最终决定使用Random Forest。此外,针对4.2节中得到的频繁序列,由于这种序列模式为大多数用户所遵循,那么这种序列所对应的数据也将是大多数人所遵循的,因此这里对原始算法进行改进。

本文将用户对于广告的记忆力分为四个等级,程度递减。为方便表达,对四个记忆力等级进行量化:

影响量化等级的特征即为自变量,表示为:X=(x1,x2,…,xn)。

算法2 记忆力模型。

输入D={(x1,y1)(x2,y2)…(xm,ym)},numTrees,depth,Rate。

输出Y。

1) DFBP(D,S,L)

2)B=Divide(D,Q)

//筛选出数据集D中包含频繁浏览模式的数据

3) RandomForest rfA=new RandomForest()

rfA.buildForest(A,numTrees,Rate,depth)

For allxiinADo

End For

4) RandomForest rfB=new RandomForest();

rfB.buildForest(B,numTrees,Rate,depth);

For allxiinBDo

End For

5)Y=[]

6) For allXiinADo

If(Xi∈Q)

End For

7) ReturnY

当本文所需求的数据信息不可通过网络获取,并且没有相关广告记忆力的模型可以对比时,各项指标最好的度量对比就是多种算法的算数平均值,因此本文将此作为基线。图6展示了实验时采取的各种分类方法中较为经典的几种分类方法下预测记忆力度的准确性对比,图中虚线表示平均值综合图6和表7可以看出:首先,使用Random Forest预测记忆力度准确性最好,并且稳定性很好,用它描述实验数据精度高。因为Random Forest是通过集成学习的思想将多棵树集成的一种算法,对于一个输入样本,N棵树会有N个分类结果,而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出。其次,无论使用哪种分类方法,通过本文提出的改进策略之后预测准确率都要比原始结果好,尤其是对于原始结果低于平均值的情况时,改进后准确率上升程度更大,更明显。

图6 不同方法下准确率对比

方法召回率的MAE召回率的MSEC5.0Bayesian NetworkSVMMLPRandom Forest原始0.0223109930.002650413改进0.0254883030.004070724原始0.0576310010.017586608改进0.0979307210.054570005原始0.0215368350.002083815改进0.0216781790.002597258原始0.0541083080.015281281改进0.0576310010.018577781原始0.0294641180.003561261改进0.0284640000.004837989

6 结语

本文旨在根据不同认知、不同布局会使用户对广告和网页内容的信息处理与决策受到影响,广告的衡量标准欠妥等实际问题进行解决。

通过研究用户在整个网页上的注意力分布情况,了解用户注意力分布是如何受到用户的认知风格这种自身特征及广告布局这种外界因素影响而变化的。不仅验证了广告的吸引力效应,并率先提出增强效应和抑制效应以及认知相同性与认知差异性;除此结果型信息外,探究用户行为的时序信息,利用频繁模式算法挖掘认知风格和广告布局不同时,兴趣区域点击行为的关联规则,并提出DFBP算法定向挖掘用户最常见的浏览模式。最后,首次提出衡量广告质量的一项新指标——广告记忆力,通过多模态征融合的方式,利用频繁模式改进Random Forest算法来构建广告记忆力模型,预测用户对广告的记忆力度。这种标准弥补了点击率中忽略掉的注意力,也弥补了转换率中网页内容和广告难以区分的缺点。

综合分析,本文对于改进SERP界面设计、提高互联网广告的质量、优化广告分配效果、增加用户的兴趣度、获得更好的交感体验具有重要指导意义。

参考文献(References)

[1] ANIMESH A, RAMACHANDRAN V, VISWANATHAN S. An empirical investigation of the performance of online sponsored search markets[C]// ICEC 2007: Proceedings of the Ninth International Conference on Electronic Commerce. New York: ACM, 2007: 153-160.

[2] SHAN L, LIN L, SUN C, et al. Predicting ad click-through rates via feature-based fully coupled interaction tensor factorization[J]. Electronic Commerce Research & Applications, 2016, 16(C): 30-42.

[3] RIBEIRO-NETO B, CRISTO M, GOLGHER P B, et al. Impedance coupling in content-targeted advertising[C]// SIGIR 2005: Proceedings of the 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2005: 496-503.

[4] 陈磊, 刘奕群, 茹立云, 等. 基于用户日志挖掘的搜索引擎广告效果分析[J]. 中文信息学报, 2008, 22(6): 92-97.(CHEN L, LIU Y Q, RU L Y, et al. Effectiveness of online sponsored search based on user log analysis[J]. Journal of Chinese Information Processing, 2008, 22(6): 92-97.)

[5] 王家卓, 刘奕群, 马少平, 等. 基于用户行为的竞价广告效果分析[J]. 计算机研究与发展, 2011, 48(1): 133-138.(WANG J Z, LIU Y Q, MA S P, et al. Sponsored search performance analysis based on user behavior information[J]. Journal of Computer Research and Development, 2011, 48(1): 133-138.)

[6] WEDEL M, PIETERS R. Eye fixations on advertisements and memory for brands: a model and findings[J]. Marketing Science, 2000, 19(4):297-312.

[7] KERFOOT W C, KELLOGG D, STRICKLER R J R, et al. Visual Observations of Live Zooplankters: Evasion, Escape, and Chemical Defenses[M]. Lebanon, New Hampshire, USA: University Press of New England, 1980.

[8] ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11): 1254-1259.

[9] BRUCE N D, TSOTSOS J K. Saliency, attention, and visual search: an information theoretic approach[J]. Journal of Vision, 2009, 9(3): 5.1.

[10] 张孝临, 赵宏伟, 王慧, 等. 基于对比敏感度和马尔可夫链的注意信息提取算法[J]. 电子学报, 2010, 38(增刊1): 213-217.(ZHANG X L, ZHAO H W, WANG H, et al. Extracting attention information algorithm based on contrast sensitivity and Markov chain[J]. Acta Electronica Sinica, 2010, 38(S1): 213-217.)

[11] ZHANG L, TONG MH, MARKS T K, et al. SUN: a Bayesian framework for saliency using natural statistics[J]. Journal of Vision, 2008, 8(7): 32-32.

[12] HAREL J, KOCH C, PERONA P. Graph-based visual saliency[C]// NIPS 2006: Proceedings of the 19th International Conference on Neural Information Processing Systems. Cambridge, MA: MIT Press, 2006: 545-552.

[13] SHEN C, ZHAO Q. Webpage saliency[C]// ECCV 2014: Proceedings of the 13th European Conference on Computer Vision. Berlin: Springer, 2014: 33-46.

[14] WEDEL M, PIETERS R. Eye fixations on advertisements and memory for brands: a model and findings[J]. Marketing Science, 2000, 19(4): 297-312.

[16] CHEN Y, LIU Y, ZHOU K, et al. Does vertical bring more satisfaction? Predicting search satisfaction in a heterogeneous environment[C]// CIKM 2015: Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. New York: ACM, 2015: 1581-1590.

[17] LIU Y, CHEN Y, TANG J, et al. Different users, different opinions: predicting search satisfaction with mouse movement information[C]// SIGIR 2015: Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2015: 493-502.

This work is partially supported by the National Natural Science Foundation of China (61672329), the Shandong Provincial Science and Technology Program (2014GGX101026), the Shandong Province Education Science Planning Program (ZK1437B010), the Graduate Scientific Research Innovation Fund of Shandong Normal University (SCX201747).

猜你喜欢
眼动降维网页
混动成为降维打击的实力 东风风神皓极
车主之友(2022年4期)2022-08-27 00:57:12
基于眼动的驾驶员危险认知
基于ssVEP与眼动追踪的混合型并行脑机接口研究
载人航天(2021年5期)2021-11-20 06:04:32
降维打击
海峡姐妹(2019年12期)2020-01-14 03:24:40
基于CSS的网页导航栏的设计
电子制作(2018年10期)2018-08-04 03:24:38
基于URL和网页类型的网页信息采集研究
电子制作(2017年2期)2017-05-17 03:54:56
国外翻译过程实证研究中的眼动跟踪方法述评
外语学刊(2016年4期)2016-01-23 02:34:15
网页制作在英语教学中的应用
电子测试(2015年18期)2016-01-14 01:22:58
眼动技术在数字媒体中的应用
出版与印刷(2014年4期)2014-12-19 13:10:39
10个必知的网页设计术语