王琳 熊颖 江雨薇 李林
(1. 天津师范大学心理与行为研究院,天津 300387;2. 天津师范大学管理学院,天津 300387)
眼动技术方法发展至今已有60多年的历史,已成为一项成熟的技术。眼动技术方法最早应用于心理学,产生了较丰富的研究成果。近年来,眼动技术方法开始受到图书情报学界的关注,并广泛应用于信息行为、用户心理、网站界面设计等分支领域。眼动技术方法以其客观性、无侵入性等优点,为图书情报学开拓了新的研究视野,弥补了学科中其他研究方法的不足,成为一种日益受到青睐的研究方法和手段。本文梳理归纳了图书情报学中运用眼动技术方法的相关文献,阐述眼动技术方法在用户信息行为、用户心理、用户差异、信息界面设计4个领域的应用情况及产生的主要成果,并讨论眼动技术方法应用在学科中未来的发展趋势。
眼动即眼球运动,更准确地说是注视点的移动。业界公认眼动有3种方式,即注视、眼跳和追随运动,也有学者称为平滑尾随跟踪[1]或平滑跟随运动[2]。眼睛停留在目标区域100ms以上称为注视,注视伴随细微的眼动[3],通常在200~300ms[4],是获取信息的主要途径。“注视点或注视方位的改变”称为眼跳[4],眼跳过程中基本不获取信息。视觉目标发生位移时注视点跟随其移动称为追随运动[3]。人们想通过视觉获取信息,要伴随着3种眼动方式,不断将目标信息调整移动到中央凹内进行获取。
眼动特征通过眼动指标来体现。不同的实验根据不同的研究目的选取合适的指标进行测量。常用指标主要有注视时间、注视次数、注视点序列、第一次到达目标兴趣区的时间、眼跳距离、回视次数、瞳孔变化等[1,5]。后3个指标多出现在阅读眼动的研究中。
眼动技术方法经历了通过直接观察眼球运动,将眼睛与记录装置相连,运用光学记录实验方法和电流记录实验方法等发展阶段[3,6]。发展至今,科研工作者主要使用高精度的设备仪器——眼动仪来进行眼动实验。相较于以往的眼动实验方法和实验仪器,眼动仪具有准确度高、对人体生理无害的优点,并且易于使用,配套软件直接进行数据分析,研究人员只需解读分析结果即可。
本研究以Web of Science数据库作为数据源,利用VOSviewer进行可视化研究。在Web of Science数据库中,选择WOS核心合集,把“‘eye-tracking’or‘eye tracking’or‘eye-movement’or‘eye movement’or‘eye
fixation’or‘eye gaze’”作为主题词进行检索,时间范围限制为2004—2019年,在文献分类中选择“Information Science Library Science”作为来源学科进行精炼,共得到111篇文献,导出文件时选择所有字段。
(1)关键词分析。设置关键词的提取阈值为4(默认阈值为5,由于数据量较小,因此修改阈值为4)。结果如图1所示,共得到32个关键词,5个簇。处于聚类核心的关键词有eye-tracking、adults、neuroscience、behavior、attention。其中,频次较高的关键词有eyetracking、information、Internet、search、behavior、attention、performance、neuroscience等,可以看出图书情报学中应用眼动技术的重点领域有信息行为、网络用户认知与决策、用户体验与交互设计等。信息行为领域的研究主题主要有信息搜索行为、检索绩效和信息理解与利用行为(如阅读过程中的理解行为)等;网络用户认知与决策领域的研究主题主要有注意力和记忆研究、神经科学研究、电子商务、信息系统设计、决策过程研究等,体现出基础研究与应用研究并重的特点;用户体验与交互设计领域的研究主题主要包括用户体验、人机交互、信息质量和网站使用等方面。可见,图书情报学界对于眼动技术方法的应用领域在不断地拓宽,研究内容持续深入,同时学科交叉的特色体现也较为明显。
图1 关键词共现/聚类标签图
(2)高被引引文分析。将阈值设置为5,共得到36篇被引文献,形成4个簇。高被引文献可以反映一个领域的研究源头,是探究热点主题、领域前沿的依据。图2形成了以(Just M.A.&Carpenter P. A.,1980)、(Rayner K.,1998)、(Jacob R. J. K.,2003)、(Duchowski A.T.& Çöltekin A.,2007)为核心节点的引文聚类,这些文献主要来自心理学、计算机科学、人体工程学等学科,涉及阅读、人机交互、信息行为等主题。这表明图书情报学中的眼动研究广泛吸取了其他相关学科的重要成果,自身的多学科交叉属性与重视输入外来学科理论和方法为我所用的特点体现得较为明显。就这些核心节点的高被引文献而言,均是各自学科中眼动研究的标志性文献。如Just等[7]在Psychological Review上发表的论文《阅读理论:从注视到理解》中提出了一个阅读理解的模型,该模型阐释了大学生在阅读科技文章时注视力的分配情况,它嵌入了一个能够适应阅读灵活性的理论框架,阐释了在阅读时从注视到理解的过程。该文在图书情报学中被引15次。知名眼动研究学者Rayner[8]在Psychological Bulletin上发表的论文《阅读和信息处理中的眼动追踪》系统梳理了20年来在阅读和处理信息任务时眼动的研究,得出眼动数据反映了被试在执行各种任务中每时每刻的认知过程。这篇文献是心理学中眼动研究的经典文献,总被引频次高达7 253次,在图书情报学中被引22次。Jacob[9]研究了人机交互和可用性研究中眼动追踪问题,该文发表在人机交互会议论文集中,在图书情报学中被引18次。Duchowski等[10]的论文研究了视觉注意与认知过程的关系,从视觉科学和感知图像技术来探讨视觉感知的基本问题,回顾了中央凹视线追踪显示(GCD)技术的应用,该文在图书情报学中被引10次。
图2 共被引文献标签图
在图书情报学中,用户研究是重要学科分支,近年来围绕这一分支,许多研究主题或领域成为学界关注的热点,如信息行为、用户心理与认知、不同用户群体信息行为差异与用户体验、信息界面设计,反映出20世纪80年代末卢泰宏所预测的情报学规范由面向信息源的S规范、面向信息交流的C规范向面向用户的U规范变迁的趋势。以上列举的4个研究领域密切相关,认知、心理与信息行为本身就存在内在的有机关联,用户体验、人机交互和界面设计则是数字环境下用户研究理论的应用范畴。在这些领域中应用眼动技术方法往往能带来创新性的研究成果和发现,上述文献计量可视化分析结果也支持这一判断。本文下面重点阐述眼动技术方法在用户信息行为、用户心理、用户差异、信息界面设计这4个领域的应用情况及产生的主要成果。
在用户信息行为研究中,研究者利用眼动技术方法对相关性判断、浏览、凝视、选择、检索、阅读等行为表现进行研究。研究内容有信息行为的眼动特征和规律、基于眼动实验的信息行为影响因素等。其中影响因素的研究主要包括信息元素的属性和位置、对信息界面的熟悉程度、搜寻阶段、性别、搜索任务、搜索引擎等。
在相关性判断研究方面,王健等[11]介绍了相关性研究对眼动技术方法的应用情况,阐释了该方法适用于此类研究的合理性。Balatsoukas等[12]探讨了相关性判断与眼动的联系,对相关性判断中相关性标准的使用与视觉行为的关系加以预测。他们通过分析被试的眼动数据,结合出声思维和访谈方法(在搜寻后进行),对24位谷歌搜索引擎用户所做的281个相关性判断进行了研究。结果表明,相关性标准的使用与搜索结果排名顺序、信息组织标识(标题、摘要、URL)相关;同时,被试在非常相关和不相关判断中所投入的认知努力也存在差异。他们提出了一种新的方法框架来分析相关性判断和眼动,并阐述了在预测相关性判断中新的相关性标准模式。Gwizdka[13]对是否可以从眼动追踪数据中推断出相关性程度、眼动追踪数据是否与相关性判断中涉及的认知努力相关进行了探讨。在实验研究中,他要求被试在包含新闻故事的文献中查找信息。实验内容包括一个信息问题,不相关、部分相关和相关的3篇文献。结果表明,被试对相关文献有连续阅读的行为倾向,而对不相关文献有扫描的行为倾向。在大多数情况下,从眼动追踪数据可以推断出被试在判断部分相关时付出的认知努力最多,在判断不相关文献时付出的最少,研究结果再一次证明了人们对于判断不同相关程度的内容所耗费的认知努力不同。
关于浏览行为的研究,王琳等[14]用眼动实验来解决信息行为中的理论争端,为浏览行为是生物驱动还是理论导向提供了实证支持。Kules等[15]考察了采取探索式搜索方式的用户与图书馆网站的分面式目录交互时的凝视行为,他们采用了多种方法,包括眼动追踪和刺激性回忆访谈(stimulated recall interviews,指在访谈过程中通过展示一些相关资料以刺激起被试的活动过程记忆),来研究分面搜索界面(faceted search interface)的使用情况,具体包括搜索者的凝视行为——搜索者看到界面的哪部分,训练和不训练的注视行为有何不同,当搜索者熟悉界面时注视行为有何变化,凝视行为在搜索过程中的不同阶段有何不同。这些结果证实了以前的发现,分面搜索界面大约占界面使用总数的10%~30%。研究结果还表明,搜索者对界面元素的使用随着搜索阶段的不同而不同,在决策使用阶段对分面搜索的使用程度更高。
页面的呈现形式是影响用户信息行为的一个主要因素。徐贲[16]利用眼动技术方法对用户使用CNKI文献关联推荐功能进行检索时的浏览行为和选择行为进行研究,得出用户在使用此项功能的信息需求和认知行为规律及偏好,同时还研究了页面呈现形式对用户选择行为的影响。胡伟[17]对页面呈现形式进行研究,总结出影响大学生多媒体阅读检索行为的主要因素,通过眼动实验,发现链接存在与否对大学生阅读多媒体材料的注视时间和注视点个数无显著影响,有分类整合和线索的情况下注视时间较短,注视点个数较少。基于此,该文提出理性使用链接、减少认知负荷、恰当使用分类和线索、利用图片线索的优势等建议。郭伏等[18]以在校大学生为研究对象,利用眼动方法研究色彩差异、模块化程度和搜索目标位置等页面呈现形式对用户认知效果的影响,发现在信息层级间色彩有差异的情况下搜索绩效、满意度等指标更优,采用模块化程度高的信息设计形式时用户的感知易用性和满意度水平更高;搜索目标位置位于中间和偏左上方区域时搜索效果较好,其次右上方和左下方,最后是右下方。
除页面呈现形式外,还有多方面影响用户信息行为的因素。Kim等[19]使用眼动方法研究了屏幕大小和任务类型对用户搜索行为和搜索绩效(搜索速度和准确性)的影响,要求用户通过台式机和移动设备两种大小不同的屏幕来完成两类任务,并使用眼动追踪技术来分析他们的Web搜索行为,研究发现用户虽然在大、小屏幕搜索文献所花费的时间存在显著差异,但他们在任一屏幕的首次点击时间是近似的。用户更难从在小屏幕上的搜索结果中提取信息。Gwizdka等[20]在文本搜索结果列表旁边以标记云的形式引入搜索结果概述,探讨这样的概述是否能让用户更快地执行搜索任务,并减少搜索时所需的认知努力。他们利用源于眼动追踪数据的认知努力衡量方法,来检验提供标记云的摘要(概述)对用户信息搜索和导航行为的影响。结果表明,摘要可以帮助用户更快、更高效地执行搜索任务。这项研究展示了如何使用眼动数据来构建一个简化的阅读模型并提出一种认知努力的衡量方法,利用这种衡量方法来解释用户在与有标记云形式和无标记云形式的搜索结果概述的显示界面交互时的差异。
任务与搜索结果排序也是影响信息行为的重要因素。Lorigo等[21]研究用户类别和搜索任务类型对信息行为的影响。他们运用眼动追踪发现按照查询结果的摘要排序来查看页面的概率仅占20%,而且用户在每个结果页面上平均浏览3个摘要。性别和任务对不同类型的检索行为有显著影响。Pan等[22]通过眼动追踪技术研究用户如何评价结果页面,结果表明,大学生被试在完成搜索任务时很大程度上受搜索结果呈现顺序的影响,这与Lorigo等的研究结果不同,并且在较小程度上受搜索摘要的实际相关性影响。这些被试使用谷歌搜索引擎,对谷歌的信任度较高,所以导致他们选择查看在搜索结果中排序靠前、但被人工判定为相关性较低的摘要,从而忽略了摘要的实际相关性。Turner等[23]采用眼动追踪技术,研究发现有购买健康食品动机的人比那些出于口味购买产品的人花费了更多的时间查看所有可用的营养信息。这个发现会对信息设计、食品标签和公共政策产生影响。Lorigo等[21]研究性别、搜索任务或搜索引擎对用户信息行为的影响。他们综述了眼动追踪技术在网络搜索研究中的应用,对实施的3个眼动追踪实验进行了讨论,并与该领域的其他工作进行了比较,揭示了用户使用谷歌和雅虎的行为特征。该研究表明,搜索结果中平均只有3~5篇摘要被浏览,证实了搜索结果排序对用户浏览行为的显著影响。在研究中尽管存在任务类型、难度级别、性别、搜索引擎、用户对搜索引擎的熟悉程度等差异,但是排序仍能影响浏览行为。研究还发现对于谷歌和雅虎而言,两者的查询任务成功率、花费时间、查看和点击行为,以及用户的满意度和舒适度没有显著的差异[24]。
用户在浏览搜索引擎结果页面(Search Engine Result Page,SERP)时的眼动行为一直是信息检索领域重要的研究内容,广受研究者的关注。梁少博等[25]对用户在不同跨设备情境下的SERP注视行为进行研究,结果表明,跨设备后,用户的视觉注意力比之前要分散,关注点减少且搜索引擎为用户提供的跨设备历史信息能够提高用户的检索效率。吴丹等[26]研究了查询式序列视角下跨设备搜索信息准备和信息重用这两个阶段的眼动变化,选取了注视时长、注视区域等眼动指标,从基本眼动现象、时间维度和空间维度三方面对用户SERP注视行为进行研究。研究发现,用户在信息重用阶段注视时间有所降低且关注点有所减少,这为用户跨设备网络搜索工具的开发提供了参考。吴丹等[27]还提出了基于眼动追踪的交互式信息检索模型,该模型包括Eye-Cognition模式(通过定量和定性的分析更全面地获取用户认知特征)、Eye-Mouse模式(主要应用于SERP相关性反馈研究)和Eye-NP模式(可以通过生理维度和个体特征来解释信息检索活动的认知过程和信息检索行为的影响)。
利用眼动技术方法对阅读行为进行研究也日益引起图书情报学界的关注。汪艾莉[28]利用眼动技术方法设计实验,从眼动指标及热力图探寻文档内辅助阅读行为,将文档内辅助阅读行为分为首屏密集型文档阅读模式、全文导向型文档阅读模式、循环阅读模式、组合阅读模式、依次阅读模式、自上而下的阅读模式,并从用户感知、认知负荷、交互界面、阅读策略和文档辅助五方面为用户提出建议。陈静等[29]对辅助阅读行为的浅阅读和深阅读进行研究,通过眼动实验发现浅阅读的眼跳距离大于深阅读的眼跳距离,浅阅读的注视时间少于深阅读的注视时间,以此分析浅阅读和深阅读的行为特点,并得出用户在利用辅助阅读系统完成任务时浅阅读和深阅读同时存在的结论。方浩等[30]运用眼动追踪技术和质性访谈方法对数据新闻中信息图表的阅读效果进行了研究,研究过程分为两个阶段:第一个阶段是通过眼动追踪技术观察被试对不同信息图表的平均注视次数、注视点持续时间和主观满意度这3个眼动指标;第二个阶段是通过被试的反应时间和正确率来探究信息图表中不同数据展示形式对阅读效果的影响。结果表明,导语和分栏标题获得被试更多的关注,被试的阅读轨迹呈现“Z”型,柱形图相比于折线图和饼图,更能缩短读者进入信息加工过程的时间。喻国明等[31]利用眼动追踪技术研究了读者在阅读中文报纸版面时的视觉规律,发现读者在接受同等视觉刺激下阅读报纸的眼动轨迹呈现从左到右、由上及下的顺序性阅读规律,版面主视觉区的设置可以在一定程度上改变读者的阅读顺序。
根据眼脑假说,眼睛和大脑的认知加工是同时进行的。眼动能反映内在的认知过程,所以眼动成为研究用户心理的一种途径和方法。
王秀红等[32]通过眼动实验对用户阅读专利文献时感兴趣的要素和要素之间的关联程度进行研究,得出科研用户有较高兴趣度的专利文献要素是摘要和独立权利要求,应优先推送这部分内容;其研究还发现用户在专利文献的摘要、独立权利要求和从属权利要求这3个要素存在明显的上下文对照阅读,表明对这3个要素的阅读兴趣有较密切的关联,系统应组合推送这些信息。Schneider等[33]的研究结果表明,参与者与其伙伴实时的相互注视知觉干预(real-time mutual gaze perception intervention)可以帮助他们获得更高的协作质量和学习收益。Al-Samarraie等[34]探讨大五人格特质对网络信息搜寻行为的影响,研究人员对75名被试的眼动行为变化进行了研究,指定被试完成的信息搜寻任务分为3类,即实时型、探索型、解释型。他们利用大五人格理论对被试的人格特征进行了评估,采用层序聚类分析方法,根据被试性格特征对其进行分类,得出3类聚类方案:第一组由尽责性(conscientiousness)得分高的被试组成,第二组由随和性(agreeableness)得分高的被试组成,第三组由外倾性(extraversion)得分高的被试组成。结果显示在大多数搜寻任务中,尽责性高组的被试任务的完成度最高,其次是随和性高组的被试和外倾性高组的被试。该研究对智能人机界面、个性化设计具有重要的实际意义。
用户差异的研究为开展个性化信息服务提供了理论基础,此类研究对于提升不同类型用户的信息体验有重要参考价值。用户的行为差异可以通过分析其搜索能力来研究。王宇等[35]通过眼动实验并结合问卷调查法和访谈法,研究不同信息搜索能力和不同搜索任务对探索式检索行为的影响,得出搜索能力高分组人群比低分组人群呈现更多的检索行为,随着任务复杂性的增加,检索行为频率也在增加;高分组人群的注视频率高于低分组人群。杨瑜[36]基于认知负荷理论,从学科知识角度将任务分成3种类型(简单任务、学科相关复杂任务、学科无关复杂任务),考察专家、熟手和新手在不同任务情境下进行学术信息检索时的眼动特征,发现其各自检索策略遵循不同的模式。
用户的行为差异也可以通过分析其知识的掌握程度来研究。Bhattacharya等[37]探讨知识水平变化的差异是否能在阅读时的眼动中反映出来,他们对30位被试的网络检索行为进行了眼动追踪研究,在每项任务完成前后测试了他们对话题的知识掌握情况。结果表明,掌握知识水平变化较大的被试与变化较小的被试相比,在总阅读序列长度、阅读序列持续时间和阅读注视次数方面存在显著差异。Ooms等[38]结合反应时间测量和眼动追踪进行实验,以深入了解用户对动态交互式地图的认知过程。此研究招募专家和新手两个用户组进行试验。实验主试将20张随机出现在屏幕上的地图展示给被试,被试根据地图右侧给出的5个地理名称在地图中进行视觉搜索,找到后按下按钮以测量反应时间。两个组的用户在查找后续名称中表现出类似的模式,从这种模式中可以得到用户认知负荷的信息,如工作记忆。在反应时间方面,专家在寻找地图中的地理名称时要快得多。这一点在眼动指标上得到了进一步的证实,专家们的注视时间明显更短,每秒的注视次数更多,这意味着专家可以更有效、更快地定位地图中的物体。Cole等[39]介绍了一种基于眼动模式分析的技术来表示用户的文本信息获取过程,提出了两个探索性回归模型来从眼动追踪数据中推断用户领域知识。
用户的行为差异还可以从年龄差异的视角来研究。侯冠华等[40]以老年人和年轻人为研究对象,选用注视点次数、瞳孔直径大小等眼动指标,对老年人和年轻人采用组间实验的方法,结合问卷量表等指标对数字阅读中字号、字间距、行间距等影响因素进行研究。研究结果表明,老年人和年轻人在使用相同字号、阅读间距的数字内容时,可用性评价、视觉舒适度这类主观感受上的差异较明显,而在字号、间距、速度等这类客观感受上的差异并不明显。Bilal等[41]调查了美国6年级和8年级(分别为11岁和13岁)的儿童在用谷歌搜索时如何阅读SERP。他们使用眼动追踪来分析儿童对SERP的阅读行为,以及年级和任务类型对阅读行为和交互行为的影响。结果显示,不同年级学生在阅读SERP时注视次数上有显著差异,与任务类型相比,年级或年龄对阅读行为、注视和与搜索结果页的交互有更显著的影响。
以用户作为研究对象来提升和优化界面设计更具有客观性和科学性,而眼动技术方法对捕获用户的行为和偏好也更客观和真实。利用眼动技术方法研究信息界面设计主要涉及电子移动阅读界面、高校图书馆门户网站、网络购物页面、有广告的新闻网页等界面情境。
孙洋等[42]总结了3种可用性测评方法,从使用效果、效率、可学习性、满意度4个维度对百阅和iReader两种阅读软件的可用性进行测评,从用户角度给出软件的优化建议。张瑞[43]探讨了如何根据眼动指标进行关联推荐和移动终端页面优化。许鑫等[44]等发现用户在浏览高校图书馆门户网站主页时习惯于先注视中部及中部偏上区域,其次是中部及左侧偏上位置,左下及右侧区域易被忽视;搜索目标位置是影响搜索效率的主要因素,当搜索目标位于中部及左上区域时搜索效率较高,位于左下及右侧会加大搜索难度,增加搜索时间。陆泉等[45]提出了在复杂动态界面环境下获取用户注视信息的眼动追踪方法,弥补传统方法在此条件下无法提取注视内容信息的不足。
本文通过对图书情报学中运用眼动技术方法的相关文献进行梳理归纳,指出眼动技术方法在图书情报学中主要应用于用户信息行为、用户心理、用户差异、信息界面设计等领域,其中用于信息行为的研究最多。眼动技术方法因其特有的客观性,能记录用户的行为过程,反映用户的认知情况,日益受到图书情报学者(特别是信息行为研究者)的青睐。作为强有力的实证工具,眼动技术方法在图书情报学中有着广阔的应用发展空间。未来眼动技术将与脑电、心电等技术联合应用,很可能成为信息用户研究中的主流方法,共同为探索数字环境下图书情报学中的基础性问题和应用性问题开辟新的研究思路;特别是为学科中长期存在的理论争议提供客观中立、有说服力的解决方案,推动学科的进步与发展。与此同时,眼动技术方法还可以与传统研究方法(如访谈法、出声思维法)相结合形成混合方法,应用于用户体验、信息服务、人机交互与界面设计等领域的研究,形成面向实务工作新的指导原则或方案建议,为图书情报工作者提供有价值的参考。