暂时性用户体验的设计与评价1

2019-10-26 07:58胡飞姜明宇广东工业大学艺术与设计学院
创意与设计 2019年4期
关键词:权重阶段指标

文/胡飞 姜明宇(广东工业大学 艺术与设计学院)

1995年Don Norman在CHI会议上首次使用了“用户体验”(User Experience)一词。此后,用户体验从人机交互(Human Computer Interaction)中不断拓展外延,并随移动互联网的迅猛发展而深入人心,当前已成为设计界的口头禅。笔者曾撰文比较了哲学、经济学、人机交互和设计学中与“体验”相关的概念,比较了可用性、用户体验和体验设计的术语内涵,探讨了用户体验和体验设计的学科逻辑;进而发现,用户体验研究完成了从要素到系统、从维度到深度的不断探索,正在突破“一个体验”,迈向更为广阔和深入的“体验设计范式”2胡飞,姜明宇. 体验设计研究: 问题情境、学科逻辑与理论动向[J]. 包装工程, 2018, 39(20): 60-75.。本文则延续此思路,聚焦用户体验的暂时性问题,以图片编辑应用为例,探讨用户使用历程中体验要素的演变及其评价。

一、时间视角下的用户体验

尽管许多研究者都试图从不同角度定义用户体验,但迄今还未在用户体验的本质和范畴上达成共识,原因之一就在于“用户体验无所不在”3Kuniavsky M. Observing the User Experience - A Practitioner's Guide to User Research.Morgan Kaufman: Elsevier USA, 2003: 45-47.。用户体验最为普遍认可的一个定义来自ISO 9241-210:“人们对于使用或参与产品、服务或系统所产生的感知和回应”。1User experience - Wikipedia, https://en.wikipedia.org/wiki/User_experience, last accessed 2018/1/20.这个定义清晰地界定了用户体验附属于“用户”,指向“感知和回应”,时间限定在“使用和参与过程”的前、中、后,对象是“产品、服务或系统”。

现有用户体验研究多聚焦于产品、服务或系统等具体对象,因此多关注显性的、具象的用户体验要素,如James Garrett(2003)认为网站的用户体验包括用户对品牌特征、信息可用性、功能性、内容性等四个方面和战略层、范围层、结构层、框架层、表现层等五个层次2Garrett J J. The Elements of User Experience: User-Centered Design for the Web. New York: New Riders Publishing, 2003: 13-20.;Hellweger和Wang(2015)归纳出用户体验的12个要素:(1)产生用户体验的要素,包括语境、可用性、产品特性、需要、认知、目的;(2)被用户体验影响的要素,包括难忘的、无处不在、知觉、情感与情绪、参与度、教育性3Stefan Hellweger and Xiaofeng Wang. What is User Experience Really: towards a UX Conceptual Framework. 2015。而“时间”这一隐性的、抽象的用户体验要素则常常被忽视。

Forlizzi 与 Battarbee(2004) 提出体验的可扩展性与时间维度相关,随着时间的推移,多个小型的交互与情感反馈过程逐渐整合为更大规模的体验,这一过程中人与产品的关系也在发生变化4Forlizzi J, Battarbee K. Understanding experience in interactive systems [C]. Conference on Designing Interactive Systems: Processes, Practices,Methods, and Techniques. ACM. 2004:261-268。Mendosa与Novick(2005)发现随着时间的推移,错误的类型与产生沮丧的原因发生了很大改变。因此,可用性测试中发现的错误在长期使用后可能不再有价值5Mendosa V., Novick D.G. Usability over time[C]. In: ACM 23rd International Conference on Computer Documentation, ACM, 2005. 151-158.。基于Hassenzahl的“美”与“好”两大标准,Karapanos与Hassenzahl等(2008)对智能电视的使用过程进行了为期四周的研究,评估不同时间点上用户体验要素的变化。结果表明:第一周,“美”与吸引力相关,“好”与实用性相关;四周后,“美”与吸引力的关系不再明显,“好”则更多与身份认同相关6Karapanos E, Hassenzahl M, Martens J B. User experience over time[C]. CHI '08 Extended Abstracts on Human Factors in Computing Systems. ACM.2008:3561-3566.。

图1 体验的暂时性模型(Karapanos等,2009)Temporality of experience from Karapanos

Karapanos与Zimmerman等(2009)进一步研究了6位用户为期一个月的智能手机使用体验,并建立了体验的暂时性模型(Temporality of experience)。这一框架中,用户对产品的接受过程被分为三个阶段:(1)适应(Orientation)阶段包含用户最初接触产品时的初始体验;(2)融合(Incorporation)阶段关注产品在日常生活中的为用户带来的意义;(3)认同(Identification)阶段则将产品的体验扩充到社会语境下,产品被视为社会交互下身份认同的沟通工具,同时,模型中也包含了实际使用过程之前对产品所建立的预期1Karapanos E, Zimmerman J, Forlizzi J, et al. User experience over time: an initial framework[C]. International Conference on Human Factors in Computing Systems, CHI 2009, Boston, Ma, Usa, April. DBLP, 2009:729-738.。

辛向阳和赵婉茹(2015)构建了用户体验的EPI模型,将用户体验分为预期(Expectation)、进程(Progression)、影响(Influence)三个一级要素,以及若干二级和三级要素,以用户的参与阶段为主线定义体验的属性2赵婉茹.基于互联网产品的用户体验要素研究[D]. 无锡:江南大学,2015。EPI模型将视角从实际交互过程扩展到交互开始前的“预期”与交互结束后的“影响”,将“体验”作为大众传播的内容为用户带来了口碑、吸引、事前认知等影响;同时强调了体验的可记忆属性,即在交互过程结束后,体验依旧会在用户的心理与情感层面持续发挥作用,为用户带来回忆、自我感觉与自我改变。

钱广斌(2017)将长期用户体验划分为三个阶段3钱广斌.用户体验在时间维度上的周期性研究[J].设计,2017(12):106-107.:(1)经验阶段,基于自我主观体验或非直接性的经验传播,对产品使用进行体验评估;(2)互动阶段,掌握了与产品的互动方式、能正确使用产品的阶段;(3)期望阶段:基于互动阶段并与预期体验相对照。用户的既往经验会影响他与产品的互动过程,互动过程的体验决定了用户对新产品的期望,而在体验新产品时,之前的互动和期望也转化成了他的经验,从而构成一个循环式的体验周期。

在EPI模型的基础上,辛向阳(2019)提出了体验的EEI模型,将期许(Expectation)、事件(Event)和影响(Impact)作为体验设计的三个有机部分:首先,EEI模型的中间用“E”替代了EPI模型的“P”,强调事件进程中环境条件的重要性,以及参与者自我创造活动的存在和对进程的影响;其次,EPI模型中的“期望”强调期望值对体验结果判断的影响,而EEI中的“期许”还综合考虑了动机对事件开始的触发作用,以及目标对过程的牵引作用;最后,EPI模型适用于互联网语境下的用户体验,而EEI模型则面向更为广阔的体验设计。4辛向阳.从用户体验到体验设计[J].包装工程,2019(8):60-67.

表1 用户体验不同理论框架中的时间流

比较用户体验时间性问题的相关理论(表1)可以发现:(1)在阶段划分上,尽管用户体验的API模型、用户体验周期模型、体验EEI模型不尽相同,但都采用了三阶段划分,一定程度上与ISO 9241-210用户体验定义中“使用和参与过程”的前、中、后相呼应;而体验的暂时性模型则进一步将“使用和参与过程中”划分为适应和融合两个阶段。(2)在要素确定上,“预期”成为用户体验前期的较为一致性的要素;在使用和参与过程中,进程、互动、事件等概念的侧重点各不相同,且还有进一步挖掘次级指标的空间;在使用和参与过程后,“影响”是一个较为中性和宽泛的界定,“认同”则是积极用户体验的正向取向,即良好用户体验过程后的结果应该是“认同”。(3)整体而言,体验的暂时性模型较为完整;体验 EEI 模型具有较大的突破性,但还有待进一步完善。

二、用户体验的暂时性评价指标体系建模

本文以图片编辑应用为例,基于用户体验的暂时性模型(Karapanos等,2009),探讨用户体验的暂时性评价指标体系。

2.1 初步建立评价指标体系

(1)用户访谈。课题组访谈了21名用户,了解其对于产品使用的体验、事件、影响因素等。

(2)要素归纳。将用户描述提炼为影响用户体验的微观要素,共计128点,分属于用户体验历时性框架点四个不同阶段。

图2 指标体系与体验阶段的映射Mapping of indicators and experience phrases

(3)建立评价指标。将128个微观用户体验要素进行两次卡片分类,从而建立图片编辑应用的用户体验评价指标,其中包含5个一级指标:功能完备、介面易用、赋能社交、深层意义、营销低打扰;每个一级指标下包含若干二级指标,共22个二级指标,如图2所示。

2.2 评价指标与TE模型的映射分析

将评价指标与体验的暂时性模型进行映射,得出评价指标在用户体验不同阶段的分布规律:

(1)在预期阶段,功能完备和营销低打扰与用户体验关联较大,而介面易用和深层意义与用户体验关联较小。即,在用户初次接触应用时,功能配置是否齐全成为影响用户下载使用的首要因素;同时,在营销推广方式上,口碑良好的产品会经由用户的自发宣传推广而被更多人所熟知及试用。

(2)在适应阶段,功能完备与介面易用是影响用户体验的主要因素。即,在用户使用产品的起始阶段,功能配置齐全可以帮助用户完成更多样的任务,满足其对产品功能的期望;介面的易用性直接影响了用户对新产品的学习成本,友好的用户介面可以帮助用户更快熟悉产品;而在使用初期,页面中的广告明显影响了用户的正常任务操作,成为用户体验的负面因素。

(3)在融合阶段,影响用户体验的主要因素仍为功能完备与介面易用。可见,作为一类工具型产品,功能性因素将持续影响产品使用的全周期;图片编辑产品所提供的价值在于完成特定任务而非浏览内容,因此可用性因素同样在持续影响产品的熟练使用阶段。

(4)在认同阶段,除功能因素持续对用户体验产生影响外,意义因素也占了较大比重,表现在用户多样化的动机与修图行为对用户自身观念的长期影响两方面。此外,认同阶段也占据了赋能社交因素的全部比重,说明在对功能与使用方式充分熟悉之后,用户开始转向产品的社交属性。

2.3 评价指标的理论分析

将本文中不同体验阶段所显现的影响因素与Karapanos(2009)的研究结论做以对比,大体一致:(1)Karapanos将预期解释为实际使用产品之前建立期望的过程;而在本文中,用户对产品期望的建立主要通过他人的分享推荐来实现,与影响用户体验的营销因素相对应。(2)在适应阶段,从属于功能要素的素材优质与功能趣味性对应了Karapanos研究中使用户兴奋的因素,而从属于介面要素的流程精简对应了Karapanos对此阶段中可学习性的定义。(3)在融合阶段,功能要素下的全面、优质与趣味性可以用Karapanos结论中的有用性来解释,介面要素下的流程因素则与长期可用性相关。(4)在认同阶段,Karapanos提到的社会交互因素也在本文中通过图片编辑应用的话题性得到体现。

与Karapanos研究结论的不同之处在于,原本出现于融合阶段的意义属性在本文中于认同阶段出现,扩充了认同阶段除社会交互之外的内容,而在融合阶段则仍是功能因素与介面因素占据主要部分。出现这一偏差的原因可能在于,原始资料收集调研的过程中,回忆性访谈在方法上的模糊性难以让用户清晰定义不同的体验阶段及不同阶段的代表性用户体验要素;同时,由于各种类型的移动应用早已深入人们生活方式的细节中,因此,尽管是一款从未使用过的应用,用户也会因此类产品通用交互方式与功能配置而迅速学习并熟练使用,访谈中即有用户表示“修几张照片即可上手”“不需学习,迅速上手”,这种情况下相对难以精确划分不同的用户体验阶段。相比之下,Karapanos基于iPhone(2008)与智能电视(2009)的研究均于同类产品刚刚问世的初期进行,因此用户并没有关于此类产品的通用经验与概念模型,学习过程相对较长,不同体验阶段的区别也越加明显。

表2 本文指标与Karapanos研究结论的对比Result comparison between this paper and Karapanos’s

2.4 确定指标权重

明确图片编辑应用的用户体验评价指标后,需进一步明确一级指标及其二级指标的权重系数,方可得到完整的用户体验评价模型。本文将采用序关系法确定指标的权重系数1郭亚军. 综合评价理论、方法及拓展[M]. 北京: 科学出版社, 2012.。本次调研采用问卷法,让每位用户对指标体系中的一级指标及每个一级指标下的二级指标进行重要性排序,得到排序结果。序关系法的指标权重计算过程为:

(1)图片编辑应用的五个一级指标:功能完备、介面易用、赋能社交、深层意义、营销低打扰,分别记为 M1、M2、M3,M4、M5。

第一位用户认为,一级指标之间的序关系为:

相应地,指标对应的权重系数为:

ω2>ω1>ω3>ω4>ω5

为了便于指标重要程度判断,使相邻指标的间距保持一直,用Mi*表示{Mi}按序关系“>”排定顺序后的第k个评价指标(k=1,2,…,m),则:

相应地,指标对应的权重系数排序为:

且给出

则:

因此,各项指标的权重系数为:

同理可得其余用户的权重系数(见表3),并对所有用户的权重平均值,得:ω1=0.298,ω2=0.260,ω3=0.151,ω4=0.125,ω5=0.166。

用同样的方法得到每个一级指标下个二级指标的权重值。

功能完备指标下有8个二级指标,分别为功能配置全面专业、修图整体效果出众、系统运行稳定友好、修图效果自主掌控、基础功能完备实用、美化素材丰富优质、美图效果自然不浮夸、美图功能新奇有乐趣,记为 M11,M12,M13,M14,M15,M16,M17,M18,根据序关系法得到指标的权重为ω11=0.156,ω12=0.177,ω13=0.125,ω14=0.128,ω15=0.141,ω16=0.056,ω17=0.160,ω18=0.057, 如图4-2,a。

介面易用指标下有5个二级指标,分别为信息架构清晰明确、操作流程精简流畅、文字表意准确易懂、学习成本低、容错,标记为M21,M22,M23,M24,M25,根据序关系法得到指标的权重为ω21=0.210,ω22=0.230,ω23=0.178,ω24=0.200,ω25=0.182,如图4-2,b。

表3 用户为一级指标赋予的权重系数Weight of primary indicators by users

赋能社交指标下有2个二级指标,分别为营造交流话题、展示更好的自我形象,记为M31,M32,根据序关系法得到指标的权重为ω31=0.438,ω32=0.563,如图4-2,c。

深层意义指标下有4个二级指标,分别为借助修图表达情绪、展示专业的后期水平、带来新的使用习惯、提升形象自 信, 记 为 M41,M42,M43,M44, 根 据序关系法得到指标的权重为ω41=0.275,ω42=0.252,ω43=0.162,ω44=0.311, 如图4-2,d。

营销低打扰指标下有3个二级指标,分别为广告干扰小、营销推广不使用户尴尬反感、 激发用户主动推广产品,记为M51,M52,M53,根据序关系法得到指标的权重为ω51=0.338,ω52=0.330,ω53=0.331

考虑到二级指标权重从属于一级指标,而一级指标间权重亦有不同,因此,为了对全体二级指标进行比较,需对各一级指标下的所有二级指标进行规范化1胡飞,周坤,麦永治. 面向产品服务系统的用户体验可拓评价方法研究[J]. 机械设计, 2018,35(02): 109-114.:

式中:ω'ij为规范后的二级指标权重;

ωij为原二级指标权重;max ωij为各一级指标下的最大二级指标权重;ωi为各一级指标权重。

规范后的二级指标权重如下:

表4 规范后的二级指标权重Normalized secondary index weights

三、案例研究:Snapseed的用户体验评价与设计

以Google开发的图片编辑应用Snapseed为例,基于用户体验的暂时性评价指标体系模型进行产品体验评价,并根据评价结果优化产品设计,进而对改进方案再次评价,从而验证方案及评价模型的有效性。本文聚焦在二级指标层面,因二级指标数量众多且权重不等,本文选取规范权重前40%的部分二级指标进行评价,即“M12修图整体效果出众”(0.298)、“M17美图效果自然不浮夸”(0.269)、“M11功能配置全面专业”(0.263)、“M22操作流畅流程精简”(0.260)、“M21信息架构明确易懂”(0.238)、“M15基础功能完备实用”(0.238)、“M24学习成本低”(0.227)、“M14修图效果自主掌控”(0.216)八个指标。

3.1 现有产品的体验评价

评价实验以5天为一个研究周期,邀请4名图片编辑应用的专业用户,实验任务为每天使用Snapseed完成自由修图任务,因移动应用的学习速度普遍较快,为了拉开不同体验阶段的差异化特征,每天修图数量限定为2张。任务结束后根据当天的使用体验为每个评价指标进行评分,评分采用7点Likert量表的形式,请用户依次判定对指标内容陈述的认同程度,实验最终得到连续5天、每天5份选定评价指标的当日评分数据。

将Likert量表中的标度转换为从-3到3的7点数值,正向数值越大表示该指标的反馈越好,负向数值越大表示该指标的反馈越差。以每一评价指标为单位,得出不同用户对同一指标的评分在5天中评分情况的可视化图表,可以清晰看到指标评分的变化趋势。

图3 现有产品的不同指标评分趋势a)效果出众b)效果自然c)功能全面d)操作流畅e)基础功能完备f)信息架构清晰g)学习成本低h)效果自主掌控Score of selected indicators for current product a)effective b)naturally c)functionality d)process e)basic functions f)IA g)easy to learn h)control

从评分趋势中可以看出,功能全面、基础功能完备等指标的评分趋势相对更为稳定,这一现象一方面可归结为Snapseed自身多样的功能配置,另一方面功能性指标都偏向显性,用户对指标质量的感知较为轻松,不会随使用时间的推移而出现明显变化。与之不同的是学习成本、信息架构等指标的初期评分较低,而随着使用时间增长,对产品的操作方式日渐熟悉,用户也越发能够自如熟练地借助Snapseed完成特定修图任务,相关指标的评分也在后期升高。另外,由于被试用户数量有限,个体差异的影响在此较为明显,如本实验中的用户2,不同时间对不同指标的评分均保持较高值,没有体现出其他用户会表现出的变化趋势。

3.2 评价分析与设计机会

以“变化平稳—变化显著(区分依据:单个指标有半数用户的评分极差达到5)”、“功能因素—介面因素”为两轴建立坐标系,对上述评价结果进行分析可见:介面相关指标的得分动态比变化较明显,指标分布集中于第一象限,说明用户可以通过一定的学习过程而获得这类指标的体验提升,因此产品设计应充分考虑帮助用户快速学习并适应新的信息传达与交互方式;而功能性指标的得分变化则更为平稳,集中于第三象限,对于这类指标,应在充分洞悉用户真实需求的基础上进行功能开发,并使功能的入口清晰可达。

将以上不同象限中的评价指标进行聚类,得出面向不同指标的优化信息架构、优化操作流程等5项产品开发改进方向,这5个方向又分别属于设计驱动、策略驱动与技术驱动(图4)。

3.3 方案优化

图4 设计机会及其转化Transformation of design goals

本文仅从交互设计角度出发,对Snapseed的信息架构及其背后的操作流程进行设计改进。

经过卡片分类与讨论,以功能对图片进行调整的方式为依据,全部功能被分为三种类型,剪裁、视角、旋转、展开等功能对图片的画面内容进行调整,突出细节、色调对比度、曲线、画笔等功能对图片的光线效果进行调节,样式、怀旧、魅力光晕等功能均在为图片添加不同形式的滤镜,尽管本质上仍是对画面光线的调节,但由于通过添加滤镜来调节光线的操作方式较为简单直观,且滤镜也是目前图片编辑应用中的最常见功能,因此通过添加滤镜实现的光线调节功能被单独分为一类。最终卡片分类结果如下图5。

以卡片分类结果为基础,同时兼顾产品页面中其他功能的分类逻辑,梳理出改进后的产品信息架构。

在改进后的信息架构中,原本位于底部导航的“导出”按钮被移动到顶部导航,而顶部导航右侧的扩展菜单移动到左侧,导入一张新图片后,默认弹出“画面”标签下的子功能列表。这一更改也使页面设计更加符合Google自身的Material Design设计规范。底部导航位置用户来放置卡片分类得出的三类功能标签,使得不同类型的功能按钮以更加清晰的逻辑呈现给用户。

点击底部任一功能标签,向上弹出/向下收起本标签下所属的编辑功能,为了减少弹出浮层对待编辑图片的遮盖,这些编辑功能以单行排列,并通过左右滑动查看标签下更多编辑功能,这种方式可以最大程度上减小功能列表对图片的遮盖。

在三个标签中,“画面”与“光线”点开后显示下一级编辑功能,再次点击特定功能后进入功能调节介面;而“滤镜”点开后直接显示默认分组的滤镜内容,用户可直接点选滤镜进行编辑,而滤镜的分组标签位于列表顶端,通过单击切换显示不同分组的滤镜。

3.4 改进方案的再评价

基于用户体验的暂时性评价指标体系,对改进方案的高保真原型进行再评价。在实验用户的选择上,因被试数量较少,难以形成统计学规律,为了降低被试个体差异的影响,课题组仍邀请之前参与的4名被试参与测评,在相同的个体评分标准下探究改进方案与现有产品的评分差异。评价结果如图所示。

从评价结果中可以看出,单个用户的评分在时间维度上的变化趋势较现有方案的评价结果更为缓和,以原有“半数用户对单个指标的评分极差达到5”为标准,改进方案在评分动态趋势上没有任何指标达到“变化显著”的范围,仅效果出众与学习成本两个指标中各有1名用户的评分极差达到5。

在与设计方案直接相关的评价指标(信息架构、操作流程、学习成本、效果掌控)中,改进方案与原有产品的差别主要在于:(1)信息架构与操作流程两项指标的用户体验改善较为明显。具体体现在几名用户给出评分的变化趋势较为稳定。尽管使用初期的学习适应阶段得分低于后期熟练阶段,但得分的极小值仅为0,未出现负值。(2)学习成本指标的评价结果与原有产品一样呈现出分化趋势,两名用户评分稳定且较高,两名用户评分由低到高变化,改进方案的差异在于前期评分的极小值都稍有提高。(3)效果掌控指标得分变化的幅度与极值均与原有产品相同。

图5 卡片分类结果card sorting results

图6 改进后的产品信息架构Redesigned information architecture

四、结论

时间性问题是用户体验研究的深层次问题,它以用户参与过程为对象,聚焦不同参与阶段用户体验的变化:无论是基于单个任务的“小体验”,还是多个任务共同构成的最终目标及其“大体验”,都是在时间维度的积累与扩展。

图7 改进方案的不同指标评分趋势 a)效果出众b)效果自然c)功能全面d)操作流畅e)基础功能完备f)信息架构清晰g)学习成本低h)效果自主掌控Score of selected indicators for current product a)effective b)naturally c)functionality d)process e)basic functions f)IA g)easy to learn h)control

本文从用户体验的定义(ISO 9241-210)入手,比较了体验的暂时性模型、用户体验API模型、用户体验周期模型、体验 EEI 模型等相关理论。以图片编辑应用为例,基于体验的暂时性模型,构建用户体验的暂时性评价指标体系,探讨用户在与产品交互的不同阶段用户体验要素的演变规律;并根据评价结果优化现有产品,同时在一定程度上验证了用户体验暂时性评价指标体系的效度。

用户体验暂时性评价指标体系涉及相互关联的多个因素,而这些因素分别指向产品开发流程中的不同岗位职能。从设计教育的角度来看,与其专门培养“通才”或“多能”型用户体验设计师,不如基于“以用户为中心的设计”(UCD)共识进行不同岗位间的协作,后者更能涵盖用户体验的全部内涵。

此外,本文中的实验仅招募了4名用户进行评价,难以得到具有统计学意义的评价结果,且评价数据受个体差异影响较大。因此,尽管本文初步建立了用户体验暂时性评价指标体系,但其有效性需进一步验证。

猜你喜欢
权重阶段指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
关于基础教育阶段实验教学的几点看法
权重常思“浮名轻”
在学前教育阶段,提前抢跑,只能跑得快一时,却跑不快一生。
最新引用指标
莫让指标改变初衷
为党督政勤履职 代民行权重担当
基于局部权重k-近质心近邻算法
大热的O2O三个阶段,你在哪?
两岸婚恋迈入全新阶段