基于用户体验评价移动健康类应用程序的研究进展

2022-12-09 00:37兰悦万巧琴
军事护理 2022年11期
关键词:易用性应用程序用户

兰悦,万巧琴

(北京大学 护理学院,北京 100191)

随着移动设备的普及和公众对健康关注的提高,以手机和平板电脑为载体的移动健康类应用程序正成为促进公众健康的重要方式。目前,市场上已有的移动健康类应用程序繁多,针对移动健康类应用程序的评价研究也逐渐增多,其中基于用户体验的评价近年受到关注。用户体验强调个体的实际感受,从用户真实体验角度评价移动健康类程序,对完善并促进该类程序更好地发挥作用具有重要意义。本文通过检索国内外基于用户体验评价移动健康类应用程序的文献,梳理相关概念发展、理论模型、评价指标、评价工具和评价结果,阐述该领域的研究现状和发展动态,以期为今后相关研究的开展及应用提供参考。

1 用户体验的概念和发展

用户体验最早用于电子产品人机交互方面的研究,而后逐渐在网站、应用程序的设计与评价中使用。目前,国内外关于用户体验的定义较多,但大多数学者[1-2]认为用户体验需以用户为中心。国际标准化组织将用户体验定义为用户对应用程序的使用和/或预期使用所产生的感知和反应,其中用户的感知和反应包括用户在使用前、中、后的情绪、信念、偏好、感知、舒适度、行为和成果[3]。差异化用户体验的形成是应用程序的功能、系统性能、交互操作、辅助效果、品牌形象等多方面因素作用的结果。因此,应用程序评价始于对程序本身的设计和各类性能参数的客观评价,如错误保护设计、信息安全设计、运行时间、容量等。不可否认的是客观的应用程序评价与基于用户体验的评价相关,但这并不意味着客观评价可以代替基于用户体验的主观评价。例如,应用程序客观评价中备受关注的可用性,可以看作产品属性之一;而用户体验则更具有整体性,涵盖用户与应用程序交互时的各个方面,并受到使用环境和用户的内外在状态影响。用户体验超越产品本身,不是产品属性,基于用户体验的评价更加关注用户精神和情感层次的需求。Law等[4]提出,虽然用户体验的评价工具多源于传统的可用性评价,但两者并不一致。作为以服务人类健康为目的的移动应用程序,应更聚焦用户的主观评价。

2 基于用户体验评价移动健康类应用程序的常用理论模型

2.1 技术接受模型(the technology acceptance model,TAM) Davis[5]在行为学研究的基础上加入感知有用性和感知易用性构建TAM,用于评价用户对信息技术的接受度。TAM表明感知易用性是感知有用性的先行因素,且两者共同决定使用态度,而感知有用性和使用态度决定使用的行为意向,最终使用的行为意向决定应用程序的实际使用。后来TAM在健康相关信息领域得到较为广泛的应用。李前慧等[6]引入健康风险、年龄和技术焦虑等因素,构建移动健康服务的技术接受模型。Farzandipour等[7]从用户体验角度设计了健康信息技术接受模型。

2.2 技术采纳与整合理论模型(unified theory of acceptance and use of technology,UTAUT) Venkatesh等[8]通过比较和整合TAM、计算机利用模型等8个模型构建了UTAUT模型。该模型由4个核心因素(绩效期望、付出期望、社群影响和促成条件)和4个调节因素(经验、自愿性、年龄和性别)构成。在UTAUT模型中,绩效期望、付出期望和社群影响直接影响使用意愿,促成条件和使用意愿直接影响使用行为,而4个调节因素影响模型中多个路径。UTAUT模型在医疗领域也得到了扩展和应用,Hoque等[9]在老年人群对移动健康接受度的研究中加入技术焦虑、抵抗变革等因素以扩展UTAUT模型。McGoldrick等[10]基于UTAUT模型自设问卷对一款针对痴呆患者的应用程序进行评价。

2.3 信息系统成功模型(the DeLone and Mclean model of information systems success,D&M) DeLone等[11]在既往信息系统相关研究基础上提出D&M模型,并于10年后更新。第二代D&M模型由7个因素组成,分别为系统质量、信息质量、服务质量、使用意愿、系统使用、用户满意度和净收益。其中服务质量与系统质量、信息质量共同影响使用意愿,而系统使用、用户满意度与净收益间则存在相互作用。目前,第二代D&M模型在卫生健康领域应用广泛并有所扩展,如加入文化影响、信任感知等因素。随着移动健康的发展,Akter等[12]参考第二代D&M模型及其他相关研究,开发了一款基于用户体验的移动健康服务质量量表,并构建了移动健康服务质量模型。

总体而言,大部分基于用户体验的信息技术评价模型借助于心理学、行为学和营销学理论而产生并发展完善,而后应用于移动健康类应用程序的评价中。目前常见的模型对于健康信息技术类产品具有普遍适用性。而在实际评价研究中,多数学者[13]往往根据所使用应用程序的属性与特点,整合多种理论模型重新构建体系用以评价所使用应用程序。这也导致移动健康类应用程序评价模型近年来不断增加,但较少被验证和使用。

3 基于用户体验评价移动健康类应用程序的常用指标

3.1 有用性(usefulness) 其被定义为用户对其感知到预期目标和需求实现的满意程度,包括使用应用程序带来的直接结果和后续影响[14]。在移动健康类应用程序中,有用性的评价多指用户健康相关行为或结局的评价。Kastner等[15]通过慢病管理自我效能、健康指数、健康素养等工具评价一个慢病管理应用程序的有用性。Escoffery等[16]从行为改变方面对癫痫自我管理应用程序的有用性进行评价。总体而言,有用性是目前移动健康类应用程序评价中十分常用的指标,研究[17-18]多采用现存的疾病或健康知识、态度、行为量表、指南或专家共识等进行应用程序有用性的评价。

3.2 易用性(operability) 其指的是在用户进行交互体验时,考虑到用户的不同背景(包括经验、技能等),用户操作和控制应用程序完成预期任务的难易程度,也包括应用程序对不同的处理和使用方式的支持程度[14,19]。部分学者[14,19]认为易学性(learnability)是易用性的基础,建议将其纳入易用性的概念和评价之中。易学性被定义为在应用程序使用初期及后续的不断更新中,用户始终可以在预期使用环境中高效而轻松地学习应用程序使用的程度。对于相对弱势的群体来说,易用性是影响移动健康类应用程序使用的重要因素,如有研究在设计供老年人使用的应用程序时关注字体、色彩和触控的适老化,并将易用性纳入质量评价[17]。

3.3 可靠性(reliability) 其定义是用户对应用程序及其按预期顺利使用的信任程度[14]。应用程序客观评价指标中的安全性是可靠性的基础,应用程序的运行速度、兼容性及保密性均会影响用户对应用程序的信心。此外,移动健康类应用程序作为健康信息的传播平台,其可靠性还要求所展示的各种健康医疗相关信息和服务具备科学性或循证医学证据。但目前在可靠性方面尤其在是其中的信息质量部分,大部分移动健康类应用程序仍有待提高[20]。

3.4 满意度(satisfaction) 其定义为用户在与应用程序交互过程,对应用程序的总体感觉、感知和意见[14,21]。相对来说,满意度是一个比较广泛和含义丰富的概念。部分学者[15,22]将有用性、可靠性、易用性均纳入满意度概念。同时,在部分研究中[14,19,23],满意度被赋予更多二级指标,如美观性、愉悦感、用户价值感等。美观性(aesthetics)是指在应用程序界面及交互操作中,用户获得的感官上的美学体验,如好听、好看[14,19]。愉悦感(pleasure)则为用户通过应用程序实现个人目标或需求及其过程中而获得的愉悦程度[14]。用户价值感(user value)是指用户将自己的主观价值附加到应用程序并取得效果的满意程度[23]。满意度的概念相对较为综合,是移动健康类应用程序持续改进的重要参考依据。现阶段多项研究[15,17,22]将满意度纳为移动健康类应用程序的评价指标之一。

4 基于用户体验评价移动健康类应用程序的常用工具

基于用户体验的评价最初为质性评价,后续逐渐开发相关量表进行量性评价,目前研究中多将质性和量性评价结合。其中,评价工具多是根据常用评价指标和模型自行设计或是以现有评价工具为基础进行修改。

4.1 系统可用性问卷(post-study system usability questionnaire,PSSUQ) Lewis[24]为评估用户对计算机系统的满意度而设计了PSSUQ,后续有研究[22]将其用于移动健康类应用程序的评价。PSSUQ包括有效性、信息质量、界面质量3个维度,共19个条目,采用Likert 7级评分法,得分越低表示评价越好。该量表的计分方法为计算各维度平均分以及总体平均分。量表总体Cronbach’s α系数为0.96,有效性、信息质量、界面质量3个维度的Cronbach’s α系数分别为0.96、0.92、0.83。

4.2 系统可用性量表(system usability scale,SUS) SUS旨在快速、轻松地收集用户的主观评分,用以评价计算机界面、网站和应用程序等各种信息技术[25]。Quinn等[17]使用SUS对一款老年人及其照顾者的健康管理应用程序进行评价。张洪辉等[26]在评价糖尿病相关应用程序的研究中使用了SUS。SUS含10个条目,包括正向和负向条目,采用Likert 5级评分法,分数越高评价越好。目前学术界关于SUS维度划分并不统一,但倾向于单一维度,其Cronbach’s α系数为0.91。此外,多数2011年前的研究表明SUS平均得分在68分及以上表明产品/系统是可用的,而最近的研究则表明标准提高到了70分,这可能与公众的信息素养提高有关[27]。

4.3 用户版移动医疗应用分级量表(end-user version of the MARS,uMARS) Stoyanov等[28]在移动医疗应用分级量表基础上提出uMARS,其专门为移动健康类应用程序的用户终端评价开发。Serlachius等[29]在评价一款针对年轻人心理健康的应用程序中使用了uMARS。在一项风湿病患者自我管理应用程序研究中[30],uMARS被用作该应用程序的评价工具。uMARS包含5个维度:参与度、功能性、美观度、信息质量以及主观整体评价,共20个条目。此外,该团队根据移动健康类应用程序的特点,增设一个包含6个条目及1个开放性问题的子量表,以评价用户感知到的应用程序对其健康相关知识、态度、意图和行为的影响。每个条目均采用Likert 5级评分法,得分越高代表评价越好。其得分方式为计算各维度及总体平均得分。uMARS具有很好的内部一致性(Cronbach’s α=0.90),所有维度的Cronbach’s α系数也都较高(参与度α=0.80,功能性α=0.70,美观度α=0.71,信息质量α=0.78,主观整体评价α=0.78)。2020年张诚霖等[31]对uMARS进行汉化并验证发现其具有良好信效度。

5 基于用户体验评价移动健康类应用程序的研究结果启示

现有研究[17,20,22,32]表明移动类健康应用程序在有用性方面受到了用户的肯定;而在易用性和可靠性方面仍需加强。几项使用uMARS作为评价工具的研究则提示用户在个性化和参与感方面有更高的期待[17,22,30]。此外,部分研究[10,29]中存在一定比例的负面评价,结合访谈结果可以发现这与应用程序未考虑到用户不同年龄分布、文化背景及疾病程度等影响因素有关,这提示移动健康类应用程序可根据用户特征开设不同专区或使用模式。另一方面,目前相关研究的受试者往往选取新用户,用户体验时间从10分钟到6个月不等且以短时间使用居多,这使得评价结果可能存在偏倚。也有部分评价结果[22,30]源于用户在实验室或医院中的短时间使用,而这与在真实世界中使用可能存在差异。因此,未来需要更多的基于真实世界的移动健康类应用程序评价的相关研究,以期获得更切实的用户体验数据,进一步助力应用程序的改进。此外,作为健康服务的提供方,医护人员也是应用程序的用户之一,但目前针对医护人员用户体验的研究相对较少。这提示学者需要关注医护人员对移动健康类应用程序的使用体验。

6 小结

基于用户体验的评价既是应用程序客观质量的反映,同时与接受、使用应用程序的意愿息息相关。目前,基于用户体验的移动健康类应用程序评价相关研究日渐增多。其中研究多探究有用性、满意度等核心指标,常见理论模型有TAM、UTAUT模型和D&M模型,评价工具以PSSUQ、SUS、uMARS和自设问卷多见。现有相关研究结果表明移动健康类应用程序受到大多数用户认可,但其在易用性、个性化等方面仍存在完善空间。随着移动设备的普及,用户将通过应用程序更多地参与到自身的健康管理中。移动健康类应用程序将被寄予更高期望。而应用程序的评价研究将助力应用程序从设计、开发到应用、迭代的全过程发展。然而,目前移动健康类应用程序领域研究仍然不够充分和深入。首先,由于各学者采用的评价方法及工具不尽相同,应用程序间可比性不高。其次,应用程序的评价体系和工具不断涌现及拓展,内容多有交叉重叠,还需要更多的使用和验证。此外,医护人员也是移动健康类应用程序的用户之一,但目前研究中却鲜少关注医护端评价。

猜你喜欢
易用性应用程序用户
政务软件易用性评测探究
删除Win10中自带的应用程序
谷歌禁止加密货币应用程序
老年人家电产品易用性设计研究
中国国际人才交流大会网站易用性评价调查问卷
关注用户
关注用户
关注用户
关注用户
三星电子将开设应用程序下载商店