可用性评估方法在移动医疗APP中的应用现状*

2020-02-23 06:46:49刘佩玉张小曼

医学信息学杂志 2020年11期

刘佩玉刘倩张小曼

(徐州医科大学护理学院徐州 221004)

1 引言

移动医疗APP是指安装在智能手机上的第3方医疗健康类应用程序或软件，在疾病预防、慢性疾病管理、疾病监测、健康教育、提高依从性等医疗卫生保健中起到积极的推进作用[1]。然而这些医疗APP大多数缺少医学专业人士参与，在医学信息发布上缺乏把控的标准，增加医疗事故发生率。可用性作为产品评估的一方面已在其他电子系统中得到广泛研究和认可。但移动医疗APP使用人群和使用目的特殊，可用性评估方法对移动医疗APP适用性与其他电子系统不同。本文对近年来可用性评估方法在移动医疗APP中的应用现状进行综述，以期为我国移动医疗APP发展提供依据。

2 移动医疗APP评估研究情况

2.1 国外

2012年Happtique公司发布移动医疗、保健及健身APP标准草案[2]，该草案主要包括操作、隐私、安全、内容等指标。2013年美国食品药物监督管理局(Food and Drug Administration, FDA)发布《移动医疗应用最终指南》[3]，将移动医疗分为3大类，该指南是美国移动医疗设备进入医疗市场和相关监管领域的重要依据。2015年Stoyanov等[4]编制MARS量表，该量表包括4个客观量表：用户参与度、功能、界面设计美观、信息质量，以及1个主观量表，所有子量表Cronbach′s α系数在0.80～0.89之间。2016年Stoyanov等[5]在原有MARS量表基础上简化并修改最终编制uMARS量表。MARS和uMARS量表都采用李克特5分制评分法并经专家应用和实践得到相关研究人员认可[6-8]。相比于MARS量表，uMARS量表可读性更高，适用性更广泛。国外已广泛开展移动医疗APP质量研究，针对不同适用范围的移动医疗APP制定不同评价标准。

2.2 国内

2015年王婧婷等[9]通过自制问卷、调研使用行为以及访谈15名白血病患儿照顾者的方法，进行为期3周的白血病APP试用体验测评。李轶[10]从移动运营商、医院主导和医疗机构3大研发主体对国内问诊类APP进行功能评价。陈可涵等[11]从基本概况、软件功能、收费标准和安全性等方面评价21个“共享护士”APP。国内研究人员大多自行选择或采用质性方法对移动医疗APP进行评估，评价指标和测评人员均不同。国内尚未见可靠性高、信效度好的移动医疗APP质量评估量表。今后国内学者除可用性外应结合多方面对移动医疗APP进行全面的质量评估，完善相关监管条例，构建标准的移动医疗APP评价体系。

3 可用性评估方法在移动医疗APP中的应用

3.1 概述

在移动医疗APP评价研究中，可用性研究数量最多，研究人员认为可用性是评价移动医疗APP质量的关键[12]。本文通过文献检索，就近年来可用性评估方法在移动医疗APP中的应用情况进行归纳总结。

3.2 问卷调查法

研究人员评价移动医疗APP最常用的方法[13]。最常见的是系统可用性量表(System Usability Scale, SUS)和用户交互满意度量表(Questionnaire for User Interface Satisfaction, QUIS)。1986年John Brooke编制SUS量表，包括5个正向和5个负向问题。该量表采用李克特5分制评分法，总体得分为0～100，当SUS平均得分>68分表明该产品可用性良好[14]，量表信度Cronbach′s α=0.91。Ahn等[15]招募15名非医学专业人士根据SUS量表测量79个移动医疗指导APP可用性，最终仅有3个APP分数>68分。QUIS量表首先提出的是使用时的整体感受，其次是4个分类评估，包括界面使用感受、术语系统信息感受、学习因素、系统功能感受[16]，共有41个条目并采用李克特9分制，研究者可根据需要自行删减或添加条目，量表信度Cronbach′s α=0.94[17]。Alanzi等[18]招募33名2型糖尿病患者使用QUIS量表评价移动医疗糖尿病管理系统的可用性，证明该医疗系统可用性良好。SUS和QUIS量表是标准化、量化的可用性量表，条目简单易懂，计算方法简单，信效度较好，可靠性较高。但由于开发时间早，跟不上移动医疗APP发展速度，国内学者可在其基础上结合我国情况对量表进行汉化、验证并应用。

3.3 质性访谈法

可用性强调的是特定情境下对用户的影响，因此用户主观满意度是测评移动医疗APP中重要的一部分。Lodhia V等[19]采用半结构式访谈，由4名经培训的研究人员进行访谈，将问题编码分为效率、有效性、可学习性和操作灵活性4个主题,结果显示眼部检测APP有良好的临床意义。质性访谈是一种能有效了解用户主观满意度的方法，但该方法受研究人员访谈技术和主题分析能力的影响，若不能把控与访谈对象的关注点则会影响最终访谈结果，而访谈对象的纳入标准也同样影响最终评估结果。此外访谈环境、研究人员提问方式等都是评估的影响因素。因此应严格控制影响因素，采取正确访谈技巧，结合其他评估方法以提高评估结果准确性。

3.4 有声思维法

指用户在使用APP的同时说出个人想法，专家通过用户所述说的内容分析用户曾经所遇到的可用性问题，掌握用户关注点、思考方式及所采取的操作等信息。Arvidsson S等[20]将有声思维和半结构式访谈结合起来，先观察受访者在使用儿童癌症交流互动APP时的想法，再对受访者进行半结构式访谈以了解其对APP界面设计、信息内容和各模块使用感受以及改进建议。由于有声思维法是在用户使用移动医疗APP时进行的访谈，多数研究人员将有声思维法和质性访谈法结合，利用访谈技术获得更多的主观信息。因此可在评价移动医疗APP时将有声思维法和质性访谈法有效结合起来，激发受访者思维，提出更多意见和想法，提高评估结果客观性。

3.5 启发式评估法

1994年Nielsen[21]首次使用启发式评估法进行可用性评估，专家采用角色扮演模拟用户使用产品情景，根据已知的可用性原则独立评估后详细写出系统到场有效性问题，以此作为该方法评价标准。McClellan等[22]由医学信息学专家根据可用性最佳实践指南对卵巢癌移动医疗APP进行可用性评估，每个条目评分分别为-1、0、1，-1表示此项目不合格、0表示仍需改进、1表示所有要求都满足不需要任何改动。启发式评估法的局限性在于可用性评估原则没有简单通用的，不同原则会得到不同评估结果，而这些原则是否能起到关键性判断作用又难以确定。此外专家数量、背景、对指南的理解程度等都影响评估结果。因此在使用该方法进行移动医疗APP可用性评估时，应在合理的专家数量基础上严格控制专家背景，选择统一、标准化指南，尽量减少这些因素对评估结果的影响，提高结果可靠性，而如何选择适合、可靠的指南，后期还需进一步探索。

3.6 其他

可用性评估方法还包括认知过程走查法、用户任务分析法、眼动追踪技术、遥感追踪法等。虽然这些方法在移动医疗APP和其他信息系统上被研究人员广泛使用，但相比于以上4种评估方法，这些评估方法在移动医疗APP上应用较少。其中使用眼动追踪技术和遥感追踪法评估移动医疗APP的研究非常少见，未来可多采用眼动追踪和遥感追踪法，以探索该方法在移动医疗APP评估中的应用效果。

4 结语

互联网信息技术和智能手机发展迅速，为移动医疗APP发展提供良好平台。移动医疗APP质量研究在国外已广泛开展并取得一定进展，可用性评估方法多，量性和质性方法能有效测评移动医疗APP可用性效果。相较于国外，国内移动医疗APP质量评价尚处于初步发展阶段，主要局限于可用性、临床效果或功能评价，评价指标也各不相同。同时这些评价方法尚无统一评价标准，结果不能相互对比，缺少医学专业人员把控。此外各个评估方法有其特色和缺陷，多项研究综合运用多种评估方法测评移动医疗APP。部分可用性测量量表开发时间久且更新速度慢，而移动医疗APP发展、更新速度较快，需在完善法律监管的基础上不断开发或更新可用性评估方法以满足移动医疗APP的市场需求，为患者构建安全可靠的移动医疗互联网环境。