社交媒体平台信息搜索系统的可用性研究
——以新浪微博搜索为例

2018-09-05 12:30:48杜春凤朱庆华孙霄凌

图书情报研究 2018年3期

杜春凤杜晴朱庆华孙霄凌

（1. 南京大学信息管理学院南京 210023；2. 南京邮电大学管理学院南京 210003）

1 引言

近年来，以微博和微信为首的社交媒体迅猛发展，并不断影响和改变着人们的现实生活。社交媒体（Social media，又称社会化媒体）最早由Mayf i eld在其著作What is social media中提出，他认为社交媒体具有参与、公开、交流、对话、社区化、连通性六大特征，是一种能够给予用户极大的参与空间的新型媒体[1]。在我国，社交网络用户不断增加，截至2015年年底，中国互联网用户规模达6.9亿人，其中社交网络用户占比高达92.8%[2]。在此背景下，如何使用户从大量社交媒体的海量数据中迅速找到自己所需的信息，成为研究的热点之一。可用性研究最初诞生于人机交互领域，之后被图书情报学、软件工程等其他领域学者所引用，目前已经广泛应用于各类网站和软件设计中，但暂时尚未有对社交媒体的相关可用性研究。

目前，学界基于社交媒体的研究主要涉及社交媒体的理论研究[3-4]、社交媒体的用户研究[5-6]、社交媒体的商业应用[7-8]及社交媒体环境下的信息伦理问题[9-10]等，关于社交媒体平台搜索系统的可用性研究并无多见，大部分都是关于用户搜索行为的研究[6,11]。本研究选择新浪微博（移动客户端）平台的搜索系统作为研究对象，新浪微博作为全球最具影响力的中文社交媒体平台之一，其搜索系统的影响力也越来越大，截至2015年11月，新浪微博搜索每日用户主动搜索量已突破2亿[12]。同时，由于微博信息具有发布自由、文本简短、语言组织松散、更新消亡迅速等特征，用户想要快速、全面地获取信息变得困难。然而，目前关于微博搜索的研究大都集中在排序方法、结果优化等技术方面上[13-14]，鲜有从用户角度对搜索系统的可用性进行研究。

鉴于新浪微博广泛的影响力以及数据的可获得性，本文将结合启发式评估法和用户测试法对其可用性进行研究，旨在发现新浪微博的搜索系统存在哪些可用性问题，如何进行改进，从而使得用户有更好的搜索体验。希望本研究可以为相关社交媒体平台搜索系统的开发和设计提供借鉴。

2 可用性与可用性评估方法

可用性（Usability）一词来源于人机交互领域“对用户友好（User-friendly）”这一概念，指 “特定的用户在特定的使用场景下，为了达到特定的目标而使用某产品时，所感受到的有效性（Effectiveness）、效率（Eff i ciency）及满意度（Satisfaction）”[15]。有效性是指用户能够达成自己的目标；效率是指用户不必做无用功，就能以最短路径达成目的；满意度是指既使有效性和效率两方面没有大问题，也要从更深层面来考虑，即有没有给用户带来不愉快的体验。

2.1 可用性评估指标

可用性作为一个非常抽象且定义模糊的概念，难以对其进行直接评价，因此研究者常常退而求其次，将其划分为不同属性来进行研究[16]。许多研究者根据所评价的具体系统的特征，概括出可用性评价的指标体系，并通过评估指标体系中所包含的各项具体指标来达到评估系统整体可用性的目的[17]。传统信息系统的可用性评估指标较为明确，且内容相对统一（如表1中的1、2）。近年来，随着互联网应用的大规模普及，可用性评估指标加入了一些新准则，主要可分为两大类：关注内容的可用性评估指标（如表1中的3、4）和关注用户的可用性评估指标（如表1中的5、6）。从研究思想上看，关注内容的可用性指标研究，可以看成是传统信息系统可用性评估思想在互联网时代的进一步发展；而关注用户的可用性指标研究则更多的从用户行为分析的角度进行可用性指标体系构建。

表1 可用性评估指标对比

虽然可用性评估指标被划分为关注内容和关注用户两种，但并不代表前者就不关注用户，后者不关注内容，只是这两种评估体系的出发点不同。从具体指标的构成上看，两种评估体系的区别实际上并不明显。Nielsen在分析了很多产品的可用性问题后，提炼出了隐藏在背后的产品可用性原则，这些原则被称为启发式评估十原则，包括系统状态的可视性，系统和现实的协调，用户操控与自由程度，一贯性和标准化，防止错误，识别好过回忆，灵活性和效率，简洁美观的设计，帮助用户认知、判断及修复错误，帮助文档及用户手册[23]。本文的评估指标则是在传统Nielsen评估十原则的基础上，结合新浪微博特征，综合内容和用户两个角度建立的。

2.2 可用性评估方法

可用性评估的方法比较多，常见的有启发式评估（Heuristic evaluation）、用户测试（User testing）、有声思维（Think-aloud）、焦点小组讨论（focus groups）、认知走查（Cognitive walkthrough）、问卷调查（Questionnaires）、卡片分类（Card sort）、纸上原型（Paper prototyping）等方法[24]。其中使用最多的两种方法是启发式评估法和用户测试法[25]。

启发式评估法是最早使用的经典可用性评价方法之一，它是由Nielsen提出的一个“廉价可用性工程方法（Discount Usability Engineering Methodology）”[26]。启发式评估法的大致思想是：评估者利用一组相对简单、通用、有启发性的启发式可用性原则作为测试指导，评定待评估产品是否符合这些原则，并找出该产品的可用性问题，列出可用性问题列表。启发式评估是一种高效而又低成本的评估方法，且成功率较高，通常只需要3～5位可用性专家就可以检测出产品中出现的大部分（75%～80%）可用性问题[26]。但启发式评估法也存在一定的局限性，如对评价者要求较高，而有经验的评价专家资源又较为稀缺；此外，启发式评估的过程没有涉及到真实的用户，因此评估结果往往不能体现用户真正的需求。

用户测试法是可用性评估的另一个重要方法，它通过邀请用户完成特定操作任务，并观察、记录和分析用户的行为和相关数据，从而对产品的可用性进行评估。通常，用户测试法采用直接观察、大声思考、录像记录、访谈、问卷等方法来搜集测试用户的行为反应数据。与启发式评估法相比，用户测试法是基于真实用户数据进行的评估，因此能够直接反映真实用户的需求，从而发现产品真正的可用性问题。用户测试法的缺陷是会受到测试环境、所用设备、受测人员、测试任务等各种因素的影响，因此在进行用户测试时要尽可能提供真实的环境、完成实际的任务、招募有代表性的用户。

在实际进行可用性评估时，往往可以采用组合方法进行评估以弥补单个方法本身的不足。在Nielsen的一项研究中，启发式评估找到了42%的“大”问题和32%的“小”问题（问题的“大小”是以其重要性来评判的），因此他认为启发式在细节问题上的弱点需要通过用户测试来补足，尽管这两种方法的结果在某种程度上有所重合，但总体上还是两类存在显著差异的可用性问题[27]。因此，本研究采用启发式评估和可用性测试结合的方法对微博搜索的可用性进行研究。

3 新浪微博搜索系统可用性的启发式评估

3.1 启发式评估原则的确立

Nielsen的启发式评估十原则是可以广泛应用于各种各样的用户界面设计和评估中的“一般法则”，然而这些原则是1995年提出的，随着科技的发展、交互平台的多样化，这些准则已经不能涵盖现代社交媒体平台的新特性[28]；此外，启发式评估是关于网站可用性评估的通用准则，新浪微博搜索有不同于一般网站的特性。鉴于此，本文结合传统启发式评估原则和微博特征确立了适合微博搜索的启发式评估原则（如表2所示）。

表2 新浪微博搜索的可用性评估原则

3.2 启发式评估的实施

本研究在实施启发式评估时，选择了对新浪微博搜索很熟悉的4位图书情报专业硕士研究生作为评估人员。根据上文的启发式评估原则，评估者们寻找并记录微博搜索中的可用性问题，并与上述启发项进行匹配，启发式评估结果如下所示：

（1）系统状态的可视性。系统状态的可视性是所有软件产品都必须遵循的可用性原则。微博是一个具有海量信息的社交媒体，能否快速找到微博搜索的入口是很重要的一方面，微博主页有两个搜索入口，一个是页面上方的快捷入口，一个是页面下方的搜索主页面入口（如图1左所示）。但是很多时候打开微博主页时，上方的快捷入口会出现图1右所示的情况，用户需向下拉页面，才会显示出快捷入口。

图1 搜索入口

此外，搜索过程中的进度条、搜索结果的相关反馈等也是影响微博搜索可视性的重要内容。而在微博搜索的过程中，并没有显示搜索进度条（如图2所示），这在检索结果响应时间较长的情况下（如网速不佳），让用户无法得知当前搜索状态，从而降低用户的可用性体验。

图2 搜索过程中

图3 搜索记录

（2）系统和现实的协调。微博是面向大众的社交化媒体软件，它存在大量的草根用户，因此一定要避免使用专业化的语言。对于微博搜索来说，其入口的标识一定要使用用户所熟悉的，从而方便用户快速找到搜索入口。如图1所示，微博搜索的两个搜索入口分别是用户熟悉的搜索框和放大镜图标，即使是对于新用户，也能一眼就识别出来。

（3）灵活性和效率。对于微博搜索来说，主界面上方的搜索入口就是一个快捷搜索功能（如图1所示）。此外，由于人们一般会利用社交媒体监控自己所感兴趣的话题，因此会不断重复地搜索此话题[29]，这时，具有搜索记录功能将会使人们监控话题变得更高效。微博搜索的搜索记录如图3所示，它可以单独删除某条搜索记录，也可以删除所有搜索记录。与百度搜索的搜索记录相比，微博搜索记录可以记录刚刚完成的搜索，而百度搜索本次的搜索记录需要在下次启动时才能显示。

（4）帮助用户认知、判断及修复错误。该原则要求当出现错误时，系统并不只是告诉用户错误信息，而更应该做到使用户可以靠它来解决出现的问题。用户在微博搜索自己感兴趣的内容时，有时只是知道大概内容，需要在微博进行探索式搜索，这就需要系统提供关联搜索功能，这一点，微博搜索做得很好，它不仅有纠错（如图4左所示）、搜索提示（如图4中所示），还有关联用户推荐（如图4右所示）等。

图4 关联搜索

（5）搜索结果的个性化。个性化搜索可以说是社交搜索的首要条件，也是其价值所在[30]。随着微博用户的不断增加，微博中用户生成内容也呈爆炸式增长，能使用户在海量信息中快速获取个性化的信息将会提高微博搜索的可用性，从而增加用户黏性。微博搜索可以根据用户需要选择搜索结果分类，而且微博也具有自己的个性化推荐算法，根据用户兴趣有偏好性地展示搜索结果。

（6）搜索结果的实时性。微博是公开信息发布的第一平台，包括突发热点、最新动态、新闻资讯等，微博搜索可以检索出秒级的最新事件，相比新闻网页搜索速度更快[12]。很多用户使用微博是为了查看实时信息，关注感兴趣事件的最新发展动态，微博搜索在这一点上很好地满足了用户对实效的需求。由于微博内容的实时性，当用户有诸如查看实时天气预报、查看节假日道路拥堵状况等对实时性要求较高的信息时，微博搜索便会因实时性而很好的满足用户需求，从而提高了用户的满意度。

（7）搜索环境的社交性。作为一个嵌套于社交媒体平台的搜索系统，社交性理所当然是微博搜索可用性所应考虑的方面之一。微博搜索的主页面有很多类目体系，用户可根据自己的兴趣爱好选择对应的类目进行搜索，搜索框内也会提示“大家正在搜”的内容（如图5所示）。此外，微博搜索还提供热搜榜，用户可以查看实时、好友、名人等搜索热点（如图6所示）。对于搜索结果，用户可以进行评论、转发、点赞等行为，从而增加了用户的现场感。但由于社交性更多的是用户的感受，因此，该准则会在用户测试阶段再进行评估。

图5 微博搜索主页面

图6 微博热搜榜

4 新浪微博搜索系统的用户测试

4.1 用户测试参与者

可用性的测试参与者一般都是产品的实际用户，其数量与实际的测试时间、成本限制等因素有关。Virzi[31]发现，80%的问题是由最初的4～5个参与者发现的；Nielsen[32]指出，5个用户就可以发现77%～85%的问题，因此他建议可用性测试的一般用户数是3～5个；而Spyridakis[33]认为，少量用户难以发现不同分组之间的显著差异，实际测试中至少应当聘请10～12名参与者。本研究选择了10名用户参与了测试，其中包括经常使用微博搜索的用户7名，偶尔使用微博搜索的用户2名；为了使本研究用户测试案例更具代表性，还邀请了1位从未使用过微博搜索的用户参与。用户测试参与者的基本情况如表3所示：

表3 用户测试参与者的基本情况

4.2 用户测试任务

在前阶段的启发式评估中，本研究已经对传统的启发式评估中的系统状态的可视性，系统和现实的协调，灵活性和效率，帮助用户认知、判断及修复错误这四条原则做了很好的评估；但是针对微博特征的搜索结果的个性化，搜索结果的实时性，搜索环境的社交性这三条原则的评估还有所欠缺。因此，在用户测试阶段，本研究将主要从实际用户角度出发，评估微博搜索的上述三条可用性原则，以弥补启发式评估的不足。具体测试任务如下：

任务一：请查看自己的好友热搜榜。

任务二：请找出北京和颐酒店事件中被袭女子的微博。

任务三：请利用微博制定一个上海迪士尼乐园的游玩攻略。

这三个任务总体是按由易到难、由简到繁进行排序的。

4.3 用户测试实施及结果分析

为了保证用户测试的可靠性，所有用户的测试都是分开进行的，从而避免测试用户之间的学习行为；此外，当用户进行测试任务时，观察人员也不能对他们作出任何带有指导性质的提示，所有任务必须由测试用户独立完成。

表4 测试任务完成情况

在所有的测试用户中，除了一名没有使用过微博的测试者外，其余测试者均完成了三个任务。其中，任务一的平均完成时间为30秒，任务二的平均完成时间为2分钟，任务三的平均完成时间为30分钟，如表4所示。

任务一中的热搜榜是微博搜索的一个特色产品，它通过用户搜索行为来挖掘大家所关注的热点与兴趣点，其中的好友热搜则是基于社交关系提供的好友搜索过的热点榜，体现了搜索环境的社交性。本任务相对简单，因此所有参与测试的用户均完成了此任务（包括未使用过微博的测试者），且完成该任务的时间都较短。

HorowitzD认为[34]传统搜索引擎的目的是查找能够满足用户需求的文档或资源，而社会化搜索是为了查找能够满足用户需求的人。任务二的设置就是要查看测试用户使用微博搜索来找人的情况，本任务相对任务一难度有所提高，没有使用过微博的测试者未能完成此任务，其余测试者均完成了测试。在所有完成任务的测试者中，都是通过关键词搜索后，逐条浏览搜索结果，找出所需人物微博。没有测试者在搜索结果中选择“用户”类目进行筛选，或者直接在搜索时选择“搜人”功能。虽然新浪微博对搜索结果设置了不同的类目，供用户进行个性化选择，但在本测试任务中并没有用户选择使用此功能。通过对测试用户的访谈可知，用户没有选择对结果进行分类筛选是因为用户习惯了逐条浏览信息，而不习惯使用微博搜索的分类筛选功能。

任务三相对于前两个任务来说并没有更难，只是相对复杂，该任务的设计是为了测试用户是否会采用除了直接搜索之外的方式来获取自己所需内容。测试结果显示，所有测试者都是直接搜索“上海迪士尼攻略”等关键词，而并不会选择去问微博上已经去过上海迪士尼的用户，或者咨询上海迪士尼官方微博。只有一名测试者表示会在对攻略有疑问时给博主留言提问。这点表明用户对微博中的社交关系并不是很信任，相比于微博中的“好友”，他们更信任现实生活中的朋友。这一点说明微博搜索环境的社交性较弱，从而导致大部分搜索用户只是作为一个外部搜索者，而并没有真正地参与创造用户生成内容。

在用户测试的过程中，还发现了以下可用性问题：

（1）检索结果不能按用户所需进行排序。微博搜索一般默认是按照时间进行排序，但用户在实际浏览搜索结果时，有自己所希望的排序需求，如按转发量、地域等进行排序。

（2）搜索结果会显示很多无关信息。如任务二中，当用户输入关键词“和颐酒店”时，会出现很多无关信息（如图7所示）。测试用户表示，这种情况在平时使用微博搜索不是热门事件的内容时更为明显，经常会出现和搜索内容完全不搭边的很多无用信息。

图7 搜索结果中的无关信息

（3）已阅读内容和未阅读内容没有区分显示。这个问题在任务三中显示得较为突出，要制定一个旅游攻略，用户需要查看大量攻略，而很多攻略的名字和内容很相似，用户在大量阅读之后很难判断出哪些是已经看过的，哪些是没有看过的，从而导致阅读重复的信息，增加了做攻略的时间。

5 研究结论与展望

综合以上两种评估可以认为新浪微博搜索具有较好的可用性，用户使用起来感觉也较为舒服，尤其是在系统和现实的协调、灵活性和效率、帮助用户认知判断及修复错误、搜索结果的实时性这几个原则上的反映很好。但在系统状态的可视性、搜索结果的个性化、搜索环境的社交性这几个原则上还有所欠缺，主要表现为：①主页面上方搜索入口不易发现；②搜索过程中没有进度条显示；③搜索结果缺乏自主排序功能；④搜索结果关联度不够高；⑤无法区分已看和未看内容。

针对以上问题，笔者对新浪微博平台下的搜索子系统提出了几条改善的建议：

（1）调整界面布局，使用户具有更好的搜索体验。由于大部分微博搜索用户是利用碎片时间浏览微博，因此良好的搜索体验就显得尤为重要，不管是在搜索前、搜索中，还是搜索后。建议新浪微博搜索将快捷搜索入口始终置顶在各页面上方，从而方便用户随时进行搜索；增加搜索过程中的进度条以方便用户及时监控搜索情况；对搜索出的已读内容和未读内容用颜色加以区分以便识别。

（2）减少冗余信息，使用户能迅速找到所需内容。微博信息量大且更新速度快，如何使用户在最短的时间内找到所需内容是微博搜索需要重点考虑的问题之一。根据前文的研究，建议新浪微博搜索改进搜索算法，尽量减少无关冗余信息，提供更具个性化和更有关联度的搜索结果；此外，可增加对搜索结果的排序功能，如按发布时间、转发量、地域等，从而方便用户更迅速地找到自己所需内容。

（3）增强社交属性，使用户更信赖微博关系。新浪微博“后台实名，前台自愿”的规定使得大部分用户选择前台匿名，因此用户的言论相对不受控制，用户自然无法信赖微博中的社交关系；再加上微博消息不如微信等即时软件迅速，从而导致微博中相对较弱的社交关系。建议新浪微博采取一定的措施，如增强实名或改进消息更新机制等，以增强微博中的社交属性。

目前从可用性角度对新浪微博搜索系统进行的研究较为有限，本文以新浪微博（移动客户端）平台的搜索系统作为研究对象，结合启发式评估和用户测试法对其可用性进行了评估，得出了其存在的一些可用性问题，提出了相关的建议，并构建了适合新浪微博搜索可用性的启发式评估原则。但本研究在评估其可用性时都是采用定性分析的方法，而并没有将各原则进行量化，也没有对存在的可用性问题赋予权重。在未来的研究中可以继续扩大测试人群的覆盖面，对任务进行更加精细化的设计。

社交媒体平台信息搜索系统的可用性研究——以新浪微博搜索为例