吴智兰,王文韬,张 帅,谢阳群
近年来人们的生活和工作压力不断攀升,年轻一代中出现的健康问题日益严重[1]。国外相关研究表明,随着生活水平的提升,青年群体的体质和健康反而在许多重要方面出现了令人担忧的下降趋势[2]。因此,从日常的养生保健信息到身体不适的求医问药,已成为青年人日益关心的问题[3]。作为青年群体的典型代表,大学生检索与获取健康信息的首要来源是互联网[4]。在频繁的健康信息检索行为中,其在线健康信息检索行为有哪些特征?主要行为模式有哪些?针对上述问题,本研究以在校大学生作为研究对象,基于参与观察法对其在线健康信息检索行为进行探究,通过对大学生在线健康信息检索行为特征及模式的揭示,为在线健康信息服务的开展提供有益参考。
根据全美医学图书馆联盟的定义,健康信息是指与大众、病患及家属有关的健康和医学资讯,包括预防、医疗、保健、康复、健康教育等内容[5]。健康信息的传播载体多样,如人际、广播、报纸、电视,目前互联网是最大载体,在线健康信息弥补了以往健康信息传播方式的不足[6]。在线健康信息是指在互联网上与健康相关的信息,涵盖医学知识、健康知识、患者健康服务信息等内容[7]。由于网络的便利性及开放性,大学生更倾向于使用互联网来获取健康信息。
健康信息问题是研究热点,对在线健康信息的检索研究者通常采用问卷调查法、实验法、日志分析法等对不同的用户从各方面进行研究,取得了一定成果[8-9]。信息行为是主体为了满足特定信息需求而进行的信息查询和使用行为[10]。信息检索过程就是用户与信息系统不断交互的过程,信息检索行为是指用户与信息系统之间的交互行为。在线信息检索行为指用户在与网络交互的过程中,为获取所需信息采取的一系列身体活动和心理活动[11]。本研究所探讨的在线健康信息检索行为的主体是在校大学生,其来源于大学生在日常生活中对健康信息(包含保健知识、医学知识、健康信息服务等)的意识与需求。
国外对健康信息行为已经进行了大量研究,研究对象越来越广泛,几乎涵盖整个社会群体。Sharit 等[12]通过对照组实验的方式对两组老年人健康信息问题的搜索进行研究,发现网络知识与认知能力的结合对于信息的成功获取至关重要,检索任务的复杂性对老年人健康信息检索行为和表现产生较大影响。Manierre[13]通过回归模型分析性别差异对健康信息检索行为的影响,发现女性比男性更倾向于进行健康信息的搜寻。Mckinley[14]以大学生为研究对象探讨社会支持与网络健康信息寻求构成要素之间的关系,发现社会支持对于大学生在线健康信息寻求有着积极作用,并且其对网络健康信息的认知也间接影响着健康饮食意志,促使寻求健康的生活方式。国内对在线健康信息检索行为的研究数量不多,吴丹等[9]对老年人网络健康信息检索行为进行实验研究,发现老年人进行网络健康信息检索时呈现出明显的依赖性和定势性,且健康状况、网络信息的可信度以及对网络的熟悉程度是影响老年人日常利用网络进行信息获取的主要影响因素。王若佳等[8]通过对搜狗搜索引擎用户7 天的日志挖掘对网络用户的健康信息检索行为进行研究。张敏等[15]通过情境实验及调查问卷的方式分析网络用户健康信息检索行为的特点,认为不同类型的健康信息任务情境下用户检索行为特点存在显著差异,且性别差异也对健康信息检索行为模式产生影响。以上研究虽然围绕在线健康信息检索行为取得了一些成果,但大多是对检索行为的影响因素、特点等的研究,方法上较多使用的是问卷调查法、日志分析法、实验研究法等,缺乏采用局内人视角的方法对大学生在线健康信息检索行为的特征及模式进行的系统研究。因此,本研究利用参与观察法对大学生这一特殊群体的在线健康信息检索行为特征及模式进行研究,以便今后网络健康信息有针对性的为大学生提供信息服务。
2.1.1 研究方法与工具
参与观察法作为质性研究的核心技术越来越受到学者青睐,鼓励研究者从具体情境和场景中充分利用一切可能的机会去获取人类生活的当下经验。Moser[16]认为参与观察是科学研究的第一方法。与其他研究方法相比,参与观察法的优势在于采用局内人的视角对研究现象进行更为深入的观察与剖析,是社会学中资料收集最完整的方法[17]。因此,本研究选取该方法对大学生在线健康信息检索行为进行研究,具有一定的可行性和合理性。本研究采用直接观察与间接观察相结合的方法得出在校大学生在线健康信息检索行为特征及模式,其中,直接观察指观察者亲眼目睹了行为发生的过程,间接观察指通过观察社会现象或行动者在事发后留下来的各种追寻的痕迹来推断社会现象和行动者的方法[18]。本研究利用NVivo11 软件作为数据处理的工具,它是由QSR international 开发的支持质性和混合方法研究的软件[19]。通过NVivo11 软件对研究对象完成检索任务所记录的操作视频数据进行定性的管理和分析,归纳与提炼出在校大学生在线健康信息检索行为的特征及模式。
2.1.2 研究步骤
(1)确定研究对象。采用对外招募的形式召集研究对象,研究对象需要满足以下两个条件:首先需为在校大学生,包括本科生和硕士研究生;其次需对本次检索任务没有进行过专业检索。据此对招募的人员进行过滤式问卷调查,问卷共分为两个部分,第一部分是个人基本信息的填写,包括姓名、性别、年龄、籍贯、学校、年级及专业;第二部分是确定是否检索过相关问题,若检索过相关问题,则不作为本研究对象。考虑到观察时间与精力成本,采用参与观察法的理论研究(观察人数通常为20 人[20]),本研究在对符合条件的人员进行目的抽样后,共确定研究对象25 名。其中本科生14 名,硕士研究生11 名,男性12名,女性13 名,性别比例均衡。为了进一步消除学科专业的影响,从多个学科抽取研究对象,包括生命科学、消防工程、公共管理、图书情报与档案管理、工商管理等。他们分别来自安徽、江苏、辽宁、山东、山西、湖南、江西、福建等地区。为了对研究对象进行隐私保护,所有研究对象均以英文字母SI(subject investigated)加上数字1~25 顺序命名(如第一位研究对象为SI1),具体研究对象信息见表1。
表1 研究对象基本信息
(2)研究规则设计。本研究中研究对象需在电脑上完成检索任务,将检索结果记录于Word 文档中并借助EV录屏软件对检索过程进行全程录屏。据“2018 中国生命小康指数调查”,35.5%的受访者认为自己处于亚健康状态。人们最常见的10 种亚健康依次为记忆力下降、眼睛干涩、睡眠紊乱、精力不足、疲乏无力、注意力不能集中、急躁易怒、情绪低落、性功能减退以及便溏便秘[21]。此外,由于学业、就业等诸多因素的影响,近年来大学生失眠患者数量有所增加,大学生存在不同程度的睡眠质量问题。一项针对大学生睡眠质量的调查显示,21.63%的大学生睡眠质量较差[22]。因此,本研究检索任务均为失眠相关问题,3 个检索任务类型包括列举题(列举失眠的症状)、简单信息题(失眠症的定义及分类)、复杂信息题(失眠症的治疗方式)。
由于研究设计需根据具体状况进行评估调整,因此在研究正式开始前笔者找了3 名研究对象进行预观察研究(具体流程见图1),并根据研究对象实际情况对研究设计进行调整,以保证研究结果的真实性和有效性。由于研究设计中可根据预观察研究中检索任务时长来评估选取任务时长[23],因此设定本研究中每个任务检索不得超过20 分钟。研究要求研究对象态度认真,尽可能找出自己认为准确权威的答案且完成检索任务期间不可被打扰及使用其他移动设备辅助检索。
图1 预观察流程图
在正式研究前,与研究对象口头沟通知情同意书,研究过程完全遵照纽伦堡准则[24]。此次研究时间周期为1 个月,在得到录屏视频后对视频文件进行资料的编码分析。当研究进行到第25名对象时,没有发现新的编码内容,进而继续进行另2 名研究对象的观察研究以检验数据是否达到饱和,结果显示进一步的研究没有发现新的主题,表明数据已达到饱和[25],因此本研究具有一定的科学性。本研究中直接观察即研究人员全程观察研究对象的检索过程并进行记录,间接观察即研究人员对研究对象自行完成任务检索后的记录视频进行数据分析,其中直接观察11 人,间接观察14 人。任务检索平均视频时长26 分08 秒。
检索平台的选择是信息收集和分析选择的起点,是方向性决策,直接影响到检索结果的可靠性和准确性。对检索平台,本研究所提及的公开搜索引擎是指百度、搜狗、360 搜索等;专业搜索引擎是指百度学术、谷歌学术等;文献数据库是指中国知网、万方等;健康网站是指好大夫在线、春雨医生、39 健康网等。在本次观察研究中,所有研究对象使用检索平台共213 次,其中使用较多的平台是百度搜索(42 次)、360 搜索(38次)、中国知网(25 次)以及健康网站,如好大夫在线(10 次)、快速问医生(6 次)。在共75 个检索任务中,大部分研究对象倾向于选择公开搜索引擎作为首选检索平台,占比高达85%,在找不到所需结果时采用其他方式调整检索范围,可以看出大学生在健康信息检索工具的选择时对搜索引擎具有较强的依赖心理。另外,研究对象在进行任务检索时入口转换较多,使用检索平台交互性强,实现2 个及以上平台的交互操作的检索任务累计占比60%,具体交互情况见表2,这与大学生日常较多使用检索平台,对检索平台熟练掌握有关。
表2 检索任务平台交互情况分析
检索式即检索提问式是指检索中表达用户检索提问的逻辑表达式,合适的检索式能提高检索的查全率和查准率。用户对检索任务的最初理解可以通过初始检索式来体现,而对检索任务及检索系统的认知变化则可以从检索式的重构看出[9]。本研究共统计出大学生检索式构造行为121 次,检索式重构行为82 次,其中构造行为包括复制检索任务中相关词为检索式、直接输入检索式、下拉列表中选取检索式及选取搜索引擎提供相关检索词4 种。
3.2.1 检索式构造
大学生在检索式构造阶段的行为特点有:(1)检索式构造花费时间精力少。如表3和表4所示,大学生在完成检索任务时平均检索式构造时间为8.3 秒,占检索总时长0.2%,检索式平均长度为5.7 个字,可得检索式构造速度平均为每字1.5 秒。研究发现用户倾向于构造简短的检索式,其主要可能原因是大学生在日常生活中较多使用电子设备,中文输入能力较强。(2)高级检索策略使用较少,跟随性强。如表5所示,大学生在线健康信息检索式构造中系统提示和从任务描述中获取检索词行为占31.4%,包括下拉列表提示、相关搜索以及复制检索任务描述内容,且布尔操作符的使用仅占2.4%,这表明较多用户在构造检索式的过程中并不费心,更多地依赖搜索引擎的判断能力,这也从一个侧面表明当前的搜索引擎不需要较多的检索知识即可完成。此行为带来的弊端是广告网页均在检索结果网页的上半部分,容易误导用户且耗费检索时间精力,降低检索效率。
3.2.2 检索式重构
检索式重构(query reformulation)是指用户在检索的过程中为了改善检索效果对检索式进行的更改活动。Fidel[26]在1985年就对检索式重构在人工语义上进行判别,他将检索重构分为概念变动和操作变动两类。结合本研究所包含的重构类型,笔者将大学生检索式重构类型进行划分,共分为3 个大类和7 个子类,并对其进行编码,编码过程中允许同一个检索式存在两次及以上编码类型。具体编码见表6。
表3 检索式构造统计表
表4 检索时间分布
表5 检索式分析
表6 检索式重构类型编码
本研究共统计出大学生检索式重构行为82次,平均尝试次数1.1 次。如表7所示,在检索式重构行为中,一次重构行为占比65%,二次重构行为占比24%,且重构行为与重构次数呈反向相关关系,即重构行为随着重构次数的增加而减少。在一次重构行为中,出现频率较多的依次是更换检索平台、缩检、改变检所平台内置选项、跟随系统相关词和扩检。其中,45%检索式重构均为检索工具重构,这与大学生熟练掌握各种检索工具相关,转换检索工具以期在检索式不变的情况下从不同检索工具中获得所需内容。范围重构在检索式重构中占比28%,且缩检占较大比例,这说明大学生在检索式构造时倾向于使用较简短的检索词进行构建,在获得较大范围检索结果后通过缩小检索式范围来获得所需内容。25%检索重构为内容重构,其中跟随系统相关词占较大比例,这与大学生构建检索式所花精力少,跟随性强相符。二次、多次重构行为中主要集中于更换检索平台、跟随系统相关词、改变检索平台内置选项及缩检等,均在范围重构、内容重构及检索工具重构中进行转换,表现出大学生检索重构行为的多样化。
表7 检索式重构分布
本研究中检索结果的浏览行为是指受测大学生为满足信息需求在检索结果中有目的性的网上信息查询行为。本研究过程中大学生完成在线健康信息检索任务时共访问网页274 次,平均每次任务检索打开3.7 个网页。浏览频率前五的网站依次为:百度百科(35 次)、360 搜索(32 次)、知网(25 次)、百科名医(20 次)、好大夫在线(10 次),可以看出,在进行较强专业性信息检索时,大学生倾向于选择专业网站或数据库且对检索结果先浏览判断再点击查看。此外,开放性搜索引擎中存在大量广告,此次研究中广告网页共点击14次,仅占5%,体现了大学生具有较强的广告网页辨别能力。
研究发现,在274 次网页访问中,在检索结果首页的有252 次,达92%,表明大学生在线健康信息检索时不倾向于翻页浏览,通常在首页没有浏览到所需内容时会选择调整检索式或检索工具。邓小昭[27]对互联网用户的信息检索行为的研究结论显示,70%用户在进行Google 检索时只查看首页内容,定势心理在用户选择搜索引擎时起主要作用。如表4所示,研究对象在检索结果浏览时长和网页内浏览时长方面所花时间较多,共3 分34 秒,累计占比41%,可以看出研究对象完成在线健康信息检索任务时对检索结果的浏览花费时间较长,主要表现对检索结果网页的浏览来确定合适网页以及点击网页后相关信息的浏览分析,表明在校大学生注重对检索结果的浏览和筛选,判断与所需信息的相关性,倾向于比较分析浏览,以此确定所需答案。
检索结果的选择是指研究对象从获取的检索结果中选取最符合检索任务要求答案的过程。本研究中共统计出研究对象选择答案行为123 次,其中答案最多来自于健康网站(39 次),表明在校大学生对健康信息的检索更倾向于专业的健康网站,其次是公开搜索引擎的百科答案(37 次)以及文献数据库中健康相关文献(27 次),体现了在校大学生对健康类信息的检索要求更加专业化。
本研究对研究对象所选答案在不同网站检索结果中的深度作了进一步的统计,如图2所示,经数据分析发现,深度为1、2 的网站主要是在文献数据库和健康网站中的检索结果,可以看出在校大学生对专业网站的排序较为依赖。其中,公开搜索引擎在选择频次上幅度最大,前4 个网页中均没有选择行为,主要是受广告因素的影响。因而在深度为6、7、8 处,选择频次较多,之后深度与选择频次大致呈负相关关系。研究者对视频材料分析发现,研究对象对于健康网站、专业搜索引擎及文献数据库中的检索结果更倾向于较长时间浏览,通过对网页标题的筛选分析后获取所需信息,因此,检索结果的选择行为呈现一定的不规律性。
图2 检索结果选择深度
本研究通过参与观察法对25 名在校大学生在线健康信息检索行为进行数据统计分析后发现,在校大学生在线健康信息检索过程中表现出较为明显的跟随性。主要分为两个部分:(1)跟随以往检索经验,缺乏创新性和技术性,高级检索策略使用较少。在校大学生在日常生活中较多进行信息检索,已形成检索定势,在检索过程中较倾向于使用以往的检索习惯,如检索工具、检索网站等,在此研究中使用最多的是百度搜索引擎。此外,由于专业信息检索能力的缺乏,大部分研究对象没有使用高级检索策略,因而不能准确的检索到所需信息,检索效率降低。因此,对于在校大学生信息检索能力的培养显得尤为重要,高校开设信息检索课程能有效地提高大学生的信息检索能力。(2)对检索工具的跟随。具体表现为在检索式重构的过程中对搜索引擎下拉列表提示词、相关搜索提示词的跟随;在对检索结果浏览的过程中对搜索引擎排序的依赖性,只浏览排名靠前的结果网页等。可见搜索引擎的结果排序对在校大学生能否成功获取所需信息非常重要。因此,相关搜索引擎在对结果网页的排序应更注重信息质量,并且提供相关词供用户进行相关检索,节省检索时间,提高检索效率。
对25 位研究对象的75 次任务检索答案按照预先制定的标准进行评价,以百分制进行,将低于60 分的视为检索失败行为。通过统计,共有10 次检索失败行为,占比为13.3%。
通过对视频资料的统计分析,将检索失败行为归纳为以下方面:(1)规定时间内不能准确检索到所需答案。指研究对象因为前期浏览行为花费较长时间,导致在规定时间内没有检索到所需答案,选择相对合适的答案来完成检索任务。(2)检索结果片面性强。指研究对象在任务检索中只获取了较为片面的答案,检索结果并不能完整回答检索问题。(3)检索结果与任务要求不符。指研究对象所获取的检索答案与检索任务内容存有偏差。失败的主要原因有:(1)检索模式较为单调。研究对象在进行任务检索时通常重复使用同一种检索模式,高级检索策略缺乏,大量时间耗费在浏览上,最终导致了任务的失败。(2)对检索任务认知不明确。研究对象在正式检索前对检索任务没有准确理解,导致在任务检索时检索式构造或检索结果选择时出现偏差,检索不到所需信息内容。
按照研究对象完成在线健康信息检索任务的流程,通过对视频资料的观察分析,将整个检索过程分成4 个阶段,得出15 种行为并进行编码,见表8。依次对大学生任务检索过程中每一个操作进行归纳后,得到96 个行为序列。分析发现,研究对象在其在线健康信息检索过程中表现出的明显的检索行为模式有3 种,即返回重选网页模式、重构检索式模式,更换检索平台模式。
表8 检索行为编码
本次观察发现返回重选网页模式出现最为频繁,统计共出现87 次,将这种检索模式定义为/LG/LC/LD/。大多数研究对象在进行在线健康信息检索时输入检索式后对获得的检索结果进行浏览分析,发现目标网页后点击进入查看,判断是否为所需信息,判断不是则返回初始检索结果页面继续浏览分析,进入下一个页面查看直至找到所需信息。研究对象对检索结果网页的浏览主要集中在第一页和第二页,表明在校大学生倾向于付出最小的努力来获得所需的信息,这与最小努力法则相关。
本研究重构检索式模式的编码定义为/GS/LC/LD/,统计发现这种检索模式共出现61 次,这种模式表现为研究对象输入检索式后在检索结果页面进行浏览分析,点击进入网页查看,如果没有发现与任务相关的答案则进行检索式的重构,再次进行检索,进入重构后的检索结果页面查看,试图获得符合自己检索任务的结果。
本研究更换检索平台模式的编码定义为/XJ/LC/LD/,统计发现这种检索模式共出现39 次,这种模式表现为研究对象输入检索式后对检索结果网页进行浏览判断,点击进入网页查看,若判断与自己检索任务的信息需求相关性小,则判断可能与自己的检索平台的选择有关,因此,更换检索平台重新进行检索,或多次尝试检索式重构之后依旧选择更换检索平台。除了这三种最为常见的检索模式,还有更换检索平台内置范围模式、跟随链接模式等。
健康中国战略下,“互联网+医疗健康”服务体系进一步完善,对用户在线健康信息检索行为的研究有利于实现用户与网络健康信息平台的双赢对接。相较于其他特定用户群体,如老年人的在线健康信息检索行为,大学生在检索时长及效率上呈现出明显的优势,主要原因是其具备由于日常较强的信息检索需求形成的检索经验。尽管如此,研究结果显示大学生在线健康信息检索存在明显的跟随性且缺乏检索技巧,检索模式上更倾向于对检索式及检索工具的不断更改而不深入检索。因此针对现有问题,本文从两个方面提出参考。一方面,优化检索工具的精准度,智能推荐检索词并提高检索式的查全率及查准率。由于大学生在线健康信息检索结果选择时对网站的排序较为依赖,因此检索工具对返回结果的筛选显得尤为重要,将准确度及权威性更高的答案显示在首页,会更利于检索工具对大学生健康信息需求的识别,优化检索体验。另一方面,促进健康信息资源的优化配置,完善健康信息网络服务环境。由于平台之间健康信息组织及分类的不完善,导致检索结果契合度不高,因此,平台间应不断优化健康信息资源的组织方法,保证平台信息组织的一致性。此外,强化基础设施建设,保障网络安全,提高网络健康信息资源的质量也是必不可少的。需要指出的是,本研究存在一定的局限,如样本量虽符合社会科学研究的样本要求,但取样不够充分,略显单一。在今后的研究中,将继续关注大学生在线健康信息检索行为,力求探索提高大学生在线健康信息检索能力的措施。