寻求信息偶遇研究的突破

2020-12-17 03:31马翠嫦吴育冰
现代情报 2020年12期

马翠嫦 吴育冰

收稿日期:2020-06-01

基金项目:中央高校基本科研业务费项目“支持跨学科知识发现的学术论文信息单元识别与聚合研究” (项目编号:17wkpy56);广东省图书馆科研课题“基于知识图谱的学术会议演示文稿深度聚合研究”(项目编号:GDTK1810)。

作者简介:马翠嫦(1981-),女,副研究馆员,博士,研究方向:信息行为、信息组织与信息聚合、信息计量。吴育冰(1990-),女,馆员,硕士,研究方向:信息组织、信息计量。

摘  要:[目的/意义]信息偶遇日渐成为图书情报学、计算机科学等多学科研究的热点。国内外关于信息偶遇理论已建立若干标志性的模型和框架,但由于数据来源和研究方法的瓶颈,造成实证研究的困难与理论检验的不足。本研究试图以信息偶遇领域知识图谱构建與分析结果为依据,探索该领域未来突破的可能与发展的方向。[方法/过程]本研究以1995年至今国内外期刊论文和学位论文及相关引文数据为来源,采用文献计量学相关方法,以SATI、UCINET、NetDraw和CiteSpace等为数据分析和可视化工具构建信息偶遇领域的知识图谱。[结果/结论]研究结果揭示了20多年来国内外信息偶遇研究从理论探索到面向新环境和新技术的适应性研究与应用的发展轨迹,既呈现出由图书情报学、计算机相关学科和工商管理等学科形成的相对独立的研究领域,也呈现出图书情报学研究向相关学科扩散的趋势。计算机相关学科基于社会网络分析和行为数据分析的方法可为突破数据获取与分析的瓶颈提供方法参考;特异性的技术环境和信息使用情景的探索可能带来理论突破。

关键词:信息偶遇;非线性信息行为;非目的性信息获取;知识图谱;文献计量;中国台湾地区;中国大陆;国外

DOI:10.3969/j.issn.1008-0821.2020.12.016

〔中图分类号〕G252.7  〔文献标识码〕A  〔文章编号〕1008-0821(2020)12-0156-14

Breakthrough of Information-encountering Research

——Based on Knowledge Map of Information-encountering During the Past Two Decades

Ma Cuichang1  Wu Yubing2

(1.Library,Sun Yat-sen University,Guangzhou 510275,China;

2.Library,Jinan University,Guangzhou 510632,China)

Abstract:[Purposes/Significance]The research of information-encountering has become a hot topic in Library and Information Science and other disciplines,however,it is not easy to carry out empirical research due to the bottleneck of data sources and research methods.This paper aims to find out cues for future research through construction of knowledge map for information-encountering research.[Method/Process]With research papers published from 1995 till now at home and abroad,a knowledge map in the field of“information encountering”was formed by using the method of bibliometric and the tools of SATI,UCINET,NetDraw and CiteSpace.[Conclusion/Discussion]According to the results,the topic of information-encountering research at home and abroad has transformed from theoretical exploration to application research in new environment and with new technology from 1995 till now.As an interdisciplinary research field,the information-encountering research were carried out independently within the fields of Library and Information Science,computer related disciplines,Business Management,etc.Theories rooted in Library and Information Science research was spreading to related disciplines.The methods based on social network analysis and behavioral data analysis from computer related disciplines give insights into the research method of information-encountering in the filed of LIS.

Key words:information-encountering;non-linear information behavior;non-purposeful information acquisition;knowledge map;citation analysis;China Taiwan;China mainland;foreign countries

1  研究背景

在信息丰富的环境下,信息偶遇不仅已成为跨学科信息查寻中的常见现象,更逐渐成为用户信息获取的途径之一。近20多年来,国外和国内学者纷纷对偶遇式信息行为进行现象探索和理论构建,逐渐构建起与信息行为理论密切联系的信息偶遇理论体系。然而,信息偶遇研究发展到现阶段,图书情报领域学者已不止一次提出,该领域的发展已面临数据获取与研究方法的瓶颈[1-2]。为此,本研究拟通过知识图谱的方法对20余年来(1995—2019年)国内外信息偶遇研究进行梳理,形成信息偶遇研究的发展历史、学科概貌、内容体系与发展趋势,着重从该领域研究的关键节点、研究内容、跨学科性等方面探索演化轨迹与未来的发展路径,从而寻求当前发展的突破。

2  方法与数据

本研究以国外、中国大陆与中国台湾地区“信息偶遇”主题的期刊论文和学位论文及相关引文数据为研究与分析对象,采用文献计量相关方法,借助文献题录信息统计分析工具SATI和社会网络分析软件Ucinet及其自带的NetDraw绘制“信息偶遇”关键词共现网络,通过CiteSpace绘制信息偶遇的关键词共现时区图谱、文献同被引聚类图谱。

在数据来源方面,国外期刊论文及其引文以Web of Science核心合集数据库(下文简称为WOS核心合集数据库)中SCIE、SSCI、A&HCI為数据来源,国外学位论文以Proquest PQDT博硕士学位论文数据库(下文简称为PQDT)为数据来源;国内论文以中国知网(下文简称为CNKI)、万方、中国台湾学术文献数据库为期刊论文与学位论文数据来源,引文以中国社会科学引文索引(下文简称为CSSCI)为数据来源。

在检索词选择方面,本研究参考姜婷婷等总结的信息偶遇相关术语作为初始检索词[1],以检索文献中新增术语为补充检索词,在中外文各数据库进行迭代检索。获取数据集后对其进行人工清洗,剔除与信息偶遇行为研究不相关文献与重复文献,形成4个数据集,分别是:国外信息偶遇学术论文数据集(174条)、国外来源论文引文数据集(6 249条)、国内信息偶遇学术论文数据集(129条)和国内来源论文引文数据集(387条),如表1所示:

3  结  果

3.1  文献分布概貌

3.1.1  时间分布

学术论文数量的时序变化是衡量学科领域发展轨迹的重要指标,对评价该领域所处的阶段、预测发展趋势和动态具有重要意义。本研究按照文献出版时间对国内外信息偶遇主题学术论文进行计量分析,论文数量的年代分布情况见图1。

如图1所示,国外最早的研究是Erdelez S在1995年发表的关于信息偶遇研究的论文[3]。而在国内,最早的研究则于2005年在中国台湾地区发表[4],可见国内研究起始时间比国外晚了整整10年。1995—2009年间国外该主题年均发文量为5篇以下,从2010年起有较明显的增长,2011年增

长至1年12篇,之后呈逐年上升趋势,至2019年国外年均发文量已达到26篇。2012年以前,国内年均发文量在5篇以下,2013年1年发表论文数量已达14篇,虽然2016年发文数量较少,但2013年之后总体呈现逐年上升的趋势,2018年1年发文量超过25篇。由此可见,自2010年开始信息偶遇研究越来越受到学界的关注,至今形成较高的热度和明显的研究趋势。

3.1.2  学科分布

学术论文的学科分布方面,收藏国外论文的WOS核心合集数据库和PQDT学位论文数据库对于文献学科的标注均存在交叉与跨学科标注的现象。鉴于WOS核心合集数据库与PQDT数据库对于学科标注类别并不统一,作者对两个数据库中相同学科进行合并归类,再按学科类目进行统计,论文量≥4的15个学科类别如图2所示。

从图2可见,国外学术论文中属于图书情报学领域的论文最多,占54.02%,属于计算机科学信息系统领域的论文数量排第二,占41.38%。值得注意的是,由于WOS核心合集数据库对于计算机科学相关学科的分类细分为:计算机科学信息系统、计算机科学人工智能、计算机科学控制论、计算机科学理论与方法、计算机科学软件工程5大类。如果将计算机科学相关的5类合并计算,则属于计算机科学相关学科的论文数量最多,占59.20%。

国内学术论文学科分布方面,鉴于国内信息偶遇学术论文分布在CNKI的12个类别、万方的3个类别及中国台湾学术文献数据库的4个类别中,本研究以CNKI学科分类为基础,按照万方、中国台湾学术文献数据库中的论文学科分类,将相应论文归入CNKI对应类别进行学科分布统计,如将中国台湾地区的电算机学门归并到CNKI中的计算机类、传播学门归并到CNKI中的新闻传播类、教育学门归并到CNKI中的教育类等,将万方的计算技术、计算机技术归并到CNKI中的计算机类等。由于在CNKI和万方数据库中跨学科论文被纳入多个学科重复计数,所以学科图中的论文数量大于来源数据的数量。按照学科类目进行统计结果如图3所示。

从图3可见,国内学术论文中属于图书情报学学领域的论文最多,占59.69%,属于新闻传播领域的论文数量排第二,占22.48%。此外,还有部图3  国内信息偶遇主题学术论文的学科分布

分论文属于教育学、计算机科学等领域。可见,国内信息偶遇研究更明显地集中在图书情报学领域。新闻传播领域则从信息传播与扩散的角度对于信息偶遇问题展开研究。

3.1.3  高影响力论文

本研究采用国外来源论文引文数据集进行国外信息偶遇论文被引频次统计分析,获得被引频次论文≥100的论文共4篇,如表2所示。

从表2可见,国外4篇高影响力论文均属于信息偶遇领域早期的研究。其中,Foster A E等于2003年和2004年发表的关于偶遇式信息搜寻和信息搜寻的非线性模型两篇论文的总被引频次最高[5,7]。Ross C S关于阅读信息偶遇和Williamson K关于偶然性信息获取在信息利用模型中角色研究的论文的总被引频次也较高[6,8]。

采用国内来源论文引文数据集对国内信息偶遇论文的被引频次进行统计分析,获得被引频次论文≥10的论文共4篇,如表3所示。

从表3可见,国内4篇高影响力论文总体上属于国内信息偶遇领域中期的研究,这一时期国内正处于信息偶遇主题论文数量剧增的爆发期。在研究内容上,王知津等关于非线性信息搜寻行为的研究[11]属于概念与理论层面的探索,而其余3篇论文均属于实证研究。其中,关于科研人员信息偶遇的影响因素和特点的2篇实证研究论文被引频次最高[9-10]。

3.2  主要研究内容

3.2.1  主题分布

关键词表达了论文的研究主题,是论文内容的核心与精髓。通过绘制高频关键词共现网络,利用关键词之间的紧密程度形成关于研究主题的知识图谱。其中,网络中的节点代表关键词,节点的大小代表节点在网络中的中心度,中心度越高,节点越大,该节点在网络中的地位就越重要;节点之间的连线表示两个关键词之间的关系,连线越粗,表示共现次数越多,联系越紧密。

本研究以国外学术论文数据集中关键词频次≥2的高频关键词为对象,进行关键词共现分析,如图4所示。 结果显示,该网络中关键词Serendipity的中心度最高,并与关键词Information Encountering构成最紧密的联系。与Serendipity和Information Encountering聯系密切的主要有Information Seeking、Recommender Systems、Algorithms、Information Discovery、Information Retrieval、Design、Novelty、Information Seeking Behavior、Experimentation等。其中,关于行为、检索、算法、创新和设计等高频关键词的出现,反映了信息偶遇是一个多学科关注的领域,包含了图书情报学领域以信息行为为主的研究和计算机相关学科以人工智能、交互、知识发现等应用为主的研究。

对于国内学术论文数据集,首先进行关键词预处理,包括将繁体中文关键词转换为简体中文关键词(如将“资讯”转换为“信息”)、将“综述”“现状”等类型关键词删除等。然后,以数据集中词频≥2的关键词为对象,绘制国内信息偶遇研究关键词共现网络如图5所示。结果显示,该网络是一个以信息偶遇为核心的大型网络,而信息行为和影响因素则为该网络的次要核心,且信息行为与信息偶遇形成非常紧密的联系,说明信息偶遇作为信息行为研究的趋向性非常明显。因而,与国外主题共现网络相比,国内研究更注重信息行为理论框架内的研究及信息偶遇影响因素的研究,而国外则更关注对信息偶遇与信息查寻关系、信息偶遇应用探索等主题。

3.2.2  主题的变迁

通过学术论文数据集的关键词绘制时区图,可展示关键节点知识的演化轨迹及其相互关系。其中,不同时区节点之间连线的多少反映研究传承性的强弱,关键词所在的时区是该节点主题首次出现的时间,可以显示研究主题的时间分布和变迁。

通过国外学术论文数据集中关键词首次出现的时间绘制时区图如图6所示。从图6可知,近20年来国外信息偶遇研究主题演变历程可概括为:用户生活信息交流-偶遇-信息查寻与信息偶遇-信息查寻与理论模型-推荐系统。中心性最高的Serendipity从2001年起,在之后的时区中几乎都有出现,表明其研究持续性较好。

通过国内学术论文数据集绘制关键词时区图如图7所示。从图7可知,近15年来国内信息偶遇研究主题的演变历程可概括为:信息行为-信息搜寻-信息偶遇-影响因素。中心性最高的信息行为从2007年起,在之后的时区中几乎都有出现,表明国内信息偶遇研究在信息行为理论框架内保持较好的持续性。

3.3  领域聚类与创新分析

3.3.1  国外研究的领域聚类与创新分析

1)国外学术论文的聚类分析

对信息偶遇领域同被引文献进行聚类分析,不仅有助于明晰该领域的知识结构和子领域研究内容,还可以进一步分析出各子领域的研究活跃期、

相应的中心文献和领域内具有里程碑意义的创新文献,帮助我们更深入理解子领域知识的发展历史、面貌与演进路径,从而寻找可能推动信息偶遇领域整体发展的因素。

在基于国外来源论文引文数据集的聚类分析中,本研究以CiteSpace为工具,将Time Slice设置为按年分析,筛选标准为TOP10,即选取每年被引频次前10的数据。本研究选择LLR算法进行聚类,采用Pathfinder算法对图谱进行修剪,得到按照信息偶遇文献同被引文献聚类的知识图谱如图8所示,及各个聚类的统计信息,如表4所示。所生成的图谱模块值Q=0.5071,平均轮廓值S=0.5291,两值均大于0.5,说明该知识图谱的聚类结构清晰且合理。

如图8所示,图中每个节点表示一篇被引文献,环的厚度与相应年份的引文数成正比。圆圈外包围紫色环代表中心性较大的文献,环的厚度和中心性成比例。不同颜色的区域表示这些区域中的首

次引文链接首次出现的时间。从图中可以看出,信息偶遇领域研究被分为6类,其聚类标签分别为:#0偶遇(Serendipity)、#1信息搜寻(Information Seeking)、#2偶遇问题(Serendipity Problem)、#3信息行为(Information Behaviour)、#4个性化(Personalization)、#5偶遇问题(Serendipity Problem)。其中,#2类和#5类的标签名称相同,而从表4可知两个集合的平均引用年份分别为2006年和2012年。查看两个聚类中施引文献与相关引文的研究内容可以发现,#2集合代表以学术信息偶遇与知识创新研究为基础,探索推荐系统中的偶遇问题的研究方向,#5集合代表以各种情景下信息偶遇研究为基础,探索促进日常生活信息偶遇发生的要素与机制的研究方向。

按照表4中各聚类的平均引用年份,国外信息偶遇研究经历了“学术信息偶遇与推荐系统研究-偶遇与信息行为研究-日常生活信息偶遇研究-偶遇与个性化研究”的发展历程。从图8和表4可知,同被引论文聚类所形成最大的3个类分别是#0偶遇、#1信息搜寻和#2偶然性问题,其研究内容详细情况如下:

#0 偶遇类学术论文主要以偶遇理论与模型为基础开展应用研究。所探索的主题除了偶遇外,还包含了偶遇问题(Serendipity Problem)、创新性(Novelty)、信息推荐(Recommendation)、情感反馈(Affective Feedback)、多样性(Diversity)、超精确度(Beyond-accuracy)、长尾(Long-tail)、面部表情(Facial Expressions)、推荐系统(Recommender Systems)、知识表达(Knowledge Representation)、扩展激活(Spreading Activation)等。该类的中心性文献为Zhang Y C等将偶然性引入音乐推荐中的研究[13]。

#1信息查寻类学术论文主要以信息查寻理论为基础开展信息偶遇行为理论的探索。所探索的主题除了信息搜寻外,还包含了信息偶遇(Information Encountering)、历史研究过程(Historical Research Process)、法律(Legal)、模型(Model)、浏览(Browsing)、历史学家(Historians)、过程(Process)、偶遇模型(Serendipity Pattern)、高校图书馆(Academic Libraries)、历史(History)、跨学科研究(Interdisciplinary Research)、因素(Factors)、信息发现(Information Discovery)等。该类中心性文献为Rubin V L等采用扎根理论构建网络博客中提及的日常生活偶遇行为理论的研究[14]。

#2偶遇问题类学术论文主要探索信息偶遇中的知识创新问题,除了偶然性问题外,该类论文还包括创新(Novelty)、信息行为(Information Behaviour)、个人行为(Individual Behaviour)、信息偶遇(Information Encountering)、推荐(Recommendation)、日记学习(Diary Study)、情感反馈(Affective Feedback)、个性化(Personalization)等关键词。该类的中心性文献是Cunha M P E关于偶然性在组织学习与创新中的研究[15]。

2)学术论文的中心性与突现分析

一个时期某篇被引文献的中心性和被引频次,不但反映了该领域的知识基础,也充分证明了该文献的重要性,中心性靠前的文献在学科历史的发展中往往起到重要的作用。因而,本研究着重总结了国外中心性0.2以上的文献,如表5所示。从表5可见,Andre P等支持偶遇式获取的系统与服务设计研究[16]不仅是#3信息行为类的中心,更是所有研究中心度最高的论文。Rubin V L等关于日常生活信息偶遇的研究也具有较高的中心度[14]。

被引文献引用爆发值的大小可用于衡量该研究的创新性,是前沿的“足迹”。爆发值越大,研究成果的创新性就越大,代表了该研究领域的前沿。Bursts值强的被引文献往往是该领域研究的重要里程碑,表示研究人员对该领域研究兴趣的显著增加。因而,本研究通过Bursts分析得出排名前三的信息偶遇领域突现文献,如表6所示。

从表6可见,信息偶遇研究最早的里程碑论文是Foster A E等关于人文社科学者跨学科信息搜寻行为中信息偶遇行为的研究[5],该研究同时也位于高被引论文之首。此外,早期突现文献还包括Erdelez S在受控实验环境下对信息偶遇行为的调查[19]。Foster A E等和Erdelez S的这两篇论文分别在2003年和2004年发表,被引频次在2008年和2006年开始爆发,其热度持续至2011年与2012年。参考图1的时间分布统计结果,可发现这两篇突现文献持续的热度与国外2006—2011年间的第一次研究高潮基本吻合。而第三篇是Toms E G等关于数字图书馆中的偶然发现研究[20],其热度从2011年持续至2014年。

3.3.2  国内研究的领域聚类与创新分析

在国内研究的领域聚类与创新分析中,本文以CSSCI来源论文的引文数据集为分析对象,采用CiteSpace得出文献同被引网络及其聚类结果,如图9和表7所示。所生成的图谱模块值Q=0.5125,平均轮廓值S=0.7138,两值均大于0.5,说明该知识图谱的聚类结构清晰且合理。

从图9领域聚类结果可知,国内研究总体上可分为#0信息获取、#1知识脉络、#2认知风格、#3偶遇信息、#4支持向量机、#5意义建构理论等6个方向。按照平均被引时间对子领域排序,其发展顺序为:偶遇信息-认知风格-支持向量机-意义构建-信息获取-知识脉络。6大类中前4类的规模较大,其研究内容详细情况如下:

#0信息获取类,该类研究主要围绕国外偶遇式信息行为理论与模型开展文献梳理与信息获取的应用探索。除了信息获取外,该类还包括知识脉络和前沿展望等关键词。该类中心性文献是Makri S等的信息偶遇过程模型研究[17]。

#1知识脉络类,该类研究围绕偶遇相关的各类信息行为及影响因素研究开展理论梳理,相关关键词还包括知识脉络和前沿展望。该类中心性文献是杜雪等关于网络信息偶遇影响因素个性特征研究[21]。

#2认知风格类,该类研究以国内外早期关于不同情境下信息偶遇研究為基础,进行信息偶遇模型、线上信息偶遇经验、个人特征与认知风格等理论探索。相关的关键词还包括元人种志、信息搜寻、情境、模型研究、信息偶遇模型等。该类的中心文献是袁红等关于数字图书馆利用中信息偶遇现象研究[12]及潘曙光关于信息偶遇行为的早期研究[22]。

#3偶遇信息类,该类研究以学术信息偶遇研究为基础,探索偶遇信息利用问题。该类关键词还包括偶遇信息利用、偶遇信息共享、偶遇信息存储、偶遇信息共享、偶遇信息利用等。该类中心文献是田立忠等关于科研人员信息偶遇的影响因素研究[9]。

本研究整理出聚类中心性在0.2以上的高中心性被引文献列表,如表8所示。从表8可见,中心性最高是田立忠等关于科研人员信息偶遇影响因素的研究。该论文作者使用关键事件和扎根理论对科研人员信息偶遇行为进行探索,是国内较早采用实证研究方法探索信息偶遇问题的研究[9]。Makri S等对于信息偶遇过程模型的探索在国内研究中也具有较高的中心性。该研究采用扎根理论的方法对跨学科研究人员的偶遇过程进行研究并建立模型,其研究方法和关于跨学科研究人员偶遇行为的结论,为国内信息偶遇研究提供了十分重要的借鉴作用和意义[17]。值得注意的是,该研究同时也是国外#1信息查寻类的中心性文献,且与表7中McCay-Peet L等的研究同属偶遇过程研究[23],说明信息偶遇过程的明晰对于信息偶遇行为的深入探索和应用具有基础性意义。

然而,虽然国内研究已呈现若干子领域和中心性文献,但国内论文中并未出现Burst被引文献,这就说明国内信息偶遇领域的突破性和创新性研究尚不明显。这一方面可能是因为大部分研究是在国外已有理论、方法和应用的框架内开展的,未能有力突破当前研究方法和技术带来的瓶颈;另一方面,一些具有理论创新性的研究并未及时获得同行的检验和发展。虽然如此,国内领域发展早期出现的高被引文献,通过理论探索[11]与实证研究[9]丰富和发展了信息偶遇理论,并为后续多年的研究提供基础,一定程度上反映了这些文献的里程碑意义。

4  讨  论

为了从信息偶遇领域的历史轨迹中寻找未来发展的方向,本研究以中国大陆、中国台湾地区和国外数据库收录的以“信息偶遇”为主题的相关相学位论文和期刊论文为来源数据进行知识图谱分析。可获取的论文最早追溯到1995年,因而数据集覆盖近20年来该主题的中外文主要研究文献。在分析结果的基础上,本研究从信息偶遇研究节点与主题变迁、内容体系、跨学科性、研究趋势与突破等方面进行讨论。

4.1  信息偶遇研究节点与主题变迁

近20年来国外年均论文数量呈现递增趋势,Erdelez S早在1995年就完成了关于信息偶遇的学位论文,在信息搜寻行为的基础上提出并探索信息偶遇行为,形成信息偶遇研究的起点[3]。之后,Williamson K于1998年提出在信息搜寻行为理论之外利用信息生态理论框架进行偶然信息获取研究,该观点和理论构成了信息偶遇研究的重要理论基础[6],成为早期高被引论文之一。Foster A E于2004年发表了至今被引频次最高、具有里程碑意义的偶遇与信息搜寻行为的研究[7]。国外研究主题按照时间演进经历了:用户生活交流-偶遇-信息查寻与信息偶遇-信息查寻与理论模型-推荐系统的主题变化轨迹。该变化轨迹一定程度上反映了信息偶遇研究沿着现象探索-模型构建-应用探索的阶段性演进轨迹,可为国内信息偶遇研究理论的形成和发展提供参考。

国内最早的关于信息偶遇的研究与国外相差约10年,但国内年均论文数量的总体趋势与国外相似,总体而言呈现递增趋势。研究主题按照时间演进经历了:信息行为-信息搜寻-信息偶遇-影响因素的主题变化轨迹,反映了国内学者的研究从侧重信息行为理论下的信息偶遇研究框架的构建,到重视信息偶遇影响因素的探索历程。而至今位于国内高被引文献之首的学术论文也是关于科研人员信息偶遇影响因素的研究[9]。

4.2  信息偶遇研究的内容体系

1)信息行为理论框架下的信息偶遇研究。从文献关键词共现分析和同被引分析可知,无论国外或国内的研究,对于信息偶遇理论和现象的探索都离不开信息行为理论这一上位理论,尤其是中国台湾地区大部分研究更从属信息行为研究主题之下,仅以信息偶遇为研究对象的研究很少。而国外和中国大陆地区对信息偶遇的专门研究相对较多。因此,信息行为理论框架下总体上呈现两种类型的研究:一是信息偶遇理论的专门研究;二是信息行为研究中关于信息偶遇的研究。

2)从信息偶遇理论到应用的研究体系。在国外,信息偶遇研究涵盖了理论构建、模型研究、方法探索和应用研究等方面,涉及信息偶遇过程、不同情境下信息偶遇研究、信息偶遇的影响因素和触发机制研究、目的性信息和偶遇性信息供给的协调、偶遇几率、人工智能、支持信息偶遇的信息过滤、信息整合、信息推送、知识发现、界面设计等各类信息系统设计问题,呈现从理论到应用的多层次、多角度的研究。

3)国内信息偶遇理论的引进、创新。在国内,信息偶遇研究较多地参考国外节点性文献的研究,也形成了若干综述性文献,如潘曙光对信息偶遇研究的专门介绍[22],迪莉娅在介绍国外信息行为研究方法中对信息偶遇行为的梳理[25]。

除了引进和参考,国内研究也有一些理论、方法的创新,如王知津等提出非线性信息搜寻行为的概念及后续研究方向[11];周晓英等提出非线性信息搜寻行为概念模型,以要素分析描述信息搜寻行为,从而综合描述信息行为过程[26];田梅等面向复杂情境下的信息偶遇研究,构建面向过程-感知二元性的信息偶遇研究理论框架[27]。此外,还有面向不同用户群体、不同技术环节和不同应用情景下的信息偶遇现象的探索,从而不断丰富信息偶遇研究的理论体系。

4)基于新技术的研究方法创新。国内对于信息偶遇理论的应用探索有所缺失,造成新的理論无法检验和应用的局面。因此,应着眼于新技术环境下信息偶遇行为的研究,一方面借助新技术对信息偶遇场景进行模拟;另一方面对行为数据记录、分析和挖掘,从而更深入地探索信息偶遇发生的机制和影响因素。

4.3  信息偶遇研究的跨学科性

从学科分布情况来看,偶遇行为研究是一个多学科交叉的研究领域。信息偶遇行为作为人类信息行为的组成部分,可能出现在不同技术环境和情景下的各类型信息行为过程中,很大程度上涉及新技术环境下信息查寻与利用。图书情报学科领域是信息偶遇研究的重要领地,与计算机相关学科和传播学的交叉最为明显。其跨学科性主要体现在两个方面:

1)多个学科相对独立的研究。除了图书情报学领域外,计算机相关学科、工商管理领域存在领域内关于偶遇的探索。计算机相关学科中,推荐系统偶遇研究就是一个相对独立于图书情报学信息偶遇研究的领域,虽然该领域论文数量不多,但形成关于偶遇的较为独立的理论体系,如Sridharan S从偶然性的角度改进推荐系统并通过协同过滤方法提高其质量[28];Manca M等提出利用行为数据挖掘的方法建立社会标签系统中的偶遇推荐[29]。工商管理领域对于偶遇和创新关系的部分研究也独立于图书情报学领域,如Nylen D等探索组织环境下数字化创新过程的出现和发展,以及偶遇和预期以外的创新对传统组织数字化方向的影响[30];在网络学习和知识扩散相关领域,偶然性作为一种促进知识或思想传播的可能策略已成为一个活跃的研究课题,研究人员关注偶然性事件如何得到环境的支持以及环境中最相关的特征是什么等问题[31-32]。

2)图书情报领域信息偶遇研究构成其他学科的研究基础。由于信息偶遇早期研究和有影响力的研究集中在图书情报学领域,这些研究已成为其他学科开展信息偶遇相关研究的理论基础。这当中包括新闻传播学引用图书情报学早期信息偶遇研究,如Van D K等利用Foster A E等的非线性信息行为和信息偶遇理论[5]研究新闻信息消费过程的偶遇现象[33];Wright C以Foster A E等、Erdelez S、Rubin V L等、McBirnie和Andre P等关于信息偶遇的研究为理论基础探索用户智能手机阅读中的停顿和转移现象[34]。计算机相关学科领域的研究也有借鉴图书情报学研究以构建其理论基础的,如Amal S等以McCay-Peet L等的信息偶遇过程模型为基础[23],提出支持社会关系网络上偶遇的社会关系推荐法,支持研究兴趣相关的新社会关系的发现[35]。Cremonini M参考图书情报学领域Foster A E等、Erdelez S、McBirnie和Makri S等关于信息偶遇、社会网络分析和知识扩散相关理论,构建基于代理的偶遇促进策略模型,发现偶遇控制和引导的可能[36]。

4.4  信息偶遇研究趋势与突破

无论国外研究主题变迁的轨迹,还是国外3篇关于理论构建[5]、实验调查[19]和数字图书馆环境下偶遇行为研究突现文献,正好都对应理论探索、实证检验和应用探索3个层面的领域理论发展轨迹,因此,信息偶遇研究领域的后续发展,也相应延续理论、方法、应用3个层面开展。

国内外关于信息偶遇理论已建立若干标志性的模型和框架,但由于数据来源和研究方法的瓶颈问题,造成实证研究开展困难,理论检验不足。因此,偶遇行为数据来源和采集方法的拓展对该领域而言是最有意义的方法创新,存在较高的理论价值。计算机相关学科采用的基于社会网络分析和行为数据的采集等方法,可能为突破数据获取的瓶颈提供重要参考。

信息偶遇行为作为人类行为的一部分,不同群体可能存在不同行为特征和影响因素,因此,寻找可能存在特异性的群体进行探索,可能存在理论的突破。延續这一思路,用户群体在不同的技术环境下,特定的信息利用情境下,都可能存在不同行为特征和影响因素,寻找可能存在特异性的技术环境和信息使用情景进行探索,存在理论突破的可能。

在应用方面,关键词分析发现国内研究对于信息偶遇应用研究缺失,因而更应与人机交互、人工智能、信息聚合与推荐等领域紧密结合,构建信息偶遇虚拟环境和应用原型,一方面进行应用探索,另一方面也可以形成目的性理论检验和探索的实验工具。

参考文献

[1]姜婷婷,杨佳琪,李倩.信息行为领域概念空间构建与研究进展述评[J].图书情报知识,2019,(1):99-108.

[2]Erdelez S,Beheshti J,Toms E,et al.Research Perspectives on Serendipity and Information Encountering[C]//ASIS&T Meeting:Creating Knowledge,Enhancing Lives Through Information & Technology,Copenhagen,Denmark,2016.

[3]Erdelez S.Information Encountering:An Exploration Beyond Information Seeking[D].Syracuse:Syracuse University,1995.

[4]张郁蔚.日常生活资讯寻求模式之探讨[J].国家图书馆馆刊,2005,(2):73-99.

[5]Foster A E,Ford N.Serendipity and Information Seeking:An Empirical Study[J].Journal of Documentation,2003,59(3):321-340.

[6]Williamson K.Discovered By Chance:The Role of Incidental Information Acquisition in an Ecological Model of Information Use[J].Library & Information Science Research,1998,20(1):23-40.

[7]Foster A E.A Nonlinear Model of Information-seeking Behavior[J].Journal of the American Society for Information Science and Technology,2004,55(3):228-237.

[8]Ross C S.Finding Without Seeking:The Information Encounter in the Context of Reading for Pleasure[J].Information Processing & Management,1999,35(6):783-799.

[9]田立忠,俞碧飏.科研人员信息偶遇的影响因素研究[J].情报科学,2013,31(4):69-75,83.

[10]俞碧飏.信息偶遇概念与特点的实证辨析:以科研人员为例[J].情报学报,2012,31(7):759-769.

[11]王知津,韩正彪,周鹏.非线性信息搜寻行为研究[J].图书馆论坛,2011,31(6):225-231,281.

[12]袁红,王志鹏.数字图书馆利用中信息偶遇现象研究[J].图书情报工作,2014,58(17):104-111,135.

[13]Zhang Y C,Séaghdha D ,Quercia D,et al.Auralist:Introducing Serendipity Into Music Recommendation[C]//Proceedings of the Fifth ACM International Conference on Web Search and Data Mining.New York:ACM,2012.

[14]Rubin V L,Burkell J,Quan-Haase A.Facets of Serendipity in Everyday Chance Encounters:A Grounded Theory Approach to Blog Analysis[J].Information Research,2011,16(3).http://informationr.net/ir/16-3/paper488.html,2019-12-15.

[15]Cunha M P E,Clegg S R,Mendona S.On Serendipity and Organizing[J].European Management Journal,2010,28(5):319-330.

[16]Andre P,Schraefel M C,Teevan J,et al.Discovery is Never By Chance:Designing for(Un)Serendipity[C]//ACM Conference on Creativity and Cognition,2009.https://www.researchgate.net/publication/39997986_Discovery_Is_Never_By_Chance_Designing_for_UnSerendipity,2019-12-15.

[17]Makri S,Blandford A.Coming Across Information Serendipitously-Part 1 A Process Model[J].Journal of Documentation.2012,68(5):684-705.

[18]Agrawal R,Gollapudi S,Halverson A,et al.Diversifying Search Results[C]//Proceedings of the Second ACM International Conference on Web Search and Data Mining.ACM,2009.

[19]Erdelez S.Investigation of Information Encountering in the Controlled Research Environment[J].Information Processing & Management,2004,40(6):1013-1025.

[20]Toms E G,McCay-Peet L.Chance Encounters in the Digital Library[A].In:Agosti M,Borbinha J,Kapidakis S,et al(eds)Research and Advanced Technology for Digital Libraries.Berlin,Heidelberg:Springer,2009:192-202.

[21]杜雪,劉春茂.网络信息偶遇影响因素个性特征的调查实验研究[J].图书情报工作,2015,59(11):119-126.

[22]潘曙光.信息偶遇研究[D].重庆:西南大学,2010.

[23]McCay-Peet L,Toms E G.The Process of Serendipity in Knowledge Work[C]//In:Proceedings of the 3rd Symposium on Information Interaction in Context.New Brunswick,NJ:ACM,2010:377-382.

[24]杨敏,谢阳群,谢笑.社交媒体软件的信息偶遇研究[J].图书馆学研究,2016,(6):65-68.

[25]迪莉娅.西方信息行为认知方法研究[J].中国图书馆学报,2011,37(2):97-104.

[26]周晓英,张璐.基于活动理论的非线性信息搜寻行为模型研究[J].图书情报知识,2018,(1):4-15.

[27]田梅,张军亮,刘喜文.移动互联网信息偶遇行为演进动力机制分析:个体认知视角[J].图书馆学研究,2018(6):55-59,73.

[28]Sridharan S.Introducting Serendipity in Recommender Systems Through Collaborative Methods[D].University of Rhode Island,2014.

[29]Manca M,Boratto L,Carta S.Behavioral Data Mining to Produce Novel and Serendipitous Friend Recommendations in a Social Bookmarking System[J].Information System Frontier,2018,20:825-839.

[30]Nylen D,Holmstrom J.Digital Innovation in Context Exploring Serendipitous and Unbounded Digital Innovation at the Church of Sweden[J].Information Technology & People,2019,32(3):696-714.

[31]Kop R.The Unexpected Connection:Serendipity and Human Mediation in Networked Learning[J].Journal of Educational Technology and Society,2012,15(2):2-11.

[32]Kop R.Information Aggregation in Networked Learning:The Human Factor and Serendipity[A/OL].In:Proceedings of the 8th International Conference on Networked Learning,2012:178-185.https://www.lancaster.ac.uk/fss/organisations/netlc/past/nlc2012/abstracts/kop.html,2020-07-13.

[33]Van D K,Martens M,Van L S,et al.Mapping the Mobile DNA of News.Understanding Incidental and Serendipitous Mobile News Consumption[EB/OL].Digital Journalism.https://www.tandfonline.com/doi/full/10.1080/21670811.2019.1655461,2019-12-15.

[34]Wright C.Stumbling and Sharing:Smartphones and Serendipity in Online News Encounters[D].University of Missouri-Columbia,2015.

[35]Amal S,Tsai C H,Brusilovsky P,et al.Relational Social Recommendation:Application to the Academic Domain[J].Expert systems with Applications,2019,124:182-195.

[36]Cremonini M.Introducing Serendipity in a Social Network Model of Knowledge Diffusion[J].Chaos Solitons & Fractals,2016,90:64-71.

(責任编辑:陈  媛)