王晓红 梁玉芳 王福
〔摘 要〕掌握移动图书馆领域研究的知识演化和扩散指导国内相关研究,对移动图书馆领域引文网络实施断层扫描,了解文献之间的引证关系及引文网络路径已受到业界的关注。为此,运用HistCite探测不同节点规模引文网络的引证子群,确定引文网络主路径。借助Pajek的3种主路径算法分析不同节点规模的主路径成分差异,发现核心文献集和关键知识节点。通过对移动图书馆领域核心文献集及其关系的分析,揭示了移动图书馆领域知识演化的主体脉络。以此为基础,结合国内研究成果对移动图书馆创新研究主路径进行了规划。
〔关键词〕移动图书馆;引文网络分析;主路径计算方法;主成分分析;核心知识节点
DOI:10.3969/j.issn.1008-0821.2018.06.005
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2018)06-0032-08
〔Abstract〕In order to understand the evolution and diffusion of knowledge in the field of mobile library,and guide the related researches in China,the paper scanned the citation network in the mobile library,and understood the citation relationship and citation network path.Using HistCite to detect the citation subgroups of the citation networks of different nodes,it determined the main path of the citation network.With the 3 main path algorithms of Pajek,the difference of main path components of different nodes was analyzed,the core literature set and key knowledge nodes were found.Through the analysis of the core literature and its relationship in the field of mobile library,the main body of knowledge evolution in the field of mobile library was revealed.On the basis of this,the main path of the research on the innovation of mobile library was planned in combination with the domestic research results.
〔Key words〕mobile library;citation network analysis;main path calculation method;principal component analysis;core knowledge node
1 研究背景的提出
近年來,随着移动图书馆情境的不断丰富以及场景要素在移动图书馆嵌入的逐渐深入[1],加之微媒体、自媒体和新媒体对移动图书馆形成了巨大的冲击,使得用户利用移动图书馆持续使用意愿下降,用户对移动图书馆弃用或卸载的现象时有发生。面对这种情形,移动图书馆研究应重点关注用户在场景中如何利用现有信息接受情境,增强其信息接受的持续意愿[2]。为此,需要借助于引文网络分析工具对移动图书馆领域的现有研究成果进行分析,通过对国外和国内研究对比,可以把握移动图书馆领域研究的具体内容。①了解国外关于移动图书馆领域研究的演化过程,与国内相关研究比较,发现国内外研究的差别,从而有助于指导国内相关研究的进一步开展。②通过对国外移动图书馆领域研究引文网络的主路径分析,寻找核心文献集和关键知识节点,指导国内移动图书馆相关研究的方向。③通过对国外移动图书馆领域的引文网络分析,探测移动图书馆文献聚合子群的相关主题,指导国内相关研究的多元化拓展。④深入剖析了移动图书馆主题领域引文网络的内部结构,通过寻找核心知识节点和主路径的方法深入揭示国外移动图书馆领域核心文献集和知识演化的关键节点。
引文网络是以科学文献作为知识节点,通过引证关系构成领域的知识关联,体现了特定主题领域的知识结构和知识演化的整个脉络。引文网络主路径是从引文网络起点到引文网络终点的一条通路,该条通路上的引证关系具有最高的权值[3]。主路径分析的目的是用来识别引文网络主题领域核心文献及其引证关系,并借此掌握主题领域研究的演化脉络[4]。为深入了解移动图书馆领域引文网络的主路径的形成,借用医学领域的计算机断层扫描技术(Computed Tomography,简称CT)[5],对不同节点规模的引文网络进行断层探测,形成不同规模的引文网络断层图谱,比较不同节点规模的引文网络断层图谱,可判断包含主路径的最小节点规模的移动图书馆引文网络,并以此节点规模的引文网络深入研究,实现了引文网络由宏观研究向微观研究转化。通过对移动图书馆领域引文网络的断层扫描,实现引文网络主路径分析,可深入探测移动图书馆领域引文网络的内部结构,发现领域核心文献集和关键知识节点[6]。为此从引文网络视角出发,综合应用HisCite、Pajek网络分析工具,通过对引文网络主成分和主路径的分析,掌握国外移动图书馆相关研究的演化,推动国内移动图书馆的研究。
2 引文网络主路径分析法
最早提出主路径(Main Path)概念的是N.Hummon和P.Doreian[7],其试图从引网络中的文献间的引证关系探寻核心文献集和关键知识节点。De Nooy W等[8]指出核心文献作为知识传递主要媒介,贯穿于知识传承的主要过程、对于整个知识体系发展具有核心的传递作用,具体而言是指在引文网络中对某个主题领域的知识传承具有重要意义的知识节点集合。邱均平等[9]对引文网络中文献的核心程度用权值定义,以We表示引用关系的权值,以Wv表示节点的权值,且We,Wv∈[0,1],探讨了基于引文权值的聚合。移动图书馆研究领域引文网络的节点数不同,称为不同规模的引文网络。主路径分析(Main Path Analysis,简称MPA)主要是通过识别引文网络中具有最大连通度的系列文献来概述研究领域的发展态势以及领域演化过程中的主要文献、主要人物与主要事件。为了探寻移动图书馆领域引文网络主路径,利用Pajek的3种主路径生成方法:“搜索路径数”(Search Path Count,簡称SPC)方法、“搜索路径链接数”(Search Path Link Count,简称SPLC)方法和“搜索路径节点对”(Search Path Node Pair,简称SPNP)方法。这3种方法是结合“深度优先搜索算法”(Depth First Search,简称DFS)和“穷举搜索算法”(Exhaustive Search,简称ES),利用遍历数(Traversal counts)开发的[10]。N.Hummon等从一个由40个节点组成的代表DNA学科的引文网络中提取起中心作用的节点,并由这些节点之间的连接探究了DNA学科发展的主要思想变迁[11]。本研究正是基于此思路展开相关分析,以期获得移动图书馆领域主路径的最小节点数规模的引文网络,从而对资移动图书馆领域相关研究把脉问诊。
3 数据获取与研究实施
3.1 数据获取
选择WOS数据库中的Article,检索时间为2018年3月18日。精练后的检索式为:(TS=Mobile Library or TS=Mobile Service or TS=Mobile Information System or TS=Mobile Application or TS=Mobile Library APP or TS=Smart Library)AND(TS=Information Need or TS=Information Request or TS=Information Search or TS=Information Accept* or TS=Information Behavior)[12]。共检索到论文11 317篇,通过对WOS学科分类筛选,选择经过数据清洗后得到2 966篇,其年代分布如图1所示。
通过对引文网络分析发现:1992年,移动图书馆领域发表了学术论文3篇。从1992年开始学术论文数量处于波动,但是一直到2001年移动图书馆领域相关论文数量一直持续增长,到2016年移动图书馆领域研究成果达数量为389篇,达到了研究的高峰状态。为了进一步分析检索结果,将数据导入到HistCite中,得到非重复引文数为2 945篇,涉及的作者8 280名,期刊有1 235种,引文为68 961篇,关键词4 205个。
3.2 研究实施
在实践应用中,一般认为WOS数据库中引用次数最多的必定参考价值更大,但事实并非如此。文献参考价值的大小是由全局引用次数(Global Citation Score,简称GCS)和本地引用次数(Local Citation Score,简称LCS)共同决定的。如果某领域中1篇文献的GCS值很高,则说明这篇文献被全球各领域学者关注较多。如果某领域中1篇文献的GCS值很高,但是其LCS值很小,这就表明来自全球关注的领域比较分散,只有一小部分关注与本领域一致[13],对于本领域而言,此篇文献的参考意义可能不大。如果一篇文献的GCS值较低,而LCS值较高,表明此篇文献来自于同一研究方向,参考价值更大。为进一步掌握国外移动图书馆研究成果的主体框架和发展脉络,对引文网络采用断层扫描的方式分析引文主路径,具体方法为:①利用HistCite,通过对引文网络断层扫描生成不同规模的引文网络,探索整个网络的经络。②运用HisCite,以默认的节点数为30生成引文节点数为30的规模网络,并参考相关文献的网络规模生成规则[14],依次生成节点数为30、60、120、240、480、960和1 920节点数规模的引文网络。③运用Pajek网络分析工具,对用HisCite生成的不同规模引文网络进行断层扫描,获得不同节点数规模的断层扫描图谱,如图2所示。
图2是由6个不同节点数规模的引文网络的断层扫描图谱组成,分别显示了网络规模为30、60、120、240、480、960的聚合子群,利用网络分析工具对不同节点数规模的引文网络断层扫描信息如表1所示。
由表1可知在移动图书馆研究领域主聚合子群数随着网络规模增加主成分点不同,聚合子群节点数占总节点数的百分比逐渐减少,减少的幅度也在变小。通过图2结合表1可初步确定#5规模的网络包含了引文网络主路径。虽然#6的主聚合节点数在增加,但是其增加并非增加了主路径的节点,#5规模的引文网络最具有代表性[15],通过研究#5规模的引文网络可以发现移动图书馆领域的核心文献集和关键知识节点,有利于指导国内移动图书馆研究。
4 研究结果及分析
4.1 主成分分析
利用Pajek网络分析工具中的Net→Citation Weights下的3种引文网络权值SPC(Search Path Count)、SPLC(Search Path Link Count)和SPNP(Search Path Node Pair)对移动图书馆领域不同网络规模断层扫描可知引文网络的形成具有:①先发效应,网络规模较小的切片中主路径的主成分比例占据较多,表明引文网络的主路径具有一定的先发效应。②一致效应,运用SPC和SPLC两种方法对不同网络规模进行断层扫描,结果发现相同网络规模断层的两种引文主路径完全相同,权值也完全相同。③差异效应,运用SPC/SPLC和SPNP两类方法对不同网络规模断层扫描,发现两类方法的住路径不同,引文权值也不同。一般来说SPC/SPLC生成的主路径长度略长[16]。在本研究的不同网络规模切片中,SPC/SPLC和SPNP的主路径组分相差不是很大,如图3和图4所示。
图3左侧为移动图书馆领域节点数为480引文网络的SPC/SPLC断层扫的主路径图谱和主路径的不同组成成分的路径长度数值分布。由图3可知92.3%的组成成分路径的长度数值的权重数值为0.0681以下。说明在节点数为480网络规模的引文主路径中,引文权重不是很高,只有7.7%的路径的权重较大,符合引文网络的权重分布特点。
图4左侧为移动图书馆领域网络规模为480的SPNP断层扫描的主路径图谱和主路径的不同组成成分的路径长度数值分布。由图3可知90%的组成成分路径的长度数值的权重数值为0.042以下。说明节点数为480规模的引文主路径中,引文权重不是很高,只有10%的路径的权重较大,符合引文网络的权重分布特点。
由图3可知同一引文网络规模的SPC和SPLC断层的主路径一致,权重值也一致。由图3和图4可知同一规模网络的SPC/SPLC断层和SPNP的断层不一致,SPNP比SPC/SPLC的主路径的弧线数较少,权重值也不一致。网络规模分别为30、60、120、240的SPNP断层与SPC/SPLC断层相比,主要缺少(793,235)、(1534,793)、(1053,235)和(1053,235)4条弧线。在网络规模为480的SPNP断层与SPC/SPLC断层的节点也完全一致,只是缺少了(527,263)、(793,235)、(793,235)、(361,235)和(1051,235)4条弧线[17]。
为了进一步了解同一网络规模的SPC/SPLC与SPNP的主路径权重,通过两类引文网络的主路径的权重进行测试[18],如图5所示。
图5是节点数为480的网络规模为断层扫描图谱,左侧为SPC/SPLC的引文断层权重,右侧为SPNP的引文断层权重,通过两个切片对比分析可知:①SPC/SPLC低线值弧线占据了绝对数量的97%以上,且这些弧线的线值都低于0.051,这表明移动图书馆领域的引文网络关键知识节点比较分散[19]。②同一网络规模下,SPC/SPLC所生成主路径的引文权重比SPNP所生成主路径的引文权重要高,原因是SPC和SPLC是确保所有源点到汇点形成主路径[20]。
4.2 主路径分析
本研究中,移动图书馆领域包含全部节点引文网络规模偏小,其不重复顶点数为480,通过断层扫描识别出的主路径长度为:13(SPC/SPLC),11(SPNP)。表2是对移动图书馆领域不同节点数规模的引文网络与其所对应主路径长度的相关数据[21]。从表2可以看到:通过对不同节点数规模的引文网络断层扫描,节点数为480规模的引文网络为包含主路径的最小规模的引文网络。
由表2可知,网络规模在480个节点时趋于稳定,之所以节点为960的路径较短[22],是由于在分支路径少了1个节点,但没有改变主要路径的成分。所以本研究在网络规模为480时的路径为主路径[23]。
对于SPNP算法的几条弧线(2634,2263)、(2263,1534)、(2263,1526)、(1053,361)、(1534,793)、(1534,1053)、(527,361)、(793,361)和(1562,527)的线值和用SPC/SPLC算法的线值一致,且两行对比发现一些弧线在两行都有所包含,说明这些弧线以及连接这些弧线的节点在国外移动图书馆研究领域的知识传递具有核心作用,这些节点所对应的文献集合是移动图书馆领域的核心文献集[24]。
5 研究成果脉络发现
5.1 核心文獻集发现
通过对移动图书馆领域的主路径分析,探测到网络规模为480时的主聚合子群包含了主要路径,且在该路径处趋于稳定。通过对不同网络规模的切片分析发现:①SPC和SPLC生成的主路径中,235是361、793和1053的一个知识来源,而361是527、793和1053的一个知识来源。②在移动图书馆领域引文网络的主路径中,没有一个作者出现多次,说明在移动图书馆领域的引文网络的主路径中,并未形成领袖人物。③经过探测分析,当网络规模达到480个节点后主路径几乎不再发生变化。由前面的研究可知网络规模为480个节点时趋于稳定,形成了一个子网络(见图2),综合所有核心文献集如图6所示。
图6显示了移动图书馆领域核心文献集及其之间的引证关系。通过不同文献之间连线的密集程度,可以发现移动图书馆领域的最为核心的文献,为移动图书馆服务创新和信息空间再造提供依据。
5.2 知识脉络发现
为了进一步了解移动图书馆领域的知识发展体系,对上述10篇核心集的论文进行梳理如表4所示。
表4中235#、361#、1534#和2263#为关键知识节点。通过对关键知识节点分析发现:①国外移动图书馆最早研究是移动网络服务引入技术接受模型,指出传统应用模式应用于移动服务时间,需要对模型加以扩展和修改。②10篇核心集文献都涉及了移动图书馆或移动服务信息接受的影响因素,包括感知有用性、感知易用性以及其在应用中的拓展。③资源技术接受模型从2005年引入移动图书馆或移动应用领域,得到了进一步的扩展,对不同的实际应用进行实证研究,此类研究问题一直持续到现在。技术接受模型将是未来移动图书馆或者移动应用服务创新或者信息空间再造的依据。④从核心文献集整体脉络来看,最终是通过对接受模型进行扩展和改造,结合现有移动图书馆应用模式,实现服务创新,以增强用户信息接受的畅体验,提升用户信息接受的持续意愿[25]。
6 国内移动图书馆研究不足与展望
6.1 现有移动图书馆研究不足
综观国外移动图书馆研究的演化脉络[26],结合国内相关文献,发现移动图书馆研究存在以下几个方面的不足。①理论体系尚不完善,虽然国内在移动图书馆或者移动应用引入了技术接受模型,对于技术接受模型在图书馆中的应用也进行了实证研究,但是对于目前移动图书馆的情境和场景要素涉及的较少。目前移动图书馆场景化信息接受已成为常态,且情境要素不断丰富,但是技术接受模型的验证鲜有结合此类要素进行。②理论难以支撑实践应用,在实际应用中,由于现有理论研究并未从根本上解决“场景—需求—情境”、“场景—搜索—情境”和“场景—接受—情境”的多维度关联适配,出现了理论成果虽然丰硕,但是却很难支撑实践应用。更多的理论研究被束之高阁或者应用还停留在试验室范围内,不具备支撑全面推广应用的指导。③实践应用在微观层面研究偏少,目前移动图书馆大多研究尚停留在宏观研究视角层面,缺乏对微观视角的深入研究,如在不同场景如何配置情境,以满足用户信息需求期望、信息搜索习惯和信息接受偏好。④理想状态研究较多,在现有研究中,大多从理想状态出发,对于移动图书馆场景化信息接受的阻滞因素考虑的较少,特别是针对具体的应用如何减轻或者消弱信息接受阻滞研究的较少,如:信息接受阻力、信息接受摩擦、信息接受噪声和污染等。
6.2 移动图书馆服务创新展望
移动图书馆研究需要结合现有信息环境的变化进行服务创新和空间再造[27]:①场景引入。场景化要素已经渗透到移动图书馆的实际应用中,但是由于现在对其管理是处于粗放型的。大数据、移动设备、社交媒体、传感器、定位系统这五个要素形成了场景五力[28]。如何运用定位系统,感知用户所处场景及场景切换;如何运用大数据技术挖掘用户在不同场景的信息需求期望、信息搜索习惯和信息接受偏好,为其进行场景化信息接受情境配置提供依据[29];如何运用传感器感知用户的身体状态,为其配置针对性的情境以提升用户信息接受体验的愉悦度;如何运用社交媒体实现用户线上和线下的关系的无缝连接[30],以提升信息接受效率。②情境配置。不同用户在不同场景的信息需求期望、信息搜索习惯和信息接受偏好不同,如何为其配置针对性的信息接受情境,提升用户信息接受的体验是下一阶段研究的重点。在实际研究中,可以以数字移动图书馆理论为指导,实现不同场景的信息接受情境的组织和再组织,实现移动图书馆信息接受情境重组和聚合以及融合,针对性地为用户所处场景的信息接受期望配置情境。③接受适配。个性化服务和多元化服务在数字图书馆研究中就已被提出,具体到移动图书馆需要对其进一步深化,表现为“场景—需求—情境”、“场景—搜索—情境”和“场景—接受—情境”的多维度关联适配[31]。既满足了用户信息接受期望,也实现了这3类适配的经济性,以避免三类要素在场景中无序流动形成的碰撞、摩擦等形成的阻滞。有效控制信息接受的阻力、信息接受摩擦、信息接受噪声和污染。④信息接受畅体验。移动图书馆场景化信息接受的绩效取决于用户在信息接受过程中的感知和体验。所谓畅体验是指用户在具体场景中的信息接受能力与其信息接受所面临的挑战之间的匹配程度。如果二者匹配则用户具有信息接受的畅体验,如果信息接受能力超越挑战则用户体验到的是无聊,如果信息接受能力低于信息接受的挑战,则用户感觉到的是焦虑和烦躁。在移动图书馆实际建设中,应能对用户信息接受进行评估,为其提供畅体验的信息接受[32]。当用户信息接受能力较差时,需要对其进行信息素养提升的教育。如果信息接受能力较高时,需要对移动图书馆进行改造和优化,以促进信息接受的畅体验。
7 结 语
本研究选用WOS核心合集的移动图书馆领域的文献,综合运用HisCite和Pajek网络分析工具,从引文网络主路径视角分析了移动图书馆的主路径的线值。通过Pajek网络工具提供的3种主路径生成方法SPC、SPLC和SPNP,借助于医学领域的断层扫描方法,对不同节点规模的引文网络进行断层扫描,最终发现节点数为480的引文网络是包含主路径的最小规模引文网络。以480节点数规模引文网络为重点,采用主路径分析方法发现核心文献集和关键知识节点,从而发现国外移动图书馆领域研究的演化。通过国内外研究的对比,找出国内相关研究的不足,并对国内相关研究进行了展望。
参考文献
[1]Osborn W,Hinze A.TIP-tree:A Spatial Index for Traversing Locations in Context-Aware Mobile Access to Digital Libraries[J].Pervasive & Mobile Computing,2014,15:26-47.
[2]Diab E,Lierop D V,El-Geneidy A.Recommending Transit:Disentangling Users Willingness to Recommend Transit and Their Intended Continued Use[J].Travel Behaviour & Society,2017,(6):1-9.
[3]樊志偉,韩芳芳,刘佳.引文网络的主路径特征研究——以富勒烯领域为例[J].图书情报工作,2013,(3):17-21,60.
[4]王福,聂兰渤,郝喜凤.移动图书馆场景化信息接受适配功能设计研究[J].图书馆建设,2018,(3):65-71,80.
[5]薛平,钱俊雯.断层扫描成像新技术——光学相干计算机断层摄影术[J].中国激光医学杂志,1999,(2):118-120.
[6]宋歌.学术创新的扩散过程研究[J].中国图书馆学报,2015,(1):62-75.
[7]Braam R R,Moed H F,van Raan A F J.Mapping of Science by Combined Co-Citation and Word Analysis.Ⅱ:Dynamical Aspects[J].Journal of the American Society for Information Science,1991,42(4):252-266.
[8]De Nooy W,Mrvar A,Batagelj V.Exploratory Social Network Analysis with Pajek[M].New York:Cambridge University Press,2005.
[9]邱均平,董克.引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例[J].中国图书馆学报,2013,(2):111-120.
[10]樊志伟,韩芳芳,刘佳.引文网络的主路径特征研究——以富勒烯领域为例[J].图书情报工作,2013,(3):17-21,60.
[11]Carley K M,Hummon N,Harty M.Scientific Influence:An Analysis of the Main Path Structure in the Journal of Conflict Resolution[J].Science Communication,1993,14(4):417-447.
[12]Erlandson R J.A Review of“Building Mobile Library Applications”[J].Journal of Electronic Resources Librarianship,2012,24(4):333-334.
[13]韩毅,童迎,夏慧.领域演化结构识别的主路径方法与高被引论文方法对比研究[J].图书情报工作,2013,(3):11-16.
[14]樊志伟,韩芳芳,刘佳.引文网络的主路径特征研究——以富勒烯领域为例[J].图书情报工作,2013,(3):17-21,60.
[15]王亚男,黄国彬,张一楠,等.近十年我国图情领域科学计量可视化的研究特点剖析[J].图书情报知识,2015,(1):86-94.
[16]Matthew J.Berryman,Simon D.Angus.Tutorials on Agent-based Modelling with NetLogo and Network Analysis with Pajek[C]//Complex Physical,Biophysical and Econophysical Systems.2010:351-376.
[17]赵龙,罗勇,孟浩.基于K-means-Laplacian的技术演化分析方法研究[J].情报杂志,2015,(9):192-196.
[18]韓毅,童迎,夏慧.领域演化结构识别的主路径方法与高被引论文方法对比研究[J].图书情报工作,2013,(3):11-16.
[19]邱均平,董克.引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例[J].中国图书馆学报,2013,(2):111-120.
[20]Batagelj V,Mrvar A.Pajek—Analysis and Visualization of Large Networks[J].Lecture Notes in Computer Science,2004,2265:77-103.
[21]孟微,庞景安.Pajek在情报学合著网络可视化研究中的应用[J].情报理论与实践,2008,(4):573-575.
[22]艳琪,彭博,高劲松.基于JASIST的科研合著网络可视化研究[J].情报杂志,2015,34(8):87-91.
[23]Vladimir Batagelj,Andrej Mrvar.Analysis of Kinship Relations With Pajek[J].Social Science Computer Review,2008,26(2):224-246.
[24]唐红雨,田磐,王志英.基于Pajek的沥青摊铺机故障网络分析与诊断[J].陕西理工学院学报:自然科学版,2014,(2):24-29.
[25]祝清松,冷伏海.基于引文主路径文献共被引的主题演化分析[J].情报学报,2014,33(5):498-506.
[26]韩毅.引文网络主路径的结构洞功能探索——以知识管理领域为例[J].图书情报工作,2012,(24):65-70.
[27]王福,聂兰渤.移动图书馆场景化信息接受特征及其规律研究[J].情报理论与实践,2018,41(1):122-128,110.
[28]彭兰.场景:移动时代媒体的新要素[J].新闻记者,2015,(3):20-27.
[29]王福.移动图书馆情境与信息行为的生态适配模型构建[J].情报理论与实践,2017,40(11):80-85,95.
[30]黄素君.图书馆与移动网络社交媒体的融合发展[J].图书馆理论与实践,2016,(9):95-97.
[31]王福.移动图书馆信息接受情境功能适配性机理模型构建研究[J].情报理论与实践,2017,40(9):61-66.
[32]王福,聂兰渤,郝喜凤.移动图书馆场景化信息接受畅融合研究[J].图书馆学研究,2018,(2):77-83.
(责任编辑:郭沫含)