邱均平 吕 红
(1.武汉大学科学评价研究中心 湖北武汉 430072;2.武汉大学信息管理学院 湖北武汉 430072)
网络计量研究领域作为文献计量学和信息计量学等学科在网络环境下的新发展,相关学科研究人员积极投入到网络计量的理论、工具方法和应用研究。网络计量学作为一门交叉性边缘学科已经过了10多年的发展。网络信息资源建设是网络环境下图书馆馆藏资源的重要组成部分,而网络信息资源建设过程离不开网络信息资源评价研究,因此,网络计量学对于图书馆馆藏资源开发和建设水平的提高具有重要作用。近年来,国内部分研究者从定性综述或定量研究的角度对国内或国外的网络计量学研究进展进行了探讨。定性综述主要有:李纲等人从学科的产生与发展、研究对象和方法及国际研究进展等方面对网络计量学进行定性论述,并指出国内网络计量学研究分三个方向:网络计量学基础理论研究、讨论其他事物或方法在网络计量学中的应用研究、网络计量技术实现及应用型研究。〔1〕张洋从网络计量学的理论、方法和应用三方面对国内外的该学科研究进展进行定性综述,并指出网络计量学研究存在四大问题:学科体系的不明确、基础理论的不完善、可靠研究方法的缺乏和应用研究的不深入。〔2〕定量研究主要有:邓中华等人基于CSSCI(2000—2005年)网络计量学的研究文献进行作者共被引分析,指出国内网络计量学研究主要集中于网络信息计量学理论、方法和应用研究、跨学科网络信息计量学研究和学术(大学)网站链接分析。〔3〕黄莉等人对SCIE中的1997—2007年网络信息计量学相关论文的热点关键词进行共词分析,挖掘出网络信息计量学的六大研究主题:学科范畴、理论基础、研究对象、计量指标、研究工具和应用范围,其中理论基础和研究对象属于研究热点。〔4〕邱均平等人基于CNKI对1997—2008年国内网络计量学发展现状进行文献计量分析,发现网络计量学的研究热点集中在网络计量学和相关学科的关系研究、网络计量学的方法研究、网络环境下的学术信息研究和网络计量学的评价应用研究。〔5〕莫纯锐通过对CNKI(2006—2010年)检索的网络计量学论文定量分析,指出学者的研究热点主要集中在网络影响因子、链接分析、引文分析、搜索引擎和网站等五方面。〔6〕赵蓉英等人对Web of Knowledge数据库(1997—2009年)收录的网络计量学文献进行可视化分析,挖掘出该学科的主要研究热点领域和研究前沿领域。〔7〕付鑫金等人通过作者共被引分析了国外网络计量学领域的研究状况,指出高被引作者分别集中于网络信息计量学的基本框架研究、学术网络链接分析与评价指标研究和学术交流研究及不同网站实体的应用研究。〔8〕
为深入揭示国内网络计量学的最新学科进展,并有助于研究者更好地把握学科研究动态和发展趋势,本文以CSSCI为数据源,选择1998—2012年间国内网络计量学相关研究论文为研究对象,采用科学知识图谱方法对目前国内网络计量学的学科进展进行分析与评价。笔者分别以网络计量、链接分析、网络信息计量、网络影响因子、网络引文、网络链接和网络日志为关键词进行数据检索,分别得到108、107、67、47、41、45和16篇文献,对这431篇文献进行去重等数据清洗工作,最后得到340篇文献。
从CSSCI数据库的检索结果来看,国内网络计量学研究始于2000年前后。从2000年的1篇,快速增加到2001年的11篇,并保持发文量逐渐增加,2005年以46篇达到研究高潮期,2005年之后年度文献量有所回落,2006—2012年年均发文量在30篇左右,国内该领域的研究保持平稳发展。表1是从发文量的角度得出的目前国内网络计量学研究高产期刊、高产研究机构和高产研究者(仅统计第一作者)。表1是目前国内网络计量学的主要研究力量,具体来看,以图书情报工作和情报科学等为代表的11种图书情报学核心期刊共发文271篇,占总数的79.71%;以武汉大学和南京大学等为代表的11家研究机构共发文176篇,占总数的51.76%;以邱均平和张洋等为代表的11位研究者共发文96篇,占总数的28.24%。
表2 国内网络计量学研究的高频关键词
图1 聚类结果树状图
共词分析方法是一种通过对学科领域专业术语共同出现的现象进行分析,进而展示该学科领域研究主题的有效研究方法。〔9〕文献关键词是表征研究成果核心内容的词汇,通过高频关键词的共词聚类分析可进一步挖掘学科研究热点领域。〔10〕选择高频关键词之前,笔者先对表示同一含义的关键词进行合并处理,如网络信息计量学、网络信息计量、网络计量等关键词合并为网络计量学;网络链接分析、链接分析法、超链接分析等关键词合并为链接分析;互联网、互联网络等关键词合并为Internet;社会网络、社会网络分析方法、社会网络分析SNA等关键词合并为社会网络分析等。表2是国内网络计量学研究中出现频次超过4次的30个高频关键词。通过自编VBA程序生成高频关键词共现矩阵,并通过Ochiia系数将其转换成相关矩阵。将相关矩阵导入SPSS进行系统聚类分析,聚类方法选择组间联接 ,度量标准选择计数的卡方度量,得到国内网络计量学研究高频关键词聚类图谱,见图1。
图1显 示,目前国内网络计量学研究基本形成了网络计量学的理论、方法和应用三个研究纬度,其主要研究热点可分为六个主题领域(对应图1中①—⑥),具体如下:
第一、网络链接行为和服务中涉及的侵权风险及其规避研究。涉及的主要关键词有网络链接、侵权责任。网络链接行为和相关服务中主要涉及与著作权、商标权和反不正当竞争等有关的知识产权问题。网络链接行为有可能涉及著作权人的复制权、发行权、改编权、修改权、保护作品完整权、信息网络传播权以及由此带来收益权等权利。〔11〕网络的大环境使得网络链接技术成为信息资源开发的重要技术手段,因此,网络环境下的信息服务机构在开展信息资源管理和服务的过程中很有可能会面临各类侵权风险。如数字图书馆在进行馆藏资源管理和服务的过程中,使用的网络链接方式使其面临不同类型的侵权风险。数字图书馆网络链接侵权风险化解对策有完善法律法规,寻求利益平衡、构筑自律机制,规范设链行为和发展技术措施,建立防范体系。〔12〕网络链接的原理及其相互关系是网络计量学的重要内容和研究热点,因此,由网络链接行为导致的侵犯知识产权风险及其规避策略成为网络计量学研究的重 点内容。
第二、网络日志挖掘和Blog分析研究。涉及的主要关键词有网络日志、博客。包含流量信息、来源信息、受访及访客信息的网络服务器日志是开展网络日志挖掘的重要数据来源。网络日志数据库包含着大量的网络用户信息行为数据,可通过日志挖掘网络用户的意图和搜索行为,从而更好地开展用户服务。另外,深入挖掘和利用网络日志有助于Web站点性能的提升和设计的改进,从而有利于网络信息资源的建设。挖掘网络日志是目前搜索引擎优化的主流方法,挖掘方法包括挖掘网络日志的序列模式、查询词间语义分析以及网络链接结构分析等。〔13〕通过对Blog的信息内容及链接结构的计量,可有利于分析网络用户的信息交流情况和虚拟社会关系。网络计量学的研究领域之一是通过对网络结构单元的计量,从虚拟的Web空间反映现实空间的社会问题,Blog作为Web2.0的典型应用和虚拟空间交流方式之一,是以主题划分的局部Web空间重要组成内容之一。〔14〕Blog作为一种网络信息资源,是网络计量学 研究的重要对象,涉及Blog的链接结构及其评价研究。
第三、网络计量学与其姊妹学科的关系研究。涉及的主要关键词有网络计量学、文献计量学、信息计量学、科学计量学。信息计量学与网络计量学是在特定的环境以及技术条件下,由文献计量学逐步演进嬗变而成,它们继承了文献计量学的理论基础和方法,并形成本学科独特的特征。〔15〕正是根植于文献计量学、科学计量学和信息计量学的想法促成了网络计量学的兴起,而网络计量学研究的创新成果又有助于其姊妹学科领域的发展。〔16〕网络计量学虽是文献计量学、科学计量学和信息计量学的相关理论在网络上的拓展和延伸,但网络信息资源不同于文献信息资源的各种特性又导致网络计量学具有独特之处:一方面,网络计量学的特性会成为促进其姊妹学科不断完善和成熟的关键,另一方面,网络计量学开展针对网络信息资源的研究时,又必须借鉴计算机网络技术、信息科学技术等学科的理论和应用知识。可见,网络计量学并不是单纯从属于某一学科的研究领域,而是在网络环境下,由文献计量学、科学计量学、信息计量学、计算机网络技 术、信息科学和计算机科学等学科相互交叉而形成的新型边缘学科。
第四、网络引文分析及其应用研究。涉及的主要关键词有网络引文、网络信息资源、核心期刊、期刊评价、情报学。基于网络引文分析的方法是网络计量学方法体系的组成部分,是网络环境下文献计量学的引文分析方法结合网络链接分析法的扩展。因此,网络引文分析是结合文献引文文献理论和网络链接分析理论而出现的研究领域。网络引文研究内容分为网络引文的使用(是否可以使用、怎样进行使用)和网络引文分析(引文分布分析、可获得性分析、影响与利用分析)两方面。〔17〕网络引文分析的主要内容包括网络引文的提取方法、网络引文数量与类型、网络引文平均值和期刊影响因子的关系。〔18〕另外,网络引文老化与分布规律、网络引文指标、基于网络引文的网络信息资源评价、期刊评价和学科领域研究重点内容的测度研究等也是网络引文分析的重要研究内容。网络引文老化与分布规律和网络引文指标研究是对传统引文老化与分布规律和文献引文指标在网络链接环境下的验证和发展。通过网络引文挖掘网络文献自身内容之间和不同网络文献之间的关系,进而通过链接的逻辑关系发现同一研究领域下的核心网站和权威网页,从而实现相应网络信息资源的评价和服务。期刊评价和核心期刊的测定是文献引文分析的重要应用领域之一,同样进行类似传统文献引文的网络引文分析也可以应用于期刊评价和核心期刊的确定。基于突出期刊网络影响力的期刊网络影响因子作为期刊评价和核心 期刊遴选的补充,对于期刊评价指标体系的完善及其应用提供了新的研究视角。
第五、基于社会网络分析方法的网站结构分析和网络信息资源评价研究。涉及的主要关键词有社会网络分析、图书馆网站、大学网站、网站、内容分析法、网络数据分析、共链分析、Internet、核心网站。作为网络信息资源组织形式之一的Web网站是网络计量学研究对象的重要组成部分,网站及网站之间的链接关系类似于社会网络分析的研究内容——行动者及其相互间的关系。因此,社会网络分析的理论和方法被应用于网站结构研究。利用社会网络分析方法对共链网络进行研究,可有效地获取隐性网络信息资源、揭示网络交流模式与规律、挖掘网络结构并促进网络知识发现。〔19〕通过构建网站之间的关系矩阵,运用社会网络分析方法可对各类网站进行中心度分析、凝聚子群分析和核心-边缘结构分析,从结构关系的角度揭示网站内部之间的联系,并对网站关系强弱进行量化研究和明确网站的中心地位进而找出核心网站。〔20-21〕网络信息资源评价是网络计量学的重要应用,丰富和完善网络信息资源评价方法和工具,并将其应用到网络信息资源评价实践工作是网络计量学的重要研究内容。目前,从评价方法实例来看,应用于网络信息资源评价的方法和工具主要有链接分析法、层次分析法、回归分析法、模糊数学分析法、概率统计分析法、人工神经网络分析法、纯语言信息分析法和评价辅助工具。〔22〕还有学者构建了一种网络信息资源动态模糊综合评价模型,为其定量评价方法及实证研究提供了新的途径。〔23〕网络信息资源评价需深入到资源内容本身信 息(知识)的“量”与“质”及其两者变化情况的分析,进而实现基于资源“质”和“量”的动态网络信息资源评价。
第六、网络计量学研究方法的理论及其应用研究。涉及的主要关键词有网络影响因子、大学评价、外部链接、链接分析、网站评价、搜索引擎、PageRank、引文分析。网络计量学研究方法在其学科体系中具有基础地位,研究方法主要来源于其姊妹学科(文献计量学、信息计量学和科学计量学)的方法、数字统计学方法及其网络技术和软件技术。〔24〕目前研究方法的理论研究层面主要涉及如下研究内容:网络影响因子的功能和计算测度方法研究、网络影响因子的缺陷及其改进策略研究、搜索引擎原理和PageRank算法研究、外部链接等相关链接分析指标数据获取方法的研究、网络链接分析与引文分析的关系研究、网络链接分布规律和链接动机及其倾向研究、网络链接关系分类及其统计研究。研究方法的应用研究层面主要是指运用网络影响因子测度方法和网络链接分析法,并借助网络搜索引擎和PageRank算法进行以大学等为代表的机构评价和以网站等为代表的网络信息资源评价。网络计量学应用于网站评价应包括网站可见度评价、网站质量评价、网站影响力评价和网站健康度评价等方面。网络影响因子的应用对象已得到较大扩展〔25〕:从基础应用的网站评价到深度扩展网域评价和广度扩展机构评价。网络影响因子计算模型方法的改进及其应用实践是其未来发展的方向。
关键文献是学科领域研究发展过程中重要的研究基础,可从文献对应节点的中介中心性和文献被引频次两者来识别关键文献。CiteSpace是适于多元、分时、动态的复杂网络分析的新一代信息可视化技术应用软件,可用来分析和可视化共引网络,并挖掘出网络中的关键点文献。〔26〕设置相应参数,绘制国内网络计量学的文献共被引网络图谱。分别从中介中心性和被引频次两个角度来展示关键文献,通过对比分析发现,节点中介中心性与被引频次两者之间并不完全相关,12篇高中介中心性文献中仅7篇文献与高被引文献(被引频次大于15)重合,16篇高被引文献中也仅7篇文献与高中介中心性文献重合,通过合并处理后共发现21篇对国内网络计量学研究有较大影响的关键文献,见表3。
表3 对国内网络计量学研究有较大影响的关键文献
通过表3的分析发现,21篇关键文献中有9篇英文论文,4本中文教材,8篇中文论文,这些文献是国内网络计量学研究和拓展的重 要研究知识基础。国内网络计量学是从国外研究引进而来,国外有关网络计量学的研究成果对国内该学科的发展起着重要的基础性作用。Almind于1997年发表的《Informetric analyses on the World Wide Web: methodological approaches to “Webometrics”》提出了万维网的信息计量学分析方法——“网络计量学”,网络计量学研究者大多将此篇文献看作“网络计量学”的开始。另外一篇较早提出对互联网进行计量学研究的文章是1996年ASIS年会上Larson的《Bibliometrics of the World Wide Web: an Exploratory Analysis of the Intellectual Structure of Cyberspace》,该文试图利用文献计量学对网络空间的知识结构进行分析。期刊《Journal of Doc umentation》对网络计量学最初的发展具有重要的推动作用,除了提出“网络计量学”概念的文献外,关键文献中3篇关于网络影响因子的论文均出自该期刊,分别是Ingwersen于1998年发表的《The Calculation of Web Impact Factors》、Thelwall于2000年发表的《Web impact factors and search engine coverage》和2002年发表的《A comparison of sources of links for academic web impact factor calculat ions》。另外,关键文献中还有涉及网络信息资源评 价与分布规律研究和网络计量学方法及其应用分析研究的外文论文,这4篇论文对网络计量学理论、方法和应用研究具有重要作用,分别是Kleinberg 于1999年发表的《Authoritative sources in a hyperlinked environment》、Bjorneborn于 2001年 发 表的《Perspectives of Webometrics》、Lawrence于1999年发表的《Accessibility and distribution of information on the web》和Thomas于2000年发表的《Webometric analysis of departments of librari anship and information science》。从时间上看,9篇外文的关键文献从1996年到2002年,正是出现网络计量学并迅速发展的五年。“网络计量学”的概念在1997年前后自国外提出之后,很快就进入国内信息计量学等相关研究人员的视野,2000年前后以邱均平、吴华香、李长忠、刘雁书和金岩等为代表的一批学者开始了网络计量学的研究,并取得了丰富的研究成果。
从关键文献中包含的4本中文教材可看出,网络计量学是来源于文献计量学和信息计量学等相关学科,当然这也缘于相关研究者认为网络文献与传统文献具有相当大的相似性,传统文献计量研究方法可以运用于网络信息计量学研究。〔27〕从关键文献包含的8篇中文论文研究内容来看,完全包含了网络计量学研究的理论、方法与应用三个方面,主要涉及网络影响因子测度研究、链接分析及其在网站评价中的实证应用研究。网络环境的文献和信息资源与传统的文献和信息资源具有相似性同时也具有差异性,针对相似性可将文献计量学和信息计量学的理论方法移植到网络环境中,从而开展针对网络文献和信息资源的计量分析与拓展,面对差异性就需要针对网络信息的特性开发属于网络计量学自身的网络数据获取方法、网络数据分析方法和网络数据评价方法,从而完善网络计量学的方法论体系,基于这些方法开发相应的网络计量学工具也是网络计量学需要进一步研究的重点。借鉴和移植计算机、人工智能、拓扑学、社会学和图论等学科领域的研究方法和技术可以丰富网络计量学方法体系。〔28〕从关键文献来看,还没有这些学科领域的经典方法和技术被广泛用于国内的网络计量学研究,因此应该加大对计算机网络科学、网络挖掘、人工智能和数学中的图论与拓扑学等学科领域的借鉴和参考,网络计量学自身的特性决定了运用多科学知识和方法才可进一步深化网络计量学研究。
利用信息可视化方法,对1998-2012年主题为网络计量学的CSSCI来源文献进行分析,发现国内网络计量学研究主要来自图书情报学界,形成了以图书情报工作、情报科学、情报杂志和情报学报等图书情报核心期刊为代表的核心情报源,研究机构以武汉大学、南京大学和中山大学等为主要研究力量,并形成了以邱均平、张洋、庞景安、段宇锋、吴茵茵、吴华香、沙勇忠、李江等人为代表的高产作者。通过绘制国内网络计量学热点知识图谱,发现经过十几年的发展,国内网络计量学在理论、方法和应用三个纬度都取得了相应的进展,并形成六大研究热点。通过绘制文献共被引知识图谱发现21篇对国内网络计量学研究发展有较大影响的关键文献。另外,通过关键文献发现国内网络计量学研究重点主要涉及网络影响因子、链接分析及其在网站评价中的实证应用研究、网络计量学理论、方法与实证三者之间的相互结合研究。在知识经济时代的大背景下,伴随着计算机和网络的普及和深度应用,迫切需要开展以网络知识间接和直接发现与测度为基础的网络知识挖掘与计量。以整个人类知识体系为对象、以知识单元为分析基础的交叉学科——知识计量学正在蓬勃兴起为一种有效获取知识、发现知识和探测知识前沿的新领域与新手段。〔29〕如何将网络计量学、知识管理学、网络数据挖掘和知识计量学等学科领域进行结合来开展针对网络知识挖掘与计量研究的网络知识计量学作为一个富于挑战性的课题是未来网络计量学发展和深化的方向。
1.李纲, 郑重. 网络计量学核心领域研究进展. 情报理论与实践,2008,31(2):307-311
2.张洋. 国内外网络信息计量学研究现状分析. 情报杂志,2008(5):40-44,39
3.邓中华, 郑曦. 国内网络信息计量学研究的作者共被引分析.中国科技资源导刊,2008,40(4):40-44
4.黄莉, 李江. 网络信息计量学研究主题分析——基于共词可视化方法. 中国科技资源导刊,2008,40(5):9-14
5.邱均平, 刘华华. 网络信息计量学的文献计量规律及发展现状研究. 图书馆论坛,2009,29(6):58-62
6.莫纯锐. 网络信息计量学研究论文的定量分析. 情报科学,2011,29(9):1348-1352
7.赵蓉英, 王静. 网络计量学研究热点与前沿的知识图谱分析.情报学报,2011,30(4):424-434
8.付鑫金, 方曙. 国外网络信息计量学研究的作者共被引分析.图书馆,2012(1):73-74,78
9.邓中华, 孙建军. 网络环境下 共词分析方法的应用研究. 图书馆杂志,2008(12):17-21
10.张勤, 马费成. 国内知识管理研究结构探讨——以共词分析为方法. 情报学报,2008,27(1):93-101
11.谭九生. 网络链接行为中的著作权问题探析. 情报理论与实践,2006,29(2):175-178
12.韦楠华, 吴高. 数字图书馆网络链接侵权风险及对策研究.图书馆杂志,2011,30(2):52-56
13.段建勇,徐骥超,张梅. 网络日志中查询串语义关系挖掘及其应用研究. 现代图书情报技术,2012(1):58-62
14.刘晓娟. 网络计量在局部Web空间中的应用. 图书情报工作,2009,53(20): 93-97,46
15.赵蓉英, 许丽敏. 从文献计量学到网络计量学嬗变的可视化分析. 情报科学,2011,29(7):975-983
16.刘则渊, 朱晓宇. 国际科学计量学及其姊妹学科的计量与图谱. 科技导报,2012,30(7):68-79
17.杨思洛, 仇壮丽. 网络引文研究现状及展望. 图书情报工作,2009,53(10):41-44,125
18.孙建军, 李江. 网络信息计量理论、工具与应用. 北京:科学出版社,2009:41-45
19.岳增慧, 方曙. 基于SNA的高校图书馆共链网络研究. 情报资料工作,2012(6):61-65
20.张世怡, 刘春茂. 中文网站社会网络分析方法的实证研究.情报科学,2011,29(2):246-252
21.张英杰, 冷伏海. 基于社会网络分析的科技网群影响力评价. 图书情报工作,2011,55(12):56-60
22.张洋, 张磊. 网络信息资源评价研究综述. 中国图书馆学报,2010,36(5):75-89
23.马海群, 吕红. 网络信息资源评价指标体系及其动态模糊评价模型构建研究. 情报科学,2011,29(2):166-171
24.沙勇忠, 欧阳霞. 网络信息计量学研究方法的三维框架.中国图书馆学报,2006,32(2):30-32,41
25.张洋. 网络影响因子研究综述. 中国图书馆学报,2010,36(1):63-79
26.Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology,2006,57(3), 359-377
27.赵蓉英, 张洋, 邱均平. 网络信息计量学基本问题研究. 中国图书馆学报,2007,33(5):59-62
28.邱均平, 张洋, 赵蓉英. 网络信息计量学方法论.中国图书馆学报,2008,34(2):29-32,41
29.侯海燕等. 知识计量学的交叉学科属性研究. 科学学研究,2010,28(3):328-332,350