孔季
〔摘 要〕本文以CSSCI数据库中2000-2010年数据作为统计源,借助科学知识图谱的可视化技术手段,对这10年间的文献数据进行计量研究,将数字图书馆研究领域相关引文数据和主题词数据进行处理和分析,绘制我国数字图书馆研究主要代表人物知识图谱,通过引文分析,研究数字图书馆研究领域的关键节点和前沿热点演进。
〔关键词〕数字图书馆;CSSCI;知识图谱;CiteSpaceⅡ
DOI:10.3969/j.issn.1008-0821.2012.01.022
〔中图分类号〕G303 〔文献标识码〕A 〔文章编号〕1008-0821(2012)01-0092-05
Visualizing Map of the Research on Digital Library in ChinaKong Ji
(Library,Qufu Normal University,Qufu 273165,China)
〔Abstract〕Using advanced visualizing technology to study“digital library”can improve better understanding for researchers.This article select search words from 2000 to 2010 retrieved from CSSCI.The paper studies the dataset with citation analysis and gets a series of knowledge maps in“digital library”field.These maps can reflect the position and development trend,find out the pivotal people and work in digital library field.Then it explored the focuses and hotspots of the researches on digital library in China.
〔Key words〕digital library;visualizing map;CSSCI;CiteSpaceⅡ
随着互联网和现代通信技术的快速发展,数字图书馆(Digital Library)研究已经成为图书馆学理论与实践的热点。国内学者在数字图书馆研究方面取得了丰硕成果。本文运用先进可视化技术CitespaceⅡ软件对国内数字图书馆研究的相关引文数据和主题词数据进行处理和分析,旨在深入理解国内数字图书馆研究的现状和发展趋势。
1 数据来源与研究方法
研究所用的数据来源于CSSCI数据库。在2000-2010年CSSCI来源期刊(不含扩展版)数据库中输入关键词“数字图书馆”,检索表达式:LY00,LY01,LY02,LY03,LY04,LY05,LY06,LY07,LY08,LY09,LY10,:BY=/数字图书馆/,命中结果2 709篇。国内学者对数字图书馆(Digital Library)这一概念的翻译和使用是非常一致的,而且我们在检索数据时使用了CSSCI数据库提供的“精确”选项,经过逐条辨认,2 709篇文献均是有效论文。本文选择美国Drexel大学信息科学与技术学院教授陈超美博士用Java语言开发出来的软件CiteSpaceⅡ为知识图谱可视化分析工具。该软件提供绘制聚类视区(cluster view)和时区视图(timezone)等可视化功能,通过共被引文献的分析,能够直观地展示一个研究领域的发展趋势和前沿热点的演进历程[1]。之前,我们利用中文处理软件Litespace对CSSCI数据进行格式转换,转换成能被CitespaceⅡ处理的格式。
2 分析与结果
2.1 数字图书馆研究的发文作者和被引作者分析
2.1.1 数字图书馆研究的发文作者
我国的数字图书馆研究形成了一定的团队,如中国科学院文献情报中心、武汉大学信息管理学院、北京大学图书馆、吉林大学等,这些研究机构科研实力雄厚,承担着数字图书馆方面的一些重要课题,包括国家自然科学基金、国家社会科学基金、国家重点基础研究发展计划(973计划)、国家高技术研究发展计划(863计划)、科技基础性工作专项计划、国家科技基础条件平台建设计划,其研究成果具有一定的理论深度和实践价值。表1 CSSCI中发文15篇以上的作者和单位(2000-2010)
发文数姓 名单
位29毕 强吉林大学28董 慧武汉大学24马海群黑龙江大学24郑巧英上海交通大学23王启云淮海工学院21黄晓斌中山大学20杨宗英上海交通大学20张晓林中国科学院文献情报中心20王知津南开大学19黄如花武汉大学18陈传夫武汉大学18吴慰慈北京大学17马文峰中国人民大学16牟冬梅吉林大学 续表1
发文数姓 名单
位16盛小平湘潭工学院16邢春晓清华大学16邱均平武汉大学15王丽华广东工业大学15郑建明南京大学
从表1我们可以看出,2000-2010年CSSCI数据库中,数字图书馆研究领域发文数在15以上的作者有19人,其中4人在大学图书馆工作,6人在信息管理学院(系),其余的则是文献情报中心、管理学院、计算机科学与技术系软件技术所等。武汉大学4人,上海交通大学2人,吉林大学2人。中国的数字图书馆研究发文量高的分布城市主要有北京、上海、武汉、长春、南京等地。大学是发文的主要机构,其次是图书馆,一些科研院所的人员也在学术期刊发文。
2.1.2 被引作者分析
CiteSpaceⅡ可将被引作者(Cited-author)的被引频次和被引年份以“年轮”的大小和颜色直观展示出来。在CiteSpaceⅡ软件界面,网络节点选择Cited-author,主题词来源选择文献标题(title)、摘要(abstract)、关键词(descriptor)和标识符(identifiers),算法选择路径搜索(pathfinder)算法,数据抽取对象为top 30,设置“Time Scaling”的值为1,即将2000-2010年分成11个时段进行处理。运行CiteSpaceⅡ,得到有关图书馆学研究的被引作者网络。如图1所示。
容72张晓林四川大学信息管理系数字图书馆机制的范式演变及其挑战66高 文中国科学院计算技术研究所数字图书馆——原理与技术实现53吴志荣上海师范大学图书馆数字图书馆——从理念走向现实42初景利辽宁师范大学信息管理系复合图书馆的概念及发展构想41赵继海浙江大学图书馆论数字图书馆个性化定制服务41汪 冰中国科学院文献情报中心数字图书馆:定义、影响和相关问题36赵继海浙江大学图书馆数字图书馆的用户管理与服务34周和平中国国家图书馆关于建设中国数字图书馆工程的问题32杨宗英上海交通大学图书馆数字图书馆研究31朱 强北京大学图书馆谈谈数字图书馆实现的条件31曾 蕾美国肯特州立大学数字图书馆:路在何方?——关于数字图书馆定义、结构及实际项目的分析30李玉安武汉大学图书馆电子图书馆、数字图书馆研究与实践述评29卢共平湘潭工学院图书馆数字图书馆的读者服务模式29张晓林四川大学信息管理系走向知识服务:寻找新世纪图书情报工作的生长点28刘 炜上海图书馆数字图书馆研究所数字图书馆引论28肖 明北京师范大学信息技术与管理学系国内外数字图书馆研究现状及未来走向27王 军北京大学信息管理系数字图书馆的体系结构26刘年娣上海图书馆数字化部国内数字化图书馆研究与建设26郑燕华上海交通大学情报所数字图书馆的知识产权保护初探25杨沛超东北师范大学信息传播与管理学院论中国数字图书馆发展策略
由图1和表2我们可以看出,CSSCI数据库中,数字图书馆研究领域的重要被引作者。与发文作者相比,这些被引作者与发文作者有些不同,有的发文多的作者被引不一定高。但也可以看出,有的发文作者和被引作者同时出现。如张晓林、黄如花、赵继海、杨宗英等。
由表2可以看出,高被引的文献有几大类,一类是2000年前后出版的数字图书馆研究专著,如高文的《数字图书馆——原理与技术实现》和吴志荣的《数字图书馆——从理念走向现实》,被引频次高达66次和53次,远高于CSSCI期刊论文。前者从技术层次介绍了数字图书馆的实现原理,后者对国内外图书馆数字化热潮进行了深入评述和展望。第二类是对数字图书馆的基础理论研究,比如定义与影响、范式演变、知识产权保护、读者服务模式等。第三类是数字图书馆的实现与建构,比如体系结构、项目分析、用户管理、个性化定制等。可以看出,我国数字图书馆研究取得了丰富的研究成果。
2.2 国内数字图书馆研究的关键节点与研究前沿分析2.2.1 国内数字图书馆研究的关键节点分析
关键节点是指由共被引频次和中心性都比较高的一篇或数篇关键文献组成。它们形成了数字图书馆研究的发展脉络,是数字图书馆研究的理论基础和核心文献集合[2]。在图2中,每个圆形的节点代表一篇文献,圆形的大小代表该文献被引用的频次,节点越大,被引用的次数越多,圆圈呈现出的不同颜色年环描述了该文献在不同年份的被引状况,年环的厚度与对应年份的被引次数成正比。点的中心度表示该文献在被引网络中的地位,中心度越高,该文献越重要,往往预示着研究的方向。
表3 数字图书馆研究的关键节点信息
序号被引频次中心度关键点(作者,发表年份,期刊,篇名)1230.28赵继海,2001,中国图书馆学报,论数字图书馆个性化定制服务2390.19张晓林,2001,中国图书馆学报,数字图书馆机制的范式演变及其挑战3160.15李玉安,1999,中国图书馆学报,电子图书馆、数字图书馆研究与实践述评4230.14汪冰,1998,中国图书馆学报,数字图书馆:定义、影响和相关问题5170.09朱强,2000,大学图书馆学报,谈谈数字图书馆实现的条件6130.07党跃臣,2001,图书情报工作,数字图书馆资源建设中的版权问题7150.06王军,2000,情报学报,数字图书馆的体系结构图2 数字图书馆研究的关键被引文献图谱
从表3可知,按照节点在共引网络中的中心度大小,排在首位的是赵继海于2001年在《中国图书馆学报》上发表的论文“论数字图书馆个性化定制服务”。该文的共被引频次为23,中心度为0.28,是网络中最大的关键节点。该篇文章主要讨论了数字图书馆个性化定制服务的基本理念、技术以及应用原型,并探讨这种技术的发展趋势及在我国图书馆的应用前景等问题。该文以美国康纳尔大学图书馆的应用原型MyLibrary系统为例,介绍数字图书馆个性化定制服务系统的技术与服务方式。该系统目前由两部分组成:MyLinks和MyUpdates。这两个产品遵循共同的开发方法和核心技术,用Java动态创建HTML,运用Oracle数据库技术存储大量的用户信息。其中,MyLinks是为用户个人搜集和组织数字化资源的工具。MyUpdates的作用是将图书馆新到资源及时通知用户[3]。
排在第二名的是张晓林于2001年发表的“数字图书馆机制的范式演变及其挑战”一文。该文根据数字图书馆建设的基点、体系形式和所解决的关键任务等,将数字图书馆分为不断递进和深化的三代范式,即第一代——基于数字化资源的数字图书馆(Resource-based digital library),第二代——基于集成信息服务的数字图书馆(Service-based digital library),基于用户信息活动的数字图书馆(Work-based digital library)。数字图书馆范式演变的挑战至少体现在两个层面:一是对数字图书馆建设的影响,一是对信息服务根本理念和模式的挑战。第二代、第三代数字图书馆机制却更多地直接面向用户对信息进行感知、捕获、分析、重组、传递、应用的全过程及其多样化需求,更多地关心“是否通过我的服务解决了您的问题”(而不仅仅是“我是否提供了您所要的文献”)[4]。
排在第三名和第四名的分别是李玉安于1999年发表在《中国图书馆学报》上的论文“电子图书馆、数字图书馆研究与实践述评”和汪冰发表于1998年的论文“数字图书馆:定义、影响和相关问题”。前者对电子图书馆、数字图书馆、虚拟图书馆、网络图书馆、多媒体图书馆等“图书馆”的概念、内涵和特征等进行了回顾和梳理,提出数字图书馆研究领域的6个研究热点,即数据传输与储存问题、知识产权与产权保护、组织与管理、文献组织和服务模式研究、用户教育和咨询系统、发展模式和管理重组研究[5]。后者对以下问题进行归纳并做一初步探讨,包括数字图书馆的基本含义,数字图书馆对传统图书馆的影响;数字信息时代的信息识知能力,数字图书馆发展中面临的问题,如技术问题、版权问题、经济压力以及其它非技术因素[6]。这两篇论文总结了数字图书馆的各种观点,为国内学者日后的数字图书馆研究奠定了基础。
此外,中心度排名先前的论文还有:朱强于2000年发表在《大学图书馆学报》上的论文“谈谈数字图书馆实现的条件”、党跃臣于2001年发表在《图书情报工作》上的论文“数字图书馆资源建设中的版权问题”以及王军于2000年发表于《情报学报》上的论文“数字图书馆的体系结构”。这几篇论文从多个方面讨论了数字图书馆的建设问题。
2.2.2 图书馆学的前沿节点分析
文献在演进过程中,文献之间的引用关系可以用新的研究前沿和知识基础来定义。研究前沿被定义为一组突现的动态概念和潜在的研究问题,研究前沿的知识基础是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共被引轨迹。利用CiteSpace软件绘制前沿关键词共现网络图谱,来寻找数字图书馆领域的研究热点及其演化趋势。在参数设置选择keyword(关键词)作为节点,阈值设定为(3,2,20)(4,3,20)(3,3,20),结果以TmieZone(时间区域)方式显示(见图3)。图3 数字图书馆研究前沿的时区视图
表4 数字图书馆研究的高频关键词
序号关键词被引频次中心度1元数据1040.072信息服务960.133知识产权890.064信息资源840.125传统图书馆820.026个性化服务600.117数字资源590.178版权590.069著作权590.0510资源共享580.1311虚拟图书馆580.0412合理使用500.0813复合图书馆480.0114版权保护470.1115参考咨询470.0816知识管理450.0817数据库430.0718信息检索420.1319XML410.0921图书馆建设410.0221信息组织400.1422本体380.04
表4列出了数字图书馆研究的高频关键词。从图3和表4综合分析,可以得出以下结论:
网络环境、信息检索、信息资源、信息管理、图书馆现代化、数字水印、资源共享、信息安全等是2000-2003年数字图书馆研究的前沿热点。数字图书馆是一个系统工程,涉及到数字资源的采集、组织、整合、保存和服务等整个生命周期。1998年由文化部牵头,联合中国国家图书馆、中国电信总公司、中国科学院等多家单位及众多专家学者共同参与的“中国数字图书馆工程”正式启动并列入我国“863”计划。此后,国内各高校图书馆也开展数字化建设。国内数字图书馆研究逐渐升温。这一时期的前沿热点多而且比较分散。
从图3中可以看出,从2004-2007年,数字图书馆研究领域出现了一些明显的前沿关键词,如信息构建、本体、参考咨询、网格、数字馆藏等。从这些文献分析来看,数字图书馆研究在这3年表现出从基础理论向实践应用转变的趋势,主要集中在数字图书馆资源组织相关研究。资源组织从表面特征逐渐向知识组织深入,出现了一些基于本体、网格的组织方法,并扩展至信息检索、信息共享、参考咨询等与信息利用相关的研究主题。这些研究主要解决数字资源的保存技术、功能和支撑机制进行,在构建数字馆藏时,图书馆应采取的资源组织方式和利用模式等。
2008-2010年,语义Web、开源软件、web2.0、云计算、系统模型等是这一时期的前沿热点。语义Web是现在网络的扩展,它使网络上的信息能被明确地说明,从而让计算机或人之间能进行协同工作。云计算(cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。而博客(Blog)、简易聚合(RSS)、维基(Wiki)、社会网络(social network)、标签(Tag)、开源软件、Ajax、P2P等Web2.0的相关技术目前已经日臻成熟,在数字图书馆的应用已经越来越广泛。这些前沿热点的出现,表明数字图书馆研究对对新技术高度关注,新技术也极大地影响着数字图书馆的理论研究与实践应用。
3 结 语
本文以数字图书馆研究为分析对象,通过CiteSpaceⅡ软件的信息可视化技术,用知识图谱的方式展示了2000-2010年国内数字图书馆领域的研究力量分布以及相关的重要学术文献、学术代表人物,分析了数字图书馆学不同阶段的前沿发展趋势,由此得出以下结论:
(1)通过绘制数字图书馆研究的机构图谱,发现图书馆学的研究机构主要分布在国内985或211大学的信息管理学院(系)和图书馆。这表明数字图书馆研究从理论研究和实践应用两条线索在充分展开并互为支撑。
(2)借助CiteSpaceⅡ绘制的数字图书馆研究关键节点和共被引网络,可以看出国内数字图书馆研究热点主要集中于四个方面:①数字图书馆资源组织模式,包括网格、本体、知识组织、互操作以及资源整合和资源组织方法等;②数字图书馆的构建技术,比如网络存储、数据库等关键技术,目前数字图书馆资源库建设中最大的问题仍然海量存储技术的实现与应用;③数字图书馆的个性化信息服务,比如个人数字图书馆、参考咨询、新书推送服务、个性化定制服务以及信息过滤等;④数字图书馆中的版权保护与政策研究,目前数字图书馆涉及到的版权问题主要包括馆藏文献数字化的版权问题和数据库的版权问题,以及数字图书馆提供服务过程中所涉及的版权问题[7]。这些研究热点及其共被引网络构成了数字图书馆的研究基础与支柱。
(3)利用CiteSpaceⅡ生成的时区视图,分析了组成数字图书馆研究的前沿热点,这些节点涉及信息检索、数字图书馆的建设、资源共享、参考咨询等众多主题,相关研究内容一直在不断拓展、创新和深化。
(4)近年,数字图书馆学产生了一系列研究热点,包括语义Web、开源软件、web2.0、云计算、系统模型等,其中,最具代表性的热点是web2.0和云计算。前者作为成熟的技术被广泛应用于数字图书馆领域,后者方兴未艾,构成数字图书馆研究的技术新背景,随时获取,按需使用,随时扩展将成为数字图书馆新的发展目标。
参考文献
[1]刘则渊,王贤文,陈超美.科学知识图谱方法及其在科技情报中的应用[J].数字图书馆论坛,2009,(10):14-34.
[2]陈超美.CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J].陈悦,等译.情报学报,2009,28(3):401-402.
[3]赵继海.论数字图书馆个性化定制服务[J].中国图书馆学报,2001,(3):63-65.
[4]张晓林.数字图书馆机制的范式演变及其挑战[J].中国图书馆学报,2001,(6):3-8.
[5]李玉安.电子图书馆、数字图书馆研究与实践述评[J].中国图书馆学报,1999,(6):76-81.
[6]汪冰.数字图书馆:定义、影响和相关问题[J].中国图书馆学报,1998,(6):9-17.
[7]董伟.国内近十年数字图书馆领域研究热点分析[J].图书情报知识,2009,(9):58-63.