筱 雪,胡琳悦,董晓晴,张 媛,孟 捷
(北京市科学技术情报研究所 北京100044)
近二十年来,数字图书馆是学术界的研究热点。本文拟从文献计量法角度对我国数字图书馆领域的研究文献进行统计分析,并结合内容分析法对数字图书馆研究主题及未来发展趋势做进一步探讨。
基于中国期刊全文数据库论文,采取文献计量法研究某一个领域热点问题的方法比较常见。汪潘义等[1]从论文时间分布、空间分布、主题分布、作者情况对我国区域产业同构问题进行研究分析。熊励等[2]从文献增长规律、期刊分布规律、主题分布规律进行数据统计分析,并从主题分布规律基础上对我国政府信息资源各主题进展进行讨论。马费成等[3]从词频的角度出发,确定国内外知识管理领域关键词,用词频分析法对国内外知识管理研究的热点、方法、学科分布和应用领域进行了研究。
笔者使用科技情报分析报告自动生成系统平台工具,对中国期刊全文数据库论文进行处理,以论文被引总数量从高到低进行排序,在这个数据基础上,对数字图书馆的文献增长规律、高被引论文作者及机构、高被引论文关键词词频进行统计分析,基于这部分计量结果,对数字图书馆过去 20年的重点研究文献进行内容分析,从而得知该领域总体研究情况和未来发展趋势。
以“数字图书馆”为关键词,以万方、维普和知网三大数据库为检索源,检索时间范围是 1998—2016年,检索结果为 11,683篇。利用科技情报分析报告自动生成系统平台工具,将所有相关文献根据被引次数高低进行排序,选取了前199篇高被引论文作为主要研究对象,计算时间为2016年12月。利用文献计量分析法进行统计分析,描述文献增长规律、高被引论文、高被引作者、重点研究单位、关键词词频5个方面的特征;在此基础上,利用文献定性分析法对文献内容进行分析和总结,展示我国数字图书馆领域研究现状和未来发展趋势。
根据数字图书馆所有相关文献时间分布情况(见图1),推测国内学界在该领域研究分为3个阶段:第一阶段处于 1998—2000年,该领域研究兴起,发展较为迅速,由于计算机和网络的兴起与普遍应用,图书馆信息服务进入自动化时代;2001—2009年为该研究领域高速发展时期,传统图书馆向数字图书馆过渡,学者们对两种图书馆的概念、特点和优劣进行了比较,并更多关注过渡时期的信息资源建设、信息服务模式及知识产权的问题;第三阶段是 2010年后,该领域论文总数较高,但逐年有所下降,表明该领域研究已趋于成熟,由于 21世纪初,云计算作为一个新的技术趋势得到快速发展,基于云计算的分布式计算与存储能力,用户体验感大大提升。因此,该时期的数字图书馆走向以用户为中心的服务模式研究和云计算相关技术的开发和应用研究为主。
图1 1998—2016年我国数字图书馆领域论文总数与时间分布Fig.1 Total number of articles in the field of digital library in China from 1998 to 2016 and their temporal distribition
这 199篇高被引论文的发表时间主要集中在2000—2005年间(见图2),被引次数最高达到233次,最低为29次。
图2 按被引次数排名前199的论文数量与时间分布Fig.2 Distribution of number and time of the Top 199 papers regarding citation frequency
其中,被引次数排名前十的论文,主要集中在2001、2002和 2003年(见表 1),通过归纳这部分论文的关键词可知,该阶段主要研究方向是数字图书馆的概念构想、范式演变、数字资源和服务模式探索、知识积累等;另有少数排名前十位的高被引论文是2008—2009年发表,此时主要方向为云计算技术和云服务平台构建等,为数字图书馆向新的服务模式和交叉领域探索和发展阶段。
表1 高引次数排名前10的论文信息Tab.1 Information of Top 10 hightly cited papers
笔者选取了发表总论文数、总被引用数、平均被引用数、最小突变、最大突变、活跃起始年、终止年和活跃期复合平均增长率作为指标,将各项指标都表现较好的作者进行列表分析,按照总被引用数进行排名(见表 2)。
表2 发文数与总被引数排名靠前的作者Tab.2 Top authors regarding publication and citation
根据表 2分析,我国数字图书馆领域的研究人员,按照其科研论文成果,可以分为 3类:一是发文数量和总被引次数都较高的作者,是我国数字图书馆领域的核心研究团队,其成果最具影响力,如张晓林、赵继海、马文峰、杨宗英、卢共平等;二是虽然发文数量较少,但引用次数极高,代表该作者论文成果在领域内享有很高价值,这部分研究人员通过总发文数和平均被引数排名来确定,有初景利、邱均平、黄宗忠、沙勇忠、刘焕成;三是总发文数量较多的作者,是该领域主要研究团队,如黄敏、盛小平、孙坦、莫少强、秦珂等。
通过前199篇高被引论文作者关系矩阵图(见图3)可知,数字图书馆领域的作者合作关系并不是十分密切,只有以张晓林、曾蕾、杨宗英 3个作者为核心的研究团队在该领域有合作,以周宁丽为核心的两个团队彼此之间有合作,部分研究团队都是由 3~4人组成,更多作者是独立撰写论文,且彼此间没有什么交集。
图3 前199篇高被引论文作者合作关系矩阵图Fig.3 Cooperation relation matrix of the authors of 199 highly cited paper
图4 1998—2015年高被引论文的作者单位排名Fig.4 Institution ranking of highly cited papers from 1998 to 2015
图5 1998—2015年高被引论文作者单位总被引次数排名Fig.5 Institution ranking of total citations of highly cited papers from 1998 to 2015
通过对所选的199篇文献样本的分组检索,按照发表论文作者单位出现的次数和该单位论文总被引次数分别进行排序。高被引论文作者单位出现次数在 3次以上的研究单位共 16家(见图 4),依次是中科院文献情报中心、湘潭工学院图书馆、浙江大学图书馆、上海交通大学图书馆、武汉大学信息管理学院等。而从总被引次数计算(见图 5),排名靠前的研究单位排序发生变化,依次是中国科学院文献情报中心、武汉大学信息管理学院、浙江大学图书馆、湘潭工学院图书馆、上海交通大学图书馆、中国人民大学图书馆、北京大学信息管理系、中山大学信息管理系等。
为了进一步分析这些研究机构在数字图书馆领域的活跃时间,根据高被引论文作者单位排名前9位的研究机构发表论文的时间分布情况(见图 6)发现,高被引论文的发表时间段集中在1999—2006年间。
对高被引论文作者单位所发表论文引用次数(见表 3)做进一步分析发现,中国科学院文献情报中心和浙江大学图书馆是在数字图书馆领域展开工作时间最长、持续时间最久的两家研究机构,而其中中科院文献情报中心的论文总数和被引次数最多;上海交通大学图书馆开展该领域研究时间最早,但随后除了2003年,其他时间段都几乎没有出现重要成果;武汉大学和中国人民大学图书馆都是阶段性地展开研究,虽然在 2002年达到产出重要成果的高峰,但是持续时间不久。
图6 1999—2006年高被引论文作者单位发表论文时间分布Fig.6 Distribution of publication time of highly cited papers from 1999 to 2006 regarding institutions
表3 1999—2006年高被引论文作者单位论文被引用次数Tab.3 Cited times of highly cited papers from 1999 to 2016 regarding institutions
对于论文关键词的分析可以揭示该领域学术研究发展的基本特点、最新动态和主要发展方向,有利于相关领域研究更快速、准确地把握该领域的研究热点、难点和重点,从而进一步推动该领域学术的发展。笔者根据样本文献的关键词,将其进行归纳,得出出现次数和出现频率较高的关键词(见表4)。
表4 1998—2011年关键词词频Tab.4 Key words frequncies from 1998 to 2011
基于对高被引论文的关键词及词频分析发现,我国数字图书馆领域研究主题主要是数字图书馆的概念和特征(数字图书馆、复合图书馆、传统图书馆)、信息资源(数字资源)、信息服务(用户服务、个性化服务)、信息技术、知识产权等几个方面。
学者张晓林[4]提出数字图书馆的三代范式及其演变过程,数字图书馆第一代是基于数字化资源的数字图书馆,逐步过渡到第二代基于集成信息服务的数字图书馆,并开始向第三代基于用户信息活动的数字图书馆范式发展。基于此,数字图书馆的服务理念和模式都将面临挑战和发生相应变化。
高被引论文中对数字图书馆的定义的讨论比较少,更多是从阐述数字图书馆的特点角度去解读。朱强[5]认为数字图书馆可定义为数字信息的资料库,这个概念更反映事物本质及未来图书馆的发展趋势。张晓林[4]认为数字图书馆的目标是建立一系列服务机制来有效支持用户进行信息学习和创造知识。初景利[2]提出了复合图书馆的概念,将数字图书馆和传统图书馆结合起来,优势互补,信息用户可以在电子和印刷型资源并存的复合环境下查询信息。黄宗忠[7]讨论了复合图书馆的优势和发展策略等问题。
针对数字图书馆的特点学者们的讨论也不尽相同。王世伟[8]认为其特点是信息资源数字化、信息传递网络化、信息利用共享化、信息提供的知识化、信息实体虚拟化;朱强[5]认为数字图书馆的特点包括海量存贮的数字化资源、网络化存取、方便准确的多媒体、多维信息检索、电子商务的服务模式、联合共享的组织架构;李玉安[9]认为数字图书馆的本质特征是建立于计算机网络技术上的数据库信息系统。
信息资源是数字图书馆服务于用户的基础。学者对信息资源的探讨主要集中在信息资源的建设、数字资源整合、馆藏评价等问题上。吴志荣[10]探讨了数字图书馆信息资源建设的原则(整体性原则、用户至上原则、科学性原则和系统性原则),数字化信息资源的类型和特征,并分析了数字图书馆信息资源建设过程中遇到的问题。马文峰[11]认为数字资源整合是数字资源优化组合的存在状态,是把各个相对独立的数字资源结合为一个新的有机整体,整合方式有:基于 OPAC资源系统的整合;对相关数据库内的数据对象去除重复信息;基于数字图书馆应用系统的整合;在 OPAC资源整合系统和数字图书馆资源整合系统之间建立多维度关联。
盛小平和周欣平对数字图书馆馆藏评价做了具体分析。盛小平[12]较为完整地阐述了评价原则、评价指标体系与评价方法,他认为评价指标体系分为实体馆藏评价指标与虚拟馆藏评价指标两部分,具体包括信息资源的拥有与存取能力、检索能力、组织能力、加工能力与利用能力,评价方法则包括用户评议法、统计分析法和引文分析法,并应推广成本-收益分析法。周欣平[13]则认为评价标准包括:馆藏资源的数量和质量,网络及数字化程度,多元化的信息管理和服务,全球范围内信息资源的获取和利用,提供远距离学习和教育的环境,以及馆员素质。
随着数字图书馆服务理念的变化,其服务模式也在发生变化。郭海明[14]根据不同分类标准,将数字图书馆服务模式进行分类:如按照服务要素的重要程度可分为资源产品服务模式、馆员中心模式和用户中心模式;按照服务体系中各成员机构的关联程度可分为分散式、集中式、分布式和集成式的服务模式。黄敏[15]阐述了网上咨询服务的各种形式,对上海交通大学实时解答系统进行了分析介绍,并指出我国图书馆 VRS服务管理与国际领先水平的差距。苗凌[16]介绍了数字咨询服务的新概念,提出建立集中式协作咨询服务和分布式协作咨询服务两种对应的协作咨询系统,并指出根据时间和空间不同,可以获得协作咨询会议、分布式实时协作咨询、协作联合咨询以及分布式异步协作咨询4种不同模式的咨询服务。
更多学者讨论了以用户为中心的个性化服务模式。卢共平[17]提出未来数字图书馆读者服务模式应是以用户为中心的集成化、多元化服务模式。赵继海[18]提出虚拟用户的概念,并且针对虚拟用户,认为服务工作主要内容是将数字图书馆复杂的用户界面进行集成和简化、开展网上咨询、提供个性化服务和培训。赵继海认为,个性化定制服务是为数字图书馆用户服务的重要方向,一是用户根据自身需求定制自己所需的资源、信息和服务,二是针对用户特点,主动为用户选择并传递动态信息。卢共平[19]认为,个性化服务具体方式包括个性化界面设置、个性化信息环境和个性化信息快报,茆意宏[20]讨论了手机图书馆服务,将移动通信网络和数字图书馆系统结合起来,利用手机终端延伸、拓展传统的图书馆服务,随时随地进行信息传输与服务,认为手机图书馆是 21世纪数字图书馆服务的新模式。
在高被引论文中,关于数字图书馆信息技术研究,主要围绕云平台建设、元数据等方面展开。周舒[21]从云计算的概念和工作原理入手,分析了数字图书馆如何使用云计算模式来拓展服务和功能,改善用户体验,从而更好地实现图书馆2.0以用户为中心这一核心理念,并提出云图书馆在架构过程中可能存在的问题,如数字资源版权保护、用户身份验证与数据安全、数字资源整合框架等。王文清[22]探讨了CALIS数字图书馆云服务平台的功能,即能实现分布式数字图书馆服务的虚拟化,能实现更大程度的资源共享和协作,目前 CALIS云服务平台基本框架已经完成,但尚且需要进一步研究、开发和完善很多关键技术。
吴开华[23]认为元数据是数字图书馆建设的关键技术之一,是数字图书馆用以进行知识组织和资源发现的工具,元数据的互操作问题已成为业内人士关注的焦点。黄伟红[24]针对目前广泛存在于图书馆系统中的 MARC格式的大量书目数据,研究了基于XML/RDF的 MARC元数据描述技术,重点解决了MARC元数据的 XML描述问题和基于 RDF的MARC元数据描述问题。
有关数字图书馆的法律问题研究主要是知识产权保护和版权的问题研究。邱均平[25]较详细地论述了数字图书馆的域名权、网页版权和信息资源数据库的知识产权保护问题。阮延生提出图书馆建设与服务过程中,会涉及到复制权、传播权和数据库保护等知识产权方面的问题,认为应利用国内外版权法赋于图书馆“合理使用”的权利,最大限度满足读者信息需求。
通过对我国数字图书馆领域高被引论文排名靠前的199篇文献所做的统计分析,一方面能够了解我国数字图书馆领域研究的核心人物、团队以及研究机构的分布情况;另一方面通过对核心论文的内容分析,能够对数字图书馆领域的研究热点问题及趋势做出判断。
从数字图书馆相关文献总量的时间分布情况来看,数字图书馆领域的研究兴起于 1998年,在2001—2009年间处于研究的高峰时期,这段时期从传统图书馆过渡到数字图书馆,学者们对信息资源建设和管理、馆藏评价、服务模式及知识产权等问题十分关注;2010—2015年,该领域研究论文产出量趋于平缓,主要研究热点集中在云计算、元数据等技术手段的研究开发上,及新兴的手机图书馆服务模式等等。从高被引论文的时间分布情况来看,被引次数最高的论文主要集中在2001、2002和2003年。
从作者来看,数据分析表明:张晓林、赵继海、马文峰、杨宗英、卢共平等研究人员发文数量多、被引用次数多,是最有价值和主要核心团队成员,其成果在该领域最具有影响力;而初景利、邱均平、黄宗忠、沙勇忠、刘焕成等研究人员发文数量虽然少,但被引用次数极高,代表该论文成果具有较高价值;黄敏、盛小平、孙坦、莫少强、秦珂等研究人员被引次数较少,但发文数量较多,是在该领域研究投入较大、持续性较强的研究者。从作者合作关系看,研究团队基本是 3~4人,或个别作者间有合作关系,或独立创作,未发现有联系比较紧密的团队。
从研究机构看,中科院文献情报中心、武汉大学信息管理学院、浙江大学图书馆、湘潭工学院图书馆、上海交通大学图书馆、中国人民大学图书馆、北京大学信息管理系、中山大学信息管理系等研究机构不仅拥有更多高被引论文,且这些论文的总被引次数更多,表明这些单位在该领域的研究投入大、水平高、研究成果显著。
通过对数字图书馆高被引论文的词频研究发现,1998—2011年该领域研究热点主要是信息服务、资源共享、知识产权和版权、传统图书馆、虚拟图书馆、元数据、信息技术和个性化服务等方面。■
[1]汪潘义,吴凤平. 基于文献计量法的我国区域产业同构问题研究分析[J]. 科技进步与对策,2014,31(13):64-67.
[2]熊励,刘文,孙友霞,等. 基于文献计量分析法的我国政府信息资源管理研究进展[J]. 情报杂志,2010,29(9):11-37.
[3]马费成,张勤. 国内外知识管理研究热点——基于词频的统计分析[J]. 情报学报,2006,25(2):163-171.
[4]张晓林. 数字图书馆机制的范式演变及其挑战[J]. 中国图书馆学报,2001,27(136):3-17.
[5]朱强. 谈谈数字图书馆实现的条件[J]. 大学图书馆学报,2000(1):11-21.
[6]初景利. 复合图书馆的概念及发展构想[J]. 中国图书馆学报,2001,27(133):3-6.
[7]黄宗忠. 论图书馆的新模式——复合图书馆[J]. 图书情报知识,2002(3):10-26.
[8]王世伟. 论数字图书馆的特点及其对当代图书馆学教育的影响[J]. 图书情报工作,2001(3):13-15.
[9]李玉安. 电子图书馆、数字图书馆研究与实践评述[J]. 中国图书馆学报,1999,25(124):76-81.
[10]吴志荣. 论数字图书棺信息资源建设[J]. 图书情报工作,2000(5):61-64.
[11]马文峰. 数字资源整合研究[J]. 中国图书馆学报,2002(4):64-67.
[12]盛小平. 数字图书馆馆藏评价[J]. 图书情报工作,2003(5):40-43.
[13]周欣平. 数字时代图书馆的发展方向及评估标准[J].图书情报工作,2001(4):5-9.
[14]郭海明,邓灵斌. 数字图书馆信息服务模式研究[J].中国图书馆学报,2005,31(156):47-53.
[15]黄敏,杨宗英. 网上咨询服务的主要形式与发展趋势——兼谈上海交通大学 VRS实时解答系统[J]. 大学图书馆学报,2003(1):33-36.
[16]苗凌. 数字图书馆中信息咨询服务的新方法[J]. 大学图书馆学报,2002(2):54-56.
[17]卢共平,吴翻. 数字图书馆的读者服务模式[J]. 中国图书馆学报,2001,27(133):60-62.
[18]赵继海,史国祥. 数字图书馆的用户管理与服务[J].情报学报,2001,20(2):224-231.
[19]卢共平. 数字图书馆的个性化信息服务[J]. 图书情报工作,2002(8):10-32.
[20]茆意宏,吴政,黄水清. 手机图书馆的兴起与发展[J].大学图书馆学报,2008(1):3-27.
[21]周舒,张岚岚. 云计算改善数字图书馆用户体验初探[J]. 图书馆学研究,2009(4):28-36.
[22]王文清,陈凌. CALIS数字图书馆云服务平台模型[J].大学图书馆学报,2009(4):13-32.
[23]吴开华,邢春晓,罗德胤. 数字图书馆元数据研究[J].中国图书馆学报,2002,28(139):43-46.
[24]黄伟红,张福炎. 基于XML/RDF的MARC元数据描述技术[J]. 情报学报,2000,19(4):326-332.
[25]邱均平,陈敬全,李宏轩. 论数字图书馆的知识产权保护[J]. 大学图书馆学报,2000(4):10-15.
[26]阮延生. 数字图书馆知识产权问题研究[J]. 中国图书馆学报,2002(1):54-56.