莫岚 向荣 欧镔进 刘陵孙
摘要:以中国知网CNKI的中国学术期刊网络出版总库为统计源,运用文献计量学方法,对数据库收录(截止2011年)刊载的有关图书馆信息聚合研究论文进行统计分析,从论文年代分布、第一作者发文数、期刊分布、文献增长规律进行分析,以揭示我国图书馆RSS的应用进展,推动和促进这图书馆RSS的进一步应用和研究。
关键词:信息聚合;图书馆;文献计量
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)15-0166-03
Abstract: Bade on CNKI China academic journal network publication database as the statistical source, using the method of bibliometrics, the dataase (end of 2011) related published stem of RSS research of libarary from the paper age distribution, periodical distribution, The first author of the paper quantity,Literature growth Rate to reveal China's progress in the application of RSS in library, promote and facilitate the further research and application of Library RSS.
Key words: RSS; Library; bibliometrics
1 概述
简易信息聚合(也叫聚合内容简称信息聚合,缩写为RSS)是一种描述和同步网站内容的格式。RSS可以是以下三个解释的其中一个: Really Simple Syndication;RDF (Resource Description Framework) Site Summary; Rich Site Summary。但其实这三个解释都是指同一种Syndication的技术。RSS目前广泛用于网上新闻频道,blog和wiki,主要的版本有0.91, 1.0, 2.0。使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容[1]。
2 文献数据来源分析
2.1 检索词分析
利用中国知网CNKI(http://www.cnki.net/)的《中国期刊全文数据库》(简称CJFD)(http://acad.cnki.net/Kns55/brief/result.aspx?dbPrefix=CJFQ)为数据来源,进入中国学术期刊网络总库标准检索界面,图一为检索界面的截图。检索方式检索项为“主题含图书馆并且包含RSS”或者“篇名含图书馆并且包含RSS”或者“摘要含图书馆并且包含RSS”期刊年限为“不限到2011年”,匹配方式均为模糊匹配,在所有的学科领域中进行检索,共检出302条记录。
2.2 统计方法
首先将检索结果以NoteExpress格式进行输出并导入NoteExpress2.0软件中进行处理。通过对作者、年份、标题三个字段进行查重(其中3篇文献重复,其中1篇为作者、年份、标题、期刊、年、卷、期等数据均重复,是完全重复数据;另两条数据不完全重复,作者、年份、标题三个字段完全相同,发表在不同的期刊上。为了保持统计的完整性,仅剔出完全相同的一条数据,得到301条有效记录。在对作者字段进行统计分析时发现301条记录中其中有两条无作者字段,通过进行原文查找发现这两篇均为期刊的简要消息介绍不属于期刊论文的范畴,定义为无效数据将它们从样本中剔除,最终得到209条完全符合要求的数据。借助NoteExpress和Excel统计工具,运用排序、分类汇总和统计分析等功能对数据进行分析处理,采用文献计量学的基本方法对所检出的论文进行分析。
3 RSS技术在图书馆的研究论文的统计分析
3.1论文年代分布
从图1为2004-2011年间我国图书馆RSS研究的相关文献分布,经文献检索2004年前我国无图书馆关于RSS研究的期刊论文发表,2004年仅1篇相关期刊论文发表,2004到2009年期间该类文献数量呈现直线上升。年增长量为(2005,8),(2006,17),(2007,11),(2008,11),(2009,19),(2010,-10),(2011,-3)。其中增长数量最大的为2009年,比2008增加19篇, 2009年的发文量为67篇达到该类论文发表数量的最高峰。从发文数量比例上看2006年的发文量由2005年的9篇上升到26篇几乎达到了上一年发文量的3倍,增加了2倍为上升频率最快的一年。2010年-2011年发表相关论文的趋势有所减缓,下降的幅度并不算大2010年为57篇,比2009年减少了10篇,2011年为54篇比2010减少3篇。
3.2第一作者分析
对299篇有效论文进行论文作者进行统计,共有作者(不区分作者排名)383人,其中第一作者共有272人即以第一作者发表相关论文的人数为总作者数的71%。数据表明大部分作者以第一作者的身份发表文章的数量仅一篇,表明图书馆界对RSS的研究不深入缺少长期跟踪和研究该技术的人员。发文量最多的作者(第一作者)为武汉大学司莉[2],发表相关文章4篇,但4篇文章均为WEB2.0技术在图书馆应用的调查与分析的文章,以及对RSS的应用情况进行分析。发文三篇的作者有南开大学吴一平、福州大学林清。吴一平的文章中其中两篇文章是对图书馆3.0的应用和技术进行介绍,另一篇文章题为智能聚合技术在图书馆个性化信息服务中的应用,主要介绍信息聚合技术的概念、原理、方法[3] 。林清2009年发表了三篇关于利用RSS技术提升图书馆数字参考咨询服务的研究文章[4]。
3.3 论文期刊分布
我国图书馆RSS研究的299篇论文全部都标注了期刊名称,分布在101种期刊中,平均每种期刊刊载2.96篇。载文量最多的为《科技情报开发与经济》18篇。表1为期刊载文情况表,其中载文量大于等于10篇的期刊有7中占该类期刊数约 7%,合计载文量100篇占该类文献总量的33%。表2列出了刊载图书馆RSS研究的论文数大于5篇的期刊名称及其刊载论文的数量。
4 文献增长规律分析
根据检索到的有效记录的发表时间分年汇总得到该类文献的时间分布并对这些数据进行累计得到表3 RSS技术在图书馆的研究论文的累积情况表。
根据表1绘制文献增长曲线图如图2所示,横轴为时间轴,纵轴为发文量,蓝色曲线为每年论文发文量的文献曲线图,位于图的下方。红色曲线为累计发文量曲线图。利用EXCEL2007的趋势分析分别对两个曲线进行指数、线性、对数、多项式分析。
4.1 对每年论文发文量曲线的分析
表4为对该类文献累计论文发文量曲线分别进行指数、线性、对数、多项式 分析,得到的公式及R平方值的对应关系表,其中回归预测中三项式回归分析R平方值为0.977,拟合度大于指数、线性、对数曲线,幂函数的拟合度,其中幂函数R平方值均为0.680,指数函数的R平方值均为0.679拟合程度最小,显然指数函数与该类文献增长情况的拟合度小于多项式的拟合程度。
4.2对累计论文发文量曲线的分析
表5为对该类文献累计论文发文量曲线分别进行指数、线性、对数、多项式 分析,得到以下公式及R平方值的对应关系表其中回归预测中多项式回归分析R平方值为0.999,拟合度大于指数、线性、对数曲线,其中指数函数和幂函数的R平方值均为0.848,显然指数函数与该类文献增长情况的拟合度小于多项式的拟合程度。
5 分析
邱均平、刘华华在网络信息计量学的文献计量规律及发展现状研究里利用SPSS软件分析网络信息计量学文献增长曲线得到网络信息计量学文献增长曲线与幂乘曲线拟合得更好, SPSS 软件分析显示其拟合度为0.998,并指出在某一学科发展的初期,指数增长规律并不适用于该学科的文献增长情况[5]。在本论文的分析中指数增长规律也不适用于图书馆RSS研究的文献增长情况,但也不符合幂函数规律。拟合度最好的为三项式曲线,多项式曲线最地反映我国图书馆RSS研究的文献的增长情况,作者由此猜想学科初期的文献增长规律可能会服从不同的函数的关系,里面涉及的关系和问题可以做进一步的分析和探讨。
参考文献:
[1]http://baike.baidu.com/subview/1644/7031575.htm?fr=aladdin.
[2]司莉,谭仪,邢文明,等.Web2.0技术在美国州立公共图书馆应用的调查与分析[J].情报科学,2011(7):1036-1040.
[3]吴一平.智能聚合技术在图书馆个性化信息服务中的应用[J]. 图书馆工作与研究,2008(11).
[4]林清.利用RSS技术提升图书馆数字化参考咨询服务[J]. 情报探索,2009(4).
[5]邱均平,刘华华.网络信息计量学的文献计量规律及发展现状研究[J]. 图书馆论坛,2009(6).