●李国朋
(新乡医学院图书馆,河南新乡453003)
《图书馆理论与实践》近五年高被引论文统计分析及质量评价
●李国朋
(新乡医学院图书馆,河南新乡453003)
高被引论文;被引频次;洛特卡定律;K-S检验;《图书馆理论与实践》
本文以中国学术期刊
《图书馆理论与实践》(以下简称《实践》)创刊于1979年,原名为《宁夏图书馆通讯》,1986年更为今名并获准面向国内外公开出版发行,季刊,2000年改为双月刊,2009年改为月刊,属图书馆学、信息资源管理学专业期刊。该刊锐意改革,矢志进取,始终注意把握与反映业界的理论与实践的最新进展,以求实、创新、严谨、质朴塑起形象,连续5届蝉联全国图书馆学优秀期刊,多次多项入选全国社会科学信息科学类核心期刊和若干大型学术期刊数据库来源期刊,[1]是集学术性和实践性于一体的综合性图书馆学期刊。本文对《实践》2008~2012年间发表的高被引论文情况进行统计分析,通过数据反映《实践》的实际学术地位和影响力。同时,发现该刊近五年高被引论文作者分布服从Lotka分布,并进行了K-S验证。结论表明,《图书馆理论与实践》发表的高被引论文总体上反映了近五年中国图书馆学的发展历史,代表了近五年来中国图书馆学研究的较高学术水平。
1.1 数据获取方法及高被引论文确定
2008~2012年,《实践》共发表论文2287篇。其中,被引用论文1015篇,总被引频次6071次,篇均被引2.65次。被引用频次最高的40次。借鉴普赖斯定律(M=0.749×Nmax)确定核心作者最低发文数量的方法确定最低高被引论文数量。其中,Nmax为统计年限中发表论文最多作者的发文数量,这里将Nmax指定为统计年限中发表论文被最高引用的频次。《实践》统计年限中论文最高被引频次为40次,即Nmax=40,即M=0.749×40=5.243,确定被引频次≥5的论文为高被引论文。利用中国知网“中国学术文献网络出版总库”的专业检索,检索《实践》2008~2012年发表的且被引量≥5的全部论文,得到符合条件的高被引论文268篇,被引频次一共是2790,篇均被引10.41次。检索式如下:(JN=图书馆理论与实践and YE=(2008+2009+2010+2011+2012)and CF>=5),(检索日期为:2014-04-15)。
1.2 数据处理与分析方法
对检索到的268篇高被引论文采用手工方法,将每篇论文的题名、作者、关键词、单位、基金、年等项逐一输出到EXCELL 2003文件,应用Excel 2003统计分析功能对所有数据进行数据运算和处理。
2.1 一般结果
2008~2012年,《实践》共有1015篇论文被引用,总被引频次6071次,篇均被引5.98。被引频次≥5的论文(高被引论文)有268篇,占论文总数的11.72%,总被引频次2790次,占所有论文总被引频次的42.18%。被引频次≥15的论文有31篇,被引频次15~20的论文有22篇,被引频次21~40的有9篇,单篇被引频次最高的论文为王学熙的《公共图书馆服务体系建设的现状与对策》,其被引频次为40。在268篇高被引论文中,独著174篇,占全部高被引论文的64.93%,2人及以上合著93篇,论文合著率34.70%,1篇为访谈。268篇高被引论文共有397位作者,高被引论文合作度为1.48。
2.2 被引≥20的高被引论文及其被引频次(见表1)
表1 2008~2012年《实践》高被引论文前五及其被引频次
2.3 高被引论文的年代分布
2008~2012年,《实践》高被引论文共计268篇,表2为高被引论文年代分布及占总被引篇数的比率。
表2 2008~2012年《实践》高被引论文年代分布
本文采用共时法研究高被引论文。268篇高被引论文分布在4个年代,由于论文被引频次的累积和论文价值的体现需要一定时间,故2008年和2009年高被引论文篇数最多,占全部被引篇数的73.51%,2010年,被引篇数明显下降,2011年,剧烈下降,而在统计年份的2012年没有1篇高被引论文入选。这说明论文被引的次数与发表的时间有一定的因果关系,发表的时间越早,越有可能获得较多的被引次数。当然,2010年后发表的论文由于还没有完全达到引用高峰,所以这三年的高被引论文较少。
2.4 高被引论文的作者分布
在268篇高被引论文中,高被引论文第一作者5篇的有1位,高被引3篇的有2位作者,高被引2篇的有10位作者,其余作者为高被引1篇(见表3)。
表3 2008~2012年《实践》高被引论文作者分布
从表3可知,虽然高被引论文数量多少不同,但是篇均被引次数大致相等,说明《实践》比较成熟,拥有广泛的高水平的研究队伍,刊文质量较高。高被引论文已经代表了论文的质量和层次,在短期内能有多篇高被引论文,足以证明研究者的学术功底。以上高被引论文多产作者多是或者即将成长为我国图书馆学研究领域的领军人物,他们是《实践》高被引论文的核心作者群。但是存在一个突出问题,即高被引论文独著多,合著少。造成图书馆学研究领域论文合作率不高有特殊原因,即图书馆职称评定时部分地区要求是独著。在268篇高被引论文中,独著有174篇即可说明问题。希望相关部门能从科学角度出发,取消一些非理性的管理措施。
2.5 高被引论文的机构分布
268篇高被引论文共涉及机构(第一责任人机构)173个,高等院校及其附属机构129个,占机构总数的74.57%;公共图书馆31个,占机构总数的17.92%;党校2个,研究所和信息中心5个,其他8个,共占机构总数的7.51%。发表高被引论文≥5的机构见表4。
表4 2008~2012年《实践》高被引论文机构分布
268篇高被引论文共涉及机构(第一责任人机构)173个,发表高被引论文最多的机构分别是宁夏大学、宁夏图书馆、北京大学、武汉大学、国家图书馆等。这9个机构共发表高被引论文58篇,占全部高被引论文总数的21.64%,占全部机构总数的5.2%。表4显示了这9家机构拥有强大的科研生产力,且高被引论文机构分布极不平衡,不同机构科研生产力也不同。高等院校及其附属机构45篇,占9个机构发表论文总数的77.59%,说明高校是我国图书馆学研究的主力军。宁夏回族自治区图书馆是我国大型综合性省级公共图书馆,高被引论文也达到了7篇,说明学术型、研究型机构在我国图书馆学研究中处于绝对领先地位,是我国图书馆学研究成果的重要发源地。上表还有一个特殊现象,即高被引论文最多的单位是宁夏大学和宁夏自治区图书馆,这表明了科研工作者投稿有一定的地域倾向性,一般就近向高质量刊物投稿的较多,也表明宁夏图书情报工作者稿源质量较高。
2.6 高被引论文的地区分布
305篇高被引论文来自全国的25个省、市、自治区。其中,高被引论文超过10篇的地区分别是广东省、湖北省、北京市、湖南省、江苏省、天津市、浙江省和四川省。各地区高被引论文见表5。
表5 2008~2012年《实践》高被引论文10篇以上地区分布
通过对高产作者的地区分布进行研究,可以了解图书馆学、情报学研究的区域中心。[2]表5中的8个省区市高被引论文数为172篇,占高被引论文总数的64.18%。其中,宁夏的高被引论文为39篇,占全部高被引论文的14.55%,充分体现了该刊立足宁夏、面向全国的办刊宗旨,成为《实践》研究最活跃的地区。之后的北京、广东、江苏、河南、湖北、陕西、上海等也都取得了较好的研究成果。其余省份也各有高被引论文成果,河北9篇,湖南8篇,但不多。说明该刊获得了我国图书馆工作者的广泛认可,在图书馆学界有较大的社会影响力。上述数据也表明我国图书馆学的研究呈现一定地域差别,高被引论文数多集中在中东部,西部较少。说明社会经济文化较为发达地区,其图书馆学和情报学研究较高质量成果也相应较多。尤其值得一提的是,《实践》发表了5家县级图书馆的高被引论文,说明该刊重视基层,重视实践,为推进基层图书馆事业的发展做出了贡献,也说明基层图书馆有一定的学术研究能力。
2.7 高被引论文的基金分布
268篇高被引论文分别受60项基金资助。其中,国家项目16项,省部级项目18项,厅级项目10项,校级及学会项目共计16项。高被引论文的基金资助情况见表6。
表6 2008~2012年《实践》高被引论文基金分布
3.1 引入Lotka
Lotka分布能够定量揭示作者与其文献量的关系。这里借鉴Lotka将文献量替换为高被引论文数量。Lotka定律为撰写x篇论文的作者数y与其撰写论文数x之间存在着如下关系:xn.yx=M.c(1)
其中,M为高被引论文总数,yx=Mf(yx),n和c是对数据估计出来的两个常数。我们利用所收集的数据,估算指数n和c来揭示《实践》高被引论文作者的Lotka分布,随后进行K—S检验。
根据前面的统计数据可以得出论文数与作者数的有关数据,近五年高被引论文268篇,其中1篇未署名,实际按267篇计算。
表7 高被引论文数与作者数数据
3.2 指数n的最小二乘估算
为了估算非线性方程(1)中的指数n,在(1)的两边取对数,可得:
对式(2)中的参数n进行最小二乘估计,可得:
其中,N为被考察数据对的数量,即为N=4,X=lnx,Y=lnyx
将表7数据代入上式,得n=3.4889(Ⅴlachy的研究表明,一般1.2≤n≤3.5)
3.3 指数c的估算
对参数c的估算,我们采用美国情报学家Pao.M.L教授在1985年提出的一种指数不为2时的逼近c值的估计公式:
当n=2时,C=0.6079;当n≠2时,误差可以忽略不计。由(3)式知n=3.4889代入(4)式中可得c=0.8865。
因此,可以得到结论:《实践》高被引论文与作者的Lotka分布为:f(yx)=0.8865/x3.4889(5)3.4K-S验证
证明论文与作者实际分布与理论分布的一致性,需要进行统计检验,验证实测数据是否真正符合Lotka分布。这里采用K-S检验。K-S检验的基本思想是观察数值的累积频率分布与理论的累积频率分布之间的差异,选取最大的差距值,记为Dmax。若Dmax大于临界值,则认为理论和实际有显著差异;若Dmax小于临界值,则不能认为理论与实际有显著差异。
根据(5)式计算的作者理论累积频率与根据表7计算的实际累积频率列于表8。
表8 作者理论累积频率与实际累积频率
从表8可知Dmax=0.0613,当显著水平α=0.01时,临界值为=0.0998。因此,Dmax=0.0613<0.0998。
这样在显著水平α=0.01时,认为《实践》的论文与作者服从Lotka分布f(yx)=0.8865/x3.4889。
(1)《实践》办刊原则正确。学术杂志中作者数和论文数符合Lotka分布是学术杂志成功的一个重要标志。前面统计分析表明《实践》的高被引论文与作者服从Lotka分布f(yx)=0.8865/x3.4889。5年中,《实践》高被引论文数据量并不十分大,但通过科学验证符合Lotka分布,表明《实践》办刊思路、方向及原则符合科学发展规律。
(2)Lotka分布的参数问题。本文中n=3.4889,c=0.8865是比n=2,c=0.6079较大,但都在科学范围内。造成这种原因有2点:①统计时间较短,作者难以在较短时间内发表更多的论文。②本文研究的是高被引论文,对论文的质量和影响力有较高的要求,故高被引论文数量有限。即使放开时间限制,高被引论文的数量也不一定会激增。
(3)《实践》成熟。根据洛特卡定律,当一个刊物上实际发文量仅为1篇的作者数占作者总数的比例小于洛特卡定律的比例,则该刊物可看作是成熟刊物。[4]《实践》近五年高被引论文发文量仅为1篇的作者有236人,占作者总数的94.78%,而且作者分布在全国25个省(市)、自治区,表明《实践》“既立足西垂,更面向东南北中”、“长期关注理论前沿,时时追踪行业热点”、“鼓励学术争鸣,扶持新人新作”,拥有广泛的高素质作者队伍,形成了自己的研究风格。这里特别值得一提的是,《实践》发了5篇县级图书馆的高被引论文,表明《实践》关注基层,实实在在践行了服务学术、服务大众的宗旨,是成熟的突出标志。
(4)重视高级别课题论文。从2.6高被引论文的基金分布可以清楚地看到,高被引论文中受高级别课题(省部级以上)资助的论文占全部课题资助总额的56.67%,说明高级别课题的论文质量,社会影响力比较大。一般来说,高级别课题着力解决经济社会发展中具有全局性、战略性、前瞻性的重大理论和现实问题,对实现有重大创新价值的基础理论研究,不断推进学术观点、学科体系、科研方法和科研组织管理创新,构建科学创新体系有重要基础作用。《实践》要继续重视并加大刊登受资助高级别课题论文工作,为繁荣国家社科研究、加快人才培养、加大团队建设等做出贡献。
(5)重视学术型、研究型机构论文。从2.4高被引论文的机构分布可以看出,学术型、研究型机构的高被引论文数量较多,这与唐晔的研究结果“高校作者是《图书馆理论与实践》重要的作者队伍,公共馆的作者是不容忽视的学术队伍”[5]相一致,表明学术型、研究型机构的论文质量较高,应重视其在图书馆学理论与实践发展过程中的重要作用。
[1]《图书馆理论与实践》简介[EB/OL].[2014-04-18].http://baike.so.com/doc/6978089.html.
[2]钟文娟.《情报科学》1998-2010年作者群分布研究[J].情报科学,2011(9):1344-1347.
[3]邱均平,等.近十年我国图书馆领域知识产权研究的计量分析与评价[J].图书馆论坛,2014(1):1-6.
[4]白青,董文华.对《图书情报工作》洛特卡分布的统计分析[J].湖北大学学报(自然科学版),2011,33(4):467-469.
[5]唐晔,戴如莲.《图书馆理论与实践》2002-2011年作者群的统计分析[J].图书馆理论与实践, 2014(2):42-44.
G250.252
B
1005-8214(2014)12-0057-04
情况在一定程度上反映了研究的层次和质量,同时也反映了有关部门的支持力度。[3]2008~2012年,《实践》的305篇高被引论文中有60篇属于基金项目或受资助课题的研究成果,占高被引论文总数的22.39%。其中,国家级占5.97%,省部级项目占6.72%。一般来说,课题级别越高,说明论文研究越具有前沿性和较高学术性,对促进学术创新、培养团队合作精神等有重要作用。《实践》2008~2012年省部级以上课题占课题总数的56.67%,说明《实践》是我国图书馆学情报学研究学术前沿的重要阵地,是高级别课题和高质量论文的重要出产地,对各级课题特别是国家级课题的吸引力较大,在图书情报学研究领域极受科研人员的青睐。
李国朋(1978-),男,硕士,新乡医学院图书馆馆员。
2014-06-09[责任编辑]菊秋芳
总库为数据源,运用文献计量学的方法,借鉴普赖斯定律(M=0.749×Nmax)确定核心作者的方法确定高被引论文,对2008~2012年《图书馆理论与实践》高被引论文从年代分布、作者分布、地区分布、机构分布、基金分布等进行了详细的统计和分析。同时,发现该刊近五年高被引论文作者分布服从Lotka分布,并对其进行了K-S验证。结论表明,《图书馆理论与实践》发表的高被引论文总体上反映了近五年中国图书馆学的发展历史,代表了近五年来中国图书馆学研究的较高学术水平。