邱均平 曾 倩
(中国科学评价研究中心 湖北武汉 430072)
近年来,随着我国图书情报学研究的不断发展,以及我国学者的国际交流意识的增强,我国图书情报学科的国际学术论文数量也在逐渐增长。本文基于文献计量学的研究方法,着眼于我国图书情报学学科的高水平研究状况,对我国图书情报学国际学术论文的产出情况、数量增长、作者与机构分布、研究态势、被引情况进行统计分析,从而揭示我国图书情报学研究的发展趋势与当前国际影响力情况,为促进我国图书情报学研究的进一步发展提供参考。
ISI Web of Knowledge是由Thomson Reuters公司开发的综合性、多功能信息检索平台。其中SCI、CPCI-S和SSCI、CPCI-SSH分别收录了世界范围内的核心期刊与重要会议论文集,是最重要的检索与评价系统,能高效地提供各学科的最新文献信息。一个作者、机构或国家的学术论文被SCI、SSCI收录的数量,是评价其国际学术地位的一个重要标准。由于图书情报学这一学科的跨学科性质,该学科的期刊论文在SCI与SSCI均有收录,会议论文在CPCI-S和CPCI-SSH也有收录。
本文使用检索式 “SU=(INFORMATION SCIENCE﹠amp;LIBRARY SCIENCE) AND (AD=(Peoples R China) OR AD=(HONG KONG) OR AD=(TAIWAN))” 检索了 2012年以前 SCI、SSCI、CPCI-S、CPCI-SSH 收录的中国大陆、中国台湾、中国香港的全部图书情报学文献信息。共检索到从1916年至2011的共4512篇文献。
在所有4512篇文献中,第一作者为中国作者的有4111篇,其中大陆2700篇,台湾899篇,香港512篇。从文献类型来看,2396篇为会议论文,1862篇为期刊论文,还有少量书评、会议文献摘要等。文献语种以英语为主,此外还有中文、日语、德语、法语等语言文献。
图1 中国图书情报学国际发文的时间趋势
由中国图书情报学国际发文的时间趋势(见图1)可见,我国图书情报学国际发文的发展过程大致经历了五个阶段。(1)萌芽时期:1916年至1990年。从1916年至1979年期间,文献数量极小,除了1975年为2篇以外,其余年份均只有0~1篇。1980年至1990年,文献数量较前一时期略有增长,每年的文献数量在2~15篇之间,但数量起伏较为随意,未显示出稳定的增长趋势或下降趋势。(2)第一次发展时期:1991年至1998年。这一时期是第一个增长阶段,该时期三个地区的文献数量都开始稳步增长,至1998年达到高峰。(3)第二次发展时期:1999年至2006年。1999年文献数量较1998年有所回落,但随后立即开始了第二个增长阶段,该阶段增速较缓,但总体保持较为稳定的增长趋势。(4)繁荣时期:2007年和2008年。这是发文量迅速增长的阶段,该阶段的增长趋势最为显著(两年的文献总量均在900以上)。这一时期中国大陆文献数量急剧增长,其原因主要是由于会议论文数量的上升,该时期会议论文数量(尤其是在国内召开的国际会议)超过了期刊论文数量,论文较多的会议主要在中国台北、武汉、广州、北京及澳大利亚阿德莱德、美国奥兰多等地召开。中国台湾则无此现象,因而其增长速度虽有明显提高却低于大陆地区。香港地区的增长速度与第二阶段相比提高不大。(5)回落时期:2009年至2011年。2009年之后,由于会议论文的减少,每年文献量下跌至450篇以下,但仍然明显高于萌芽期和发展期的发文量。总体而言,我国图书情报学的国际论文数量的时间趋势虽然历经曲折,但总体态势呈现出增长趋势。
合作度和合作率是考察作者合作程度的两个重要指标。在第一作者为中国作者的4111篇文献中,共有3175篇存在作者合作,作者数量为10171人次,总合作率为77.23%,平均合作度为2.474,可见该学科国际发文的合作率较高,但合作度较低。所有文献中,合作度最高的有10位作者,大多数文献的作者数量为2位。
由合作情况变化曲线(见图2)可见,1980年以前的文献几乎不存在合作现象,所有文献均只有1位作者。1980年至1995年,各个指标都表现出剧烈而无规则的上升/回落现象,这一时期的作者逐渐开始了论文合作行为,但合作现象较为随意。1995年以后,前3个指标均呈现出曲折增长的态势,合作度、合作率以及同一论文的作者数在逐渐增长;而最后一个指标——第一作者比例在80%与96%之间来回起伏,没有再达到过100%,中国作者开始参与他国作者主导的科研、写作活动。这说明合作逐渐成为科研活动中的重要现象;由于合作关系与态度受到社会环境、科研政策、技术条件等诸多因素的影响,因此合作现象的增长曲线并不稳定,但总体合作程度仍然在不断增加。
被引频次高的文献通常具有较高的创新性、研究意义与研究深度,一篇文献的被引频次在一定程度上代表了该文献的学术价值、影响力及其在科技发展中所发挥的作用和地位。
在所有4512篇文献中,被引频次排在前两位的文献的第一作者分别来自新加坡和美国。而第一作者为中国作者的4111篇文献中,被引频次最高的文献为247,被引100次以上的文献有12篇,被引50~99次的有30篇。被引频次为0的文献共有2731篇,其中大陆2159篇,香港165篇,台湾406篇。中国大陆的2700篇文献中有2644篇(约98%)的被引频次在10次以下,最高被引频次为44,在所有文献中排名第51位,而中国台湾、中国香港文献的最高被引频次分别为247、186。
2005年,美国科学家 Hirsch提出了 h指数,Hirsch认为,一个作者发表的所有NP篇学术文献中,有h篇分别被引用了至少h次,而其余(NP-h)篇的被引次数分别小于h次,那么该作者的h指数为h。h指数自提出以来就受到广泛赞同,常被用来评价科学研究者的个人科研产出能力和质量,也可以推广到群体层面、机构层面或国家层面,评价各研究群体、地区甚至国家的研究能力。本文将h指数用于地区层面,计算得到中国大陆、中国台湾、中国香港的地区h指数分别为18、31、36,可见中国大陆地区的科研文献在被引方面低于台湾、香港地区,文献影响力有待进一步提高。
由篇均被引频次的时间趋势(见图3)可见,篇均被引频次的增长趋势与文献数量的增长趋势具有相似性,被引频次的增长曲线中的各个主要增长阶段和增长高峰与文献数量增长曲线中的相同,这说明这两个时期国际文献的数量和质量都有较大提高,这代表了我国图书情报学研究人员国际交流意识的增强以及研究实力的进步。
图2 合作情况变化曲线
图3 篇均被引频次的时间趋势
还可发现,中国香港与中国台湾地区文献的篇均被引频次几乎在任一年份都明显高于中国大陆文献的篇均被引频次。中国大陆所有年份的篇均被引频次为0.856,而中国台湾、中国香港地区分别为5.725、9.805,这进一步说明中国大陆的文献数量虽然多于香港、台湾地区,但文献质量参差不齐,总体影响力远低于香港、台湾地区。
期刊分布情况除了揭示该学科主要载文期刊和作者投稿偏好以外,期刊的学科主题也能在一定程度上反映出文献的研究主题。经统计,1862篇期刊论文共分布于99种期刊排名前10位的期刊载文量(见表1)均在45篇以上,载文量之和为1210篇,在所有1862篇期刊文献中占据了65%的比例。而前20种(20%)期刊则占据了76%(接近80%)的比例。可见,我国图书情报研究文献在国际期刊上的分布呈现出了显著的集中-离散分布现象。
表1 载文量最高的10种期刊
从期刊主题来看,大部分文献集中分布在信息计量学/科学计量学、信息管理、电子图书馆、信息系统这四类期刊上。
词频分析法是文献计量研究中的常用方法之一。关键词是一篇文献的核心内容的浓缩和提炼,某一关键词在其所在学科文献中的出现频率,反映出该关键词所表现的研究主题在该学科所受到的重视程度,因此,通过选取高频关键词可以确定该学科的研究热点与发展动向。
由于1991年及1991年之前的2468篇文献未提供关键词信息,因此,本文主要分析1992年之后的研究热点。部分表现同一主题的关键词有多种不同的表达形式(如WWW与World Wide Web等),笔者根据研究主题对关键词进行了合并整理,整理了排名前30位的高频关键词 (见表2)。出现频次最高的关键词为Electronic Commerce,其词频为82次;排在第30位的关键词Citation Analysis的词频为13,说明关键词的分布较为分散,各个关键词的出现频次并不高。这是由于本文的研究对象为中国学者在国际发表的文献,这些文献仅仅是中国图书情报学研究文献中的一部分,因此这部分文献研究主题分布相对较为分散。
表2 高频关键词(前30位)
如果对高频关键词进行进一步合并汇总,可以发现,我国图书情报学研究的众多研究主题中,在国际上较有影响力的研究主题可以分为三类。
第一类是包括电子商务、电子政务、供应链管理、计算机辅助教学、地理信息系统等主题的新兴的技术应用研究。此类研究直接面向具体问题,综合运用图书情报学的基本理论与方法及计算机科学等学科的技术研究成果,满足社会发展与科技发展的实际需求,由于研究起步时间较晚,且研究成果涉及社会与科技进步的方方面面,惠及广大人群,因而成为研究热点。
第二类是包括信息检索、数据挖掘、万维网、本体、遗传算法等主题在内的基础技术与算法的研究。此类研究侧重于图书情报学内部的研究需求,运用计算机科学的方法,解决图书情报学中的技术难点,丰富图书情报学的研究方法与技术手段,在理论研究与应用研究之间发挥了桥梁作用。
第三类是包括知识管理、电子图书馆、资源共享、技术创新、评价、引文分析等研究主题在内的基础研究,这些主题或着眼于理论探讨,或着眼于方法改进,或着眼于已有理论方法的基础应用,是图书情报学科的传统命题。
从关键词的词频分布来看,目前我国的国际发文中研究第一类主题的最多,第二类次之,而研究第三类基础理论主题的文献相对较少。
标签云图,是一种对标签(关键词)的可视化组织和表现方式。标签云图中的标签通常是单词,一般按字母顺序排列,标签的重要性(权重)通过字体大小或者颜色来标示,这就使得通过字母顺序和重要程度查找标签成为可能。为了比较中国大陆、中国台湾与中国香港三个地区研究主题的异同,笔者使用武汉大学沈阳教授开发的内容挖掘免费软件 ROST ContentMining的可视化功能,生成了三个地区高频关键词(前20位)的标签云图(见图4)。
由标签云图可以看出,电子商务、信息检索是三个地区共同的研究热点,其中,电子商务是中国香港地区的最大研究热点,而信息检索则是台湾地区的主要热点。此外,中国大陆与中国台湾地区有较多的共同热点,包括因特网、资源共享、万维网、数字图书馆、数据挖掘、供应链等;大陆与香港地区的共同研究热点较少,有知识管理、多媒体、信息技术、信任等,在图中表现并不明显;而台湾与香港地区的共同研究热点最少。
图4 三个地区高频关键词标签云图
前文根据发文量随时间的变化趋势分析了我国图书情报学国际发文的五个阶段,由于第一个阶段 (萌芽时期)的文献未提供关键词信息,因此本文只分析后四个时期的主题演进期刊。由后四个时期的高频关键词 (前20位)标签云图(见图5)可以看出,在1992年至1998年的标签云图中,多媒体、计算机辅助教学(CAI)、因特网这三个关键词最为突出,其字体大小明显大于关键词,这是由于其词频远大于其余关键词的词频。其次,万维网、网络、信息检索、信息技术等关键词也具有较大的词频。由此可见,该时期图书情报学科的国际发文主要集中在多媒体、网络、信息检索、信息技术等与计算机网络技术密切相关的主题上。1992年至1998年恰处于计算机网络发展历程中的第四个阶段,由于计算机网络技术的迅速发展和推广,其应用逐渐渗透到了图书情报学科,该时期的图书情报研究紧跟时代步伐,这在其国际发文主题上也有清晰的体现。
1999年至2006年的标签云图以信息检索和电子商务两大主题最为显著。信息检索这一关键词在前一阶段虽排在前20位但并不突出,在该阶段则上升到第一位。因特网、万维网仍然是研究热点,与前一阶段相比,其词频、排序均无太大变化。该时期刚刚起步的新兴研究主题——电子商务则后来居上,成为该阶段的第二大研究热点。此外,知识管理、数字图书馆、电子出版、本体、数据挖掘等主题也初露头角。
2007年至2008年的研究主题中,电子商务仍然是第二大研究热点,与之密切相关的供应链、风险管理则分别成为第一、第三大热点。信息检索、知识管理、本体、数字图书馆、数据挖掘等主题仍然是研究热点,但其词频和排序并不突出。因特网、万维网等传统的网络技术主题逐渐淡出视野,被各类应用技术取代。
图5 各时期高频关键词标签云图
2009年至2011年的研究热点则以知识管理、资源共享、数字图书馆最为突出,电子商务及其相关的主题退至第四位之后。该时期的研究热点中,除了上述热点以及前几个阶段已经出现的信息检索、数据挖掘之外,还出现了学术图书馆、引文分析、评价、信息服务等,这些研究主题并非该阶段新兴主题,而是图书情报学中的传统议题。可见该阶段的研究主题略有回归,不再以网络、电子商务等新技术、新事物为主,而是对图书情报学的基础理论、方法与实践研究重新给予了更多的关注与热情。
核心作者群体的状况集中地体现了学科科研实践的状态趋向,是某一学科领域的科研活动的缩影之一,对于作者的研究可以把握学科科研活动的深度和广度,对于科研活动的管理、组织、协调和引导都有积极的意义。
由于英文文献中的作者信息常采用 “姓,名的首字母”格式,不同姓名的作者容易被误认为同一作者,为了准确计量作者发文量,笔者采用自编程序,根据作者地址对作者信息进行了进一步处理。经统计,所有文献共出现了6260位不同作者(包括国内外作者),其中以第一作者身份出现的有2684位。由根据作者第一作者频次、加权频次、绝对频次三种方式选出的核心作者列表(见表3)可见,蔡明月(台湾政治大学)、于光(哈尔滨工业大学)、梁立明(河南师范大学)、张真诚(台湾交通大学)、杨传智(香港中文大学)、黄慕萱(台湾大学)、官建成(复旦大学)等7位作者的第一作者频次、加权频次、绝对频次均排在前10位,说明其论文产出数量与活跃度在所有作者中最高。其中,蔡明月教授在其发表的所有24篇论文中均以第一作者身份出现,于光教授仅在1篇论文中以非第一作者身份出现,说明这两位作者不仅活跃度高、产出量大,且在其参与的科研活动中发挥了主导作用、作出的贡献最大;而梁立明、张真诚、杨传智、黄慕萱、官建成则与之不同,这5位作者以第一作者身份和非第一作者身份都发表了较多论文,说明其既有自己主导的科研活动,又积极参加了其他作者主导的科研活动,合作面较广泛。此外,周荫强(香港大学)、朱启华(香港大学)、余显强(台湾世新大学)3位作者也以第一作者身份发表了较多论文,但其绝对频次或加权频次排名未进入前10名;Tam,KY(香港大学)、何玉山(北京大学)的绝对频次较高,Zhang,HQ(中国食品药品检定研究院)和Lin,Hsiu-Fen(台湾海洋大学)则具有较高的加权频次,但这四位作者均只有一个指标的排名未进入前10名,他们的活跃度很高,以合作者身份参与了较多科研活动。从作者地区来看,表3出现的14位作者中,有5位来自中国大陆,5位来自台湾地区,4位来自香港地区。从作者的研究方向来看,则以研究文献计量/信息计量的作者为主,其次是信息系统、知识管理和数字图书馆。
表3 核心作者(前10位)
对各研究机构发表的论文数量进行计量分析,有助于了解各机构研究能力。根据第一作者所在单位,笔者统计了发文数量在30篇以上的机构(见表4)。
表4 核心机构(前30位)
可以得知,以第一作者单位发表国际学术论文数量在30篇以上的机构共有30所,这些机构的发文总数1726篇,占总文献数量的38.25%,其中以香港城市大学和武汉大学最为突出,发文量分别为132篇、103篇。台湾大学、中国科学院、清华大学等排名前8位的机构也有优秀的科研产出能力,其发文量均在80以上。从机构类型来看,除了中国科学院以外,其余29所均为大学。从这些机构所在的地理位置来看,台湾地区有8所,香港地区有5所,大陆的17所机构则主要分布在北京(5所)、上海(3所)、湖北(2 所)、广东(2 所)、湖北(2 所)、浙江(1 所)、黑龙江(1 所)、江西(1 所)、辽宁(1 所)、安徽(1 所)。
从国际合作角度来看,我国图书情报学科的研究者共与37个国家存在合作关系,以非第一作者身份与他国作者合作发表的论文共401篇,这些论文的第一作者分布来自24个国家,其中前10个国家(见表5)的论文数量之和达到379篇,占94.51%。
为了进一步了解我国作者的国际合作情况,笔者通过自编程序对所有文献的地址字段进行了整理,提取了各位作者所在的国家,得到了国际合作矩阵,并使用NetDraw软件绘制了国际合作网络图(见图6)。图中圆形标志的面积越大,表示该国出现的频次越高;两个国家(地区)之间的连线越粗,其合作次数越多。
表5 第一作者的国别分布(前10个国家)
由合作网络图可见,在不考虑第一作者是否为中国作者的情况下,合作次数最多的国家依次为美国、澳大利亚、新加坡、加拿大、比利时、英国。从国内三个地区来看,中国大陆与中国香港地区有较强的合作关系,香港与台湾、大陆与台湾之间的合作相对较少。美国、澳大利亚、英国、新加坡、加拿大、法国、日本、荷兰是三个地区共同的合作国家,与三个地区均有合作关系。中国大陆与美国的合作次数高达257次,与澳大利亚、比利时、加拿大的合作次数也在40次以上。中国台湾地区与美国合作107次,与新加坡、英国分别合作12次、10次。中国香港的主要合作国家则是美国、加拿大、新加坡,合作次数分别为50、24、12。在所有的合作关系中,中国台湾与沙特阿拉伯、中国大陆与阿根廷、中国大陆与斯里兰卡为两国合作,其余均为多国合作模式。
图6 国际合作网络图
本文通过检索ISI Web of Knowledge中中国作者发表的论文,利用文献计量学的方法,对我国图书情报学的国际发文情况进行了定量分析。研究发现:
近年来,我国图书情报学科的国际发文增长迅速,70%以上的论文是在近五年发表。具体到地区而言,中国大陆地区的增长最为迅速,台湾地区的增长相对缓慢,香港地区的发文量最为稳定。
被引情况则与增长情况不同,大陆地区无论是篇均被引频次、最高被引频次,还是h指数,都低于香港地区和台湾地区,且第一作者为中国作者的论文被引用情况逊于第一作者为外国作者的论文。这说明我国(尤其是大陆地区)图书情报论文的平均影响力还不高。
会议论文数量是期刊论文数量的1.29倍,多于期刊论文,说明当前我国图书情报学科的研究者虽然有较强的国际交流意识,国际发文增多,但通过会议交流多于期刊论文发表,今后应适当提高期刊论文的比例。
我国图书情报国际期刊论文中65%刊登在10种(10%)期刊上,这些期刊的主题大致为信息计量学/科学计量学、信息管理、电子图书馆、信息系统等四类,其中Scientometrics和Information﹠amp;Management是发文最多的两种期刊。
研究热点可分为新兴技术应用研究、基本技术与算法研究、基础理论与实践研究三类,其中第一类研究最多。信息检索、电子商务、知识管理、资源共享、数字图书馆是三个地区共同研究热点。从历时演变情况来看,各时期的研究热点基本与国内外研究背景吻合,各主题均有高影响力论文在国外发表,最近几年的研究热点逐渐向图书情报学基础理论、方法与实践方面回归,技术应用研究的规模逐渐减少或主题逐渐细化、分散。
核心研究机构以香港城市大学、武汉大学、台湾大学最为突出。近年来,该学科国际发文的合作率与合作度均在不断提高,国际合作对象以美国、比利时、英国、加拿大、新加坡为主,共与37个国家开展过合作研究,但与大多数国家的只有极少的合作频次,未建立稳定的合作关系,合作面与合作强度均可进一步提高。
[1]何朝晖.网络参考文献研究[J].图书与情报,2002,(4):45-47.
[2]K.Subramanyam.Bibliometrics Studies of Research Collaboration:A Revicw [J].Journal of Information Science,1983,10(6):33-38.
[3]Hirsch J E.An index to quantify an individual's scientific research output [J].Proceedings of the National A-cademy of Sciences of the USA,2005,102(46): 16569-16572.
[4]Van Raan A F J.Comparison of the Hirsch-index with standard bibliometric indicators and with peer judgment for 147 chemistry research groups [J].Scientometrics,2006,67(3): 491-502.
[5]Molinari J F, Molinari A.A new methodology for ranking scientific institutions [J].Scientometrics, 2008, 75(1): 163-174.
[6]Csajbok E, Berhidi A, Vasas L, et al.Hirsch-index for countries based on essential science indicators data[J].Scientometrics, 2007, 73(1): 91-117.
[7]马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报, 2006, 25(2): 163-165.
[8]廖凤,张建勇.Keyword Cloud在文献检索中的应用研究[J].图书馆杂志, 2010,(9):57-61.
[9]邱均平,马瑞敏.基于CSSCI的图书馆、情报与档案管理一级学科文献计量评价研究[J].中国图书馆学报,2006,(1): 24-29.