刘晓霞 (上海师范大学图书馆 上海 200234)
图书是文献信息资源的主要类型之一,在社会科学的研究中发挥着重要作用。根据CSSCI(Chinese Social Sciences Citation Index,中文社会科学引文索引)的统计数据,CSSCI收录论文的引用文献中图书的比例高达50%以上,语言学论文引用图书占所有引文文献的61.68%[1],这表明图书是语言学最重要、也是该学科研究人员使用最多的学术资源。对图书馆来说,一方面,我国图书文献出版量逐年增长,任何一家图书馆都不可能网罗所有的图书资源;另一方面,根据统计我国高校图书馆的新入藏图书利用率约为40%[2],图书馆采访到的图书并不被读者认可,图书利用率偏低。那么图书馆应如何选择图书,使其既能满足读者需求,又能使图书馆的资源建设经费发挥最大作用,这就需要测定每个学科的核心书目。
被引用情况是文献利用率和影响力的最直接反映,引文分析法是信息计量学的重要方法之一,通过对文献的引用和被引情况进行分析,可以对文献进行定量评价并揭示不同文献间的相互关系,其被广泛应用于对期刊论文的评价。近年来,有些学者把引文分析法应用于对图书的评价中,用其来测定某学科有影响力的图书或者核心出版社。例如,南京大学中国社会科学研究评价中心在苏新宁教授的带领下,以CSSCI统计数据为基础,发表了心理学、语言学、政治学、社会学、外国文学、民族学、文化学等一系列对学科研究有影响力的学术著作及分析出版社的学术论文,并出版了《中国人文社会科学图书学术影响力报告》,用科学数据和引文分析法客观反映了我国人文社会科学领域有重要影响力的学术著作;杨思洛等以中国引文数据库为基础,用引文分析法对图书情报学领域1979—2008年的图书影响力、出版社影响力、作者影响力、年代影响力及高影响力图书同被引情况进行了统计和分析[3];蔡迎春等以Google Scholar引文为测量工具,对 2002—2005年国内经济类“核心书目”进行测定并与馆藏图书进行比对[4];陆怡洲用引文分析法对《全国总书目》2002—2005年出版的计算机类图书被引情况进行了统计分析,并测定了该类图书的核心出版社和核心作者[5]。本文并未采用引文数据库中的相关数据,而是以第一手书目为基础,利用Google Scholar中的被引频次,用客观数据反映语言类(H大类)学术图书的被利用情况,测定H大类核心书目并对其做出详细分析。
由于人文社会科学类学术著作的半衰期较长,考虑到文献老化对被引频次的影响,近几年出版图书的学术价值还不能完全确定,故本文选择1995—2005年11年间的H大类书目数据。其主要来源于人天书店集团、超星集团、上海丹诚图书数码科技有限公司和上海图书馆,除此之外,还有国家图书奖、中国图书奖、五个一工程奖等获奖图书,除去重复共计书目58228条,经过与《全国总书目》进行抽样比对,书目数据的数量大大超过了《全国总书目》中H大类的数据量,说明统计的书目数据较全,基本能反映我国这11年间H大类图书的出版情况。
在H大类书目数据收集好之后,为了测定核心书目,首先要筛选中文学术性图书(包括译著)。其删除的非学术性图书范围包括以下各类:①各类大专以下(包括大专)教材;②各类教学辅导材料、习题集;③各类职业认证考试、等级考试教材及辅导材料;④各类职业教育、岗位培训、励志类图书;⑤各类科普读物、普及读物;⑥各类文艺作品;⑦工具书;⑧各类政策法规、政府出版物。按以上标准对H大类进行筛选,共得H大类学术性图书4774种,占H大类图书总数的8.2%,学术性图书所占比例较低,这与H大类图书中外语学习、外语考试、词典、中外文对照类文学作品等图书较多有很大关系。
在确定学术性图书之后,选择何种检索系统作为评价工具是关键。目前,国内可用的引文数据库(如CSSCI、中国引文数据库等)在收录范围上有限制,引文类型比较单一,难以全面反映图书的真实被引情况。而Google Scholar则可以获取期刊论文、同行评议论文、技术报告、学位论文、图书、底稿、PPT介绍等各类型的学术信息,自2004年被推出以来,被广泛用来查找文献、确定引文。目前国内外均有关于Google Scholar与其他数据库引文的比较。例如,Bauer和Bakkalbasi在2005年曾比较研究Google Scholar、Web of Science(WOS)、Elsevier's Scopus中的被引频次,对于《Journal of the American Society for Information Science and Technology》(JASIST)上2000年发表的文章,Google Scholar明显高于WOS和Elsevier's Scopus[6];Belew的研究结果表明Google Scholar和WOS中的被引频次有较高的相关性[7];Ruane和Tol的研究也表明基于Google Scholar的引文排序与WOS和Elsevier's Scopus中的引文排序相关性较高[8];Kousha 和 Thelwall则发现在Google Scholar检索到的出版物及其被引量比其他数据库要多[9];任静和孙建军以图书情报领域期刊为研究样本进行研究发现,Google Scholar因为引文的类型更多样化(除了期刊论文,还有会议论文、图书章节、学位论文、技术报告、预印本和工作底稿等),其引文量远大于WOS,也更具有学术影响性,并且认为把Google Scholar作为引文评价分析工具具有可行性[10]。虽然目前没有Google Scholar与中文检索系统引文量的比较研究,但是以上研究从不同角度证实了Google Scholar引文的科学性,因此,本文选择了Google Scholar作为检索工具统计被引频次,以测定H大类核心书目及其影响力,检索时间为2012年1月。
所有4774种H大类学术性图书的总被引频次为96849,其中有2888种图书有被引频次。笔者根据80/20法则确定了入选的H大类核心书目。经统计,被引35次以上的图书有543种(占11.37%),被引频次为77296,占被引总次数的79.81%,满足按总被引频次计算的80/20法则。因此,入选H大类核心书目的图书为543种,入选图书的均被引频次为142。
由表1可知,图书的被引频次分布很不均匀。有7种图书的被引频次大于等于1000,占被引总频次的10.30%,平均被引频次为1426;被引频次大于等于500小于1000的的图书有14种(占0.29%),占总被引频次的9.40%,该段图书平均被引频次为650 ;被引频次和比例最高的为被引次在100和500之间的196种图书(占4.11%),占总被频次的40.36%;被引频次在0到10之间的图书有3503种(占73.38%),总被引频次所占比例为6.22%。
在所有入选图书中,被引频次最高的是何自然的《语用学与英语学习》,该书总被引频次2125次,年均被引频次〔年均被引频次=总被引频次/(2012-出版年份)〕为141.67;排在第二位的是《新编语用学概要》,总被引频次为2114次,但由于出版时间短,其年均被引频次达176.17,详见表2。
表1 H大类学术性图书被引频次分布表
表2 被引总频次排名前10位的图书
在入选核心书目的图书中,除了531种中文原著图书外,还有12种外文译著,平均被引频次为58.33,这表明外文学术性图书虽对H大类有一定的学术影响,但是H大类研究人员以中文学术性图书的利用为主,应适当注意对外文文献的翻译利用。
在科学研究与交流中,作者的影响力主要靠发表论著呈现,衡量标准是发表数量与被引频次等的综合评价[3]。因此,本文对作者影响力的统计分析分两个方面,一是统计入选图书多的作者,二是统计被引频次多的作者。为了计算方便,对图书作者的统计只考虑第一作者。在所入选的543种图书中,出版2种以上图书的作者共有80人,其中出版2种图书的作者有55人,出版3种图书的有12人,出版4种图书的有6人,出版5种图书的有5人,出版6种图书的有2人。这80位作者所入选图书的总被引频次为38891次,占所入选图书总被引量的50.31%,可见,这些作者在该学科领域内影响较大,是本学科领域的核心作者。按照入选图书种数计算,表3列出了入选4种以上图书的作者及其被引频次,入选图书最多的作者是束定芳和冯志伟,各有6种图书入选。虽然某些作者同在入选图书较多的作者之列,但是从表3可以看出被引频次差别较大。按照作者入选图书的总被引频次计算,表3也列出了排在前13位的作者,入选图书被引频次最高的也是束定芳,总被引频次达2930次。
从表4来看,不同年份出版的图书入选核心书目数量有所差别,但并无规律可循。其中,2000年出版的图书入选H大类核心书目种数最多,为88种,占所有入选图书的16.21%,每种图书的平均被引频次为178.53次。1997年出版的图书平均被引频次最高,达194.26种。1999—2001年入选核心书目的图书比例均大于该年份学术性图书所占比例;2002—2005年出版的图书则相反,入选核心书目的图书比例均小于相应年份的学术性图书比例。从学术性图书的数量来看,1995年的学术性图书比例最低,仅有253种,与此对应,该年份入选核心书目的图书种数也最少,为21种;2005年出版的学术性图书比例最高,达13.97%,但对应的入选图书却不是最多。
表3 入选图书高被引作者
入选的543种图书来自106家出版社(北京语言学院出版社、北京语言文化大学出版社入北京语言大学出版社统计),入选图书在10种以上的共有13家出版社(详见表5),总被引频次为56275,占所有入选图书被引量的72.80%。这13家出版社也均列在王东波、周冰倩根据CSSCI数据所得出的对语言学最有学术影响的百家出版社[11]之中,而且排名靠前,说明这些出版社影响力较大,是语言文字学科领域中的核心出版社,在H大类的资源采访中应特别注意。由表5可知,图书种数、总被引频次和均被引频次最高的均是上海外语教育出版社,该出版社所入选的89种图书的被引频次占所有入选图书被引频次的31.88%,对于图书馆的资源建设来说,上海外语教育出版社的H大类学术性图书须尽网罗。
表5 入选图书在10种以上的出版社分布表
通过在CALIS(China Academic Library & Information System,中国高等教育文献保障系统)联合目录检索系统和国家图书馆馆藏目录系统中对入选图书的分类号进行检索核查,一种图书有两个分类号的,只取第一个,对应《中国图书馆分类法》中H大类的类目细分,如表6所示。从入选图书的二级类目来看,H大类核心书目主要涉及4个二级类目,语言学类图书最多,占入选图书的42.54%;其次是汉语语言文字方面的图书,占31.86%;外语类图书占核心书目的25.41%;最少的是汉藏语系类图书,仅有1种入选。从三级类目来看,每个二级类目下都有一个或者几个类占量的优势,也就是该学科研究的焦点所在。入选最多的是英语类图书,共有120种,占总入选图书的22.10%,表明英语是该学科研究人员的主要研究对象;其次是总论语言文字方面的图书,共有93种(占17.13%)入选;排在第三位的写作学、修辞学有71种图书入选。可见,在1995—2005年间H大类的研究主要集中在英语、语言文字总论、写作学、修辞学、语法等方面。
本研究利用引文分析法测定了H大类1995—2005年11年间出版的学术性中文图书的核心书目,543种图书以学术性图书11.37%的比例占据了总被引频次79.81%的比例,充分说明了这些图书的高学术影响力,为H大类的研究人员读书治学和图书馆的资源建设提供了一定的依据,并且通过详细数据展示了H大类学术性图书核心书目的作者、年代、出版社及主要研究领域的分布。但是原始书目难免有所遗漏,而Google Scholar不够稳定[12],加上被引频次由外包数据公司检索确定,使得统计结果可能存在一定偏差。此外,本研究没有涉及图书的引证文献的类型、年代,高被引图书的互引、同被引分析等,在以后的研究中可以对这几个方面做进一步考虑,比较分析Google Scholar和中文引文数据库中的被引情况、图书出版后多久达到被引高峰、同学科高被引文献之间的关系。
表6 入选图书学科类目细分表
[1]苏新宁.我国人文社会科学图书被引概况分析:基于CSSCI数据库[J].东岳论丛,2009(30):7-13.
[2]刘淑波,胡文华.新书书库图书利用实证调查研究及对策:以华东师大闵行校区图书馆为例[J].图书情报知识,2010(3):101-105.
[3]杨思洛,王 皓,文庭孝.基于引文分析的图书影响力研究:以图书情报领域为例[J].情报资料工作,2010(1):89-92.
[4]蔡迎春,岳之英,穆卫国.基于“核心书目”的藏书质量评价与分析[J].图书馆理论与实践,2010(1):15-18.
[5]陆怡洲.基于引文统计的我国计算机类学术性图书出版情况分析[J].图书馆论坛,2009(2):145,165-167.
[6]Bauer K,Bakkalbasi N.An Examination of Citation Counts in a New Scholarly Communication Environment [EB/OL].[2012-05-23].http://www.dlib.org/dlib/september05/bauer/09bauer.html.
[7]Belew R K.Scientific Impact Quantity and Quality: Analysis of Two Sources of Bibliographic Data[EB/OL].(2005-04-10)[2012-05-20].http://arxiv.org/pdf/cs/0504036v1.pdf.
[8]Ruane F, Tol R S J.Rational (Successive) H-Indices: An Application to Economics in the Republic of Ireland[J].Scientometrics,2008, 75(2):395-405.
[9]Kousha K,Thelwall M.Google Scholar Citations and Google Web/URL Citations: A Multi-Discipline Exploratory Analysis[J].Journal of the American Society for Information Science and Technology, 2007,58(7): 1055-1065.
[10]任 静,孙建军.Web of Science与Google Scholar的引文分析比较研究[J].情报科学,2011(11):1688-1692.
[11]王东波,周冰倩.对语言学最有学术影响的百家出版社分析:基于CSSCI(2000-2007年度)数据[J].出版科学,2011(1):66-71.
[12]陶慧卿,潘 卫,庄 琦.从引文分析的角度比较Google Scholar与Web of Science的优势与不足[J].图书馆杂志,2008(12):29-35.