(上海师范大学图书馆 上海 200234)
核心学术图书,即学术影响力大、学术价值高的图书。人文社会科学领域的图书是学者学习、研究的重要参考资源,据CSSCI的统计数据,其收录的论文引用的参考文献中图书所占比例为50%以上,因此本文从引文分析的角度入手,探寻哪些是有重要影响和学术价值的图书,这些图书具有哪些规律或特点,从而为图书的选择与评价提供依据。
为了确保数据的充足与全面,课题组整合了多方的数据,其中包括国内规模最大的数字图书资源提供商北京超星公司、目前国内知名的民营书商人天书业集团、长期为图书馆制作书目数据的上海联诚图书公司以及上海图书馆。人文社科类对应《中国图书馆分类法》(简称“中图法”)的AK类,而这些数据中包含题名、责任者、ISBN号、丛编、中图分类号、摘要等基本信息,处理起来相对容易,各方汇总,共收集到1995-2005年出版的人文社科类学术图书信息180万余条数据,经过去重复处理,最终获得72万余条数据(包含重版、译著)。
为了加强对出版状况的了解,同时也为了降低查引的工作量,先将去重处理的数据进行学术图书的筛选。学术图书即反映本学科的最新研究成果及前沿研究状况和发展趋势,对本学科领域具有较大影响或推动作用的学术性著作。基于此,制定筛选规则,人工删除以下几类非学术图书:①各类大专以下(包括大专)教材;②各类教学辅导材料、习题集;③各类职业认证考试、等级考试教材及辅导材料;④各类职业教育、岗位培训、励志类图书;⑤各类科普读物、普及读物;各类文艺作品;⑥ 各类政策法规、政府出版物;⑦工具书。共计筛选出学术图书12万余种。之后,通过Google Scholar对12万余条数据逐条进行被引查询,Google Scholar作为专业的学术搜索工具,可以客观、全面的反映文献的被引情况。查被引的过程也是对数据进行校对的过程,通过国家图书馆书目、CALIS联合目录以及本馆馆藏数据等多方求证,进行纠错处理,保证图书书目信息的正确。
根据二八定律筛选、确定核心学术图书,即将学术图书按被引次数排序,按总被引次数的80%选出排在前若干位的图书,作为核心学术图书。考虑到学科间引用情况的差异,按A-K类分别筛选,最终选出核心图书14022种。
核心书目筛选、确定的过程也是揭示1995-2005年人文社科类图书的出版状况的过程。本文按年代将人文社科图书总量、其中筛选出的学术图书的数量、按二八定律遴选的核心学术图书的数量以及核心学术图书的平均被引次数分别汇总在表1中,并计算出了学术图书在对应年度人文社科图书中的比例和有价值的核心学术图书分别在学术图书及总量中的比例,详见表1。
表1 1995-2005年人文社科类图书总体情况
总体来看,11年间我国出版的人文社科类图书总量不低,但出版质量不高。学术图书的比例不足20%,学术图书中有引用记录(引用次数大于等于1的有53333种)不足一半,真正有学术影响力、有价值的图书比例可能更低。
从年代分析,1995年至2005年人文社科图书总量稳中有升,小幅波动。其中学术图书与核心学术图书的数量也基本随总量的变化而变化,根据表1中的学术图书比例与核心学术图书在学术图书中的比例的逐年变化情况绘制图1,可以看出,11年间两个比例相对都比价稳定,仅在小幅范围内上下波动,人文社科学术图书的比例在15%-20%之间,印证了二八定律。而核心学术图书比例较低,基本在10%上下。说明核心学术图书的数量与该年度出版、发行的图书总量有直接的关系(详见图1)。
图1 学术图书与核心图书比例对比
另据被引统计,被引次数500次以上的图书有124种,被引1000次以上的有32种。显示高被引次数的图书数量相对较少。
3.2.1 出版社分布
对核心图书的出版社进行统计可知,共涉及529家出版社,而据新闻出版总署的统计报告,在2005年全国共有573家出版社,说明绝大多数出版社都出版过较精品的人文社科类图书。以各出版社为单位,分别统计各自拥有的核心图书数量和每种核心图书的平均被引次数,汇总在表2中。
表2 核心图书出版及被引分布
从表2可以看出,出版社的数量与核心图书数量总体呈反比关系,仅12家出版社的核心图书数量在200种以上,绝大多数出版社在统计的11年间只有1-5种图书入选核心图书。而各出版社的核心图书的平均被引次数呈中间高两头低的格局,即平均被引次数高于100和低于10次的都比较少,在20次和50次之间的最多,有264家。
分别对出版社按核心图书数量和每种平均被引次数排序,发现两者并不一致,出版核心图书数量多的出版社平均被引次数并不一定高,同样,平均被引次数较高的出版社可能出版核心图书数量较低。一个具有竞争力的出版社应该是出版数量与出版质量齐头并进,因此,本文分别按入选图书种数和平均被引次数对出版社进行了排序,篇幅原因,仅取二者均排在前100位以内的列出,作为高影响力出版社的代表,共35家(见表3)。
表3中,专业类出版社18家,主要集中在教育、法律类,仅教育类出版社就有11家;此外,高校出版社10家,综合类出版社7家,这些出版社在人文社科领域具有较强的出版实力。总体来看,这些出版社绝大多数为人文社科类出版社,但也不乏特例,像电子工业出版社和中国轻工业出版社就属于科技类出版社,但也入选了人文社科类的核心出版社。仔细分析二者的入选图书可知,中国轻工业出版社入选的多为教育类图书,而电子工业出版社入选的基本是信息管理和计算机教学相关类别。说明随着市场经济的发展,出版社的发展方向、出版领域都发生了转变,这要求我们打破固有的思维模式,对出版社重新进行认识与评价。
表3 部分高影响力出版社
3.2.2 作者分布
本文的研究对象包括再版图书,所以统计出来的结果中包含较早期的已故作者,也会出现同一作者不同版别的一种著作同时被选中的情况,如作者郑杭生在1998年和2003年均对《社会学概论新修》一书进行了修订再版,且两本书均有较多的被引次数,此种情况本文视作两种图书。
表4 核心图书作者总体分布情况
本文只统计第一作者,按作者的入选图书种数进行排序,汇总结果见表4。总体上,作者数量随入选的核心学术图书数量的减少而增加,绝大多数作者仅有一种著作入选核心学术图书,入选两种及以上著作的作者仅有2093人,只占作者总数的20%。限于篇幅,本文仅列出有5种以上著作入选核心学术图书的作者名单,同时统计每位作者所有入选图书的总被引次数,计算出每种图书的平均被引次数(均被引),详见表5。这部分作者共有83人,他们是人文社科领域的核心高产作者。
需要指出的是,上述作者入选的著作中,包含译著,如冯克利入选的6部著作全部为译著。而在所统计的14022种核心学术图书中翻译作品有1281种,占9%,且多为欧美作品,可见1995至2005年西方的人文社科学术思想对我国的影响非常之大。再看表5,这些作者不仅是高产作者,而且著作的平均被引次数也较高,大多都在50次以上,体现出较高的科研能力与学术水平。他们基本都是各自学科领域内的拔尖人才、领军人物或者说学术“大家”,是人文社科领域的核心作者。
表5 部分高产作者名单
通过对各入选著作的分类以及主题词的归纳,总体来讲,上述83位学者的研究领域都比较固定,研究也相对集中,研究方向较为专一或相近,研究文学及其相关领域的最多,达17人次,教学论、比较教育等教育相关问题研究也有16人次,再次是哲学、经济、历史文化、法律各类研究均在10人次左右,语言、艺术等研究较少。
3.2.3 学科分布
本文的数据来源广泛。有些取自采访征订目录,该目录信息简单,分类号不完备不准确,因此本文通过CALIS的馆藏数据对其进行补充、校对,CALIS上没有的则通过作者所在单位图书馆、国家图书馆和上海图书馆馆藏数据进一步查询,将经过查证核实的核心图书学科分布汇总为表6。
表6 各类核心图书情况
从表6可以看出,人文社科类核心学术图书在数量、平均被引次数以及核心图书在学术图书中所占的比例,几个数据的差别都比较大。其中,A大类各项指标较低,说明研究马克思主义、列宁主义、毛泽东思想、邓小平理论的学者相对较少,且著作较少被参考、引用。而语言类高被引图书较多,平均被引次数达到了136次之多。
依次统计A-K类核心图书的研究主题,按中图法二级类目所包含的图书数量排序,取各类的前三名汇总在表7中。
表7 核心学术图书学科分布
一部图书被引用,表明引用者也在从事着相同或相近领域的研究,引用次数越多,代表关注度越高,表示该领域的研究越活跃。因此对核心学术图书学科分布的研究,可以清楚各领域的研究热度与影响力,对于我国的学科建设具有一定的指导意义。
一部优秀作品的面世离不开优秀的作者和优秀的出版机构。通过对人文社科类核心图书的分析,可以清楚地揭示作者和出版社在人文社科领域的影响力,为图书馆图书采访和科研中的参考借鉴提供依据与指导。在本研究的基础上可以建立“核心作者与核心出版社”数据库,数据库应该是一个动态的、不断更新的库,可以为各图书馆补充馆藏、评价馆藏提供依据。另外,基于被引次数的学科研究可以看出哪些领域的研究热度比较高,哪些领域较少被关注,或者比较薄弱,从而为我国学科建设的发展规划提供决策依据。基于作者研究主题的分析,可以组群等形式为相同研究领域的学者建立沟通的桥梁。核心出版社的研究可以了解出版社侧重的学科领域及其影响等等,这些问题还有待研究。
1,4,5.吴志荣.文献发现:大数据时代的重要命题.上海师范大学学报(哲学社会科学版),2013,42(4):21-27
2.苏新宁.我国人文社会科学图书被引概况分析.东岳论丛,2009,30(7):5-13
3.蔡迎春.基于综合分析法的核心书目及核心出版社的测定.图书馆杂志,2009,28(1):4-9