叶继元
摘要 为验证目前中国有关图书、学术图书与人文社会科学学术图书种数的多种统计数据,估计数据的可信度,文章运用书目统计法、抽样调查法,对国家出版管理部门公布的图书种数、《全国总书目》和《全国新书目》收录的图书种数进行了统计、整理、分析。结果发现,这些数据在研究与管理中具有重要作用。但由于疏忽或其他原因,一些数据和估计数据出现了差错。建议国家出版管理部门增添对学术图书及文科学术图书等项目的专项统计,或选择有条件的学术机构或评价中心负责此项工作,加强学术图书及文科学术图书等的书目控制,提高数据质量,提升数据的可利用性,加强管理的规范化。
关键词 图书 学术图书 学术图书种数 人文社会科学 书目统计 《全国总书目》《全国新书目》
分类号 G23
DOI 10.16603/j.issn1002—1027.2016.01.001
1引言
图书、学术图书、人文社会科学(以下简称“文科”)学术图书是图书情报界、出版界、学术评价领域、基金会、管理部门等经常使用的词语。其品种数量有多少,也是这些部门在进行经费预算、资源建设、管理规划、资助出版时迫切需要了解的。然而,目前在中国,要知晓和利用其准确数据却并非易事。因为其中有的数据会被误用,有的是未经验证的估计数据。例如,要知道某时间段一共出版了多少种新书,理论上似乎只要查找到每年出版的图书种数再相加即可。因为国家出版管理部门每年均要公布图书出版种数(以下简称“国家图书种数”)。但在这些数据中,有图书种数、图书初版种数、重版和重印图书种数(合并统计后无法知道各自的种数)。不少同行、新闻记者将“图书种数”相加,未考虑重版、重印的情况,造成数据失真。又如,国家每年公布图书种数数据,但并未出版相对应的能涵盖全部图书种数的图书目录。目前收录图书种数最多的、以呈缴本为基础的《全国总书目》(以下简称“《总目》”)也收录不完整。《总目》收录的数据有图书种数、图书初版种数、重版图书种数,但没有重印图书种数,与国家图书种数统计项目也不一致。要计算《总目》收录图书的覆盖率(占国家图书种数的百分比),是与“图书种数”相比,还是与“图书初版种数”相比?有的论者选择前者,结果造成图书覆盖率下降。至于学术图书、文科学术图书种数的准确数据,要获取就更加不易。因为长期以来国家出版管理部门没有将“学术图书”、“文科学术图书”作为统计项目,所以无法提供权威、全面、可靠的数据。目前所能查到的学术图书种数数据仅是一些研究者的推估数据。这些数据是怎样估计的,采用什么方法,误差率是多少,可信度如何?迄今为止还没有见到对此提出质疑或进行验证的文章。有鉴于此,笔者对以往有关图书种数、《总目》图书覆盖率、学术图书、文科学术图书估计种数的文献进行了调查,利用国家图书种数、《总目》收录图书种数等数据,对目前流行的数据或数据比例进行了验证、核实,分析其作用,指出其不足。同时,对《全国新书目》(2014年)的书目进行抽样调查统计,推算出我国近年来学术图书、学术著作、学术专著和文科学术图书、学术著作、学术专著的种数,以供同行讨论参考之用。对如何准确统计学术图书、文科学术图书的种数提出了建议。
2文献中相关数据调查
清晰定义统计项目所涉及到的相关概念的定义是进行数据统计的必要前提。有关图书、学术图书、学术著作、学术专著等概念的定义及其相互关系,笔者近期将有专文发表,在此不再赘述。这里仅简要提及笔者对图书、学术图书的定义。图书(Book)是指用文字、图画或其它符号将有关信息内容记录在纸张、磁性材料等不同载体上,具有相当篇幅、以单本卷册形式、非连续出版的读物。图书包括单册书、丛书、多卷集(此处是指印刷型图书)。学术图书(Academic/Scholarly Book)是指内容涉及某学科或某专业领域,具有一定创新性,对专业学习、研究具有价值的图书,通常在书中有文献注释或参考文献、书后索引等。它包括学术著作及专著、学术性的各种图书类型。
经文献检索,有关图书、学术图书、文科学术图书、《总目》图书覆盖率等的数据说法大致有以下七种。
其一,30%说。《学术出版市场上大学出版社的地位和发展战略》一文在第一节“我国学术图书出版概况及分析”中有下列文字:“由于这种粗糙简单的归类无疑造成学术图书统计的极大困难,因此,至今我们无法知晓我国每年究竟出版多少种学术图书,每年在市场上究竟销售了多少种多少册此类图书。按照我国业内资深人士估计,学术图书品种数大约占总品种数的30%以下,我们若以30%的乐观比例估算,我国近三年出版学术图书数分别为:2005年38573种、2006年39079种、2007年40000种。”此说对后续数据的推断有较大影响。
其二,4万多种与2.2万种左右说。《谈学术出版的问题与机遇》一文认为:“现在国内有出版权的正式出版机构578家,今年出版图书总量接近40万种,90%以上的出版机构都涉及学术出版;年出版学术图书的数量,用宽口径统计有4万多种,其中人文社会科学总品种数2.2万种左右,自然科学和科学技术占1.9万种左右。”由于此说涉及学术图书、文科学术图书的具体数据,引来业内作者不少引用,诸如《2013年我国学术图书出版现状述评》一文就引用了此数据。
其三,17.5%说。2013年10月出版的《中国哲学社会科学类学术图书基本书目(1995—2005)》一书根据书目统计,从1995—2005年11年间的72万多种的文科图书中筛选出文科学术图书品种数量达126118种,占比17.5%。这里虽说是“学术图书”,作者认为不包括下列图书:“(1)各类大专以下(包括大专)教材;(2)各类教学辅导材料、习题集;(3)各类职业认证考试、等级考试教材及辅导材料;(4)各类职业教育、岗位培训、励志类图书;(5)各类科普读物、普及读物,各类文艺作品;(6)工具书;(7)各类政策法规、政府出版物。另外,考虑到《中国图书馆分类法》的Z大类的哲学社会科学类图书都属于大套的丛书,具有一定的特殊性,本书目也不予收录。”如果将高校以上教材、学术性工具书等划归“学术图书”的话,那么这里所谓的“学术图书”,实际上称为“学术著作”较为合适。
其四,76%说。《中文人文社会科学学术图书评价的瓶颈因素及对策研究》一文,为了说明文科学术图书不断增长的大体趋势,在没有权威的文科学术图书情况下,利用文科各学科图书种数来反映。作者根据国家图书种数,统计出2002—2012年全国出版的图书中,“人文社会科学图书所占比例基本保持在76%左右,最低时为2008年度的74.11%,最高时为2012年度的79.1%。”
其五,54%—78%说。《21世纪的国家书目控制》一文认为:《全国总书目》覆盖率在20世纪70年代达到最高,约为78%,尚存在超过20%的缺口;到1980年代降为72.2%,到1990年代甚至降为约54%。由于此文在《全国总书目》电子版里发表,此覆盖率的数据应有可信度,故不少学者曾引用该比例数据。诸如《<全国总书目>与图书馆文献资源建设》一文就引用此比例来说明《全国总书目》“文献覆盖率不理想”。
其六,全面覆盖说。《<全国总书目>与图书统计》一文认为,《光明日报》、《人民日报》、《文汇报》登载的文章说中国出版的图书种数大大高于《全国总书目》收录的数量,“个中原因很难理解。因为《全国总书目》‘是一本年鉴性质的综合性图书目录,它全面系统地反映了每一年度全国图书的出版情况。如果其他资料与《全国总书目》的统计数字差别太大,人们就会有理由怀疑《全国总书目》的全面系统和权威性了。”此说暗示《总目》图书全面覆盖。
其七,数量模糊说。《中国学术著作:现状反思与未来之路》一文提到“国内出版的学术著作品种数量多”,但具体是多少数量,没有明说。
综上所述,1)有关图书、学术图书、文科学术图书的数据是研究者和实务工作者都十分关注的问题。2)推估数据填补空白,聊胜于无。在国家出版管理部门没有对学术图书等进行专项统计的情况下,研究者不辞辛劳,不惧工作量大,根据国家出版部门发布的所有图书的权威数据,自行推估出学术图书、文科学术图书等数据,以应研究和管理工作之急需,此举具有积极意义,其勇于探讨的精神值得充分肯定。3)一些研究者对国家图书种数数据和《总目》收录图书种数数据的关系,对图书种数(总量)、初版图书种数、重版图书种数、重印图书种数及其相互对应关系认识不一。4)有关推估数据的详细方法、涉及的统计项目的概念大多没有说明和界定。总体看来,尽管以上这些数据和研究存在一定问题,但是仍具有相当的合理因素,可为笔者深入研究提供积极的帮助。
3图书、学术图书、文科学术图书等种数的考证
为了验证上述各种数据及比例的可信度,下面分别从国家图书种数、《总目》收录图书种数和《全国新书目》图书种数数据进行统计与分析。
3.1中国国家图书种数统计数据的整理与分析
尽管中国国家出版管理部门没有专门统计学术图书等的品种数量,但是每年8月左右均要发布上一年全国新闻出版业基本情况,列出图书出版种数(总量),包括初版图书种数、重版图书种数、重印图书种数,并按22个学科统计图书和初版图书种数。这些数据为推算学术图书等种数提供了可靠基础。根据国家出版管理部门发布的1995—2005年数据,整理后可得表1。
从表1可见,1995—2005年全国图书总量为1696766种(包括重版、重印图书)。如果从中扣除自然科学类图书(按上文第四种观点“76%说”,即文科图书占76%,自然科学图书占24%),根据最保守的估计,自然科学图书占30%的话,那么文科图书至少有1187737种,比《中国哲学社会科学类学术图书基本书目(1995—2005)》(以下简称《基目》)一书根据各种书目统计的文科图书约72万种(包括重版、重印图书),要多出约46万种,说明各种书目的文献覆盖率与实际图书数量有不少差距。《基目》从72万种图书中选出学术图书126118种,“学术图书总量高于总出版量的1/6(实际为1/5.7)”,照此算来,1187737种文科图书中应有学术图书208374种。考虑到《基目》所选学术图书126118种中不包括本科以上的教材、学术性的工具书等,因此,1187737种图书中学术图书至少是208374种,实际数量应更多。从表1还可看出,重版和重印图书种数较多,达71万多,仅比初版图书少27万多种,如果忽视重版和重印图书种数,统计的数据或数据比例的差别将会有很大误差。
上文提到,“30%说”认为2005年38573种、2006年39079种、2007年40000种。从表2可知,这些学术图书的数据是通过2005、2006和2007年的初版图书总量乘以30%得出来的。即:2005年初版图书总量128578×30%=38573种;2006年初版图书总量130264×30%=39079种;2007年初版图书总量136226×30%=40867种。但是,十分遗憾,许多作者和媒体记者未经考证,将2007年的学术图书4万种,误读为近期(2012或2013年)的数据。根据表2可知,若以30%计算(实际上随着社会和学术的发展,每年学术图书的比例是变化的),2012年学术图书应为72595种,2013年应是76794种,这比4万种多了3万多种。
那么,文科学术图书是多少种呢?是否是22000种左右呢?根据上面的计算,22000种恐被低估。从表2可知,各年平均文科图书(含重版重印)占图书种数总量的76.40%。若以文科初版图书占初版图书种数总量的比例算,也可以得出大体相当或略高的数据。例如,2013年文科各学科初版图书总量为205295种,详见表3。全国初版图书种数为255981种(见表2),那么,文科初版图书种数占全国初版图书种数百分比是:205295/255981=80.2%。所占比例还高于76.40%。
汪:文科类依据中国标准书号的22类选择而定。
数据来源:2002~2013年全国新闻出版业基本情况EEB/OL].[2015—07—201.http:∥www.xwcbj.gd.gov.cn/news/html/qgtj/index.html.
从表3可知,2013年文科图书种数是353412种,而文科初版图书种数为205295种,二者相差15万种之多,而这15万多种,即为重版和重印书的种数。如果认为“综合类”不完全属于文科图书,则可将其删除,因只有几千种,影响有限。这样文科图书占比为(205295—2534)/255981=79.2%,仍高于76.40%。顺便指出,国家图书种数统计分类依据是中国标准书号的22类,有些分类存在不少问题。比如,“谈学术出版的问题与机遇”一文曾谈到“人文社会科学的一些书,像社会学,我们在图书馆的分类里是归到社会科学的综合类,而综合类里边没有再分。”这意见是很对的。不仅如此,在文化、科学、教育、体育类中,包含的学科太多,诸如新闻学、出版学、图书馆学情报学、教育学、体育学等,每个学科没有进行单独分类统计,如要使用专类数据,则很不方便。
再有,全国出版统计资料上将“图书”又分为“书籍、课本、图片”三个亚类分别统计:2013年图书总量是444427种,其中,书籍是356122种(初版225030种,重版、重印131092种);课本87509种(初版30385种,重版、重印57124种);图片796种(初版566种,重版、重印230种)。由于“课本”中有许多是高校本科及以上教材,“图片”数量很少,因此此次推算未采用“书籍”的数据。“书籍”与“课本”似不能并列,因为“课本”也是“书籍”。“图书”与“书籍”一般场合下经常通用,硬将二者形成上下位类关系,十分别扭,易产生歧义,建议修改。
文科图书中一般通俗读物、中小学课本、教辅等非学术图书有不少,但文科图书基数大,且文科各学科的研究成果还是以图书形式反映为多,而自然科学主要以期刊论文来反映。根据表2,2013年全国初版图书是255981种,以本文前部的第一种观点“30%说”(学术图书占比30%)计算,学术图书是255981×30%=76794种,再按第二种观点“4万多种与22000种左右说”,即文科学术图书占比为22000/40000=55%,那么,“文科学术图书”应为76794×55%=42236种。从表3看,2013年文科初版图书有205295种,如果以“30%说”(学术图书占比30%)计算,“文科学术图书”应为205295×30%=61528种。根据课题组对2014年《全国新书目》中28745种学术图书进行分类统计,发现文科学术图书有16644种,占比为57.90%,以57.90%计算,76794×57.90%=44464种。这三种算法所得到的种数在4万到6万之间,都远大于2。2万种(见表8和表9),说明目前文科学术图书2。2万种确实被低估了。
3.2《全国总书目》收录图书种数的统计与分析
国家图书种数统计数据具有可靠性和权威性,但在使用数据时,要特别注意图书种数(总量)、初版图书、重版、重印图书的种数数据的关系,不能张冠李戴,否则极易出错。同样《总目》是年鉴性编年总目,自1949年以来逐年编纂,以中国版本图书馆征集的样本为依据,收录当年中国出版的公开发行和只限国内发行的各种文字的初版和重版图书,也收录中小学、师范学校、业余学校教学用书。由于各种原因,《总目》收录的图书总数及初版数、重版图书种数总是小于国家图书种数及初版图书种数和重版、重印图书种数。且《总目》不包括重印书,而国家图书种数统计中却包括重印书(与重版书混合在一起),二者不对称。例如,《总目》收录2002年出版的图书共计102515种,其中初版图书93422种,重版(改版)图书9093种;而国家图书种数2002年共计170962种,其中初版图书100693种,重版重印图书70269种。可见,国家图书种数、初版图书种数均高于《总目》收录的相应种数,重版重印图书70269种也大大高于《总目》重版(改版)图书9093种,但“70269种”中有多少是重版图书,没有分开统计的数据,因此二者统计事项不对称,不能直接对比。具有可比性的是国家图书种数中的总种数、初版种数和《总目》中的图书总种数、初版种数(见表4)。
从表4可知,如果要计算每年有多少新书,应以初版图书种数来算,不能用图书种数(总量),因为图书种数(总量)中包含大量的重版、重印书。从历年情况看,1949—2013年初版图书种数是3445086,而图书种数(总量)是5732887,比初版图书多了200多万种。这些重版重印书的数据量很大。当然,重版图书是否属于新书,同行中有争议,因为重版的图书中一般要有25%的内容有改动。这个问题因为篇幅暂且不论。关键的问题是,在全国图书种数(总量)中,重版和重印书的数据是合并统计的,所以无法知道重版书与重印书各是多少种,也就不能将全国初版图书和重版图书种数相加后与<<总目》收录种数(初版书和重版书种数)直接相比。如果将《总目》图书种数(初版书和重版书种数)直接与全国图书种数总数或全国初版图书种数相比,就会出现比例过低,如42。35%,或过高,如113.20%等不可能的反常情况(见表5)。
至此可以看出,“54%—78%说”是用《总目》收录的图书种数(总量)(初版书和重版书种数)直接与国家出版部门发布的图书种数(总量)对比所得出的比例,数据选择不妥,导致比例数偏低。刚才分析过,分母中包含了“重印书”种数,分母量大,其值则低。全国图书种数(总量)中包括初版书、重/改版书、重印书三类,且重/改版书和重印书合在一起统计,而《总目》仅包括初版书和重/改版书二类,二者不对称。因此,应将《总目》收录的初版图书与国家出版部门发布的初版书种数相比才合适。如果这样计算,则《总目》收录的初版图书种数占全国初版图书种数的比例会增加不少。平均比例从56.80%增加到86.23%,详见表6。
误用全国图书种数总量统计数据的一个典型事例是记者在《光明日报》(1989年9月16日第2版)“出版事业专版”中使用的数据:“据统计,我国自西汉以来的2100年间,共出书90多万种。新中国40年就出版88万多种。近10年的成就尤其引人注目,1978年出版图书14987种,到了1988年已达65962种。十年累计种数410544种。”。一些同行曾发文对此数据提出质疑。他们利用《总目》收录图书种数数据来论证,认为1949—1977年473582种,1978—1988年410544种,此数据不可靠。他们的质疑精神是可取的,但他们没有指出88万多种之所以数据太大的要害是因为在图书总数中包括了大量的“重版书和重印书”。他们认为《总目》收录的数据是“全面系统和权威的”。但他们不了解《总目>>收录的呈缴本并不全面,由于各种原因,《总目》收录的图书种数要少于国家图书种数统计数据。他们也不清楚《总目》收录的初版书应该与国家初版图书种数相比,不能与国家图书种数总量相比。从表4可以计算出,1949—1977年全国初版书应为314290种,1978—1988年应为304271种,二者合计为618561种,比《光明日报》文章中所说的1949—1978年图书总量884126种少了265565种,这265565种就是图书总量中的重版图书种数和重印图书种数之和。