刘 双,钱澄澄,王德广
(1.徐州医科大学 图书馆,江苏 徐州 221004;2.空军勤务学院 图书馆,江苏 徐州 221000)
图书内容索引,又称书后(末)索引,一般置于书后,作为原书的一个组成部分随书出版,以书的附录形式出现,摘记书中的知识单元或事项为条目,表明页码出处,并按一定次序编排,以方便查检该书内容的附属性资料[1]。它对促进知识信息交流、提升科学研究水平、改进学习研究效率、促进图书市场繁荣等方面具有非常重要的作用[2]。图书内容索引编制有无以及好坏对增加图书价值(包括学术价值和经济效益)、评判图书质量、评价文化工作者学术素养、净化图书市场等方面具有重要的参考与应用价值[3],是反映图书出版事业真正繁荣昌盛的重要指标[4]。
长期以来,图书内容索引在西方国家受到广泛重视[5],索引工作是其索引实践和索引普及的出发点[6],西方读者习惯于使用图书内容索引来检索自己所需的内容。在国外尤其是美国、加拿大、英国、澳大利亚、新西兰、南非、日本等国际索引联盟成员国,不附内容索引的图书是难以正式出版的,即使出版了图书馆也不予收藏[7]。事实上,研究表明,随着17世纪近代科学诞生以及随后的大科学时代到来,西文著作从19世纪末、日文著作从20世纪初便开始普遍重视编制书后内容索引的工作[8],前50年有内容索引的图书占的比率尚略有起伏,进入50年代后呈现逐年稳定上升的态势,从70年代起即超过了全部图书的90%[9]。
我国近代索引理论方法来源于欧美国家,在20世纪20-30年代才从古代索引过渡到近代索引,并逐渐形成一个索引运动[10]。陈永山对1891-1980年我国出版的1 774种中文图书进行统计,分析表明有图书内容索引的仅占总数的18%左右[11];纪晓萍1994年对长春市图书馆馆藏六个大类我国作者编著的1 454种图书的调查显示,有图书内容索引的仅占总数的1.2%[12];周柏康对2004年1 064种中文新书(不含工具书)的统计表明,有内容索引的图书仅33种,占全部样本的3.1%,此外还针对2013-2014年出版的52种图书进行了微调查,有编制内容索引的图书仅占比5.8%[13];余美萍2017年针对中山图书馆馆藏六个大类我国作者编著的1 056种图书进行调查,结果显示有内容索引的图书占3.5%[14]。由此可见,数十年来发展至今,中文图书内容索引发展相对缓慢。
图书内容索引编制是国际著作通行的惯例,是图书结构规范化和标准化的要求,在学术著作、大型书稿中通常都要求在书后附有索引[15]。注重经济效益与自己声誉的西方出版机构与著作者本着服务读者为宗旨的理念,在图书的内容索引上肯下功夫,绝大多数图书著作都附有内容索引,普及率很高,并且种类不一而全,质量较高。相反,我国图书内容索引除了国家没有强制规定、宣传不足,技术研发资金与人员投入不足,内容索引编制繁复耗时、出版时间与经费的限制等客观原因外[16],相比西方发达国家,我国出版社、著作者等缺乏对内容索引编制的意识与共识,从而没有形成高度的行业自律,更重要的是没有充分认识到当前我国图书内容索引编制现状所面临的严峻形势等主观因素才是导致我国图书内容索引发展缓慢的主要原因,而目前又缺乏较为客观、全面、真实反映我国图书内容索引发展现状的理论尤其是实证研究。
目前的主要问题表现在:涉及我国图书内容索引现状研究图书抽样基数偏少,抽样存在人为因素(如喜好、学术背景等)、环境因素(馆藏特点、馆藏量等)等,不能完全反映出我国图书内容索引编制的整体现状与趋势;图书抽样覆盖中国图书馆图书分类法所涉及的基本大类偏少,不足以反映我国图书在每个基本大类下内容索引编制的现状以及发展特点;没有就《中国图书馆图书分类法》基本大类直接展开的子类目下图书内容索引编制现状进行过相关研究,从而没有子类目下图书内容索引编制现状的相关成果内容;从而不能够有针对性地提出推动我国图书出版内容索引快速发展的解决路径。
本文将就以上问题以中文图书大数据[17-18]为研究对象,深入开展我国图书内容索引发展变化规律理论与实证分析研究,以期给出促进我国图书内容索引快速发展的解决路径,推动我国图书出版结构的规范化与标准化,提升参与国际的竞争力,引导图书出版行业健康有序的发展,这对实现我国从出版大国到出版强国、提高民族创造力、提升国家文化软实力、增强文化自信、建设社会主义文化强国具有重要现实意义[19]。
本文选择《中国图书馆分类法》[20]包含的基本大类(下文称“大类”)和由基本大类直接展开的一级类目(下文称“一级类目”)作为数据采集、处理与分析的参照属性。由于军事大类图书流通少、收集困难且涉及保密信息等原因,所以本文将覆盖剩余的21个大类和由大类直接展开的241个一级类目,其中大类具体为“工业技术”“航空、航天”“环境科学、安全科学”“交通运输”“经济”“历史、地理”“马克思主义、列宁主义、毛泽东思想、邓小平理论”“农业科学”“社会科学总论”“生物科学”“数理科学和化学”“天文学、地球科学”“文化、科学、教育、体育”“文学”“医药、卫生”“艺术”“语言、文字”“哲学、宗教”“政治、法律”“自然科学总论”“综合性图书”。
本文从时间与图书类目角度对图书和含有内容索引图书的册数分别进行采集。考虑数据采集过程用时长和数据库动态实时更新等原因,本文对1989-2016年共28年的数据进行统计,时间区间覆盖我国改革开放以来图书出版行业的历史演变和学科发展的兴衰变化[21]。同时为了避免图书重复计算,采用单一来源自底向上的方式进行数据统计,进而可对238个一级类目下从1989-2016年每年分别收录图书和含有内容索引图书的册数进行采集,最终汇总形成21个大类自1989-2016年每年分别收录图书和含有内容索引图书的册数以及1989-2016年我国分别收录图书和含有内容索引图书的总册数。(1)选择超星信息技术发展有限责任公司旗下“读秀学术搜索数据库” 作为开展中文图书大数据收集的载体工具。
由于图书出版有一定周期,为了避免一级类目下采集得到的相关图书册数波动较大影响数据分析结果的真实性,所以本文对238个一级类目下从1989-2016年采集得到的图书和含有内容索引图书的册数进行单双年合并,得到14个采集时间周期对应的238个一级类目下图书和含有内容索引图书的册数,其中单双年合并得到的14个采集时间周期。此外,我国图书出版数量的整体上升带来了含有内容索引图书册数整体上升,这种现状不足以客观、全面、真实反映出我国图书内容索引发展现实情况以及所面临的严峻形势,仅对含有内容索引图书册数进行分析不利于提出切实可行的应对策略,因此,针对采集得到的数据采用“内容索引图书比”(2)“内容索引图书比”是在同一个采集时间周期同一类目下通过用含有内容索引图书册数除以相应的图书册数得出的结果。作为数据分析的数据源,最终可得到21个大类与238个一级类目下对应14个采集时间周期内容索引图书比数据。
选用EXCEL(2007)和MATLAB(R2016a)作为数据采集与处理、绘制图表的软件,选用PHOTOSHOP(CS2)作为图像处理的软件,选用SPSS(18.0)作为数据分析的软件。由于数据采集过程是定向大样本量非概率性抽样问题,选择未假定方差齐性Games-Howell方法作为显著性配对分析方法,选择Spearman秩相关系数作为相关性分析方法,条件设置为双侧检验[22]。
根据对采集得到的数据整理得出,1989-2016年图书和含有内容索引图书的总册数分别为4 028 354册和100 284册,内容索引图书比为0.024 9,其中1989-2016年21个大类内容索引图书比分别为工业技术0.050 8(24 369/479 672),航空、航天0.026 9(130/4 833),环境科学、安全科学0.019 1(411/21 545),交通运输0.012 2(470/38 429),经济0.018 1(7 253/401 570),历史、地理0.025 6(8 541/333 104),马克思主义、列宁主义、毛泽东思想、邓小平理论0.031(379/12 244),农业科学0.027 7(1 948/70 242),社会科学总论0.02(1 691/84 516),生物科学0.097 8(3 214/32 863),数理科学和化学0.059 1(3 728/63 054),天文学、地球科学0.028 6(948/33 120),文化、科学、教育、体育0.011 8(7 190/611 176),文学0.005 7(3 587/629 373),医药、卫生0.061 1(12 455/203 768),艺术0.012 3(3 467/282 510),语言、文字0.029 3(6 484/221 133),哲学、宗教0.027 7(4 032/145 505),政治、法律0.023 1(6 290/272 374),自然科学总论0.038 8(623/16 045),综合性图书0.043 1(3 074/71 278)。根据图1,采集整理出所有图书册数随14个采集时间周期呈现上升发展趋势,其中21个大类随14个采集时间周期的图书册数变化趋势与所有图书变化趋势保持一致,这与我国出版图书册数呈现整体上升的实际情况相符[23]。
Fig.1 The development trend of the number of books with 14 collection time periods图1 图书册数随14个采集时间周期发展变化趋势
根据数据处理得到的数据,绘制21个大类以及采集得到的所有图书分别随14个采集时间周期内容索引图书比发展变化曲线和含有内容索引图书册数发展变化曲线,并绘制相应曲线的线性趋势线(直线)。如图2所示。
Fig.2 The ratio of content index books (blue) and the number of books with content index (red)图2 内容索引图书比(蓝)与含有内容索引图书册数发展趋势(红)
21个大类含有内容索引图书册数在每个采集时间周期点上在0~3 000千册之间变化,并且随14个采集时间周期均没有呈现下降趋势,除综合性图书大类与马克思主义、列宁主义、毛泽东思想、邓小平理论大类呈现波动变化以及自然科学总论大类呈现微弱上升趋势外,其余18个大类都呈现明显上升趋势,这与所有图书中含有内容索引图书册数随14个采集时间周期呈现出明显上升趋势保持一致。这说明随着我国出版图书册数整体上升,含有内容索引图书的册数相应地呈现出上升趋势,每个大类中含有内容索引图书的册数也基本全都相应地呈现出上升趋势。然而21个大类内容索引图书比数据随14个采集时间周期除“天文学、地球科学”“航空、航天”“政治、法律”“艺术”4个大类呈现上升趋势外,其余17个大类全都呈现下降趋势。由于呈现上升趋势的4个大类涉及内容索引图书比为0.018 3,低于所有图书对应内容索引图书比的0.024 9,因此,不会对所有图书对应内容索引图书比随14个采集时间周期呈现出的下降趋势造成影响。这说明相比于我国出版图书册数的整体上升,含有内容索引图书的册数并没有实质性的上升,而是下降了且下降趋势非常明显。此外,虽然“天文学、地球科学”“航空、航天”“政治、法律”“艺术”4个大类含有内容索引图书册数呈现出了实质性的上升趋势,但由于这4个大类各自含有内容索引图书册数在每个采集时间周期较上一个采集时间周期增幅不大,所以上升趋势并不明显。
特别在2005-2006年采集时间周期点及其以后,21个大类除“天文学、地球科学”“交通运输”“马克思主义、列宁主义、毛泽东思想、邓小平理论”“环境科学、安全科学”4个大类内容索引图书比呈现下降趋势和含有内容索引图书册数呈现上升趋势,以及航空、航天1个大类内容索引图书比和含有内容索引图书册数均呈现上升趋势外,其余16个大类内容索引图书比和含有内容索引图书册数全都呈现下降趋势。由于航空、航天大类含有内容索引的图书总册数仅为130本,“天文学、地球科学”“交通运输”“马克思主义、列宁主义、毛泽东思想、邓小平理论”“环境科学、安全科学”4个大类含有内容索引图书的册数并没有实质性上升,因此这个5个大类不会对所有图书对应内容索引图书比和含有内容索引图书册数在2005-2006年采集时间周期点及其以后均呈现出的下降趋势造成影响。这说明相比于我国出版图书册数的整体上升,含有内容索引图书的册数在2005-2006年采集时间周期点及其以后呈现出绝对下降状态。而在2013-2014年和2015-2016年两个采集时间周期上,21个大类含有内容索引图书的册数虽然全都呈现出下降趋势,但所有图书对应的内容索引图书比却呈现上升趋势(3)数字化出版技术逐渐成熟,电子图书出版数量正呈现上升趋势,数字化出版环境有利于图书内容索引的编制。,这说明我国数字化出版正对纸质图书出版产生的冲击[24],在某种程度上对含有内容索引图书的出版产生了影响。
为了能够严格区别21个大类间和大类对应一级类目间含有内容索引图书册数随14个采集时间周期发展现状情况,以便整体把握和深入认识21个大类间含有内容索引图书发展现状的相互差距,对内容索引图书比数据进行显著性分析。
通过显著性结果和均值差对21个大类进行排序,顺序为“生物科学”“医药、卫生”“数理科学和化学”“工业技术”“综合性图书”“自然科学总论”“马克思主义、列宁主义、毛泽东思想、邓小平理论”“语言、文字”“天文学、地球科学”“农业科学”“哲学、宗教”“历史、地理”“航空、航天”“政治、法律”“环境科学、安全科学”“社会科学总论”“经济”“文化、科学、教育、体育”“交通运输”“艺术”“文学”。由此可见,生物科学大类与文学大类分别在所有21个大类中含有内容索引图书发展现状是最好的与最差的。
为了能够分析21个大类含有内容索引图书册数在14个采集时间周期之间相互之间的变化规律,通过深入挖掘大类中的典型代表以便为我国图书内容索引推广找准切入点,对21个大类内容索引图书比数据进行相关性分析。
通过对每个大类与其他大类的相关性系数以及显著性结果的比较,得出每个大类含有图书内容索引发展变化与其他大类相关性程度的排序,顺序为“语言、文字”“生物科学”“交通运输”“医药、卫生”“数理科学和化学”“农业科学”“文化、科学、教育、体育”“文学”“综合性图书”“工业技术”“自然科学总论”“经济”“环境科学、安全科学”“社会科学总论”“历史、地理”“马克思主义、列宁主义、毛泽东思想、邓小平理论”“天文学、地球科学”“哲学、宗教”“航空、航天”“艺术”“政治、法律”。因此,语言、文字与政治、法律两个大类是反映我国出版含有内容索引图书发展变化规律的典型代表。
图书内容索引编制是一项专业化程度高、牵扯业务面广且涉及多方利益的工作。我国现有的社会职业中没有索引员,图书出版等业务部门一般也没有配备专职索引员,也不存在职业索引员相关认证制度。在内容索引编制过程中需要出版、编辑、图书、情报、学术研究等业务部门以及相关行政管理部门参与进来,通过著作者、研究者、翻译者、索引工作者以及读者的齐心协力,完成图书内容索引工作的编制。因此,为了改变我国图书内容索引的落后面貌,必须优化图书内容索引工作内、外部环境,切实重视图书内容索引工作,促进这一工作规范化与标准化,提出适合我国图书内容索引发展现状与规律的推广与普及策略。
4.1.1 数量偏低且形势严峻
笔者采集整理出的4028 354册图书中,含有内容索引的图书仅为100 284册,内容索引图书比为0.024 9,即平均每一百册图书中含有内容索引的册数仅约为2.5册,即便是整体发展现状比较好的生物科学大类图书,每一百册图书中含有内容索引册数平均也未到10册,这与发达国家出版含有内容索引图书比率达到90%以上形成鲜明对比。从整理得到的所有图书对应内容索引图书比和含有内容索引图书册数随14个采集时间周期发展趋势可以看出,虽然我国出版含有内容索引图书的册数呈现上升趋势,但是我国平均每出版一百册图书中含有内容索引册数从1989-1990年采集时间周期点的接近3册却逐渐下滑到2015-2016年采集时间周期点的不足2册,明显低于所有图书的平均含有内容索引的2.5册,这说明我国图书内容索引发展落后的现状,并没有因为国家实力逐渐强大、社会制度逐渐完善、经济总量不断增长、技术研发不断进步与人力资源不断增多而得到明显改善,反而越发不如从前,反映出我国图书出版结构不规范、不标准的程度越来越严重;随着我国每年数十万册图书的出版,图书内容索引编制现状依然没有改变,反而逐渐形成“出版大国,索引小国”的尴尬局面,与发达国家差距越发巨大,形势极其严峻。而根据我国目前图书内容索引编制现实状况,借鉴西方国家在保障图书内容索引健康发展所实施的法规政策,只有推动我国图书内容索引立法,强制规范或推荐相关图书编制内容索引才能出版,通过法律规范的强力约束,才能在较短时间内改变我国图书内容索引所面临的严峻形势。
4.1.2 未有实质性的改变
2006年,我国诞生了第一部图书内容索引专著《图书内容索引编制法》[1],同年由中国索引学会翻译并面向国内出版了国际标准ISO999-1996《情报工作和文献工作——索引的内容、组织和表示准则》[25]。2008年,国家标准化管理委员会正式发布了由全国信息与文献标准化技术委员会提出,中国索引学会、复旦大学、南京农业大学等单位起草的GB/T22466-2008《索引编制规则 (总则)》,并已于2009年4月1日起实施。2012年,国家新闻出版总署颁发了《关于进一步加强学术著作出版规范的通知》[26],指出索引与图书中的引文、注释、参考文献一样,要严格执行国家有关标准。根据对采集数据趋势的分析,在2005-2006年采集时间周期点以后,虽然我国出版含有内容索引的图书册数整体要比之前明显增多,但是我国出版图书册数整体较之前明显增多,出版含有内容索引图书册数较之前正呈现出下降趋势,最重要的是内容索引图书比数据整体要比之前明显减少而且呈现逐渐下降趋势。
因此,我国图书内容索引发展落后的现状,并没有因为这些对著作者、研究者、翻译者以及出版社、新闻出版局等业务、行政部门具有制度性约束力的文献规范化工作成果的出台而得到明显改善,反而呈现出倒退发展现状且表现明显,造成这种现状除了国家没有强制规定、宣传不足,技术研发资金与人员投入不足,内容索引编制繁复耗时、出版时间与经费的限制等原因外,相比西方发达国家,有些措施过于宏观、忽视市场经济力量、出版社、著作者等缺乏意识与共识、不区分各项措施的先后主次、没有形成高度的行业自律,更重要的是没有充分认识到当前我国图书内容索引编制现状所面临的严峻形势等原因有更为重要的直接关系[16,24]。所以,推动图书内容索引立法无疑将成为我国图书内容索引推广和普及的强劲东风,吹走一些人的偏见、疑虑、功利和懈怠,从而大大加快图书内容索引在我国的推广与普及和追赶世界水平的步伐。
根据文中数据统计结果,我国出版图书97%以上都没有内容索引,其中甚至存在翻译的外文书籍也删掉原书内容索引的情况,而目前一本图书有无内容索引不影响它的出版、流通、销售与收藏,所以著作者、翻译者与出版机构当然很少愿意投入额外的时间、精力与成本去编制图书内容索引,并且业务、行政管理部门疏于对图书内容索引功能的认识,一定程度上放松了对图书内容索引编制的监管,而这些消极的举动无疑最终损害了读者的利益,对读者在使用内容索引梳理和规整知识单元、提高信息获取效率、挖掘知识等方面造成极大的不便,不利于图书社会效益和经济效益的提升,更不利于提升我国图书的国际竞争力。 因此,图书内容索引编制要遵循本身应有的功能和价值,以满足读者基本需求为中心,以服务读者为宗旨,使得著作者、研究者、翻译者以及相关业务、行政主管部门切实维护好读者的利益,重视图书内容索引,提升图书质量,让图书内容索引成为图书出版必不可少的内容。
随着数字化出版技术的发展、读者阅读方式与行为的改变[27],电子图书正改变着我国纸质图书的格局。根据对2013-2014年和2015-2016年两个采集时间周期上的数据分析发现,我国纸质图书出版的数量正呈现出下降趋势,相应地含有内容索引图书的册数也呈现出下降趋势,但是内容索引图书比呈现上升趋势,这在某种程度上说明我国出版纸质图书数量的减少、电子图书数量的逐渐增多对含有内容索引图书册数产生了一定影响。由于数字化出版在很大程度上可以减轻图书内容索引编制的时间与成本,所以从长期来看,与纸电图书发生改变的格局一致,数字化图书内容索引比重将逐渐增多,纸质图书内容索引比重逐渐减少。因此,著作者、研究者、翻译者以及索引工作者要适应数字化出版给读者带来的阅读与行为方式的改变,相关业务与行政管理部门要及时创新数字化图书内容索引标准,使得电子图书内容索引编制符合时代发展的要求,借助数字化出版政策支持与资金投入的持续优化、大众日常网络阅读习惯的持续渗透以及信息化技术对数字出版的持续支撑等良好的氛围环境,采用创新索引原理、方法、技术、形式、选题以及引用内容索引不同结构等策略[24],使之更符合索引数字化的潮流趋势,做到切实重视数字化出版对图书内容索引带来的长远影响。
图书内容索引编制涉及著作者、研究者、翻译者、索引工作者以及读者等参与者和新闻出版局、出版社及各出版主管单位等业务、行政管理部门,专业化特征明显,信息化程度高,学科背景强且书目种类繁多。因此,开展我国图书内容索引编制普及与推广要做到统筹规划,要以覆盖所有图书为目标,参与者与业务、行政管理部门要以图书内容索引立法为依托,要从提高民族创造力、提升国家文化软实力、增强文化自信、建设社会主义文化强国的战略高度形成统一认识,严格执行国家有关索引编制相关标准,加强索引人才的培养,构建我国索引人员的认证制度,定期对从事索引编制工作的编辑人员进行培训,加大对索引软硬件编制等信息化工具的投入与研发,提升我国索引编制技术与水平。
开展我国图书内容索引编制普及与推广要做到分类实施、试点先行,应结合图书所属不同学科类别特点,以开展图书内容索引编制试点工作为实施途径,选择具有代表性分类目录下的图书开展内容索引编制工作的试点。如根据对我国图书内容索引发展变化规律的显著性和相关性分析,可以选择每个大类中具有显著性变化的一级类目开展试点,覆盖所有图书种类对应所有学科领域,也可选择生物科学与文学两个发展现状分别为最好的和最差的大类或者选择语言、文字与政治、法律两个反映我国图书内容索引发展变化规律具有代表性的大类开展试点。通过深入研究,解决试点图书类目下内容索引编制实施过程中面临的共同难题,求同存异,制定符合不同学科发展规律、适合不同学科领域的图书内容索引编制规范细则,全面扭转我国图书内容索引发展落后的局面。
我国图书内容索引发展非常缓慢,本文通过对中文图书大数据从时间和类目角度的比较与分析,得出如下结论:首先,我国出版图书中约2.5%的图书含有内容索引,数量极其偏低,形势非常严峻;我国图书内容索引发展落后的现状并没有因为有关图书内容索引政策、标准以及通知的出台而得到明显改善,反而呈现倒退的局面;唯有推动图书内容索引立法,才能迅速改变当前这种形势与局面;其次,在所有图书分类中,生物科学大类图书内容索引发展现状是所有图书大类中整体最好的,而文学大类是整体最差的;语言、文字与政治、法律两个大类是反映我国图书内容索引发展变化规律的典型代表;再次,我国出版图书97%以上没有内容索引直接严重损害了读者的利益;数字化出版技术将在不久的未来对图书出版和图书内容索引编制产生重要影响。上述结论对于我国图书内容索引推广与普及具有重要的政策含义,今后在注重图书内容索引编制量的过程上必然面临质的要求。一本图书含有内容索引的好坏是否对图书的价值、图书受欢迎程度、著作者的学术影响力以及图书市场繁荣程度等有无影响目前还有没有评价指标,而这些指标恰恰由读者的需求行为创造而又直接与著作者、研究者、翻译者以及出版商的学术与商业利益息息相关。因此,构建以反映读者需求行为用来衡量图书内容索引质量好坏的评价指标是后续需要研究的内容。