叶继元
文献计量学对文献整理的作用与展望(摘要)
叶继元
报告主要从四个方面进行阐述:一是文献计量学的定义和概述;二是网络计量学及补充计量学(Altmetrics)的发展;三是文献计量学对文献整理的发展;四是文献整理实务与研究展望。
(一)相关概念的辨析
文献:记录知识的一切载体(国标);用一定的技术手段把一定的信息内容记录到一定载体形成的存储性传递媒介(《图书馆学情报学词典》)。结合这二个定义,参考目前文献的实际情况,可以将定义修改成:文献是记录知识及某些信息的一切载体。
文献学:以文献典籍整理为主要研究对象的学科。内容包括文献鉴别、校雠、分类、编目、辨伪、辑佚、传播编纂学等。其任务是系统记录研究结果,以反映一定历史时期、一定学科的学术内容,为读书治学提供门径。具体说就是通过对文献的整理、编纂、注释,使之条理化、系统化,去粗取精,去伪存真,条别源流,甄论得失,为科学和文化建设服务。
文献计量学:用数学和统计学的方法,定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体,注重量化的综合性知识体系。其计量对象主要是:文献量(各种出版物,尤以期刊论文和引文居多)、作者数(个人、集体或团体)、词汇数(各种文献标识,其中以叙词居多)。文献计量学最本质的特征在于其输出务必是“量”。目前,文献计量学已成为图书情报学和文献学的一个重要学科分支,也是专门、重要的研究方法,国内外研究活跃。
(二)文献计量学发展简况
20世纪初已经有人用定量的方法来研究文献,最早是对自然科学文献的研究,后来扩展到社会科学文献。60年代末,从“统计书目学/文献统计学”,定名为文献计量学,并把研究对象由期刊扩展到所有的书刊资料。
文献计量学的专业期刊,国外有《科学计量学》、《网络计量学》(电子期刊)和《信息计量学杂志》。
有关文献计量学的国际会议,1987年在比利时召开第一届国际计量学与情报检索理论会议。近年来,每两年举办一次会议。我国的大连理工大学有一支实力较强的文献计量学团队,2009年承办过一次国际会议。
(三)文献计量学的相关定律及其应用
文献增长定律(普赖斯定律)对图书馆资源建设,馆藏收集政策以及经费预算有指导作用;
文献老化定律通过文献的利用和引用数据,计算文献半衰期,定量地衡量文献老化程度,对于图书馆藏书剔旧、清点等有一定意义;
文献集中分散定律(布拉德福定律)对核心期刊的收集、利用有很大作用;
文献引用定律(加菲尔德)的引文分析,对回溯检索、学科、作者影响力评价;
洛特卡定律的作者分析,对于专家影响力进行评判;
齐普夫定律的词频分析,找出高频词和常用词,对建立检索系统等,都有很大意义。
互联网的出现彻底改变了人们的生活与工作方式,网络增长定律、网络价值定律和摩尔定律的出现,促使了网络计量学的发展,而网络上不仅有利用,还有各种评论、点赞,各种交流的痕迹,这些都可以收集起来,进行分析和利用。国外创造了一个新词,即补充计量学。补充计量学重视基于社交网络数据的计量指标,线上线下的所有数据。网络计量学和补充计量学的出现使得传统的文献计量学有所发展。但报告同时以国内四个引文库为例,通过对它们的对比介绍,指出网络计量学、补充计量学,其可信度问题,统计数据源的不确定问题,统计指标的规范性问题,以及验证性的问题,包括权威的计量工具的问题,尤其在我们国家还有较大的研究和发展空间。
文献计量学的很多定义直接来源于文献整理工作,因此,文献计量学必然作用于文献整理工作,主要归纳为六点:
1、指导性。文献计量学为文献整理提供了理论依据,具有指导作用。
2、方法论。文献计量学对于怎么分区,怎么统计,怎么选择数据源,都有相应的方法要求和规定。
3、精细化。文献计量学可以定量测度,它可以具体到每个数据。
4、整序性。文献整理很重要的标志就是有序化,而分类、标引最主要的功能就是排序,或者内容排序,或者形式排序。
5、宏观分析。文献计量学可以分析、归纳出研究对象的总体走向。
6、微观评价。可以精细定位,为专家评价提供参考。
当然,这些作用的发挥离不开内容分析法、引文分析法、著录法等文献计量方法的支撑。报告同时对文献整理的案例——目录、索引等二次文献以及参考文献著录规则、规范,引文的目的、作用,索引的发展及编制等进行了详细介绍。
另外,报告对目前计算机编目中存在的问题也进行了分析,认为计算机能做的就要计算机做,但是复杂的、关键性的、人工智能尚未能做的工作还是要人工做,专家还是不可或缺的。不排斥编目工作外包,但要重视原编,图书馆应该有专家来控制外包编目数据的质量。
2013-2016年间国家社科基金和教育部文科项目中,有关文献整序与整理的重大课题就有120多项,涉及各学科领域,充分证明了文献整理的学术地位。文献整理是研究的基础,是研究工作不可分割的一部分;各学科、各领域有大量文献待整理;有文献整理才有学术积累,也才有学术创新;图书情报学、文献学、文献计量学在文献整理方面有独特的优势;既懂文献学又精通某一领域的专业人才将大有用处。另外,通过这些重大课题,我们也可以总结研究趋势,拓宽研究思路,为今后的研究指明方向。
随着信息化的迅速发展,在大数据时代,文献计量学将有更大的发展,图书情报文献学的核心内容——文献整理将大有用武之地,“图情学文献学+”将带来新的机遇。
Q1:叶老师,您好!您今天讲的非常精彩,以前我对文献计量学不了解,今天听了之后感觉还是挺有意思的。我有两个问题,一个是关于文献计量学的几大定律,像二八定律,我看到一个说法,像我们娱乐节目中的爆款产品,这些背后的原理是不是因为人的注意力是有限的,所以人的注意力被爆款产品全部吸引过去了?第二个问题是关于补充计量学,它好像跟现在特别火的大数据关系很密切,它们之间是不是有什么结合或者相关性?谢谢!
叶继元:好的,谢谢!第一个问题,二八定律也好,或者我们文献计量学的布拉德福文献集中与分散定律也好,在社会现象中也是有反映的。至于爆款产品的原因,实际上是马太效应,马太效应就是越有就越有,它有了以后就有很多资源,像宣传资源,这是一个很重要的现象,不管是产品也好,娱乐界也好,收视界也好,还是文献也好。但我们知道,马太效应有正面影响,也有负面效应,负面效应就是大家全部聚在一起,同质化,像核心期刊的采集就发现这种问题。我们知道核心期刊可以节省经费,对我们采购有好处,因为用少量的钱得到了更多的信息,但各个图书馆如果都是一样的,我们叫千刊一面,没有个性化,这样从整体来说就不好了。所以大家不知道有没有关注到,现在非核心期刊的生存就很困难,包括一些内部期刊,它们的生存有问题,因为整个的评价体系对它们是不利的,但是非核心期刊是不是就没有作用呢?它们还是有的,它们里面也有好文章,而且非核心期刊也在发展,它们更大的作用是衬托核心期刊的存在,核心期刊与非核心期刊是相辅相成的,所以从这个角度讲,非核心期刊是有作用的。所以我们最近在关注这个问题,就是怎么使非核心期刊生存下去,而后还有发展,因为核心与非核心是动态变化的,因此就要遏制马太效应的负面影响,包括学术评价也是这样,著名学者做出成绩,会对他今后写的东西有影响,但不是篇篇都有影响,因为学术研究是项复杂的劳动,这就说明对马太效应我们要正确对待。我顺便提一句,在网络条件下产生的长尾理论,这个理论实际上是反二八定律的,在网络条件下,百分之八十的产品也有可能带来可观的利润,这一现象原来我们都忽视了,认为百分之八十没什么用,实际上是不对的,网络条件下,营销非常方便,销售渠道也畅通了,信息交流也方便了,有可能积少成多。因此任何理论都有一定的约束条件,我们要灵活运用。
第二问题,关于大数据与补充计量学的关系。网络计量学本身就是随着大数据的出现而出现的,随着网络的出现而出现的,现在我们任何人在网络中做事情都会留下痕迹,打电话、买东西、吃饭,饭卡中每天吃掉多少钱,像这种,都会记录下来。学术活动更是这样,它不仅是引文,引文只是一种行为,现在的学术交流、点赞、口头发表,过去都被忽视了,因为它们不容易留下来,而现在留下来了,都可以作为数据,作为统计的数据、评价的数据,所以二者有直接的关系。其实数据本身早就有了,中国人口这么多,过去当兵、打仗都有人名册,但统计缺漏比较多,因为当时都是手工统计。除了大数据,我们现在还有小数据的概念,我们讲数据只管相关性,不管因果性,但现在这一点需要反思,因为实际上最终还是要管因果性,因果性是我们科学研究的一个重要方面。当然大数据强调某一事物的全面数据,反映整体情况,这与补充计量学注重各种利用数据,尤其是网络数据有几位密切的关系。大数据热有热的道理,热了以后我们还要反思,看看它究竟能解决哪些问题。
(上海师范大学图书馆 唐晓艳、许晶晶整理)