肖敖夏,杨思洛
学术图书是学术交流的重要途径之一,尤其在人文社科和艺术领域[1]。相较于学术期刊,学术图书的影响力评价并没有受到学者的重视。一方面,当前缺少一个针对学术图书的可靠且全面的引文索引系统,使得学术图书的影响力分析较难适应评价研究的发展[2];另一方面,不同于期刊论文一经发表便成定稿的特征,学术图书具有独特的文件类型属性,尤其当涉及图书的版本、翻译、丛书等情况时,对其进行影响力分析更加复杂[3]。目前使用较为广泛、基于引文的学术图书评价工具,主要是Web of Science平台推出的Book Citation Index(BKCI,图书引文索引),能够分别针对图书和章节,统计其被其他图书、期刊或会议论文等引用的情况。BKCI 存在很多问题。比如,BKCI 收录的图书以英文为主,其他语种的图书比例很小;BKCI图书的出版时间集中在2005年至今,在回溯性上存在不足[4]。
近年来,学术图书越来越多采用在线出版方式,为图书提供了广泛的传播途径,也为图书评价提供了新角度。基于新环境带来的新需求,在线评价指标Altmetrics 被Jason Priem 等提出[5]。Altmetrics 是一种基于社交网络的科学评价方法,它通过对科研成果的在线交流数据进行实时追踪与采集来实现评价。相较于传统计量方法,Altmetrics 更加全面、精确与多样[6],因而被迅速应用于学术成果的评价。随着Altmetrics的发展,基于在线交流的非引用型度量指标被提出并用于学术图书的评价。这一度量分为基于使用情况的指标和基于社交媒体的指标两种,主要包括书籍在相关平台的下载次数、读者标记数以及从社交媒体上收集的书籍被提及的频率等[2]。Bookmetrix 正是顺应这一趋势提出的,它是Springer Nature和Altmetric.com合作开发的图书评价指标平台,汇集了一系列性能指标,能够帮助人们了解相关图书在全球范围内的讨论、引用和使用情况。Bookmetrix包括CrossRef引用数(Citations)、Altmetric.com 的在线提及数(Online Mentions)、 Mendeley 的 读 者 标 记 数(Readers)、 Springer 的 评 论 数 (Book Reviews)、Springer 的下载量(Downloads)等 5 个指标[7]。它对传统的引文指标以及基于在线交流的非引用指标进行收集整合,能够从多维度对图书的影响力进行揭示。本研究的主要目的正是利用Bookmetrix 指标对Springer 学术图书影响力进行评估,并分析Bookmetrix 指标在多大程度上能对学术图书的价值进行评判。
利用Bookmetrix 平台,可以检索Springer Link数据库的书籍和书籍章节的各种评价指标,查找特定主题中最受欢迎的书籍和章节,并探索每个度量标准类别的最佳表现者。此外,通过Bookmetrix 还能够查看图书的影响、用途和范围。Bookmetrix 的详细信息页面显示各种书籍及其章节的所有可用数据,为每本书或每章节收到的引用数、读者标记数、在线提及数、评论数和下载量等5 大指标数据提供全面的概述[8]。Bookmetrix从Springer和CrossRef中检索书籍和章节元数据,然后从各种数据源聚合相关书籍和章节的度量,各指标说明详见表1。
表1 Bookmetrix各指标介绍[9]
笔者利用爬虫工具,从Springer Link 数据库平台(https://link.springer.com/)爬取各学科类别下学术图书的Bookmetrix 数据。为便于后续的分学科讨论,参考《中国图书馆分类法》五大部类分类思想和《杜威十进制图书分类法》10个大类的分类准则,将Springer 的24 个学科重新划分为人文学科、社会科学、自然科学、应用科学4个大类,并设置变量存储划分结果。以“1”表示人文学科,“2”表示社会科学,“3”表示自然科学,“4”表示应用科学,见表2。
表2 4个大类变量值及其对应的Springer学科类别
由表3可见,截至2019年3月22日,本研究共爬取Springer Link学科分类体系下的24类学术图书,并将其归为4 个学科大类,共得到239,032种图书。然后,将这些图书的Citations、Readers、Book Reviews、Downloads 和 Online Mentions 等 5 个 Bookmetrix 指标数据,导入SPSS Statistics软件,开展后继分析。
表3 学科数据量统计
对数据进行因子分析:提取能充分解释全部5个指标的因子个数,计算因子得分及其方差贡献率;利用得到的因子及个案因子得分,对因子赋予因子旋转后的方差贡献率作为各自权重,从而得到因子综合得分。通过计算因子综合得分,对Springer学术图书进行直观便捷的影响力综合评价,详见图1。
图1 Bookmetrix综合得分计算流程
(1)KMO样本测度和巴特利特球度检验。对数据进行KMO 样本测度和巴特利特球度检验,以判断数据是否适合进行因子分析。本研究中的KMO样本充足度检验值为0.601,大于适合因子分析的临界值0.5,表明变量可以进行因子分析。巴特利特球度检验的统计量观测值为44,794.875,对应的概率P值为0.000,小于显著性水平α,指标间具有一定的相关性,存在共同因素,与KMO检验结果一致。
(2)因子分析与提取。对原始变量进行因子分析的目的并非削减变量个数,而是在于给出一个计算综合分值的办法。本文数据仅有5个原始变量,因而考虑提取全部5个因子,以保证对原始变量的解释程度。由于保留了全部因子,因此5个原始变量的共同度均为“1.00”,此时不存在信息丢失。导出各因子对应的总方差解释,详见表4。表4第一组数据描述了因子分析初始解的情况,其中第1 个因子的初始特征值总计为1.527,解释原有5 个变量总方差的30.544%(即:初始特征值÷5×100%),累计方差贡献率为30.544%;其余数据含义类推。第二组数据描述了提取因子的具体情况——由于提取了全部5个因子,因而提取因子的具体情况同因子分析初始解一致。第三组数据展现的是旋转后的最终因子解,此时得到的因子得分为最终因子得分。因子旋转后,总的累计方差贡献率没有改变,但重新分配了各个因子解释原有变量的方差,此时的因子方差贡献率即是对应因子的得分权重。
表4 因子分析总方差解释
(3)综合得分计算。将因子分析后所得各种图书(本研究中称为“个案”)的因子得分输入SPSS中,生成对应的SPSS变量,见表5。
表5 各因子对应的SPSS变量及其权重
以旋转后各因子的方差贡献率作为其权重,计算最终的综合评价得分。创建综合得分变量“score”,使:
(4)归一化处理和个案排序。为了使综合得分更加直观,对综合得分变量score做归一化处理,使得到的新数据位于[0,1]之间。设置变量“New_score”,用于存储标准化后的观测值。由归一化公式对数据进行归一处理,公式如下:
x'=(x-min)/(max-min)
对所得New_score变量进行基本描述统计(保留四位小数),见表6。
表6 New_score变量的基本描述统计
经过标准化处理后,所有个案Bookmetrix指标综合得分变量score的最低值转换为0,最高值转换为1。将个案按照New_score变量值的降序排列,创建变量“sort”,表示New_score变量值由大到小的排序。设New_score观测值最大的个案对应的sort变量值为1,得分第二的个案对应的sort变量值为2,以此类推。
因子综合得分排名靠前的学术图书Bookmetrix各指标观测值及相关学科分类统计情况见表7,仅列出排名前10的学术图书信息。由表7可知,综合得分高的图书并不是传统意义上学术价值高的图书,即被引量高的图书。实际上,排名首位的图书被引量仅为1次,排名第二的学术图书被引量也仅有3 次。得分最高的学术图书为A Survey of Radial Velocities in the ZodiacalDust Cloud,分值为1.00,作者布莱恩·哈罗德·梅(Brian Harold May)是英国著名摇滚乐队皇后乐队的成员,该书是其博士学位论文。该书的在线提及数达2,100 次,是统计中在线提及数指标的最大值,显然作者的身份使这本著作得到更多关注。排在第二位的是国际天文学联合会(International Astronomical Union,IAU)的官方参考书,因较高的下载量(306,000次)及在线提及数(2,000次)获得较高的综合得分。
表7 综合得分排名前10的个案及其统计信息
从图书综合得分排名前30来看,排名较高的图书主要有3类:(1)学术价值较高、获得较多被引量的专著,如排名第3、第9的作品。这类专著主要为专业类学术著作。(2)社会关注度较高、获得较多在线提及数的图书,如排名第1、第2 的作品。这类书籍可称为明星类学术专著。(3)在Mendeley 获得较高读者(标记)数,有众多学者进行标记阅读的书籍。这类图书在各个学科内往往是重要的教学或基础性参考书籍。比如,排名第6位的作品对11种神经系统疾病的临床试验设计进行深入描述和讨论,是神经科临床医学的重要参考读物;排名第8的作品辑录了城市生态学领域的重要论文,提供有关城市生态学核心内容的丰富背景,是该学科的重要参考读物。这类著作主要为基础参考类学术专著。
以“图书综合得分排序”变量为横轴,“图书综合得分”变量为纵轴,绘制简单散点图(见图2)。由图2可观测到,图书综合得分具有显著的马太效应和长尾效应。少数图书的综合得分较高(见散点图左端),绝大多数图书的综合得分较低(见散点图右端)。少数Bookmetrix综合得分高的学术图书获得较多关注(下载、引用、评论、在线提及和读者标记),相关计量指标呈现出更好的观测值;计量指标数据靓丽又吸引了更多的关注,体现出学术交流过程中的马太效应。同时,大量学术图书仅获得较低的综合得分,在散点图中呈现出一条向右延伸的长尾。
图2 图书综合得分简单散点图
以综合得分排名前20%的图书为一组,以综合得分排名后80%的图书为另一组,分别进行计量统计。由表8可见,综合得分前20%的图书下载量占68.87%、被引量67.99%、评论数80.55% 、 在 线 提 及 数 77.38% 、 读 者 数76.11%,呈现“二八分布”规律。Springer 评论数指标、Altmetric 在线提及数指标和Mendeley读者数指标,相较Springer下载量指标和CrossRef被引量指标,呈现出更显著的聚集效应。
表8 以综合得分排名前20%为分界线的图书分组统计情况
以4个学科大类作为独立样本,检验各独立样本的综合得分变量观测值分布是否一致。由于数据不符合正态分布,须进行非参数检验。采用Kruskal-Wallis检验,对4个学科大类进行两两之间的观测值分布相似度检验,非参数检验结果见表9。可以看到,人文学科和社会科学之间的双尾显著性概率为0.066,大于0.05,表明这2个大类具有相似的数据分布情况。除此之外,其余样本两两之间的双尾显著性概率为0.000,小于0.05。因此,应拒绝原假设,即综合得分变量分布在其余学科大类上两两间各不相同。
表9 基于学科大类的独立样本Kruskal-Wallis检验
绘制各学科大类综合得分均值和中位数的折线图,见图3。由图3可知,各学科大类综合得分均值具有较大差别。自然科学综合得分均值最大,为0.0080,社会学科综合得分均值最小,为0.0054。自然科学和应用科学综合得分的中位数及平均数均大于人文学科和社会科学,由此可见,自然科学和应用科学的Bookmetrix 综合得分较人文学科和社会科学高。
图3 学科图书综合得分均值及中位数折线图
(1)利用Bookmetrix指标可以对学术图书进行精确评价,对部分被引量不高但具有社会影响力的学术图书进行揭示和发现,从多角度对学术图书价值进行分类评价。利用因子分析法,基于Bookmetrix 指标数据构建每种图书的因子综合得分,综合得分高的图书不仅仅是高被引图书,获得较高社会关注度(Altmetric.com在线提及数指标表现较好)的明星类学术著作,以及读者量较多(Mendeley读者标记数及Springer下载量较多)的基础参考类学术著作在这一评价指标体系中均能被更好地识别出来,使得对学术图书的评价更加精确。而更加精确的分层分类评价,正是包括Bookmetrix 指标在内的Altmetrics 指标最重要的优势。这一研究结果也与众多学者的发现一致。例如,杨思洛等[10]利用Altmetrics 指标对PLOS中社会科学领域2015年发表的论文进行综合评价,将论文分为名作类、明星类、专业类、明星-专业类和普通类5 个类别进行多维度分析。本研究指出,学术价值高或具有一定明星效应,或具有学科基础性参考价值的图书(即专业类、明星类和基础参考类学术著作)更容易获得较高的综合得分。究其原因,主要是学术价值高的专业类图书往往获得更高的被引量;明星类学术著作则由于其较高的社会关注度,具有较强的社会影响力;而基础参考类著作则由于其独特的学术参考价值,吸引更多的读者。
(2)Bookmetrix 等指标不能规避学术交流中马太效应对计量评价的影响,且Altmetrics指标的马太效应较引文指标更为显著。传统基于引文的计量数据中马太效应屡见不鲜,有学者进行了研究[11-12]。由庆斌等[13]在Altmetrics相关研究中指出基于引文的传统计量方法所面临的马太效应等缺点,希望Altmetrics 发展能弥补这一不足。然而, 本文利用Bookmetrix 指标对Springer 学术图书影响力进行评价发现,综合得分排名前20%的图书占据Springer 总评论数80.55%、Altmetric.com总在线提及数77.38%和Mendeley总读者数76.11%,但在CrossRef引用量指标上,仅占据总被引量67.99%。Altmetrics相关指标较传统被引量表现出更强的集中分布规律,该研究结果与邱均平等[14]、余厚强等[15]发现一致。前者指出,学术评价中影响力与知名度往往互相产生马太效应;后者利用新浪微博数据进行指标分析后发现,5.1%学术论文占据新浪微博关注量50%,呈现出显著的离散和集中分布特点。利用Altmetrics指标进行学术评价要更加注意区别性分析,单纯的频次统计无法反应真实的影响力和学术成果价值。
(3)基于Bookmetrix指标的学术图书评价具有较大的学科差异,不适用于跨学科比较。本研究数据显示,自然科学和应用科学的Bookmetrix指标表现优于人文学科和社会科学。这与匡登辉[16]、Erfanmanesh等[2]的研究结果一致。这是由于Bookmetrix 仅收录Springer 出版的学术图书,其中自然科学和应用科学的图书数量远多于人文学科和社会科学。Springer以出版科技图书闻名,吸引了众多用户与读者,从而使其图书的Bookmetrix指标表现突出。
总体而言,利用Bookmetrix相关指标对(图书的)学术成果进行评价有其价值——可以对学术成果/价值进行多维度揭示及更精确的分类评价。但相关Altmetrics指标表现出较传统引文指标更强烈的马太效应,离散和聚集现象更显著,需要对数据进行进一步识别与处理。Bookmetrix 指标在学科之间的表现具有较大差异,针对不同学科的评价应该区别考量。为此,学术成果的综合评价应当以分层分类评价为发展方向,纳入更多的指标和数据,开展更全面的分析。
本研究的不足在于数据分析主要基于图书的现有数据,并未考察数据随时间推进的发展情况。此外,本文未能对在线提及、评论等数据作更深的文本分析,而仅仅提取统计数据。社交媒体的在线提及与评论原因较为复杂,仅对其进行统计数据分析不能准确揭示著作的价值。