基于DEA-Tobit两步法的学术图书交流效率评价研究

2019-06-15 08:13李端明
关键词:学术图书效率

李 星 李端明

基于DEA-Tobit两步法的学术图书交流效率评价研究

李 星 李端明

(西南科技大学经济管理学院 四川绵阳 621010)

传统学术图书的评价主要以书评为主,由于量大而杂,使得学术图书的评价难以开展。本文考虑运用DEA方法评价学术图书交流效率的可能性,对于学术图书的发展具有重要意义。首先,通过分析现有学术图书的评价方法,提出学术图书交流效率评价的投入和产出指标。其次,以图书馆学术图书为例进行DEA方法分析,得到图书交流效率。最后,运用Tobit模型分析影响学术图书交流效率的因素。通过实证分析,发现图书馆学术图书知识交流效率差别较大,多数图书呈现交流无效的状态,图书交流效率与图书著者发表图书的篇均被引次数有较大关系。基于DEA-Tobit方法能为学术图书评价机构提供方法借鉴和理论依据。

学术图书;效率评价;DEA-Tobit

学术图书作为科技文献的一部分,是科研成果产出的重要体现,在学科发展中充当着不可或缺的角色,图书出版量的迅猛发展给图书评价带来了不少问题,在图书总量如此之多的环境下,挑选、利用、评价图书变得不再容易。传统图书评价以出版社评价和书评为代表,主要以图书装帧、质量、销量和编辑校对为主,但这些也主要是针对大众书籍,对于学术图书的评价,开展非常少。学术图书的评价,是高校图书馆馆藏采购、科研人员获取利用的重要参考,对于普通读者的利用也有着十分重要的意义。基于学术图书的这些特性,本文拟从学术图书的交流效率入手,研究学术图书在传播过程中的交流效率,以此来评价学术图书,对于我国学术图书的动态发展和图书馆馆藏采购以及出版单位的发行工作提供一定的决策参考。

一、学术图书评价研究现状

文献计量学使科研评价实现了量化的可能,学术论文、期刊的评价研究推动计量指标的发展。学术图书种类繁多、数量巨大,因此,评价数据不易获取,交流利用效率难以衡量,但目前的研究也在不断推进,主要是从评价指标和评价方法进行研究尝试。

(一)基于评价指标的研究

引文分析即通过图书被引量等指标对图书进行影响力评价,与期刊评价不同,图书引文分析指标相对较少,且指标数据不易获取,通常以图书被使用、被利用和被引用的数量为主。在2009年,K.Kousha和M.Thelwall就对Google Book Search做出分析,发现该平台在人文社科类图书中有较广泛的数据源,对于人文社科类图书评价效果更好[1]。2017年,他们又对Goodreader的评价指标能否评价图书做出研究,通过与BKCI和Scopus的对比研究,发现Goodreader在人文社科和艺术领域能够提供更为广泛的图书影响力指标数据[2]。但更多学者是针对Altmetrics的指标进行研究的,韩雨彤等利用BKCI和Altmetric.com平台获取生物化学和化学等五个学科学术图书的被引频次和在线书评指标,并将这两项指标进行相关性分析,发现被引频次与Altmetrics指标的相关性较低,Altmetrics能够为图书在社交网站上的影响力提供数据支持[3],但该研究是针对英文图书的评价,具有一定的局限性。

(二)基于评价方法的研究

图书评价方法中,书评是最原始的一种,主要从主观角度对该书的科学性、规范性和创新性进行评价,但随着技术的发展,书评也有了新的内涵。Liu Weishu等通过Web of Science的科学引文、社科引文和人文艺术引文索引平台,对2006年-2015年间三大平台的书评模式进行实证研究,发现书评在人文社科领域较常见,自科领域比较少,而书评内容主要由英美国家作者贡献,中国和日本学者不太可能提供[4]。J.Gorraiz和C.Gumpenberger等通过实证研究证实尽管一本书的书评量和引文量在不同领域间的相关性不大,但有书评的书平均引文量也更高,因此,书评可作为BKCI(图书引文索引)的评价指标[5]。书评之外,也有不少学者提出运用不同领域的方法来评价学术图书的可能性。何峻等采用层次分析法、专家调查法和模糊隶属度等方法建立了中文图书评价体系,并实证应用于1949年-2004年出版的中文图书,确定其中的核心图书和扩展图书[6]。Zhou Qingqing和Zhang Chengzhi等通过多粒度挖掘亚马逊上学术书籍的在线评论,利用熵值法对书籍的正负面评论信息进行计算整合,得到学术图书的影响力评分,并与传统引文分析结果相对比,认为在线书评能够对学术图书的影响力进行分析,是未来学术图书评价的发展方向[7]。

无论基于评价方法分析或者基于指标分析,对于学术图书的评价方法仍有很多值得探索的地方,但是尚未考察学术图书交流的投入产出效率,运用DEA方法在学术期刊、社会网络信息交流、高校图书馆服务质量绩效等方面已经较为成熟,如陈琨等用DEA模型对学术期刊的表现力进行评价,对出版期数、引文密度、被引半衰期等指标的适用性进行讨论,通过最后的结果分析,发现DEA-Malmquist方法适用于期刊评价[8]。刘虹等人采用DEA-VRS模型对政务微博信息交流效率进行评价研究,并通过冗余分析为政务信息交流效率改进提出建议[9]。

上述研究中,大多是从学术图书的评价指标和评价方法进行评价的,研究成果较为丰富但也存在不足之处。图书评价工作是为学者引用图书、读者利用图书、图书馆采购图书以及出版社发展服务的,图书评价应当围绕这几点要求,明确评价目的,采取合适的方法,而不是一味的扩展新指标、采取新方法,导致评价结果顾此失彼。鉴于DEA方法在学术期刊和论文评价上有较多的成功运用。因此,本文尝试从学术图书传播交流中的效率入手,以分析影响图书传播效率的因素为目的,采用DEA-Tobit两步法对学术图书的交流效率进行评价和分析,为学术图书提高传播交流效率提供参考。

二、研究方法及指标构建

(一)DEA分析法

本文采用的研究方法是数据包络分析法(DEA)和Tobit回归模型。DEA分析法是对同一部门多投入、多产出的决策单元(DMU)进行效率评价的方法,其评价结果表现为产出对投入的比率,效率值为1的即表示有效,小于1即为无效。本文采用DEA方法对学术图书进行效率评价,即通过图书投入和产出的比率衡量图书传播过程中的交流效率。采用DEA方法中的CCR模型,具体如下:

(二)Tobit模型

本文采用Tobit模型进行学术图书的影响因素分析,构建回归方程,探究影响学术图书交流效率的因素。Tobit模型是Tobin于1958年提出的因变量受限的模型[10],是因变量满足某种约束条件下取值的模型。由于DEA模型所得效率值均在0-1之间,采用普通最小二乘法进行回归会产生效率值偏向0的可能,Tobit模型能够弥补最小二乘法回归带来的参数偏差问题。Tobit模型具体如下:

(三)指标构建

学术图书的交流效率主要由学术图书传播过程中的引用和利用等行为产生,学术图书从发行、购买、利用到引用的一系列过程都可看作是学术图书传播交流的过程。本文从学术图书的交流效率入手,考察学术图书传播交流过程中的投入和产出及效率。其中图书投入指标可从图书发行量、出版社、作者等方面考虑,而产出指标则可设置为图书的被引次数、评论量、馆藏量及图书销量等。具体的投入产出指标设置如下:

在表1中,投入指标和产出指标分别参考了部分国内外专家学者对于图书评价的指标研究。投入指标主要考察图书著者和图书出版社两方面,作者传播能力和出版社传播能力对于图书的交流传播过程有导向作用,会影响图书从被查询、购买到利用的全过程。其中作者发表图书数量代表了图书著者的学术产出能力,图书篇均被引次数代表了该作者学术著作的被引情况,出版社获奖次数和出版社创办时间以及图书版本印次从三方面衡量了出版社的出版水平、出版能力和图书发行量。产出指标则是从图书传播能力入手,考察图书发行后,被查询、获取、购买、利用、反馈等一系列过程中的传播能力,指标分别设置为图书被引频次、馆藏数量、网络销量、在社交网站和网络购书平台的评论数量和评价分数以及在微博的提及次数。由于图书的实体销量数据难以获取,本文只考虑了图书的网络销量,评论数量和评论星级是考察图书在网络购书平台和社交网站的评价信息和被利用的情况,微博提及次数则衡量了图书在社交平台的传播能力。

表1 学术图书效率评价指标体系

为对本文所设指标进行验证,本文选取了293本图书进行实证分析并进行指标的代表性检验。通过主成分分析,发现KMO值为0.744>0.5,说明变量之间相关性显著。表2为主成分解释的总方差表,通过表格可以看到累积方差贡献率为81.591%,并且提取7个公因子可以代表81.591%的原始变量,能够基本反应原始数据信息,指标设计合理。

表2 解释的总方差表

三、实证分析

(一)数据收集

针对已有研究多数选择英文图书进行探索研究的现状,本文的评价对象是中国引文数据库,选取自2000年-2018年19年间出版并被期刊、学位论文和会议论文所引用的学术图书,中图分类号为G250,检索结果共有332本学术图书。删除其中部分译制的外文图书、部分检索不到相关指标信息的图书,剩余293本学术图书为本文的研究对象。

各个指标信息均可检索获得,作者发表图书总数和收藏馆数由读秀平台获取,作者篇均被引次数和图书的被引频次由CNKI检索得到,出版社获奖可通过Web网页检索得到,评论数和评星数通过检索每本书在当当网、亚马逊和豆瓣网的评价数量和评星级数即可,版本印次可通过图书的CIP号查询得到。表3为部分学术图书的指标数据(因篇幅有限,未展示全部数据,后文同)。

表3 图书馆类学术图书各项指标数据

(二)DEA分析

DEA方法的优点之一是无需对指标数据进行无量纲处理,因此上表数据可直接进行DEA分析。本文采用DEA-Solver5.0软件对学术图书交流效率进行分析,得到各个学术图书相对效率值结果如下表4所示。

表4 图书馆学学术图书交流相对效率值数据

表5 图书馆学学术图书交流相对效率值统计特征

由表4、表5可知,图书馆学学术图书交流效率的平均综合效率为0.5410,平均技术效率为0.6870,平均规模效率是0.7875,综合效率有效的学术图书有24本,占此次研究对象的8.19%,技术效率有效的图书有110本,占研究对象的37.54%,而三种效率同时有效的学术图书也只有24本,说明此24本图书的交流效率达到最高,交流过程最好。

(三)K-均值聚类分析

利用SPSS20,以2000年-2018年19年间出版并被期刊、学位论文和会议论文所引用的学术图书的规模效率和纯技术效率为聚类变量。在对所有的评价决策单元进行K-均值聚类法进行Q型聚类,在聚类设定3和4的情况下,分析最终聚类中心,发现聚类系数为4时,分类特征较明显,其最终聚类中心如表6所示。

表6 最终聚类中心

在表6中可以看出,第一类型的纯技术效率和规模效率都较高,因此交流效率较高;第二类的纯技术效率明显高于规模效率,因此属于技术高效型的图书;第三类是规模效率比纯技术效率要高,因此属于规模效率型;而第四类的纯技术效率和规模效率都较低,因此可定义为低效型图书。

根据分析结果的效率情况,可将这293本图书进行交流效率的等级划分,如表7所示。

表7 图书馆学学术图书交流相对效率类型归属

第一类是高效型,即效率值都为1的图书,这些图书在投入一定的情况下,产出达到最优,也即其交流效率达到最优。

第二类是规模高效型,即技术效率有效,规模报酬递增的图书。在指标数据表中这三本图书的投入指标都相对较小,作者发表图书总数均为1,平均篇均被引次数为10,平均出版社获奖次数为0.3,但产出指标中,其馆藏数量处于中间水平,因此,可以增加此类书的投入规模,以此提高效率值。

第三类是技术高效型,即技术效率有效但规模报酬递减的图书,说明此等级的图书投入规模较大,但产出并没达到投入的相应水平,造成DEA无效,此类图书的作者发表图书总数较多,但每本图书的被引频次、利用率及受关注度并不高。

第四类是低效型,即DEA无效且规模报酬递减的图书,这些图书是投入与产出不相符的图书,说明这些图书的传播效率是无效的,绝大部分图书的作者只发表过一本图书,如果不是教辅用书,则关注度会更少,影响幅度也更小,使用人群基本固定在科研人员和单位。

(四)Tobit模型构建及分析

上文对图书馆学术图书的交流效率有效性进行了测算,但DEA分析仅能判断图书的传播交流是否有效,对影响图书传播交流效率的因素无法判断。Tobit模型能够对效率影响因素进行分析和计算,本文以DEA分析结果中的技术效率值为依据,将学术图书的效率值作为Tobit模型的因变量,以投入要素的影响因素作为自变量进行回归,即自变量分别为图书版本印次、出版社获奖次数、出版社创办时间、作者发表图书总数、作者发表图书的篇均被引频次。由此,Tobit模型构造如下:

(3)

(五)Tobit分析结果

本文采用STATA15.0对Tobit模型进行分析,结果如下表6所示。

表6 Tobit结果

结语

学术图书的交流效率评价及影响因素分析对于学术图书质量的提高、图书馆的馆藏购入、出版社的出版工作和科研人员的利用都有着重要参考价值。本文采用DEA效率分析和Tobit影响因素分析模型对图书馆学部分学术图书进行了效率评价分析,得到以下结论:

图书馆学领域被引用的图书中,绝大部分图书是达不到知识交流有效的,293本图书中只有24本图书交流有效,占总数的9%,图书的广泛传播还有待提高。

学术期刊和论文的评价方法和体系日趋完善,而图书的评价理论和方法还有待完善。评价指标、评价工具、评价方法等实践性的具有公信力的评价方法还有待研究。

根据以上研究结论的分析,提出一些建议:

加强图书数据采集和聚合平台的建设。国外有较多稳定的数据获取平台,但国内对于期刊和论文的数据较为集中,因此,加强对人文社科和自然科学的图书数据进行搜集和整合,能更好的满足对应学科的学术研究,取得更大的突破。

深入对各学科的图书进行质量评价。各学科的图书知识结构差异性很大,因此深入对某一个学科的图书进行评价研究,对学科知识体系的完善和研究会有推动作用。

[1] Kousha K,Thelwall M. Google book search:Citation analysis for social science and the humanities[M]. John Wiley & Sons,Inc. 2009.

[2] Kousha K,Thelwall M,Abdoli M . Goodreads reviews to assess the wider impacts of books[J]. Journal of the Association for Information Science and Technology,2017,68(8),2004-2016.

[3] 韩雨彤,周雨涵,杨伟超,刘晓娟. 面向学术图书的Altmetrics指标分析[J]. 图书情报工作,2018,62(14):91-97.

[4] 陈琨,杨国梁. 基于DEA-Malmquist的学术期刊生产率分析[J]. 中国科技期刊研究,2017,28(05):441-449.

[5] Liu W,Ding Y,Gu M. Book reviews in academic journals:patterns and dynamics[J]. Scientometrics,2018,110:1-10.

[6] Gorraiz J,Gumpenberger C,Purnell P J. The power of book reviews:a simple and transparent enhancement approach for book citation indexes[J]. Scientometrics,2014,98(2):841-852.

[7] 何峻. 我国图书评价现状分析[J]. 大学图书馆学报,2012,30(03):106-110.

[8] Zhou Q,Zhang C,Zhao S X,et al. Measuring book impact based on the multi-granularity online review mining[J]. Scientometrics,2016,107(3):1435-1455.

[9] 陈琨,杨国梁. 基于DEA-Malmquist的学术期刊生产率分析[J]. 中国科技期刊研究,2017,28(05):441-449.

[10] 刘虹,孟凡赛,孙建军. 基于DEA方法的政务微博信息交流效率研究[J]. 情报科学,2017,35(06):9-13.

[11] 张艳丽. 人文社会科学类学术图书评价指标构建研究[J]. 出版发行研究,2018(11):70-73.

Efficiency Evaluation of Academic Book Exchange Based on Clustering and DEA-Tobit Two-Step Method

LI Xing1,LI Duan-ming2

(School of Economics and Management,Southwest University of Science and Technology,Mianyang 621010,Sichuan,China)

[Purpose/significance] Traditional academic books are mainly evaluated by book review. Due to its large amount and complexity,the evaluation of academic books is difficult to carry out. This paper considers the possibility of using DEA method to evaluate the exchange efficiency of academic book,which is of great significance for the development of academic books. [Method/Process] Firstly,by analyzing the evaluation methods of existing academic books,the input and output indicators of academic book communication efficiency evaluation are proposed. Secondly,taking the academic books of library science as an example to analyze the DEA method,the efficiency of book exchange can be approached. Finally,the Tobit model is used to analyze the factors affecting the efficiency of academic book communication. [Result/Conclusion] Through empirical analysis,it is found that the efficiency of knowledge exchange in academic books of library science is quite different. Most books show a state of ineffective communication,and the efficiency of book exchange has a great relationship with the number of articles published by books authors. Based on the DEA-Tobit method,it can provide methodological reference and theoretical basis for academic book evaluation institutions.

academic book,efficiency evaluation,DEA-Tobit model

G25

A

1672-4860(2019)06-0098-07

2019-08-07

李星(1993-),四川眉山人,硕士在读。研究方向:用户画像和评价研究。

李端明(1964-),广东汕尾人,硕士,教授。研究方向:管理信息系统与商务智能。

教育部“突发灾害应急物资筹集支持网络及其优化策略研究”(项目编号:16YJC630040)的阶段性研究成果。

猜你喜欢
学术图书效率
学术是公器,不是公地
图书推荐
提升朗读教学效率的几点思考
如何理解“Curator”:一个由翻译引发的学术思考
欢迎来到图书借阅角
对学术造假重拳出击
班里有个图书角
跟踪导练(一)2
“钱”、“事”脱节效率低
提高讲解示范效率的几点感受