学术期刊评价的起源、趋势与我国期刊评价发展路径分析

2022-02-05 11:32李利华

财政科学 2022年5期

李利华

内容提要：本文从《关于深化改革培育世界一流科技期刊的意见》提出的重要指引出发，思考我国学术期刊评价体系建设路径。本文从学术期刊评价产生的初衷入手，通过对我国现阶段期刊评价体系的现状与存在的问题进行总结梳理，结合国际期刊评价领域正在萌芽的新技术与新趋势，分析技术进步与学术生态变迁对期刊评价的要求和改变，以及我国期刊评价体系的发展路径。

2018 年11 月，习近平总书记主持召开中央全面深化改革委员会第五次会议，审议通过了《关于深化改革培育世界一流科技期刊的意见》①资料来源：《关于深化改革培育世界一流科技期刊的意见》，澎湃网，https：//m.thepaper.cn/news Detail_forward_4180720。。《意见》提出，“要以建设世界一流科技期刊为目标，科学编制重点建设期刊目录，做精做强一批基础和传统优势领域期刊”，须通过“推动发挥全国学会同行评议功能和相关研究机构作用，分领域发布科技期刊分级目录，形成全面客观反映期刊水平的评价标准”，实现中外科技期刊同质等效。本文首先回顾了文献计量理论的思想源头与初衷，对期刊评价产生的背景和原因进行梳理，通过国内期刊评价发展现状和问题分析，并结合国际期刊评价发展新趋势与技术进步带来的变革，进一步分析学术生态变迁对期刊评价的要求和改变，以及我国期刊评价体系的发展路径。

一、学术期刊评价的起源

（一）思想源头

科学引文索引（Science Citation Index，SCI）是目前学术界最权威、最重要的期刊索引数据库之一，其期刊评价方法和指标体系被世界各国广泛使用。20 世纪60 年代，SCI 诞生于美国科学情报研究所（Institute of Scientific Information，ISI），其索引产品包括 SCI、SSCI（社会科学引文索引）、A&HCI（艺术与人文引文索引）、ISTP（科技会议录索引）、ISSHP（社会科学和人文会议录索引）。然而，SCI诞生之初，并非出于期刊评价的目的。期刊引证报告（Journal Citation Report，JCR）的思想源头是格罗斯夫妇于1927 年为解决图书馆在预算约束情况下，如何选出更重要、更有代表性的期刊这一难题时，采取的一系列做法。他们对1926 年发表的247 篇论文中全部3633 项参考文献的引用次数进行统计，并对被引刊物同时进行统计，依据统计结果选出排序居前的刊物供图书馆参照。格罗斯夫妇将他们的做法发表在了当年的Science 上，很快引起了一些科学家的关注和借鉴（江晓原、穆蕴秋，2016）。1955 年，尤金·加菲尔德在Science 上提出并详细阐述“引文索引”的想法，希望能够为科学家的文献搜寻提供一种文献计量工具或方法。1973 年，芝加哥大学出版社出版了美国社会学家乔纳森·科尔和斯蒂芬·科尔的专著《科学界的社会分层》（Social Stratification in Science），该著作的主要研究内容是确定用来评价科学家影响力的决定性因素，以及在科学家的学术贡献评价中，究竟是论文数量还是论文质量更重要。研究结果显示，仅仅用论文数量来衡量科学产出会忽视论文质量的重要性，并对使用“引文数”来衡量科研成果质量和影响力的思想进行了详细阐述。可见，引文数量分析法应用的初衷并非直接瞄准期刊评价，而是当时流行的科学社会学的研究工具之一。

（二）期刊评价体系的诞生与应用

20 世纪30-60 年代，一些研究者在文献统计与分析的基础上，寻求构建具有普遍指导意义的理论体系，布拉德福定律、加菲尔德定律、普赖斯指数、特鲁斯威尔定律等理论体系相继出现。布拉德福定律主要用于文献分散与集中状态的分析，能够为图书馆订购哪些期刊提供基本判别标准；加菲尔德定律主要用于研究期刊论文与参考文献间的引证关系，可以作为搜寻核心期刊的量化测度指标；普赖斯指数从期刊论文的时效性、生命周期角度评判期刊的科学价值；特鲁斯威尔定律则从文献传播与流通数据角度进行期刊量化评价，为图书馆期刊续订与撤订提供依据。

20 世纪30 年代，布拉德福第一次提出学术期刊“核心区”（nucleus）概念，主要是根据文献分散与集中定律反映特定学科领域相关论文的分布情况（Bradford，1934）。到20 世纪60 年代，加菲尔德做了大量统计与分析工作，对当时存在的多项定律的主要指标进行整合，证明布拉德福定律正确；最重要的是，他从对引文的统计分析中发现期刊文献集中与分散存在一定的规律，特定学科的大部分文献集中在小部分核心期刊里，此即著名的加菲尔德引文集中定律：各学科核心期刊不超过1000 种，最主要的核心期刊不超过500 种。继而，加菲尔德推出SCI、SSCI 以及A&HCI 等具有评价功能的指标工具（穆蕴秋、江晓原，2017）。1972 年，加菲尔德提出了年度评价指标“影响因子（IF）”（Garfield，1972），即学术期刊两年内发表的论文被引证的次数与该刊两年内所发表的论文数之比。此后，这一指标被广泛应用。引文分析法的出现和引文工具的使用，使图书情报领域、教学科研机构及学者们认识到，这些评价体系不仅能够用于搜寻有价值的文献，以及文献价值的分析，同时可以用于反映期刊质量、学术价值及影响力。自此，学术期刊评价开始从理论研究走向指标化、体系化，并逐渐形成了一套具有实操性的期刊评价体系与工具，而且发展成为能够根据使用者的不同需求进行不同指标组合评价的综合性工具体系。

ISI 每年发布的JCR 中关于期刊评价的指标体系主要包括：总被引次数、影响因子、即时指数、发文数、被引半衰期，用以评价期刊的科研产出和学术影响力。随着学术活动越来越频繁，对单篇文献进行评价不仅操作不方便，而且价格高昂，而如果进行期刊评价，则可以满足规模效益，且作者不用再支付相关费用。在学术评价规则、市场需求与大出版商的共同推动下，逐渐形成以期刊地位代表论文学术价值的评价标准，并在国际各学科研究领域大行其道。

二、学术期刊评价发展的新趋势

数字技术的快速发展与广泛应用，对学术环境、学术行为与学术生态产生了显著的影响。学术研究更加开放，学术交流更加及时，学者的研究工作从线下延伸至线上，进而延伸至不同的融媒体平台。遍布网络的学术行为碎片化带来无处不在的学术生产，包括网络上各个学术讨论话题下的提问、回答、浏览、转引、下载、上传等。学术生态的变化使期刊评价模式难以满足当前学术需求，带来国际学术界对期刊评价模式的反思；同时，学术期刊作为优质学术成果的仓储与传播平台，其出版模式与数据构成呈现出迥异的变化趋势，文献计量相关技术的发展也紧跟这一趋势展开。

（一）替代计量指标的应用

基于引文的学术期刊评价体系需要的评价周期较长，难以快速、即时地反映学术期刊的影响力。互联网科技和社交网络的高度发达，使学术成果传播周期更短，学术期刊的办刊模式正在从一对多模式转变为多对多模式，学术成果的发布形式也更加多样化，学术论文的作者、读者、编辑、出版方、审稿人等都在以不同形式参与对学术期刊的评价。这些评价恰好可以弥补传统文献计量学的不足，填补学术成果网络影响力评测的缺位。

在5G 技术与数字技术应用的不断冲击下，新媒体架构下的学术期刊评价模式开始进入传统期刊评价领域。大数据技术能够对学术期刊的浏览情况、下载情况、被提及或转引情况、社交媒体上的讨论和评价情况等进行数据挖掘和分析，形成了重要的评价领域，形成“替代计量学”（Altmetrics）体系（翟莉莉，2017）。根据计量指标统计源的不同，涌现出不同的替代计量学工具，如博客替代计量指标（Blogs Altmetrics）、推特替代计量指标（Twitter Altmetrics）等；根据网络活动与交互类型不同，又有阅读替代计量指标（Readership Altmetrics）、下载替代计量指标（Download Altmetrics）、分享替代计量指标（Share Altmetrics）等。由于数据源的获取方式、更新频率等的不同，替代计量方法尚未形成相对一致的实践标准和统一操作体系，需要进一步规范与完善。

（二）反对期刊评价过度指标化的呼吁

2012 年，一群学术期刊编辑和出版人在旧金山发起了《旧金山科研评估宣言》（San Francisco Declaration on Research Assessment，以下简称《旧金山宣言》）①《旧金山宣言》内容详见官网http：//www.ascb.org/dora。。该宣言旨在优化科研成果的评估机制，呼吁学术界停止使用期刊评价计量指标判定学术成果和学者的学术贡献。应摒弃简单量化评价方法，构建定量定性有机结合的综合评价体系，既需要发挥同行评价的定性优势，又需要发挥数据分析的定量优势，开创学术评价新局面，回归学术期刊本来的职能。

2014 年，美国佐治亚理工学院的公共政策教授Diana Hicks 等在荷兰莱顿提出七项原则，呼吁合理利用科学评价指标。2015 年4 月，Nature 杂志发表了由上述七项原则扩充而来的十项原则，被称为《莱顿宣言》（The Leiden Manifesto for Research Metrics）。十大原则包括：“第一，量化评估应当支撑质化的专家评估，而不是取而代之；第二，衡量绩效应基于机构、团队和个人的科研使命；第三，保护卓越的本地化的相关研究；第四，保持数据采集和分析过程的公开、透明和简单；第五，允许被评估者验证数据和分析；第六，考虑发表和引用的学科差异；第七，对个人研究的评价应基于其综合作品的质性评价；第八，应避免评估指标不合理的具体和虚假的精确；第九，认清并识别评价指标对科研系统的影响；第十，定期审视评价指标并加以改进”。①《莱顿宣言》内容详见官网http：//www.leidenmanifesto.org/。《旧金山宣言》和《莱顿宣言》是国际学术界反对期刊评价过度指标化的标志性事件，也是综合型期刊评价指标研究与实践的开端。

从期刊评价方法出现至今，国际学术期刊评价已有近百年历史，期刊评价体系经历了由简单到复杂、由粗浅到精深，不断探索、创新的发展历程，为学术传播和学术进步起到了重要的推动作用。然而，学术期刊评价体系是一套根植于实践，操作性很强的指标型定量分析工具，产生于特定历史背景和当时的学术需求，在当下技术迅猛发展和学术行为显著改变的环境下，不再适应学术发展的需求是无法避免的。

伴随着技术进步和学术发展，期刊评价在大数据、网络技术和学术需求的共同推动下，有条件形成多指标深度融合的评价体系，从而能够更好地从文献分布、引文情况、网络关注、社交媒体评价等不同侧面反映学术期刊影响力；同时可以根据特定规则对学术期刊进行针对性评价，满足学术生产传播链条上不同类型用户的需求，如作者、读者、出版商、审稿人等。一些学术期刊评价研究机构已经开始积极尝试。为探索指标深度融合之路，2017 年6 月，科睿唯安宣布与Impact Story 建立全新的公私战略合作伙伴关系，合作开发创新型分析与解决方案。同年，爱思唯尔收购PlumX Metrics，目前Scopus 已经实现PlumX Metrics 数据查询功能（齐东峰，2021）。

三、我国学术期刊评价及存在的问题

20 世纪70 年代，我国期刊评价研究工作方始（李军，2021）。50 多年的实践中，基本以借鉴国外期刊评价的成熟理论为主，在国内学术生态中，逐渐形成了目前大家所熟知的指标体系与评价规则。目前国内影响力比较强的期刊评价的机构及评价报告分别是：北京大学图书馆研制的《中文核心期刊要目总览》（以下简称《总览》）、中国社会科学院文献信息中心研制的《中国人文社会科学核心期刊要览》（以下简称《要览》）和南京大学社会科学研究评价中心的《中文社会科学引文索引》（以下简称CSSCI）。

（一）我国期刊评价体系

由于电子图书技术和网络技术不发达，《总览》（1992 年）第一版只采用了载文量、文摘量和被引量三个评价指标；2004 版取消了载文量指标，以凸显《总览》对期刊学术质量的侧重；2020 版的《总览》已经形成由16 个指标构成的评价体系，包括：被摘量、被摘率、被引量、他引量、影响因子、他引影响因子、五年影响因子、五年他引影响因子、特征因子、论文影响分值、互引指数、论文被引指数、获奖或被重要检索工具收录、基金论文比、Web 下载量、Web 下载率。《要览》使用文献计量学方法甄选出25 个重要学科的近500 份期刊。评价指标是：期刊总被引、影响因子、期刊即年影响因子、学科自引量、学科载文量、引文率、摘转率；用综合统计法从文献利用和被利用的角度，评价期刊的“论文产出率”和“学术影响力”。CSSCI 于1999 年创办，其社会科学评价指标主要有三个：被引量、影响因子和专家评审（甘冰，2006）。CSSCI 指导委员会是学术决策机构，其主要职责是制定和修改指导委员会章程、审议中心中长期研究发展规划、指导中心CSSCI 系统的研制与开发、审议中文社会科学引文索引来源期刊、审核CSSCI 重大新闻发布内容、协调中国人文社会科学研究评价领域的全国性重大学术活动（叶继元，2022）。

（二）我国期刊评价存在的主要问题

有学者（李军，2021）认为，简单套用、普及国外学术期刊评价模式，会造成优质论文、科研经费与科学数据外流；数据库议价权、学术主动权、学术话语权受制于人；出版生态、学术生态、社会生态失衡；以及科技安全、信息安全、战略安全隐患等问题。2018 年11 月，习近平总书记主持召开中央全面深化改革委员会第五次会议，审议通过了《关于深化改革培育世界一流科技期刊的意见》，提出要以建设世界一流科技期刊为目标，科学编制重点建设期刊目录，做精做强一批基础和传统优势领域期刊。2020 年2 月18 日，教育部、科技部印发《关于规范高等学校SCI 论文相关指标使用树立正确评价导向的若干意见》（教科技〔2020〕2 号）明确提出：SCI 论文相关指标不是评价学术水平与创新贡献的直接依据，建立健全分类评价体系，基础研究领域坚决摒弃“以刊评文”，评价重点是论文的创新水平和科学价值。

由于我国学术期刊评价起步晚，学科设置与学术发展环境与国外不尽相同，在期刊评价借鉴发展的过程中呈现出一系列问题，直接关系到我国学术期刊的创新发展，并影响到我国学术生态的优化。一是我国学术期刊评价难以与国外期刊同质等效。我国学术期刊评价基本局限于国内期刊，对国外期刊采取全盘接受ISI 各大期刊目录的方式，大大压缩了我国学术期刊评价的领域，严重分流了优质学术成果。大多数科研机构的学术评价规则总体上倾向于发表国外期刊的论文，在职称评定、科研项目与资金配置、评奖评优、毕业考核等环节都存在国外期刊优先的规则设置。如何设计实施期刊评价机制，达到国内、国外学术期刊同质等效，是我国当前亟须解决的问题。二是我国自主创办的外文学术期刊数量少，影响力弱。2019 年SCI 高被引论文排名前1%的论文中，我国作者占1.67%，位居世界首位；中国作者的论文占当年SCI 收录论文总量的21.5%，居世界第二①中国科学技术信息研究所：《中国科技论文统计结果（2020）》，http：//con- ference.istic.ac.cn/cstpcd2020/。。与学术论文的高影响力相比，2016 年我国被 SCI 收录的科技期刊共178 种，仅占当年SCI 收录的8856 种期刊的2%，Q1 区期刊占比仅为0.4%。我国英文科技期刊实现“走出去”仍任重道远。三是传统期刊评价由于数据收集与统计手段的繁冗落后，评价指标主要采用发文量、引用率、转载率、影响因子等。出于维护本国学术自主性、保护自有学术成果的原则，各领域学者对国外借鉴而来的评价指标体系的合理性和适用性一直颇有争论。四是开放存取的期刊出版趋势带来学术期刊评价主体与评价指标多元化。传统期刊评价模式周期长、评价参考机制不透明、评价过程互动性差等缺点已经与开放存取出版趋势相矛盾；在学术活动与学术传播的主要内容均已网络化的环境中，传统期刊评价对网络影响力评估的缺位成为学术界质疑传统期刊评价体系的重要原因。

四、关于我国期刊评价体系发展路径的思考

文献计量思想源于更好服务学术研究的目的，学术期刊评价亦应有效促进学术繁荣与进步。期刊评价在学术研究和学术评价之间承担着“标准”的作用，应该坚守根本职能，主动适应学术生态的改变，积极调整优化期刊评价的功能与体系，更好地满足学术需求。期刊评价机制的调整优化涉及世界范围内学术评价机制的转换，不可能一蹴而就，因此，当前及未来一段时间内，学术界与期刊界对学术期刊评价的外部需求，以及期刊追求高质量发展的内在需要将同时作用于学术期刊评价体系。只有行之有效地提升国内学术期刊的学术水平、加强我国学术的国际交流、协调平衡好国内外期刊评价的关系，才能更好实现学术期刊的根本职能与社会效益。基于此，有必要采取更主动的方式寻求更加科学的期刊评价路径。

（一）回归学术期刊的根本职能，建立多元、竞争的期刊评价体系

中宣部、教育部、科技部印发的《关于推动学术期刊繁荣发展的意见》（中宣发〔2021〕17 号）明确指出学术期刊的根本职能：“学术期刊是开展学术研究交流的重要平台，是传播思想文化的重要阵地”，学术期刊要“加强优质内容出版传播能力建设”。关于期刊评价如何才能更好地服务于学术研究，《莱顿宣言》已有所呼吁。期刊评价应关注自身职能所要求的评价指标，如论文质量、学科贡献、理论创新、现实意义、服务社会等多维度指标。评估方法应定性定量结合，重视同行专家的定性评价，定性评价须借助定量方法的支持与验证，而不是将重点倒置。指标设计应根据学科的特点与重点进行差异化设置，在自然科学和哲学社会科学领域内套用相似指标体系的方式在当前强大的数据挖掘和分析技术面前，以及活跃的网络学术活动中已显得僵硬、落后。适当的竞争是保持期刊进步动力的有效机制。应构建各专业水平期刊间的竞争性淘汰机制，以良性竞争激励学术期刊高质量发展的积极性主动性，进而提升期刊学术水平、提高管理效率，加强期刊的同业竞争力与国际话语权。同时要避免1-2 年短期评价所带来的过度竞争与急功近利，代之以3-5 年的评价周期，使期刊有充足时间和空间进行中长期发展规划和学术影响力积累，更加专注于行业竞争力与刊物特色的培育。

（二）重构期刊评价规则实现内外协调效应

国内外学科分类体系、学科内容重点并不完全相同，将ISI 规则直接应用于国内社科期刊评价容易产生偏误，并人为地对我国学术发展与交流形成阻碍，造成学术成果外流，使国内期刊缺乏优质内容支撑，国际影响力难以提升。如何对国外期刊科学评价，如何通过改变科研成果认定规则来改善国内成果外流的状况，是我国学术期刊评价无法回避的问题。因此，需要依据国内社科学术特点和学术需求重新制定国内社科学术期刊评价体系，并同时调整对国外社科期刊进行评价的规则，形成国内国外期刊评价标准对等、规则统一，能够在学术成果评价中对等互认的指标体系与评价规则，引导优质论文回流及期刊学术水平提升。

（三）政策扶持助力国际影响力提升

学术期刊影响力的海外拓展，根本上还是要以期刊学术水平为支撑。创办外文学术期刊难度大，而学术出版除受商业规律引导外，其学术产出的外溢性和公共性需要政府和学术机构进行一定程度的扶持。例如，2013 年由中国科协、财政部、教育部、国家新闻出版广电总局、中国科学院、中国工程院联合实施的《中国科技期刊国际影响力提升计划实施方案》是当时国内最大的科技英文期刊支持专项。该方案“对提升我国科技期刊学术质量和国际影响力进行统筹规划、滚动推进，遵从科技期刊发展规律，兼顾不同学科科技期刊的差异性和发展水平，引导我国科技期刊大力提升国际影响力和创新能力”①中国科学技术协会：《中国科技期刊国际影响力提升计划实施方案》，http：//kexie.hust.edu.cn/info/1013/1079.htm。。在资金支持方面，对不同学术分区的期刊进行结构性资金配置并配套差异性的支持政策。截至2017 年，我国已新批创办英文或中英文双语科技期刊84 种。

目前政策扶持对象以科技期刊为主，未来应加强对哲学社会科学英文期刊的资助。中国特色哲学社会科学的特点在于继承性、民族性、时代性、原创性、系统性及专业性，需要融通马克思主义思想、中华优秀传统文化与国外哲学社会科学体系，坚持不忘本来、吸收外来、面向未来。坚定中国特色社会主义道路自信、理论自信、制度自信，本质上是要坚定文化自信。②资料来源：《（授权发布）习近平：在哲学社会科学工作座谈会上的讲话（全文）》，新华网，http：//www.xinhuanet.com//politics/2016-05/18/c_1118891128_3.htm。学科特点带来了学术期刊评价的难点：一是政治责任重大；二是不易凝聚国外作者，只有中国作者的外文刊物也达不到国际学术交流、提升国际学术地位的目标；三是外文期刊要以中国特色理论、实践吸引国外读者，难度比较大。正因为如此，才更需要政府和学术机构大力扶持，在管理制度、资金分配及评价规则引导等各方面予以差异化考量。

（四）构建适应当前学术环境的期刊评价体系

现阶段传统学术期刊的评价主体以评价机构为主，专家为辅，作者、读者、编辑、审稿人等虽然参与学术期刊工作但无法对学术期刊评价形成显著影响。大数据时代中应运而生的学术期刊开放存取出版模式允许作者将论文自主存放至出版平台，用户免费获取并参与互动，作者、编辑、审稿人的工作都集中在这一论文之下，形成快速发表、多方参与、多向互动的学术共同体。

伴随学术期刊开放存取出版模式的普及，学术期刊评价的各类方法将逐渐融合。学术论文的创作、审核、发表以及论文的意见反馈等都将依托于融媒体与出版平台进行，期刊评价数据来源和获取方式更加便捷、多样，表现方式也更加直观。应基于大数据挖掘技术，加快对替代计量技术的研究和应用，推动期刊评价指标更加合理、赋值更加精准、权重分配更加科学，在学术成果静态评估的基础上，对成果发表后所产生的评价数据等进行动态更新，从而实现动态评估与静态评估的优势互补，实现学术期刊网络影响力的持续跟踪，推动学术传播模式与学术期刊评价的变迁和重构。

在数字浪潮中，学术期刊必须与时俱进，使学术交流和知识传播适应跨平台、融媒体的发展趋势，从而推动学术共享理念的不断普及，也对创新期刊评价理论与体系提出了新的要求，即期刊评价对学术网络活动与网络影响力的反映，以及学术期刊如何改善传统评价模式下数据收集效率不高、统计源渠道有限和指标权重设置不合理的问题。融媒体、跨平台的学术交流与传播不仅能够给予学术共同体更大的空间，同时也构建了更加便捷、互动性强的学术环境与相对透明、公平的学术秩序，新的学术生态正在形成。