人文社会科学学术评价及其治理①
——基于对“唯论文”及其治理的思考

2019-02-20 02:32:33

西北工业大学学报(社会科学版) 2019年4期

为贯彻落实习近平总书记在全国教育大会和2018年两院院士大会上的重要讲话精神，扭转不科学的教育评价和学术评价导向，2018年11月7日，教育部办公厅发布《关于开展清理“唯论文、唯帽子、唯职称、唯学历、唯奖项”专项行动的通知》，要求各有关高校开展“五唯”清理工作。在“五唯”中，“唯论文”处于最基础性地位，其他四个方面都与“唯论文”高度相关。“唯论文”有三个具体表现：唯论文数量，唯论文被引量，唯论文发表期刊影响因子。这三个具体表现都与数量和量化有关系，都与学术质量评价有关系。现在大家普遍感到“唯论文”的三个表现主导甚至绑架了人文社会科学学术生产和学术质量评价。

我是高等教育研究领域的一名学者，这些年来撰写和发表了大量学术论文，是一名作者；从2000年6月至2019年6月，我负责《高等教育研究》杂志的工作，是一名学术期刊的负责人和编辑；在从事高等教育研究和负责《高等教育研究》杂志工作的过程中，我阅读了包括教育学类学术期刊在内的大量学术期刊论文，是一名忠实的学术期刊论文的读者。另外，我在2008年5月至2018年11月担任华中科技大学教育科学研究院院长，负责学院的管理工作。因此，我想以作者、编者、读者这三重身份，结合我10年半的高校基层学术管理工作经历，主要从对“唯论文”及其治理的思考出发，谈谈人文社会科学学术评价及其治理问题。

一、关于学术论文数量问题

（一）为什么会追求学术论文数量

关于追求学术论文数量，有两种情况：一是学者个人追求学术论文数量，通常认为学者发表学术论文多则学术水平高、学术影响力大；二是学者所在的工作单位（如高校、院系）追求学术论文数量，通常认为单位发表学术论文多则反映单位的学术实力强，学术影响力大。这两种情况都是以量取胜，而且这两个方面是相互激励的。

不少高校和院系为了追求学术论文数量，采取了“大棒+胡萝卜”政策。一是对教师和研究生都制定了相应的考核标准和要求，如教师需要发表多少篇学术论文才能通过年度和聘期考核，才能晋升职称等；研究生需要发表多少篇学术论文才能获得答辩资格。这是“大棒式”政策，用“大棒”驱赶你去发表学术论文，追求学术论文数量；二是对教师和研究生发表学术论文进行奖励，不同高校对发表不同级别期刊（如顶级期刊、权威期刊）和影响因子的学术论文都制定了相应的奖励政策，有的高校对学术论文的奖励力度非常大。这是“胡萝卜式”政策，用奖励来激励你发表学术论文。这两者相互激励，导致学者和单位都追求学术论文数量。久而久之，学术研究的目的被异化了——教师为了学术职务晋升，为了学术奖励等而从事学术研究；研究生为了获得学位论文答辩资格而从事学术研究；单位为了追求学术实力和学术影响力而要求教师和研究生从事学术研究，从而使教师和研究生放弃了追求真理、追求学术的使命感。国外通常有学术职业的说法，认为高校教师从事的是学术职业。将学术作为职业，是高校教师的生存方式，高校教师靠学术职业吃饭，靠学术职业营生。对此，我们不能求全责备。但从学术发展和学术追求角度来看，高校教师不仅从事着学术职业，还需要将学术研究作为一种“天职”和“志业”（由德国社会学家马克斯·韦伯1918年提出），从而追求学术理想并履行学者的学术责任。目前我国人文社会科学研究领域所形成的对学术职业的强化和对学术志业的弱化，原因在于以下几个方面。

第一，新公共管理思想主宰了学术生产和学术管理。新公共管理思想的核心是追求绩效和效率，并以外部绩效评价和绩效问责机制来推进绩效和效率。所谓外部绩效评价，就是说绩效的大小、质量的高低，不能由学术共同体自己说了算，而要由外部利益相关者说了算，而且要用量化的方法和技术来测量和评价你的绩效。通过量化方法和技术来评价你的绩效，目的是实行绩效问责。通过绩效问责和绩效奖励增加推力（压力）和拉力，使你有更高的学术产出，取得更高的学术绩效。而所谓的绩效，就是学术论文的数量。

我曾在《高等教育质量保障：反思、批判与变革》一文中，揭示了绩效问责已经成为了一种意识形态，绩效评价已经成为外部利益相关者的一种权力、成为了一种单纯的技术手段。[1]我们可以看到，20世纪90年代以来，各种各样的大学排行榜如雨后春笋般出现，并为社会所接纳和认可。不论大学你信不信，社会公众、媒体，甚至从某种意义上讲，政府主管部门也相信它。在这种外部环境下，大学办学要“不为排行榜所左右”着实很难。即使那些声称“不为排行榜所左右”的大学校长，他们一方面在总结学校工作成绩，推介自己的大学时，无不是介绍学校各类人才的数量、获奖的数量、发表论文的数量，以及这些方面在全国高校中的排名等诸如此类的“干货”，并且选择对自己有利的排行榜来介绍。另一方面，他们在自己所主政的大学，在院系目标管理、教师学术评价等方面，大力推进量化管理和绩效问责，以促使学校有更多的学术论文等方面的产出，以使学校获得更好的社会评价和政府评价。所以，大学在办学过程中，一方面进入了外部绩效问责的巨大漩涡之中不能自已；另一方面，自己的进入又加大了巨大漩涡的能量，将更多的大学卷入其中。

第二，学术评价的理念和技术落后。首先是学术评价理念的偏颇。学术评价理念其实就是关于为什么要进行学术评价的认识，特别是对学术评价目的的认识。学术评价理念是有价值意义的，在回答为什么要进行学术评价时往往要强调价值引领，评价指标体系要受到评价理念的影响，并为评价理念所决定。而评价指标体系则完全是一个科学性问题，是落实和反映评价理念的工具。因此，有什么样的学术评价理念就有什么样的评价指标体系。目前，我国实行的学术评价，存在评价理念上的偏颇——为评价而评价，异化或者遮蔽了学术评价的目的。

学术评价目的应该是通过学术评价促进学术发展和进步，促进知识的增长，促进学术知识在经济社会发展中发挥更好的作用。但以追求学术绩效为目的的问责性学术评价，已经严重偏离了学术评价的目的，导致学术评价的异化，产生了学术绩效是评价出来的错觉，产生了对量化学术评价的崇拜。但这种学术评价神话在现实的学术生产过程中被击破——产生了学者学术生产的短视和学术尊严的丧失，带来大量投机取巧行为。学者学术生产的短视，就是学者只是以适应眼前的学术考核为目的，对照量化评价指标从事学术生产，从而放弃长远的学术追求，放弃学术质量而追求论文数量；学术尊严的丧失，就是学术工作沦为追逐名利的工具，为社会所不齿。不仅学者自身没有尊严，而且整个学术界都没有尊严。更不用说那些为了追求学术论文数量、达到考核要求而剽窃学术成果对学术尊严所造成的伤害了；投机取巧行为就是通常所说的“上有政策下有对策”，从而导致学术问责失灵——达不到通过问责来促进学术质量提升的目的。

其次是学术评价技术和方法落后。在人文社会科学领域，我国有不少大学排行榜都开发了针对学者和学科的评价指标体系，但基本上都处于粗放式阶段，大多数只进行最简单的、缺乏技术含量的论文数量统计。现在这种单纯的论文数量排行已经泛滥成灾，给学者及其所在单位开展严肃认真的学术研究造成了严重的负面影响，应该是“破五唯”要重点治理的对象。

曾经有评价机构将学者的H指数评价法引入国内，但影响不大，认同度还不高。H指数评价法相对于单纯的论文数量评价而言，是有科学性的。它综合考虑了论文数量和论文引用量两个方面。在同一个统计时段内，假如A发表了100篇论文，但是只有10篇论文被引用的次数大于等于10，那A的H指数就是10；假如B只发表了50篇论文，但是有20篇论文被引用的次数大于等于20，那B的H指数就是20。虽然B发表的论文数量比A少一半，但B的论文质量要比A高一倍。相对而言，这是比较科学的评价方法。但H指数评价法在我国人文社会科学领域运用的科学性，受到“论文被引量”的影响而大打折扣。因为复杂的原因，我国人文社会科学领域单篇论文的“被引量”并不一定能真实反映该论文的学术水平和质量。对此，我将在后文详述。

现在理工科很重视高被引论文（Highly Cited Papers），人文社会科学领域也开始重视起来。所谓高被引论文，顾名思义，就是在一定的统计时间段内，根据不同的研究主题或者科技期刊，单篇论文被引次数超过基准线（有不同的确定方法）的论文。[2]高被引论文的确可以反映学者论文的质量，但它主要针对的是单篇论文。因此，与学者H指数评价法相比，它没有考虑到学者论文发表的数量。因而，它对评价学者的学术论文质量和影响力有一定的局限性。

（二）如何看待学者学术论文数量与其学术水平之间的关系

目前基本的认识是，学者发表的学术论文越多，其学术影响力越大，学术水平越高。“唯论文”就是这样蔚然成风的。应该说，由学术论文数量来判断学者的学术水平有一定的道理。但学术水平是个综合性评价和判断，不能仅仅由学术论文数量来判断。极端的例子是，改革开放初期，我国人文社会科学领域有很多“述而不作”“述而少作”的学者，他们发表的学术论文数量并不多，但他们的学术影响力很大，学界大都认可其学术水平和学术地位。目前这样的例子不多了，大家都用论文数量来判断学者的学术水平。学者的学术论文数量与其学术水平之间并不是线性关系，至少在某个区间内不是线性关系。对此，我想从以下四个方面来谈。

第一，学术论文的篇幅与数量问题。在我国人文社会科学研究领域，有的学术期刊发文的篇幅很长，如《中国社会科学》《史林》等学术期刊发文篇幅都在3万字以上，而不少学术期刊发文篇幅在1万字以下。虽然不能简单地以篇幅长短来判断学术论文的质量，但作者所撰写的一篇数万字的学术论文显然要比一篇几千字的学术论文所花费的时间和精力要大得多，论文所涉及问题的广度也更广。学术论文所涉及问题的广度，往往与问题的研究深度有着高度关联性。我在指导博士研究生的过程中，学生经常向我反映说“为什么文章总是写不长，总是没有话说”。我认为，造成这种情况的重要原因是学术视野不够宽阔、知识积累不够、对问题和观点的论证缺乏多学科知识和理论的支持，而最根本的，是没有形成学术理论思维。因此，论文写作就只能是“巷子里赶猪直来直去”，论文的研究和思考深度就有很大的局限性。

第二，学术论文的学术贡献问题。学术论文的学术贡献就是论文的创新性，能够在学术前沿研究领域取得创新性成果，在学术研究的上游产出学术成果和思想观点。凡是成熟和规范的学科和研究领域，都有学科的核心理论和关键性学术问题。学术研究的确有上游、中游、下游研究之分。这里不是说中游、下游研究不重要，也不可能要求所有学者都去做上游的研究。但如果学者发表的学术论文，研究的问题都是一些中游和下游问题，即使他发表的论文再多，也难以说其学术水平很高。因为他的研究不在学术前沿领域，对学科的核心理论和关键学术问题的贡献不大，甚至没有贡献。

这里还要分别谈谈实证研究论文和评论性论文的学术贡献问题。目前，我国社会科学研究领域比较推崇实证研究，实证研究非常重要，也非常必要。但不少实证研究成果都是运用西方学者的理论，借鉴别人的研究框架和模型，运用别人的研究方法，加上一些自己调查得来的数据，做出研究结果了事。连必要的问题讨论，与同行研究结果的比较分析和解释都没有。有的演变为国外学者的理论、概念模型、测量量表在中国的运用案例。这样的实证研究虽有必要，但在理论模型、测量理论和方法、量表编制等关键性方面没有创新，没有实现中国化，只是验证了西方学者的理论和研究方法的科学性。从学术国际化层面来看，并不是具有创新性的研究成果。

关于评论性论文的学术贡献问题。我曾经研究过SCI、SSCI期刊目录中的教育学类和心理学类期刊的情况，发现凡是评论性的期刊或者评论性论文，其影响因子和论文引用率都很高。因为评论性论文都是该领域的学术大家所撰写，有的学术期刊专门约请学术大家来撰写评论性论文。但是，在我国人文社会科学领域，似乎一般学者都敢写评论性论文和对某一研究主题的综述性论文，也有不少学者为了追求学术论文数量，“跨界”撰写评论性论文和综述性论文。这类评论性论文的学术贡献可想而知。

第三，基于课题和项目研究的学术论文问题。我国目前有大量依托各级各类基金项目和课题而产生的人文社会科学学术论文。政府部门设置的各类基金和课题对人文社会科学学术研究提供了巨大支持，应该继续加大对人文社会科学研究项目和课题的支持力度。但是，在人文社会科学领域有实践背景强的学科，也有实践背景弱的学科；有理论性强的学科，如人文学科，有应用性强的学科，如教育学科；也有理论性和应用性都强的学科，如政治学、法学、经济学等学科。当然，各个学科内部其实都是以学科基本理论和方法论为核心而形成的“涟漪图式”。目前我国政府部门设置的人文社会科学的课题和项目，总体上都是以现实问题研究为核心，其立项原则就是要解决现实问题，或者有助于解决现实问题。即使是学科中的理论问题研究，也是以解决现实问题为原则的。因此，基于课题和项目研究而产出的学术论文，总体上都是立足于现实问题的，绝大部分都是一些理论应用性的研究，这就导致对学科和学术的源头理论和核心理论重视不够，研究成果的原始创新不够。

第四，关于第一作者论文问题。目前，有些学术评价和排名机构不区分第一作者，对作者学术论文进行全口径统计。有的学者学术论文数量达到数百篇，但第一作者论文所占比例很低；有的学者为了追求学术论文数量，要求学生发表学术论文时将自己挂名为第二作者。这些都不能准确反映学者的学术水平。我认为，在人文社会科学领域，尤其是文科基础理论研究领域，只有第一作者论文才能反映学者的学术水平。与理工科不同，文科领域真正有思想性和创新性的研究成果，不可能有太多的作者。因为文科优质学术论文主要以思想性见长，学术思想的个性化特征非常鲜明，不可能由多作者共同提出和共享。他人（团队成员、助手和学生）所做的工作和贡献，主要是辅助性的，对论文思想观点的确立没有实质性贡献。即使是多作者论文的署名顺序，也应该是提出了论文的基本观点和思想的作者优先。因此，我国的文科学术期刊目前基本没有实行“通讯作者”“共同第一作者”“同等贡献作者”署名制度，是有道理的。

二、关于学术论文被引量问题

一般说来，学术论文的被引量反映了学术论文在学术界的影响力和认可度。学术论文被引量高，说明学术论文在该研究领域提出了有影响力的、代表性的学术思想和观点，对该领域的研究工作做出了重要贡献。但相对于理工科的学术论文来说，人文社会科学学术论文的被引量问题极为复杂。理工科学术论文所研究的问题，一般都可以找到清晰的学术思想和学术问题谱系，源头性的观点及其发展脉络很清楚。在某一学术问题的解决上，谁做出了什么贡献，解决了什么问题，非常清楚。学术同行的后续研究，必定要也必定会引用观点和思想最先提出者的论文。否则，那就表明你还没有进入学术圈子，涉猎文献少，不了解学术圈子的研究状况。但是，人文社会科学的情况则要复杂得多。

（一）人文社会科学研究往往难于判断和找到某种学术思想观点的源头和谱系

人文社会科学研究的问题往往具有高度的开放性，即使围绕同一个问题，学者们都可能发表具有一定相似性的学术思想和观点。因此，在论文的引用方面就产生了四种情况：一是就作者本人而言，即使是受到别人学术思想观点启发后产生的学术观点，他也可以不注明是引用别人的论文，而作为自己的原生思想和观点，所谓“英雄所见略同”。对此，除非作者自律，他人一般难于判断；二是相关研究者的文献研究功夫做得不足，或者出于其他考虑，可能只引用后续者论文的观点，而不引用事实上的首创者论文的观点；三是相关研究者对论文的引用，并不是对已发表论文的核心思想观点的引用，而是引用一些枝节性观点；四是人文社会科学各学科之间的关联性很高，某一学科的学者，如教育学学者可能要引用社会学学者的论文，但由于作者对社会学相关问题的研究状况不甚了解，作者完全可能引用并非权威的社会学学者的研究成果和思想观点。这四种情况及其相互交织，都会导致论文引用的随意性和论文引用量不准确。

以笔者为例。在1999年我国启动高等教育大众化进程之后，我曾就“我们应该确立什么样的高等教育质量观”这一问题思考了很久，完成了《高等教育质量观与高等教育大众化进程》一文，发表于《江苏高教》2001年第6期，论文发表后被《新华文摘》全文转载。论文在吸纳1998年首届世界高等教育大会公报的有关思想的基础上，结合我国国情和高等教育发展实际，通过阐发高等教育质量观确立中的“优先性原则”，提出了我国高等教育大众化应该确立“多样化质量观”“发展性质量观”“整体性质量观”的观点。其中，“多样化质量观”是世界高等教育大会公报所提出和主张的，也为国内多位学者所介绍，不是我的独创。而“发展性质量观”和“整体性质量观”则是我根据我国高等教育发展实际和大众化发展需要提出的。我在对其进行概念化或命名上可谓苦心孤诣，至今都觉得存在缺陷。因此，我对其内涵进行了严格界定和说明。论文发表后，“发展性质量观”为学术同行所广泛引用。截至2019年8月30日，该文在CNKI上的引用量为320次，下载量为3684次。但是，我后来陆续发现，有的学者（假设是A）在自己的论文中采纳了“发展性质量观”的观点，但并没有注明是引用我的观点，当然这也有可能是“英雄所见略同”。但“发展性质量观”的概念化工作，是我首次做的，并提出来的。问题的关键是，B学者在论文中引用的是A学者的论文，而不是引用我的论文。这种情况非常普遍。由于文科学术期刊的编辑工作量极大，编辑人员还难以在论文文献引用上做正本清源的工作。这就导致学术论文的引用出现极为复杂的情况。

（二）人文社会科学研究中有大量“重复”研究，论文的创新性和学术贡献往往难以准确判断

在人文社会科学研究领域，有很多研究主题和问题是常做常新的，我们往往很难说是重复性研究。学者们站在不同的角度，根据不同的学术立场，从不同的侧面切入，都可以对同一问题发表不同看法，阐发不同的思想。这是人文社会科学研究的特点，也是学术繁荣的表现，所谓“百花齐放”。如教育学中的各种教育思想理论流派都有自己的教育思想，对于“什么是教育”，大家都可以发表自己的认识和看法。但“百家争鸣”则比较困难。学术争鸣要开展起来，需要具备很多条件。除了要具备外部的宽松学术环境之外，学术共同体内部的基本共识也非常重要。但由于人文社会科学研究往往充斥着学术观点的“相对主义”，很难达成基本共识，不少问题处于“公说公有理，婆说婆有理”的状态，学术争鸣由此失去了争鸣的基础。学术争鸣的本质是学术思想和观点的争鸣，但目前一些学术争鸣不是就根本性学术思想和观点展开争鸣，而是就枝节问题上的所谓“硬伤”展开讨论，容易演变为学者间的“相互攻击”。还有一种情况，有些学者为了吸引“眼球”，引起学界关注，增加自己论文的被引量，专门找知名学者开展学术“商榷”，但他们根本就没有正确理解商榷对象的学术思想和观点。而有些后续研究者不明就里，在自己论文中引用那些所谓的“商榷观点”，正中下怀。

（三）人文社会科学论文的被引量，主要反映的是学术论文选题的“现实热度”

对文史哲、语言、艺术等人文学科的研究而言，从业者总是少数人，学术论文的选题主要是学科中的基本理论问题，其现实热度不高，而且学术期刊的数量也比较少，因此，学术论文的被引量相对而言就不会太高。而社会科学的从业者数量相对则要大得多，学术论文的选题也容易与现实问题相结合，学术期刊的数量相对也比较多，因此，社会科学学术论文的被引量相对而言就会比较高。同时，在社会科学各学科内部，也有主要从事学科基本理论研究和现实问题研究的分别。总体而言，涉及基本理论问题研究的论文，其被引量要少于现实问题研究论文的被引量。但我们不能简单地说，人文学科和基本理论研究的学术论文水平和质量就比较低。

以笔者为例。我自己下了很大功夫所做的高等教育基本理论研究的论文，我自认为理论性比较强，水平是比较高的，但其被引量并不一定都很高。但我发表的一些关于高等教育改革发展现实热点问题研究的论文，其引用量却普遍比较高。如《关于地方本科高校转型发展若干问题的思考》一文，截至2019年8月30日，CNKI显示其被引用142次，下载5158次；《高等教育大众化背景下的教学质量保障问题》一文被引用155次，下载2999次。由此可以看出，论文被引量可能更多地反映了论文选题的“现实热度”，反映了高等教育研究界都在关注现实热点问题研究，而不大关注高等教育基本理论问题研究。其原因在于基本理论问题研究难度比较大，产出率相对比较低，加上一些学术期刊出于提高期刊影响因子的考虑，不大支持和关注基本理论问题研究，导致基本理论研究的论文发表比较困难。但就高等教育学学科建设和提高高等教育现实问题的研究质量而言，高等教育基本理论研究是基础。特别是从培养高等教育研究的继任者（博士和硕士），从而保证高等教育学术共同体充满生机和活力的角度来看，高等教育基本理论研究更加重要。

我国高等教育学学科发展历史短，学科的规范性还不够强，学科地位还比较低，高等教育学学科建设任重道远。这就要加强高等教育基本理论研究，培养具有深厚高等教育基本理论基础和较强理论思维能力的博士研究生。目前，我国高等教育学专业的博士生大部分都是从校门走进校门，缺乏高等教育改革发展的经验基础和对高等教育的感性认识。但大部分博士生的博士学位论文选题都是高等教育现实问题研究，有的选题来源于导师所承担的各类课题。在博士学位论文的研究和撰写过程中，文献阅读和文献研究急功近利，忽视对高等教育理论经典文献的阅读和研究，特别是忽视理论思维的养成；博士学位论文往往罗列一大堆理论基础，但却与具体问题研究和观点的阐发毫无关系，只是一种摆设。长此以往，高等教育研究队伍中就只有无数“建筑搬运工”而没有“大厦设计者”，其高等教育研究的质量可想而知。因此，高度重视高等教育基本理论研究，建立科学评价高等教育研究论文的质量标准，成为当务之急。我们不能简单地、一概地用论文被引量来判断学术论文的质量和水平，更不能简单地由其来说明学者的学术水平。

（四）人文社会科学学术论文的被引量，与学科的成熟度和规范性有很大关联

在西方知识体系中，所有学科都有共同的起源——哲学，以至牛顿将自己的物理学称为自然哲学。学科的分化产生了自然科学、社会科学与人文学科的分野，到了现代学科发展时期，技术科学迅猛发展，工程学如日中天。在人文社会科学内部，既有像文史哲这样的传统经典学科，也有像社会学、政治学、经济学、管理学这样的现代经典学科，还有适应现代社会需要发展起来的大量现代学科。不同学科的成熟度和规范性差异极大，学科门槛的差距也很大。

一般说来，成熟度高的学科，其入门处在半山腰。面对半山腰的入门处，有的人望而却步了，有的人在爬上半山腰的过程中就被淘汰了。同时，成熟度高的学科，其学科规范性强，其他学科的学者很难介入，所谓“隔行如隔山”，因此学术研究从业者少，发表论文的数量相对要少，论文的相互引用量一般不会太高；而成熟度低的学科，其入门处在山脚，很多人都可以比较轻松地入门，并且有大量其他学科的学者介入，因而从业者众，发表的论文相对就多，论文的相互引用量就大。因此，学科的成熟度和规范性，深刻地影响学术研究从业者队伍的规模，深刻地影响学术论文的质量，并且与学术论文的被引量有着极大的关联。

三、关于学术期刊影响因子问题

学术期刊的影响因子涉及学术期刊界和学术研究界这两大学术界别。一般认为，期刊影响因子高，期刊质量和学术论文质量就高。因此，学术期刊界高度关注期刊影响因子，希望多发表学术影响力大的学者的论文，甚至主动约稿、抢稿；学者也高度关注学术期刊影响因子，总希望将学术论文发表到影响因子高的学术期刊上。这两者之间也形成了相互激励的关系。但人文社会科学学术期刊影响因子问题也非常复杂。

第一，学术期刊影响因子并不一定能准确反映学术论文的质量。学术期刊影响因子与所发表论文的被引量有高度关联，但如前所述，论文被引量与学术研究从业者规模、学科的性质（基础性学科还是应用性学科）、学科研究的现实热度等众多因素有关。目前，无论是理工科还是文科，其基础学科的学术期刊（如数学、哲学、艺术学等学术期刊）的影响因子都不高，而技术层面和热点学科（如生命科学、医学等相关学科）学术期刊的影响因子都非常高。有资料显示，2018年1月，《临床医师癌症杂志》的影响因子为244.585，《新英格兰医学杂志》影响因子为79.258，《自然—能源》的影响因子为46.859，《自然》的影响因子为41.577，《科学》的影响因子为41.058。而世界数学领域的顶级学术期刊《数学年刊》《数学新进展》《美国数学会杂志》的影响因子一般为3左右。很显然，就期刊学术论文质量而言，我们不能说发表在《数学年刊》上的论文质量只是发表在《临床医师癌症杂志》上的论文质量的3/245。在人文社会科学领域，情况也是如此。因此，科学评价学术期刊影响因子及其论文质量，必须根据不同学科期刊的具体情况，对其影响因子和论文质量做等值性处理。但人们（期刊评价者、学术管理者等）目前不愿意做这种等值性处理，而是“唯影响因子”——用绝对影响因子来评价和判断不同学科领域学术论文的质量。这就使得人文社会科学期刊以及基础学科期刊“灰头土脸”，人文社会科学和基础科学的学者丧失学术尊严，从而使人文社会科学和基础科学研究受到极大影响。

第二，关于同类学科中不同学术期刊的影响因子问题。目前，我国人文社会科学同一学科内部都办有不同的学术期刊，如教育学科就有学前教育、基础教育、高等教育等方面的学术期刊，有教育理论、教育史、比较教育、课程与教学、教育领导与管理等方面的学术期刊，也有职业教育、成人教育、教育技术等方面的学术期刊，还有一些教育学分支学科和交叉学科的学术期刊。由于各类期刊所对应的具体学科领域不同，以及该学科领域研究问题的“现实热度”和从业者规模不同等复杂原因，学术期刊影响因子的差异比较大。如果简单地以学术期刊影响因子的大小来判断学术期刊的质量，就缺乏科学性与合理性。如教育学领域的教育史研究期刊比较少，从事教育史研究的学者数量也不多，而且目前的功利化社会环境和实用性学术环境也不利于开展教育史研究，因此，教育史研究期刊相对于其他教育学类学术期刊而言，其影响因子就比较低。但我们不能由此简单地认为教育史学术期刊的质量就比较低，进而认为教育史研究的学术论文质量低。

第三，关于综合性学术期刊的影响因子问题。我国有大量涵盖人文社会科学全领域的综合性学术期刊，省级社会科学联合会（社科院）一般都主办了综合性学术期刊，不少高等学校主办的文科学报也属于综合性学术期刊。综合性学术期刊的影响因子也非常复杂，只根据期刊影响因子来判断学术论文质量更缺乏科学性和合理性。假设A刊和B刊的影响因子相同，但A刊的影响因子可能主要是由其经济学栏目文章决定的，B刊的影响因子可能主要是由其社会学栏目文章决定的，很显然，我们不能说发表在A刊和B刊的经济学论文质量是一样的，对发表在A刊和B刊的社会学论文来说，也是如此。

这里我还要特别谈谈高校文科学报的建设和发展问题。如前所述，我国不少高校（包括许多理工科高校）都主办了文科学报或者学报人文社会科学版，高校文科学报大多数是综合性学术期刊。过去，高校文科学报主要立足校内，发表校内学者的论文和研究成果。现在，在激烈的期刊影响因子竞争中，特别是在单一学科（如经济学、社会学等）学术期刊的压力下，不少高校文科学报逐步失去了校内优秀学者稿源，影响力相对较大的文科学报则主动向全国知名学者约稿，导致高校文科学报正在向全国性学术期刊转变，并出现了很大的分化。大多数高校文科学报，特别是理工科高校主办的文科学报发展非常艰难，陷入进退两难的境地。高校文科学报何去何从，的确是一个大问题。

四、关于人文社会科学研究领域“唯论文”的治理问题

人文社会科学领域“唯论文”之所以成为顽瘴痼疾，根源在于形成“唯论文”的原因错综复杂。既有外部社会大环境的影响，也有我国学术生产体制机制的原因，还有人文社会科学研究的复杂性以及学术质量难以准确判定的原因。在技术层面，还有对“唯”与“不唯”的界限难以准确把握的问题。因此，治理“唯论文”非常复杂，这里只就其中的三个方面谈谈看法。

（一）要处理好“破”与“立”的关系：破“唯论文数量”立“学术贡献”

目前，教育部对“破五唯”工作进行了部署，要求有关高校对“五唯”现象进行清理，明确要用“破”的方法来治理“五唯”。但用“破”的方法来治理“五唯”，会面临有些学者所提出的问题：一味反“四唯”（教育部后来增加了“唯帽子”）又拿不出更合理的办法，比“四唯”更坏，会增加一些人篡改标准、自由心证的底气。不“四唯”，“唯”什么？唯觉悟？唯境界？唯“我看可以”？[3]这就是说，只破不立是难以治理“五唯”的。

要治理“唯论文”，需要“不破不立”与“先破后立”并举。现在的问题是破“唯论文数量”之后“立什么”，有学者提出破“唯论文”，根子在论文质量；要用学术影响来评价论文，认为论文发表后的影响才是学术评估的重要内容。[4]但人文社会科学学术论文的学术影响往往难以准确判定，因为没有衡量学术影响的标准。而一旦建立学术影响的评价标准，我们又会走到唯被引量、唯影响因子的老路上去。有理工科学者提出通过“学术评论句”来评价科技论文质量[5]，这种方法对科技论文评价是否可行，尚不明确；但对人文社会科学学术论文的评价而言，则缺乏可操作性。因为问题的关键在于由谁来写“学术评论句”，以及A专家写的“学术评论句”B专家是否认可。

我认为，人文社会科学领域治理“唯论文”，要破“唯论文数量”立“学术贡献”，同时要把握好“唯”论文数量与“不唯”论文数量之间的度。

关于破“唯论文数量”立“学术贡献”，国家自然科学基金委地学部在2019年人才项目评审中推行的一项新举措给我们以重要启示。该项新举措用“基础科学研究评价的四个考虑方面”来评价人才的主要学术贡献和创新。这四类学术创新是：一是方法学创新，是否创立了原创性的科学研究方法，可被用来解决重要的科学问题；二是关键科学证据，是否为重要科学问题的解决提供了新的、关键的、可靠的证据；三是理论认知或社会需求，是否对所在学科的认知体系或对解决重要社会需求背后的基础科学问题有实质贡献；四是学科发展，研究工作是否可以导致领域研究方向、范畴、视野（视角）的变革或者领域认知体系的显著进步，从而促进学科发展。[6]这项新举措提出的考察学术创新和学术贡献的四个方面，如果结合人文社会科学研究的特点进行适当改造和转换，是能够适合人文社会科学论文的学术贡献评价的。

关于把握好“唯”论文数量与“不唯”论文数量之间的度，虽然不好操作，但总体方向是：对学术论文的评价不可完全废除量化评价，从而用不能量化的指标代替能量化的指标，而是要实现适度的量化评价与严格的同行评议相结合。这就是说，我们还是要相信学术同行的“模糊评价”。与理工科学者不同，人文社会科学学者的学术水平和学术影响力是经过长期积淀形成的，一般不大可能“杀出一匹黑马”。由权威学者所进行的学术同行评价，虽然评价标准比较模糊，可能有时候还是“凭印象”“凭感觉”来进行评价，但只要他们人品端正，出于促进学术发展的“公心”和学术良心来进行评价，其评价结果一般都是可信的。他们对学术论文的评价结果、对人才的评价结果，肯定要比完全的量化评价方法评出来的结果要科学得多、准确得多。

（二）建立多元利益相关者协同治理的学术治理体制机制

治理与管理的重要区别之一是强调利益相关者共同参与的协同治理。如前所述，“五唯”的形成，原因非常复杂。因此，治理“五唯”，必须建立多元利益相关者协同治理的体制机制。就我国人文社会科学学术治理而言，其利益相关者主要有政府部门、高校及其院系、学术共同体（学科性专业学会）、媒体、学术期刊、学者等。这里主要就发挥政府部门、学术期刊这两个重要主体在协同治理“唯论文”中的作用谈谈粗浅看法。

第一，从政府部门来看，政府部门在学术规划、学术资源配置、学术生产、学术评价、学术奖励、人才项目等方面发挥着主导性作用。与西方国家实行的学术共同体学科制度和学术管理体制不同，我国目前实行的是国家学科制度和学术管理体制。这种学术管理的体制机制虽然具有某种优越性，但过强的行政干预容易导致学术生产和学术评价的行政化。特别是这些年来各级政府部门普遍实行学术生产的绩效管理、绩效评价、绩效奖励制度，在促进人文社会科学学术生产的同时，也存在因考虑人文社会科学学术生产特点不够而带来的问题。如对人文学科重视不够，忽视社会科学中的基础研究，学术研究的功利化色彩浓厚，学术浮躁现象比较普遍，等等。更为突出的是，这种由政府部门主导的学术生产和学术评价体制机制，挤压了学术共同体的空间，弱化了学术共同体的作用。

从学术生产和学术评价来看，学术共同体理应是关键主体，政府部门不可越俎代庖。因此，需要在政府部门领导下，建立有效发挥政府宏观管理作用和充分发挥学术共同体主体作用的学术生产和学术评价的体制机制。一是要提升人文社会科学领域的专业性学会的地位，充分发挥专业性学会等学术团体在学术评价中的作用，同时也要防止专业性学会的行政化倾向；二是要指导建立人文社会科学方面的研究基金会，促进公益性基金进入人文社会科学研究领域。西方国家的研究基金会非常发达，对繁荣人文社会科学学术研究发挥了重要作用。如美国的卡纳基教学促进基金会围绕美国高等教育改革发展以及大学教学和人才培养，开展了众多调查研究和专题研究，发布了不少重要报告，对政府高等教育决策和大学教育思想的转变产生了重要影响；三是支持和鼓励民间新型智库机构的建设和发展。一方面，目前我国的民间智库机构发育还不充分，数量少、类型单一；另一方面，大多数民间智库机构作用发挥不充分，处于边缘状态。需要政府部门在规范管理的基础上，大力支持和鼓励民间新型智库的建设和发展。

第二，从学术期刊来看，学术生产系统与学术期刊系统是整个学术生态系统的重要组成部分。一般说来，学术期刊系统依赖于学术生产系统。如果学术生产系统缺乏“源头活水”，学术期刊“难以成渠”；学术期刊纵为“巧妇”，也难为“无米之炊”。这就是说，应该由学术生产系统来主导学术期刊系统。但因为复杂的原因，两者的关系在现实中出现了逆转——学术期刊系统主导着学术生产系统。这种关系的逆转使得“唯论文”愈演愈烈，并严重影响学术同行评价的开展和实现。

上文提到的复杂原因至少表现在两个方面。一是目前的学术评价体制和机制，在通过一系列转换后，将学术论文质量和水平的同行评价工作“转嫁”给了学术期刊——用期刊影响因子来反映学术论文质量。而由影响因子所反映的学术论文质量和水平又直接关系到学者切身利益的实现——获得学位、晋升职称、得到奖励、通过考核、提高待遇、进入人才工程，等等。似乎学术期刊掌握着学者的“学术生命”，控制着学者的核心利益及其实现。这就把学术期刊置于风口浪尖，使得学术期刊面临巨大风险，承受着“不可承受之重”。二是学术期刊自身也卷入影响因子的巨大漩涡中不能自已。面对社会上普遍流行的影响因子崇拜，以及形形色色的期刊评价，不少学术期刊在办刊过程中被影响因子所裹挟。由此产生了如媒体所揭露的学术期刊与期刊评价机构搞关系、要求学者的论文引用自己期刊发表的文献等形形色色的“暗箱操作”。

学者学术生产之外的“核心利益”与学术期刊关联性太强，无论对学术发展本身还是对学术期刊建设来说都不是一件好事；学术期刊界围绕影响因子所展开的恶性竞争，必然扭曲学术期刊的学术使命，加剧恶化学术研究生态。因此，学术期刊在治理“唯论文”和改革学术评价制度方面，既是治理的对象，又是治理的主体。

对这类既是治理对象又是治理主体的治理问题，关键的治理措施主要有两个方面：一是要逐步改变学术评价的社会外部大环境，打破原有学术评价系统的平衡状态。学术期刊的“角色逆转”主要是在学术评价的外部环境下发生的，这个外部环境的形成，受到了新公共管理理论思想的深刻影响。新公共管理理论强调绩效，并通过建立绩效考核和问责机制来提高效率，认为质量和效率来自于考核和问责。从20世纪90年代开始，我国经济发展中的“GDP主义”，高等教育发展中的“以规模论英雄”，薪酬改革领域实行的“绩效工资”等，都源于新公共管理思想，并共同构成了学术生产、管理和评价的外部大环境。因此，要治理“唯论文”和改革学术评价制度，必须从改变社会外部大环境入手，需要统筹考虑，综合施策。二是学术期刊从自己的学术使命出发，准确定位自己的角色，加强自律，规范办刊，力求做学术健康发展的“守夜人”。社会外部大环境的改变是一个渐进过程，学术期刊不能坐等社会外部大环境改变后再来实施改革，而是应该主动作为，最根本的是坚守促进学术繁荣和学术创新的使命和初心。如前所述，目前学术期刊已经成为学术质量评价和学者核心利益的枢纽，如果学术期刊坚守使命和初心，不做“随波逐流者”，不做“助纣为虐者”，准确定位自己的角色，不为影响因子所左右，那么，学术期刊就能在治理“唯论文”和改革学术评价制度方面发挥独到作用。

（三）促进学术生产由“单位利益共同体”主导向“学术利益共同体”主导转变

同行评价是学术评价的共同规则，是世界各国学术评价的普遍做法。我国的人文社会科学学术评价，如基金课题、成果奖励、人才项目、学术论文、学位论文等方面的评审，大都实行了同行评价制度，并建立了相关回避制度，其目的在于保证学术质量评价的客观性和科学性。但这种学术同行评价制度，受到了我国“单位制”组织传统和“人情关系型”社会文化的冲击和挑战。

同行评价本质上应该是对学者个人学术水平的评价，但在目前的学术生产、学术管理和绩效考核体制下，学者个人是隶属于高校及其院系等“单位”的。在高校之间、高校内部院系之间激烈的资源竞争和发展竞争中，由于学者个人的学术质量和水平关系到“单位”发展的切身利益，因而形成了“单位利益共同体”，并且这种“单位利益共同体”往往要优先于“学术利益共同体”。另外，我国是一个“关系型”社会，“人情和关系”文化无孔不入，也影响着人文社会科学学术评价的客观性。这些都会冲击同行评价的存在基础，容易使同行评价流于形式。

剑桥大学原副校长阿什比曾经指出：在现代西方社会，学者往往面临“双重忠诚”问题——既要忠诚于他所属的学术共同体（本学科领域的世界性专业学会），又要忠诚于他所服务的机构（大学）。而当两者出现矛盾时，学者一般会选择忠诚于他所属的学术共同体。[7]这就是说，对西方学者而言，忠诚于学术共同体是具有优先性的。我国的学术传统和学术生产管理体制虽然与西方国家不同，但目的都是一样的，都是为了学术繁荣和学术创新，并通过学术繁荣和学术创新来履行学术研究的社会责任，来为国家发展和人的全面发展服务。这就必须在遵循学术生产共同规律的基础上，建立有利于学术繁荣和学术创新的学术生产管理体制和机制。我国目前由“单位利益共同体”所主导的学术生产及其管理体制机制，已经严重阻碍了学术繁荣和学术创新。[8]目前治理“唯论文”和改革学术评价制度，需要促进学术生产由“单位利益共同体”主导向“学术利益共同体”主导转变。

注释

① 本文根据笔者2019年4月27日在浙江大学召开的“《教育研究》论坛2019——破‘五唯’教育评价改革”上的发言提纲写作而成。

人文社会科学学术评价及其治理①——基于对“唯论文”及其治理的思考