元评价视域下大学学术评价体系的审视与重构*

2023-06-05 18:19:38耿旭

当代教育论坛 2023年5期

耿旭

学术评价体系是对学术研究成果进行事实判断与价值判断的行动指南，其合理性关乎学术研究成果评定的信度和效度。从政策层面看，国家先后出台的《关于分类推进人才评价机制改革的指导意见》《深化新时代教育评价改革总体方案》等政策，均致力于构建科学有效的学术评价体系。从实践层面看，虽然我国高校已落实相关创新性举措，但学术评价体系仍存在诸多问题，如“五唯”问题根深蒂固。从根本上看，学术评价体系不是简单的评价标准、评价制度和评价方法的求和，而是一种综合性的价值判断。元评价理论主张回归学术评价体系价值判断的功能，发挥评价的引导、保障与激励作用，确保评价标准、评价制度以及评价方法的科学性与有效性。从已有的研究来看，尽管学界已对大学学术评价体系存在的功利性、唯量化、单一标准等表象问题进行了详细的阐释，但少有学者从元评价理论的视域出发，探讨大学学术评价体系的根本性问题。鉴于此，本研究基于元评价理论的分析框架和研究视角，审视大学学术评价体系在评价标准、评价制度和评价方法等方面存在的问题，提出综合性价值判断下的学术评价体系的优化路径，以重构大学学术评价体系。

一、元评价视域下的学术评价体系：一种综合性的价值判断

评价是在综合考察价值主体需要与价值客体属性的基础上，基于价值主体需要判断价值客体属性与功能的活动。区别于传统教育评价活动，元评价是一项基于教育评价的本质做出价值判断的特殊的教育活动。评价内涵价值主体“我”的存在且价值主体包含“态度、选择、情感和意志”等主体认识。因此，该评价是基于主体认识形成的一种综合性的反映活动[1]。由此可得到两种不同的认识：一种是知识性认识，该认识建立在对被评客体的状况和功能的认识基础上，停留于事实判断的阶段；另一种是评价性认识，基于主体需要和客体属性的价值关系表达事物存在的价值属性与价值意义，故该认识是建立在事实判断基础上的价值判断[2]。元评价正是基于一定的价值标准和理论框架对教育评价活动展开的评价性认识。因此，在该评价过程中，价值主体、价值客体、评价性认识以及元评价形成“评价环”，即价值主体的需要成为元评价首要审视的对象。如此循环，元评价则重点考察价值主体需要。有学者指出，元评价是评价的循环与价值原点[3]47-57。评价主体对高等教育评价本身或某一项评价活动的认识都应回归评价的原点，以对评价的原因和本质做出哲学层面的追问。因此，元评价不仅涉及评价活动的事实问题，还涉及对评价本身的价值追问，这正是元评价的价值表征。

美国加利福尼亚大学教授马文·艾尔肯（Marvin C.Alkin）基于方法、价值与应用三个维度划分评价理论，绘制了“评价理论树”，其中“元评价”在评价理论树上被划分为“价值”分支[3]47-57，即元评价是对评价进行的价值判断，是维持和保障评价体系的信度和效度，改进和完善评价工作的特殊质量保障机制。元评价有其内在价值标准和程序规范以保障评价的质量，具体而言，包括对评价理论的评价、制度体系的评价、方法技术的评价，即标准、制度、技术等方面的评价。基于上述分析，元评价理论下的学术评价体系是指评价者依据一定的评价标准、运用科学的评价方法、构建完善的评价制度，以保证和提升学术评价质量的一种特殊的评价方式，具体可表现为一种综合性的价值判断。

（一）评价标准的质量导向性

元评价理论认为，在评价标准上应首先考虑实效性标准，以评价其功用性；其次考虑可行性标准和适当性标准，以评价是否能够满足利益相关者的需求和是否存在利益冲突等；最后满足上述三条标准再考虑准确性标准。尽管元评价理论阐述了多种评价标准，但最根本的是实效性标准，即对学术价值的评价。它要求大学学术评价标准改变以工具理性为主的价值取向，指向构建以质量导向为基础的评价标准。从本质上看，大学学术评价是判断学术研究成果学术价值与社会价值的依据，也是激励学者进行研究与创新的手段。因此，只有构建质量导向的评价标准，才能保证评价结果的信度与效度。究其原因，可以概括为两个方面：其一，知识生产与创新是质量导向评价标准构建的价值追求。大学作为高深知识的生产者，担负着促进知识生产与创新的任务，这从客观上要求大学学术评价标准需坚持质量导向，从根本上保证学术生产与创新的价值性。换言之，构建质量导向的大学学术评价标准是确保大学学术知识生产与创新的重要前提。其二，大学职能的多元化是质量导向评价标准实施的现实要求。从大学的职能看，大学肩负着人才培养、科学研究与社会服务等多重任务，且基于大学职能的划分延伸出以教学、科研和社会服务为重点的教学型学术、探究型学术与应用型学术，不同的学术类型在学术评价中应享有同等重要的位置。但在评价实践中，存在重点突出以科研成果数量为主的探究型学术评价，而教学型学术和应用型学术被排斥在学术评价之外的现象。不同的学术类型采用同质性和数量至上的学术评价标准，不仅有违于多种学术类型分类评价的逻辑，而且会严重抑制大学学术的繁荣与发展。

（二）评价制度的程序规范性

“规范”是指建立在价值基础上的共同的学术信念，为学术共同体成员提供一套完整的学术价值标准。元评价从组织管理的角度阐明学术评价制度的重要性，旨在通过学术评价制度的规范性以达到“善治”之目标。鉴于学术评价对象的特殊性和复杂性，及评价结果的科学性和有效性，元评价对大学学术评价体系在具体操作层面提出合乎规范的新要求。理想状态下的学术评价制度体系包括外部制度体系和内部规范体系，其中外部制度体系是由行政主体制定的一系列制度构成；内部规范体系则是由学术共同体共同协商而建构的。这正契合元评价要求下评价制度体系的规范性与完善性，不仅强调以制度体系约束学术评价中权力与责任的失衡，而且主张通过建构共同的学术评价信任框架，以弥补学术评价外部制度体系的强制性与工具性。在学术评价实践中，强调学术治理的绩效问责和外部利益相关者的权力，故其必须接受学术评价制度体系的规制：一方面，引导学术治理由绩效问责走向学术信任。基于学术信任的评价环境，学术资源的委托者和代理者是互相协作的关系，即委托者以具体的信任行动取代刚性的监管和控制，赋予学术代理者自由探索学术研究的权力，同时学术资源代理者能够基于学术期望和学术兴趣进行知识生产与创新[4]。另一方面，确保大学学术评价制度的完整性。学术评价制度是由外部评价制度和内部评价制度共同构成的制度体系，任何制度类型的缺失与错位都将抑制学术评价活动的顺利开展，且完整的学术评价制度不仅明确界定学术评价的组织与管理，分析学术评价活动的规范性，监督原有教育评价活动的运行，而且通过对学术评价程序的规制，可保证学术评价结果的公正，提高评价结果的可靠性和有效性。

（三）评价方法的科学合理性

元评价基于评价内容的不同采取不同的评价方法，包括基于评价技术的定量分析和基于评价环境的定性分析[5]。同时，有学者指出，元评价还包括内部元评价和外部元评价，其中内部元评价是以定性与定量相结合的方法对评价内容和评价过程的评价；外部元评价是以访谈法对评价现状的评价[6]。从上述内容可以看出，一方面，元评价以评价方法与技术为评价对象，通过对评价方法的科学性以及优缺点的综合考虑，获得准确、可靠的评价结论；另一方面，强调定量评价与定性评价的结合。科学的评价方法应坚持事实判断与价值判断的统一，既包括对评价现状的事实判断，又强调评价内容和评价过程的价值判断。而当前追求唯量化的学术评价方法，只停留于对学术评价事实判断的基础上，尚未上升至对学术评价的价值判断，背离了元评价的本质，无法判断学术评价的质量。因此，元评价视域下的学术评价体系，在评价方法上应突破过去局限于研究成果的量化统计，采取综合性的评价方法以对研究成果的质和量进行事实判断和价值判断。

二、元评价视域下大学学术评价体系的问题审视

就大学学术评价的事实判断和价值判断而言，元评价分别从评价标准、评价制度和评价方法等层面做出规定性的要求。然而，在评价实践中，囿于行政主义的管理倾向和工具理性的价值导向，大学学术评价体系表现为学术评价标准的外化和同质、学术评价制度的不完善以及学术评价方法的唯量化，从而导致学术评价本真价值、正义价值和人本价值的缺失。

（一）学术评价标准的外化和同质造成学术评价本真价值的流失

元评价视域下评价标准的质量导向彰显其促进知识生产与创新的目标，要求基于大学人才培养、科学研究和社会服务的多元化职能构建分类评价标准。然而，目前大学学术评价标准存在外化与同质的问题，不仅相悖于元评价的理论逻辑，而且造成学术评价本真价值的流失。具体而言，一是学术评价标准的外化驱使大学学术的市场化。随着知识市场化的发展，高等教育的发展模式由避免其卷入市场的理想化模式转变为以高等教育涉足商业活动作为维护公众利益办法的现实模式。在此模式下，知识被看成是一种可以购买、以货币为单位的东西[7]。在商品交易市场，“知识交易”被贴上如教师职称、学位、职务等外在评价要素，甚至以学术期刊级别、影响因子等指标评价教师的学术活动。同时，以市场化为背景的学术部落，使学者面临着来自满足政府、工业、社会公众等群体的需求和学科内部评价标准带来的学术控制等双重学术压力。在压力的驱使下，学者必须将认知发展与社会影响相联系，一味迎合重数量、轻质量的“工分式”评价标准。此种以简单的数字作为判断学者学术贡献与创新的参考依据，不仅将学术成果质量较高者拒于学术职务晋升的大门之外，出现“劣币驱逐良币”的现象，而且加速学术评价标准的外化，难以体现学术的本真价值与促进学术创新性发展。

二是学术评价标准的同质忽视不同学术类型的差异性。构建分类评价标准的目标是合理评价不同学术类型教师的学术生产力与学术价值。在政策层面，我国政府相继出台一系列政策文件，试图推进分类评价的落实与发展，如《深化新时代教育评价改革总体方案》中提出高校教师科研评价应根据不同学科、不同岗位特点，坚持分类评价；《第五轮学科评估工作方案》中明确指出，根据不同门类、不同学科特点，以一级学科为单元，突出特色，体现优势，强化不同学科的分类评价。然而，在具体操作层面，却表现为用一把尺子丈量不同学术类型教师的学术成果。不同学术类型具有差异化的评价标准，比如教学型教师更加突出其教学能力，研究型教师则侧重科研能力，应用型教师重视操作能力，而同质化的评价标准则未体现不同类型教师在人才培养、科学研究、社会服务等方面的评价权重，导致不同学术类型教师学术活动差异性和贡献性的缺失，出现马克斯·韦伯所担忧的局面——学术所享有的利益，对科学出于兴趣的选择和学术特长的发挥，在更多方面愈加恶化[8]。

（二）学术评价制度的不完善致使学术评价正义价值的沦陷

元评价视域下，评价制度的完善性以监控评价过程、改进评价实施为载体，保证评价活动的规范性和合理性。就学术评价制度而言，学术评价制度的完善性是确保学术评价程序正义的前提。约翰·罗尔斯在《正义论》中指出，程序正义包括纯粹的程序正义、不完善的程序正义和完善的程序正义，其中，“不完善的程序正义”表现为当有一种判断正确结果的独立标准时，却没有可以把握达到它的程序[9]73。大学学术评价体系是由多元主体共同参与的，承载着不同主体的价值偏好和利益导向，作为参与被评价的学者，将受到来自内部科研评价体系和外部科研环境的双重影响。因此，学术评价的正义价值需要置于制度环境和制度文化中才能得以合理解释，才能体现学术评价制度的合逻辑性。

在实际运行中，学术评价制度的不完善使评价制度陷入双重困境：一是单向性的评价制度环境。长期以来，自上而下的学术评价制度主导着学术评价活动。中央政府以出台改进学术评价政策为主要任务，地方政府则上传下达，按照上级政策的指示督促高校落实相关政策。高校虽在具体学术评价实践中针对评价标准、评价主体、评价方法等内容做出相应的调整，但作为被评价的学者，却将完成高校设置的考核指标作为第一要务，较少参与学术评价制度的制定。因此，自上而下的学术评价制度以行政管理为导向，将学术权力高度集中于行政主体，而被评价主体则拥有较少的发言权。有学者调查发现，多位高校教师认为本校学术评价制度的制定是由学校科研管理部门或人事管理部门组织，自己则较少参与制度设计和制度实施的过程[10]。二是效率崇拜的评价制度文化。工具理性也被称为“效率理性”，工具是主体实现自身利益的手段，故研究者与科研成果之间的关系演化为“目的—手段”的关系，教师将论文发表数量和项目审批数量作为学术产出的目标，出现追逐学术产出效率而忽视学术价值的现象。就其本质而言，以效率为导向的学术评价制度是大学学术评价物化逻辑的结果，外显于绩效导向的价值观和精神劳动被过分“货币化”，与研究人员的内在发展与科研成果的社会价值并无必然联系。学术评价制度的不完善性是元评价制度缺失的表现。由于其在学术评价过程中缺少对评价制度的监控而使学术评价制度环境和制度文化出现异化的现象，不仅导致学术评价正义价值的沦陷，更是元评价参与学术治理的失范。

（三）学术评价方法的唯量化引致学术人本价值的缺位

元评价强调评价方法的科学性，表现在学术评价上主张采取科学合理的评价方法，全面评估学术评价的多重价值，达到事实判断和价值判断的统一。然而，受实证主义和技术理性思潮的影响，我国学术评价走向“重数字、重量化”的评价阶段，表现为以事实判断为主而严重忽视学术评价中所蕴含的价值意义。马克斯·韦伯指出，工具理性是一种技术理性，认为现代技术赋予事物数量化和规范化，渗透于学术评价制度中表现为以论文、项目数量等表象数字作为学术评价的依据。正如舒尔曼所言，量化方法被等同于技术统治的世界观。在此观念的影响下，质性评价方法因其复杂化和难以操作化而受到评价主体的否定，导致量化评价在学术评价领域迅速蔓延，且长期控制着学术评价方法的发展方向。哈贝马斯把这种观念称为“技术统治论”，认为其实质是将控制自然的方式延伸至社会领域，把科技的物化逻辑渗透到社会文化的生活层面，成为支配生活世界的对象性力量[11]。

当前，政府通过一系列政策文件试图扭转量化评价在学术评价中的主导地位，如《关于深化高等学校教师职称制度改革的指导意见》和《深化新时代教育评价改革总体方案》，均提出不得将论文数、项目数、课题经费等科研量化指标与绩效工资分配、奖励挂钩。量化评价虽能在一定程度上反映出学术研究的厚度，却恰恰不一定能切实体现出学术研究与创新的深度，甚至还会压抑学术创新的活力。学术研究是学者持续努力的结果，不是几日可达、阶段性的表现。量化评价方法不仅违背学术发展的内在规律，更是对学术生命价值的忽视。如1982 年的诺贝尔奖获得者、美国康奈尔大学的威尔逊教授曾因连续4 年未发表一篇论文，在获奖前险些被该大学解聘[12]。学术研究是学者基于学术兴趣、付出学术努力而进行学术创新的过程。数量至上的学术追求不仅抑制学术创新，忽视学术研究成果的质量，而且导致“学者”“学术”沦为评价的工具，贬低学术研究的人本价值。

三、元评价视域下大学学术评价体系的优化路径

长期以来，学术评价的数量导向导致学术与研究者沦为知识和技术的奴隶。立足于元评价的视角，在评价理论和评价实践活动中始终坚持质量导向，强调在事实判断的基础上对学术评价的价值进行思考与探寻，主张回归学术评价的本质，为学术创新营造良好的评价环境，对于摆脱工具理性的桎梏、实现价值理性的回归具有重要的意义。

（一）优化基于质量导向的学术评价标准

优化基于质量导向的学术评价标准，首先要思考学术质量评价的价值预设是什么、如何评价以及由谁来评价等问题，否则难以从根本上扭转数量至上的学术评价导向。基于此，遵循元评价标准的质量导向应从以下几个方面着手。

首先，秉持以质量为前提的价值追求。评价标准是价值标准的直观再现，存在于价值主体与价值客体所形成的多种价值关系之中，故价值主体选择评价标准的过程正是反映其价值导向的过程。换言之，学术评价标准的选择应以质量导向的价值标准为基础。然而，笼罩在数量至上的学术评价环境下，质量导向的价值追求已被评价主体抛之脑后，而代之以简单、易操作的量化指标。因此，秉持以质量为前提的价值追求是构建基于质量导向学术评价标准的价值预设。具体而言，一是发挥元评价价值判断的功能，引导学术评价标准从关注论文与科研项目的数量向注重学术研究成果的质量转变，重点关注学术研究成果的学术价值和社会价值，回归学术评价的价值判断功能；二是转变科研管理效能，以科研规律代之以管理规律为主的学术评价逻辑，突出以科研创新和社会贡献的学术评价目标，发挥学术评价“以评促教”的重要作用，回归大学育人本位的教育本体价值[13]。

其次，构建多维分类评价机制。评价机制约束着评价主客体的行为以及评价方式的实施，是实现评价目标的关键力量。美国教育家欧内斯特·博耶对学术类型进行了划分，在学术质量上通过分析不同学术类型的典型特征，明确不同学术类型质量标准的共同点与不同点，分别建构了基于不同学术类型的分类评价体系。如，发现的学术和综合的学术以知识的建构与创新为根本目的，应将学术本体价值作为评价标准的核心，彰显其学术影响力；应用的学术侧重于知识的应用范畴，在评价标准中应强调其经济社会效益和实践贡献；教学的学术则强调知识的传播，学术评价标准需要凸显教师的教学能力。本研究认为，可借鉴美国教育元评价的实效性标准、可行性标准、适当性标准和准确性标准，建构适合我国学术评价实践的标准体系。具体可包括：评价学术研究成果本质的原则性标准、关注评价指标体系和评价信息采集与统计的操作性标准、指向评价主体间利益与权力冲突的伦理标准、保证评价方法科学的技术性标准。

最后，建立多元主体评价体系。学术评价的质量标准是不同利益主体基于不同视角而作出的价值判断，具有较强的主观相对性。因此，学术评价标准的构建以及评价学术的质量，需要兼顾不同利益主体的主观需求，以构建涵盖多元利益主体的学术评价体系。具体来说，大学学术评价质量标准的制定应建立在行政主体、学术共同体和终端用户等多元利益主体共同商议的基础上，以行政主体为牵引，收集学术共同体和终端用户的建议，共同制定学术评价的质量标准。另外，基于教学型学术、探究型学术、应用型学术研究范式和评价逻辑的不同，构建基于共同的学术研究旨趣、共同的学术研究范式、共同的学术话语体系的多样化学术研究共同体，保证学术评价质量标准的建构[14]。

（二）健全基于程序正义的学术评价制度

元评价对评价过程的评价指向学术评价程序的正当性。程序正当意指学术评价过程正当，遵循学术评价制度体系的规范性，以得出公正的学术评价结果。程序正当是结果公正的必要条件，只有在制度体系的规制下才能确保结果公正。美国经济学家诺思（Douglass C.North）认为，制度包括三个方面：正式制度、非正式制度和实施机制。其中，正式制度是指具有强制约束力的政治规则、经济规则和契约等；非正式制度是指在长期的社会活动中日渐形成的行为规范、意识形态以及惯例等，此种不具有强制力特征的“软约束”，成为正式约束的延伸与补充，塑造主体的交往与互动行为；实施机制则是保证制度得以执行和发挥作用的手段或措施[15]。因此，从制度的构成维度来看，制度体系的建设离不开正式制度与非正式制度的统一，并借以外在实施机制发挥学术评价制度的规制作用，从而保障学术评价程序的公正性。

首先，以自下而上的制度设计完善学术评价制度体系。就大学学术评价实践而言，在国家层面推出相应宏观政策后，各高校应基于学术评价现状制定并出台与之相匹配的具有约束特征的学术评价制度，旨在通过上下“同频共振”的制度体系，规制大学学术评价活动中的异化现象。同时，最大程度地降低行政权力对学术评价的干预，建立学术评价权力行使的制度体系，具体可包括学术评价信息公开制度、学术评价监督制度、回溯和责任追究制度[9]78-81。

其次，通过非正式制度营造良好的学术生态环境。非正式制度弥补正式制度的强制性与监督性，延伸出尊重、包容与理解的学术文化。在长期的学术评价实践中，学术共同体自发形成基于学术道德规范的生态环境，并在潜移默化的过程中影响学术共同体的学术行为。然而，学术生态环境的良好与否取决于非正式制度对学术共同体的主观塑造。学术共同体作为知识含金量极高的职业，应当具有较高的学术规范意识。随着学术不端行为的频繁发生，需要从培养学术共同体遵守学术规范、坚守道德准则和规制学术共同体权力的行使等方面塑造基于个体的学术规范意识，以维护学术纯洁和塑造良好的学术生态环境。

最后，建立元评价制度体系。如前所述，元评价是对评价标准、评价制度、评价方法的监测和调整，故元评价在评价过程中发挥着实施机制的规制作用，其目标是保证评价活动回归正循环。然而，元评价制度在大学学术评价活动中的缺位，需要基于元评价价值体系的制度开发：一方面，借鉴国外元评价的过程和标准体系，结合我国大学学术评价的实际情况，建构适合我国大学学术评价的元评价制度，既包括元评价标准的开发，也涵盖对评价内容和结论的申诉制度和仲裁制度；另一方面，元评价资源的缺失也可能导致元评价制度的缺位，比如缺乏元评价者和评价经费等。因此，确保元评价享有必要的人力资源和物力资源也是建立元评价制度的重要基础。换言之，具备元评价的资源才能促使元评价从理论探讨走向实际操作[16]。

（三）融合量化与质性的学术评价方法

就大学科研影响而言，既包括基于学术知识生产与创新的学术影响，又涵盖促进知识传播与应用的非学术影响。不同科研影响的评价方法存在明显的差异，仅以量化方法评价学术影响，而非学术影响则难以通过量化方法作出合理的判断。休谟曾在《人性论》中提出“事实判断”与“价值判断”的概念，在评价方法上表现为量化评价与质性评价。事实上，当前学术评价乱象频发的根本原因在于评价方法的滥用，致使学术评价难以按照评价目的和评价规律进行合理的事实判断与价值判断。以促进知识生产与创新为主的质量导向是大学学术评价的内在规定，亦是科学选取学术评价方法应遵循的基本原则。科学的评价方法应兼顾量化指标与质量导向，既能基于简单、易操作的量化评价作出事实判断，又符合学术评价质量导向的价值判断理念。合理的学术评价体系是以实证主义为基础的量化评价与以人文主义为基础的质性评价的有机结合。

首先，建立基于量化评价指标的代表作同行评议制度。一方面，充分发挥科学计量学方法在发掘和统计研究者科研成果等方面的多重数据采集作用，并形成定量表征；另一方面，借助同行专家的专业知识和科研积累完善对研究内容等方面的质性评价，以公开评价的方式保证质性评价的透明和公正。同时，将同行专家评价结果与定量表征信息进行对比，形成制衡机制。此举既能实现量化评价与质性评价的融合，又能规避同行专家基于质性评价的暗箱操作，保证同行评议制度的理性逻辑。

其次，构建定量评价的质量标准。学术评价的主要目标是对研究成果的学术价值和社会价值进行判断，而局限于数量标准尚不能合理判断出研究成果的学术影响与非学术影响，故应以质量标准取代数量标准。可在学术评价的过程中，设置提交研究成果数量的上限，引导研究者追求科研成果的质量目标。英国卓越研究框架明确规定参与评价的人员，每人最多可以提交4 篇研究成果，对于超出数量的研究成果，将不被列入参评的范围，同时确立高质量成果的不可取代性，以高质量成果替代低质量成果，弱化低水平的“数量标准”[17]。

最后，扩大数据采集范围以提高其质量。正如科学计量学创始人彭菲尔德（T.Penfield）所指出的，一项全面综合的学术评价包括描述性文本、科学计量的证据、基于利益相关者的调查、媒体影响与政策采纳程度等多种复杂性因素[18]。因此，在大数据时代，应借助其多重性数据采集、精准性价值判断，以及非显性数据挖掘等特征完善量化评价方法，从根本上保证评价数据的范围、内容，从而做出全面、客观的学术评价。