研究型大学科研业绩考评的教师满意度现状
——基于10所高校教师的问卷调查分析

2019-03-19 09:20方宝

牡丹江教育学院学报 2019年2期

方宝

(广西中医药大学，南宁 530200)

在我国，为数不多的研究型大学往往聚集了各专业领域最优秀的一批专家、学者，并拥有着最为先进的实验室和实验设备，是科学研究的重要平台和科研创新的重要推动力量。近几年来，为推动高校科研评价工作的发展，国家各部委连续出台了多份文件，用于指导科研业绩评价改革，以营造良好的科研环境和促进高校科研创新。科研考评对教师的科研行为具有重要的引导和推动作用，而科研考评是否科学合理则要以“教师满意”为其重要衡量和参考。现有的相关文献虽然多有提及高校教师对科研业绩评价方式、方法存在诸多不满，但基于较大规模实证调查结果的专门研究仍非常缺乏。那么，总体上，研究型大学教师对当下的科研业绩考评是否满意？其满意或不满意的方面主要有哪些？不同的教师群体的考评满意度是否存在显著性差异？从受考评对象真实体验的角度来对这些问题加以研究可以更好地发现高校科研业绩考评所存在的问题，并加以改进。

一、科研业绩考评教师满意的基本内涵

上个世纪三十年代，Hoppe和Lewin首次在社会和实验心理学领域对满意理论进行探索，其研究表明，满意与自尊、信任以及忠诚都有密切关联[1]。后来，随着“满意”理念重要性日益凸显，顾客满意的相关研究日益成为统计学、管理学、教育学等研究领域的热点。目前，人们对“顾客满意”定义引用最多的是美国市场营销学家Kotler所提出的观点，其认为：顾客满意是顾客对一个组织所提供的全部产品，包括服务、活动、过程等的可感知效果与其期望值比较后形成的感受状态[2]。该界定比较清楚地表明满意程度是一种可以感知和测量的效果，是预期值与效果值之间的差异函数。如果个体的实际体验未达到其预期效果，个体就会产生一种消极的情绪或情感，也就是不满意；如果个体的实际体验与其预期相匹配或超过其预期，其就会产生一种积极的情绪或情感，即感到满意。这样的一个定义不仅符合心理学上对满意的基本定义，而且还为人们在实际中对满意度进行测量提供了一个可操作的理论支撑。

从本质上理解，高校教师的科研业绩考评既是高校实现对教师的一种管理，也是高校服务教师的一种体现。一个成熟的、科学的考评必须要得到其受评价主体的认可，即顾客(教师)满意。从科研业绩考评的本质出发，同时在借鉴顾客满意相关概念的基础上，本文认为教师对科研业绩考评满意的内涵至少应包括以下几个维度：一是从质量角度而论，其是教师对考评技术、方法应用以及指标设计等方面的认可程度。二是从价值层面而论，其是教师对考评所发挥功能和作用的认知与认可。三是从服务过程而论，其是教师对考评过程中所体现出的合理性、公平性以及受到尊重等方面的感知程度。四是从预期匹配而论，其是教师对科研业绩考评与其预先设想结果相一致的程度。五是从考评体验而论，其是教师是否对学校的考评制度表示赞赏，是否会忠诚于现有的考评制度，是否愿意将其作为成功经验进行对外分享的一种感受和意愿表达。

二、研究设计

本文主要采取问卷调查方法，对研究型大学教师科研业绩考评的满意度进行调查研究。根据研究内容与目标，研究的基本设计如下：

(一)研究目的

本研究的主要目的有以下三大方面：(1)对研究型大学科研业绩考评教师满意度相关指数进行测评；(2)了解不同教师群体(不同年龄段、职称、岗位类型、学科类型、性别等)之间的满意度差异；(3)通过对问卷数据的统计处理来深入剖析其中所凸显的问题，进而为改进教师科研业绩考评提出针对性的建议与对策。

(二)调查问卷

调查所使用的问卷是自行设计的《研究型大学教师科研业绩考评教师满意度调查问卷》。该问卷由两大部分组成，第一部分是教师个人的基本信息构成，包括所属学校、性别、年龄段、所属学科门类、岗位职务类型、现任职务等级、是否担任研究生导师等；第二部分是问卷的主体部分，即一个标准的Likert10级等级量表。量表的指数模型建构主要以“美国顾客满意度指数模型”(American Customer Satisfaction Index：ACSI)为参考[3]。量表总体由24个题项组成，其中包含科研业绩考评教师满意相关的7个维度(潜变量)，即教师满意、价值感知、质量感知、弹性感知、教师期待、教师抱怨、教师忠诚，其中“质量感知”潜变量之下又包含2个二级潜变量，即指标设置与技术应用变量。量表各潜变量包含的测评指标如下(表1)所示：

(三)研究对象

研究的对象是我国10所研究型大学的专任教师，不包括学生辅导员、行政人员与工勤人员等非狭义上的教师。研究最终所确定的10所样本大学分别是：北京大学、电子科技大学、复旦大学、华东师范大学、华中科技大学、天津大学、兰州大学、西北工业大学、厦门大学、中山大学。这10所大学都是我国的“985工程”和“双一流”大学，而且其无论是从知名度、学科构成、发展特色，还是从地域分布而言，都具有良好的代表性。根据研究对象的性质以及从研究的可行性出发，本研究采取了方便抽样与配额抽样相结合的方法进行抽样，从最后确定的10所研究型大学教师中抽取样本，对其发放问卷，并使问卷发放尽可能覆盖到每所大学多数院系的老师。

三、问卷调查实施与数据回收

在正式实施问卷调查之前，笔者对所编制好的问卷进行了多次调适和预测试研究，确保问卷具有较好的信度、效度和区分度，并符合本次调研的需求。

(一)问卷调查的实施

研究主要采取通过网络发送和回收问卷的方式进行调查。笔者首先借助“问卷星”专业网站所提供的网络问卷制作工具，将编制好的问卷转换成相应的网页版本。其次，通过网络搜索查寻到样本大学各院系教师的邮箱，并将所获取的教师邮箱按大学以及院系进行分类汇总。再次，对所搜集到的教师邮箱，根据其大学、院系分布情况进行多次筛选，直至各大学教师的数量及其院系分布趋向合理。最后，编写统一的邮件内容，在其中表明调研者身份、调研目的、问卷题项数量、对信息的保密承诺、笔者联系方式以及致谢等信息，并将问卷网址链接粘贴在邮件中的显眼位置。随后按统一模式逐一对筛选后的教师邮箱发送邮件。由于部分教师在网络上公布的邮箱地址有误，或者已经失效，所以最后能成功送达目标教师的邮件会比实际发送的数量有所减少。据不完全统计，在这10所大学中，本次调研共发送邮件6180多封。在邮件发出后的3个星期内(我们以这个时间点为调研的终止时间点)，在链接的网页问卷上填答了问卷的教师数量为916位，以此计算，本次调研问卷的回收率为14.82%。所回收问卷的学校分布如下表(表2)所示：

表2 问卷发放与回收情况统计

网络调查的不可控因素比较多，因此问卷回收率低是一个可以预见的结果，对此，本研究也进行充分估计，并主要采取大幅度增加问卷发放量的措施来加以应对。本次调研总体回收的问卷虽然比预期数量略少，但整体差别不太大，而且问卷的学校分布也比较合理。此外，在网页版问卷设计的时候，笔者将其设置为“填答人员必须要逐一填完问卷所有题项后方能提交”的模式，从而保障了所回收的问卷均为无数据缺失的有效问卷。

表3 10所不同大学教师问卷数据总体的方差分析结果统计

为了进一步检验问卷数据质量，即检验从不同大学目标教师所获取的数据分布是否存在显著性差异，笔者通过SPSS20.0统计软件对10所大学样本总体在量表各个题项上的综合得分进行单因素方差分析处理。首先是样本总体的方差齐整性检验，其统计结果(表3)表明，其相伴概率为0.860，大于显著性水平0.05，因此可以认为10所大学的样本总体方差是相等的，满足方差检验的前提条件。其次，从单因素方差分析的结果可以看到，方差检验的F值为1.226，其F值比较小，其相伴概率为0.275，明显大于显著性水平0.05，这说明组间差异不显著。可以认为10所大学之间的数据样本分布没有统计学意义上的显著性差异，即各大学受调查教师来自的样本总体相对一致。

(二)调查样本的构成

为了进一步观察样本的构成，笔者对样本总体按照问卷提供的基本信息进行分类统计。从下表(表4)的相关统计数据中可以看到：男女教师各自所占的比例分别为71.1%与28.9%，其中中青年教师占主体；副高级和正高级教师占多数比例，这基本符合研究型大学师资构成的现状；“是否担任研究生导师”与“现任岗位职务类型”的统计信息也基本符合研究型大学的教师岗位设置现状。此外，按“所属学科门类”的构成来看，除了军事学以外，其它学科均有教师参与问卷调查。虽然各学科门类教师的比例有较大差异，但总体上人文社会科学领域与自然科学领域的教师人数相对均衡。可以认为，样本总体构成比较合理，符合调研目的需要。

表4 问卷调查样本的具体构成统计

四、问卷数据的统计分析

问卷数据的统计分析主要分两大方面进行：一是对教师总体的满意度进行测评；二是深入了解不同教师群体(不同年龄段、职称、岗位类型、学科门类、性别等)之间的满意度差异。

(一)教师总体满意度的描述性统计分析

为了增强读者对教师满意度状况的直观感受，本研究将教师在量表24个题项上的得分结果换算成100分制，因此量表总体得分的最高值为100分，单个题项的最高分值也为100分。从下表(表5)中有关量表得分的均值和中值来看，教师的总体得分主要分布在60分以下，这说明总体上教师对科研业绩考评的满意度为中等水平。从其标准差来看，教师之间的满意度具有较大的差异。

表5 问卷调查样本数据的描述性统计结果汇总

a. 存在多个众数，仅显示最小值。

同时，为了进一步观察不同分数段教师的分布情况，笔者将总体教师按其得分从低到高进行排序，其四分位数，即排名第25%、第50%、第75%的教师的得分值分别是45.94、59.58、72.92。由此可见，高分数段教师组的测评得分并不高，而低分段教师组的测评得分明显偏低。同时从各个分数段教师所占的比例来看，主体教师的分值分布在40-80之间，而测评得分在80以上(即总体比较满意)的教师比例仅为12.0%。同时，从下表(表6)的统计结果可以看到，总体上参与问卷调查教师在科研业绩考评7个不同维度的满意度测评得分都不高，且彼此之间的均值差异也不大。其中均值最高的是“教师满意”潜变量，而均值最低的是“教师忠诚”潜变量。

表6 量表各潜变量得分均值的描述性统计结果汇总

综合表5与表6的统计结果，我们基本可以判定，总体上教师们对当下的科研业绩考评并不太满意。教师总体普遍满意或非常满意的情况并没有出现，其对科研业绩考评的某一个方面(单个潜变量)比较满意的情况也不存在。

(二)不同教师群组满意度的差异性分析

根据问卷基本信息部分所提供的相关信息，本研究将总体教师划分为不同的群组，进而通过SPSS20.0软件对不同群组教师的满意度状况进行差异性检验。

1.不同性别教师群组满意度的差异性检验

SPSS20.0软件对不同性别教师群体的各潜变量以及总体得分均值进行独立样本T检验处理的结果表明(表7)，不同性别组方差方程的 Levene 检验的F值相伴概率均大于显著水平0.05，不能拒绝方差相等的假设，即可以认为男女性别组满意度方差无显著差异。不同性别教师满意度均值的独立样本T检验结果表明，无论是在总体得分还是各潜变量的得分上，男女教师之间都不存在显著性差异(其均值差异t检验的P值均大于0.05显著性水平)。

表7 不同性别教师群组满意度均值的独立样本T检验结果统计

2.不同学科门类教师群组满意度的差异性检验

本次调查样本覆盖了12个学科门类，为了使均值比较更具意义，笔者将这12个学科门类进一步划归两大类，即人文社会科学类(包括：哲学、哲学、经济学、法学、教育学、文学、历史学、管理学、艺术学)和自然科学类(包括：理学、工学、医学、农学)。其中人文社会科学类与自然科学类的样本所占的比例分别为45.5%与54.5%。笔者分别对这两类教师的各潜变量以及总体得分均值进行两独立样本T检验处理。

表8 不同学科类型教师满意度均值的独立样本T检验结果统计

SPSS20.0统计软件的处理结果表明(表8)，不同类型组别方差方程的 Levene 检验的F值相伴概率均大于显著水平0.05，不能拒绝方差相等的假设，即可以认为不同类型组别满意度均值方差无显著差异。从两者的均值比较来看，人文社会科学组的满意均值在7个潜变量和总体得分上都小于自然科学组的均值，说明人文社会科学教师对当下科研业绩考评的满意度普遍更低。人文社会科学教师与自然科学教师组别的独立样本T检验结果表明，两者的差异在质量感知、弹性设置以及教师抱怨3个潜变量上具有统计学上的显著性(其均值差异t检验的P值均大于0.05显著性水平)。

3.不同年龄阶段教师群组满意度的差异性检验

问卷的基本信息部分对教师的年龄段从26岁开始统计，每隔五年为一个统计段，以“61岁以上”为最后一个年龄统计段，将教师整体划分为了8个年龄段。为了检验不同年龄段的教师在各个潜变量以及总体得分上的均值是否存在显著性差异，以教师年龄为分组标准，对不同组别教师之间的满意度得分均值进行了单因素方差分析。

表9 不同年龄段教师满意度均值的单因素方差分析结果统计

SPSS20.0软件的处理结果表明(表9)，其方差齐性检验的相伴概率都大于显著性水平0.05，因此可以认为各个年龄段组别的总体方差是相等的，满足方差检验的前提条件。从单因素方差分析的结果来看，7个潜变量和总体均分变量的相伴概率值(P值)都大于显著性水平0.05，表示不能拒绝零假设，也就是总体上不同年龄段教师组之间在7个不同的潜变量和量表总体得分上都不具有显著性差异。这说明年龄因素对教师的满意度测评结果不会产生显著性影响。

4.不同岗位类型教师群组满意度的差异性检验

问卷将所有教师的职务类型划分为教学为主型、教学科研并重型、科研为主型以及未分类型四大类别。选填“未分类”选项的问卷，自然无法判定其职务归属，同时由于选择该选项的问卷数量也比较少，一共只为9份，笔者故而将其剔除。通过SPSS20.0统计软件对三组不同职务类型教师在各个潜变量以及总体得分上的均值进行了单因素方差分析处理。

表10 不同岗位类型教师满意度均值的单因素方差分析结果统计

统计软件的处理结果表明(表10)，其方差齐性检验的相伴概率都大于显著性水平0.05，因此可以认为各个组别的总体方差是相等的，满足方差检验的前提条件。从单因素方差分析的结果看，其8个变量的相伴概率都大于显著性水平0.05，表示不能拒绝零假设，也就是总体上不同岗位类型教师组之间在7个不同的潜变量以及总体得分的均值上不具有显著性差异，可以认为教师的岗位类型对其科研业绩考评满意度测评结果不会产生显著性影响。

5.不同职务等级教师群组满意度的差异性检验

问卷将教师总体根据其职务等级，将其划分为正高级、副高级、中级、初级以及未定职5个不同的职级类别。从样本构成来看，具有初级职称的教师仅为2人，而暂未定职的教师仅为4人，因此这两类教师不具有组间均值比较的统计意义，故将这6个样本数据剔除。为了进一步检验三大职务等级样本教师组别之间在各个潜变量以及总体得分上的均值比较是否具有组间显著性差异，笔者通过SPSS20.0统计软件对其进行了单因素方差分析处理。软件处理的结果表明(表11)，在方差齐性的前提下，7个潜变量及总体均分变量的相伴概率都小于0.05，表示拒绝零假设，也就是总体上在3个不同职务级别的教师组(教授、副教授、讲师)中，至少有一个组与其它两个组在不同变量得分上具有显著性差异。

表11 不同职务等级教师满意度均值的单因素方差分析结果统计

为了进一步比较不同职务等级教师在各变量得分均值上的差异性，笔者对不同职务级别教师在各个变量满意度得分的均值进行了多重比较分析。SPSS20.0统计软件处理的结果表明(表12)，在8个存在显著性差异的变量中，正高组的满意度均值都显著高于副高组(P﹤0.05)。总体上正高组的满意度均值在各大变量上都高于中级组，但只有在“教师抱怨”潜变量上存在统计意义上的显著性差异(P﹤0.05)。另外一个比较有趣的现象是，除了“教师抱怨”潜变量以外，副高组的满意度均值都普遍低于中级职称组。从理性上分析，具有正高职称教师的科研业绩一般都较为突出，因此其满意度普遍高于具有副高和中级职称的教师是一个正常现象。但是副高职称组教师的满意度普遍低于中级职称组教师，倒是一个令人费解的现象，其具体成因需要通过进一步探究方可获知。

表12 不同职务等级教师满意度均值的

*.均值差的显著性水平为 0.05。

6.不同导师身份教师群组满意度的差异性检验

问卷将教师总体按其是否担任研究生导师分为了博士研究生导师、硕士研究生导师与非研究生导师三个不同的教师组别。为了检验不同导师身份是否对教师的满意度测评在7个潜变量以及总体得分上产生重要影响，笔者通过SPSS20.0统计软件对相应的统计数据进行了单因素方差分析。软件处理结果表明(表13)，在方差齐性的前提下，8个潜变量的相伴概率都小于0.05，表示拒绝零假设，也就是总体上在是否担任研究生导师的三个不同教师组别中，至少有一个组与其它两个组在8个不同的变量得分均值上具有显著差性异性。

为了进一步检验三个不同导师身份教师组别在8个变量得分上具有什么样的差异性，笔者对数据进行了相应的LSD多重比较分析处理，其结果表明(表14)，在8个存在显著性差异的变量中，博士生导师组的满意度均值都显著高于硕士生导师组(P﹤0.05)。总体上，博士生导师组的满意度均值在各变量上都高于非导师组，但只有在教师满意、教师期望、教师抱怨、教师忠诚、总体均分5个变量上存在显著性差异。此外，硕士生导师组的满意度均值都普遍低于非导师组，但其差异性比较小。不同导师身份教师满意度均值的单因素方差分析结果与不同职务等级教师满意度均值比较的结果大致一致。

表13 不同导师身份教师满意度均值的单因素方差分析结果统计

表14 不同导师身份教师满意度均值的LSD多重比较结果统计

*. 均值差的显著性水平为 0.05。

五、研究的主要发现与反思

(一)研究的主要发现

本研究主要发现有以下三大方面：

一是教师总体对当下科研业绩考评的满意度偏低。总体教师的满意度均值仅为58.6592(满分100为分)，测评得分在80分以上教师比例仅为12.0%。此外，对样本性别、所属年龄段与不同岗位类型进行的独立样本T检验或单因素方差分析结果表明，无论是在总体得分还是各潜变量的得分上，不同教师群体之间都不存在显著性差异。因此，可以认为教师的满意度水平不受其性别、岗位类型以及年龄段等因素的显著影响，即都表现为总体不满意。

二是教师总体的满意度水平受其职级水平和导师身份的显著影响。总体上具有教授职务等级的博士生导师对科研业绩考评的满意度最高，具有副教授职务等级的硕士研究生导师对科研业绩考评的总体满意度最低，而具有中级职务等级的非研究生导师对科研业绩考评的总体满意度居中。

三是教师的满意度水平总体呈现较大的学科差异性，总体上人文社科类教师的满意度比自然科学类教师的满意度偏低。对样本按学科大类两分法进行的独立样本T检验结果表明，人文社会科学类教师组的满意度均值在7个潜变量和总体得分上都小于自然科学类教师组的均值。同时，两者的差异在质量感知、弹性设置以及教师抱怨3个潜变量上具有统计意义上的显著性。

(二)研究结果反思

一是测评结果凸显教师存在的多面性不满表明，当下科研业绩考评所存在的问题不是某一个方面或单一制度不当所引发，而是整体考评机制体系设置不合理及其相互作用所致。近几年来，随着高校科研评价扮演着越来越重要的角色，大学科研评价所存在的问题日益受到学者们的质疑和诟病。一些学者分析指出，当下学术评价的探讨和研究虽然呈现繁荣趋势，但学术评价依然是乱象纷纭，比如，存在评价过度量化、“以刊评文”、“影响因子狂热”、行政主导、权力异化等诸多问题[4][5] [6]。而导致这些乱象的根源“不仅仅是评价体系不合理的问题，更是因为科研体制缺陷所致。因此，要治理科研乱象问题，改革不合理的科研体制才是根本途径”[7]。为此，要更好地改进高校教师的科研业绩考评，就必须从整体上对考评机制体系进行再设计与优化，而不是仅仅对某个或某些方面进行细枝末节的技术性修补。

二是高校科研考评政策所覆盖的不同群体特征往往复杂多样，一般的理性认知与分析可能会对决策的科学性造成误判，因此应加强对被考评群体进行广泛而深入调研。对于本次研究中所产生的“具有副高级职称教师群体的满意度最低”的困惑，笔者对其中2所样本大学中的一些年轻教师进行了进一步访谈研究。调研发现，由于研究型大学教师的入职门槛都比较高，能够进入研究型大学任教的人员一般都是知名大学博士毕业生，而且往往都要具备较高的学术、科研能力，因此对他们当中的大多数人而言，完成科研业绩考评并不具有太大压力。而对于具有副高级职称的教师而言，他们面临着与更高职称级别教师进行科研资源竞争的压力。而在这些竞争中，资历相对低的副教授、特别是新晋升的副教授，自然处于劣势，因此他们的压力最大，对考评的满意度最低。这给我们的启发是，对不同职级教师的科研业绩考评，不能只是简单地按照其职级高低进行业绩数量上的增减，而应该考虑不同教师群体的特点，设置具有较大差异性和体现教师不同发展阶段特征的考评指标体系。

三是教师的满意度体现一定的学科差异性、教师职级差异性，这要求我们必须重视分类考评机制的设置。对此，《教育部关于深化高校教师考核评价制度改革的指导意见》(教师[2016]7号)中也明确提出要“实行科学合理的分类评价”，针对不同类型、层次教师，按照哲学社会科学、自然科学等不同学科领域，基础研究、应用研究等不同研究类型，建立科学合理的分类评价标准。从现实来看，目前，对大学教师的科研业绩进行分类考评基本已经取得共识。从分类的实际情况来看，按岗位类型(教学型、科研型)与学科领域(人文社科、自然科学等)等因素进行的分类评价设置相对成熟，但是按研究类型(基础理论研究型与应用研究型)对教师科研业绩进行的分类评价设置仍存在较大不足，其突出表现在，对应用型研究类教师的社会效益和实际贡献考评方式设置相对比较单一、缺乏灵活性。此外，对教师科研业绩按个体评价与团队评价进行的分类考评设置普遍缺乏。当下大学的科研业绩考评主要是以对教师个体的考评为主，对以科研团队、科研平台为基本单位的评价机制设计则非常缺乏。此外，从分级评价的角度来看，目前多数评价基本都是按教师的职称将其分为初级、中级、副高级和正高级四大层次分别进行科研业绩考评。但是仅仅将庞杂教师队伍分为四个等级来进行评价还是略显粗糙，不利于体现不同教师群体的差异性。

研究型大学科研业绩考评的教师满意度现状——基于10所高校教师的问卷调查分析