张冰冰,张青根,沈红
随着世界一流大学和一流学科建设进程的加快,中国高等教育逐渐受到国外竞争的冲击,人才培养的国际化亟待加强,关键则是教师队伍的国际化。中国政府每年投入大量资源资助高校教师到海外访学,根本目的是通过“一流大学、一流学科和一流导师”的合作模式参与相关学科的前沿研究,提升教师的学术能力。同时,随着科学管理在高校的兴盛,学术评价愈加走向量化,作为追求学术声誉最大化的高校,科研评价比重日益上升,为筛选出更具学术潜力的教师,也为建设国际化的教师队伍,一般要求教师在入职或晋升时至少拥有一年及以上的海外访学经历。由此,海外访学经历成为了衡量教师学术能力的重要指标之一,造成了海外访学信号效应的外显,具体表现在:对教师而言,海外访学经历是入职和晋升的硬性要求,与收入水平直接挂钩,教师为实现收入最大化而寻求访学机会;对高校而言,在量化评价体系下,海外访学教师的比例是教师队伍质量和国际化程度的表征,为迎合学科评估而鼓励教师海外访学。然而,一方面,由于缺乏对海外访学政策效果的评估,对其生产效应的判断仍停留在经验层面,高校也多止步于拥有海外访学经历的教师比例等量化指标的上升,忽视了对海外访学生产效应的准确计量;另一方面,海外访学存在严重的信号效应,能够传递关于教师学术能力的信号,故教师盲目地去丰富这一履历,忽视了其本质在于学术能力的提升,导致了海外访学往往流于形式。总之,实践中对海外访学效果的政策评估环节的缺失导致了教师“为访学而访学”和高校“为评价而评价”的现象普遍存在,教师和高校也由此忽视了海外访学的本质目的,并不关注海外访学信号效应与生产效应的匹配。
在学界,与海外访学相关的研究多集中于经验总结与建议(曹丹平,2015)、现状问题与出路(张柳,2012)、跨文化适应(杨阳等,2013)、管理制度改革(张传亮等,2015)等方面。仅有少数集中在对海外访学的收益研究上,具体而言:其一,对访学收益的理论分析,集中讨论海外访学收益的类型和表现,但对访学收益的类型划分并不统一,其中陈学飞(2004)认为出国访学的社会效益要远远大于个人效益,其中个人收益又具有社会效益性质;桑德森(Sanderson,2008)认为在国际化过程中教师会获得工具性收益和人文性收益,前者与自身的成功紧密相关,而后者则与理解、接受、尊敬和平等等国际化意识紧密相关;也有学者认为教师的访学收益主要体现在知识效益和态度效益上,但态度效益因其需要在沉浸式的学习环境中才能获得而更为重要(Biraimah et al.,2013);更有学者在迪尔多夫的跨文化能力发展模型的基础上,将访学收益划分为内部收益和外部收益,前者包括认知维度、态度和社会维度上的收益,后者包括科研创新、教学改革和国际合作上的收益(蒋玉梅等,2015;陈晓军,2017)。其二,对海外访学的收益进行实证研究,但多通过自评法对教师的科研产出进行量化。黄明东(2016)等通过对访问学者的自评调查发现,出国访学并没有对其科研能力、学术水平或管理水平产生较大的帮助,但对其“理念与方法”和科研项目经历有所助益,且访学动机和访学过程对访学效果具有显著的正向影响;同时,马万华(2016)对北京市的调查表明,虽然教师认为进修期间和回国后在科研方面的收获很大,但仅有24%的人在进修期间公开发表过相关论文。然而,杨光富(2014)对华东师范大学的调查表明了有96%的青年教师认为海外访学有利于其专业发展;同时,张玮佳(2015)发现在H大学的理工科中,有出国留学经历的教师在论文产出和科研项目方面更具有优势,但在著作和获奖方面则并不占优势;此外,也有研究通过质性分析发现海外访学教师在内外部收益上具有显著的提升(蒋玉梅等,2015)。
综上,相关理论研究都认为海外访学会对教师的科研产出有所帮助,这既表现在海外访学对教师科研能力的提升直接作用,例如国际合作、科研项目参与和研究方法学习等外在因素,还表现在海外访学能够改善教师的学术理念与认知等内在因素,这些内在和外在因素的改变最终都应有助于教师论文产出的提升。然而,相关的实证研究仍不足,一方面,已有实证研究多通过自评法对教师的科研产出提升进行分析,且所得到的结论也并不统一;另一方面,少数实证研究虽然通过论文产出来评估海外访学对论文产出的提升效果,但仍停留在描述性分析阶段(韩福乐,2013),这种评估难以区分教师论文产出的自然增长效果与政策影响效果。为此,本研究利用2014年中国大学教师调查数据,通过倾向得分匹配方法,探讨海外访学经历对高校教师论文产出的真实影响,既有利于验证长期以来各界对海外访学经历的生产效应的认知,为高校教师管理和质量提升提供契合的实践证据,又有利于在理论上厘清海外访学的信号效应与生产效应之间的关系(张青根等,2016),为相关理论在学术劳动力市场中的应用提供基础。
本研究所使用的数据存在以下偏差:其一,调查数据并不能够保证有海外访学经历和没有海外访学经历的教师分布是随机的;其二,海外访学经历是分类变量,这可能会导致包含不可观测因素的误差项与解释变量之间的相关;其三,教师是否拥有海外访学经历会受到个人、家庭和高校三个层面的影响,包括学术认知、学术能力、家庭状况、工作环境和工作预期等多个因素,难以保证教师在上述因素上的分布是完全随机的。上述选择偏差的存在并不能保证传统OLS估计量的无偏性、一致性和有效性,故需采用其他的计量方法来纠正由选择性偏差所造成的估计偏差,其中最为理想的是完全随机试验的方法,可保证干预组和控制组在可观测变量和不可观测变量上具有随机的分布,但考虑到本研究属于影响评估研究,既无法人为地对教师进行随机化分组以施加干预,又受限于截面数据和缺乏有效的工具变量,故更适合采用准试验方法中的倾向得分匹配方法(Propensity Scores Match Method,PSM)。当前,已有的实证研究多用描述性统计和传统OLS估计,PSM方法既能够有效地控制上述三种偏差的影响,又可对无法进行随机试验的截面数据进行因果推断。
罗森鲍姆和鲁宾在1983年提出了倾向得分匹配法,其核心是通过一系列协变量计算出样本接受干预的概率,将概率相当的干预组和控制组相匹配以构成彼此在统计上的对照组,并将二者在结果变量上的差异作为项目的平均处理效应。假定PSM的协变量矩阵为X,干预变量为ω,样本接受干预的倾向得分为P,其处理效应T如公式(1)所示:
T=E(Y1│ω=1,P)-E(Y0│ω=0,P)
(1)
为此,PSM方法基于以倾向得分为支撑的非混淆假设条件来进行反事实估计,其处理效应指标包括平均处理效应(Average Treatment Effect, ATE)、干预组平均处理效应(Average Treatment Effect on the Treated, ATT)和控制组处理效应(Average Treatment Effect on the Untreated, ATU)。具体而言,ATE表示从总体样本中随机抽取单一个体的期望处理效应,ATT则表示从干预组随机抽取单一个体不接受干预时的期望处理效应,ATE则表示从控制组随机抽取单一个体接受干预时的期望处理效应,具体计算公式如下:
ATT=E(P(X)|ω=1){E[Y1|ω=1,P(X)]-E[Y0|ω=0,P(X)] }
ATU=E(P(X)|ω=0){E[Y1|ω=1,P(X)]-E[Y0|ω=0,P(X)] }
ATE=E[Y1-Y0,P(X)]
(2)
然而,倾向得分匹配方法具有两个至关重要的前提假设,其一是共同支撑假设(Common Support Assumption),该假设是PSM方法的基础,要求干预组和控制组在协变量X的每个可能取值上都存在正向概率,即干预组和控制组在倾向得分分布上具有相同或重叠的部分,重叠区域越大,样本的保存率就越高,匹配质量也相对越高;其二是条件独立假设(Conditional Independence Assumption),该假设是指在控制可观测因素X后,结果变量与干预变量之间相互独立,这要求必须基于丰富的协变量才能进行PSM估计,否则会出现由于遗漏不可观测因素而造成干预变量内生的可能,但该假设并不能直接被验证,只可通过干预组和控制组在匹配前后协变量差异的显著性变化来判断,即平衡性检验。
倾向得分匹配方法的实施有以下步骤:第一,选择协变量,协变量应当既与干预变量相关,又与结果变量相关,并需选择足够丰富的协变量以提高研究的内外部效度;第二,估计倾向得分,常见模型包括Probit、Logit和判别分析等,其中以Logit模型最为常见;第三,选择匹配方法,常见的匹配方法有六种,分别是最近邻匹配、卡尺匹配、卡尺内最近邻匹配、核匹配、局部线性回归匹配和分层匹配,其中前三种可归类于近邻匹配法或贪婪匹配,其匹配结果为临近的部分个体,并对其进行简单的算术平均,后三种可归类于整体匹配法,其匹配结果为不同组的全部个体,并根据个体距离不同给予不同的权重;第四,匹配效果检验,包括对条件独立假设和共同支撑假设的检验,以反映选择偏差的控制程度和混淆变量选取的好坏;第五,估计处理效应,包括ATT、ATU和ATE三个指标,其中以ATT为主;第六,进行敏感性分析,估计不可控制因素对研究结果的影响程度。具体到本研究中,一是对传统OLS的估计结果和PSM的处理效应进行对比;二是对不同匹配方法的估计结果进行对比,其中以K=1的最近邻匹配为主要匹配方法,并对K的不同取值进行估计,同时也辅以半径匹配、核匹配和局部线性匹配的匹配结果;三是对比不同持续时间的海外访学经历的处理效应,由此既对比不同估计方法之间的差异,又可作为稳健性检验的一部分。
本研究所用数据来源于国家自然科学基金项目“大学教师评价的效能研究”支持的2014年中国大学教师调查,涉及大学教师的个人基本信息、教学与研究、工作及管理、个人与家庭四个部分,较为全面地调查了教师工作与发展状况。该调查通过“问卷星网络调查软件”给全国13个省份的88所高校35418名教师的邮箱发送调查问卷,受邮箱接收限制的影响,有效发送21533个邮箱,最终回收有效问卷5186份,有效问卷回收率为24%*更为详细的调查介绍及样本分布情况参见沈红发表于2016年第2期《高等教育研究》的文章。。本研究将研究对象限定为已获得博士学位的高校教师,并剔除论文产出缺失的样本*匿名审稿人指出论文发表系统性缺失的问题,需注意的是,调查中拥有博士学位的教师样本为4582人,在调查中并未直接询问教师的发表情况,而是通过将调查邮箱与姓名相匹配的方式,在相关数据库中反向查找教师的发表情况,不可避免地出现了调查邮箱难以与姓名匹配的现象发生,这部分样本量为364,故最终有效样本量为4218名。至于变量存在系统性缺失的问题,即选择性偏差的存在,本研究所使用的倾向匹配得分估计可有效地避免上述偏差的影响。,最终有效样本数为4218,其中男性有3119人,女性有1099人;东、中、西部分别有2510人、750人和959人;985高校、211高校和一般本科院校分别有1626人、1201人和1391人;青年教师(35岁及以下)有1138人,中年教师(36-50岁)有2489人,老年教师(50岁以上)有591人;拥有一年及以上海外访学经历的教师有1778人,其他教师有2440人。
本研究的结果变量为论文产出,其分布如表1所示。考虑到教师的一作论文发表反映了教师作为研究主要负责人的学术能力,其贡献程度理应大于非一作论文发表,故将教师的一作论文发表和非一作论文发表按照1∶0.5的比例进行加权;又考虑到教师论文发表的学科差异和影响力差异,并兼顾论文产出的质量和数量,分别选取了被SCI或SSCI收录的论文(国外发表)和被CSSCI或CSCD收录的论文(国内发表)两个指标,并对其进行3∶1的加权计算,由此可计算出教师自进入学术职业后的总体论文产出当量。考虑到当前大多高校的入职和晋升标准中对海外访学时间的设定为一年及以上,本研究的将拥有一年及以上的海外访学作为干预变量。此外,考虑到未来相关政策的可扩展性和稳健性检验需要,本研究同样以三个月、半年、九个月、十五个月、一年半和两年为节点估计了海外访学对论文产出的处理效应。
表1 高校教师论文发表情况汇总
如表2所示,协变量包括个人、家庭和组织三个维度的变量,具体如下:其一,人口统计学特征,分别以女性、少数民族、未婚和青年教师为参照组;其二,家庭社会经济特征*本研究将被调查者的职业合并成三大职业分类,其中第一类职业为国家和社会管理者,经理人员,私营企业主,专业技术人员(含教师、医生等);第二类职业包括企事业单位普通员工,产业工人,个体工商户,商业服务人员和军人;第三类职业为农业劳动者,城乡无业、失业、半失业者,农民工和不便分类的其他从业人员。,分别以农村、没有接受高等教育、第一类职业为参照组,其中社会阶层主观感知则采用十分制直接加入模型,数值越小,社会阶层的主观感知越高;其三,个人人力资本特征*本研究将哲学、法学、教育学、文学、历史学和艺术合并为文科,将经济和管理学合并为经管类,将工学、农学和军事合并为工科类,对医学和理学并未处理。,分别以文学、无跨学科就业、985高校或211高校、无博士后经历和无高校外工作经历为参照组;其四,所在高校组织特征,分别以985高校、西部高校和博士毕业于其他高校为参照组;其五,所在岗位职业特征,分别以高级职称、收入低于全国平均水平的教师群体为参照组;其六,学术认知特征*学术认知特征是通过直接询问被调查者“您对目前科研工作量的感受”、“您对工作负荷的总体感受”、“由于评价活动的存在,我可能会被迫发表质量不高但有数量的学术论文”和“对您而言,教学、科研和服务三者在教师评价中的合理权重应该是”这四个问题获得,其中前三个问题采用李克特五分量表的形式,最后一个问题采用填空的形式,从而得到教师的主观感受。,分别以科研占比在50%以下、科研工作正常或轻松、整体工作正常或轻松、追求论文发表质量而非数量或二者并重的主观感知为参照组。最后,本研究对数据的处理采用Stata13.0进行,对PSM模型的估计采用Psmatch2命令及相关命令进行操作。
通过均值比较后发现,拥有一年及以上海外访学经历的教师的论文产出要显著地高于其他教师,其均值较后者高13.07篇。通过稳健OLS回归后发现,在控制了教师的个人特征、人力资本特征、组织特征、职业特征和学术认知特征后,拥有一年及以上海外访学经历的教师的论文产出仍显著高于其他教师,但其系数较均值比较结果发生了较为明显的降低,约为2.74篇,如表2左侧所示。这意味着:一方面,可初步地认为海外访学经历对高校教师论文产出的提高具有正向影响,通过海外学习可显著地提高教师的科研生产力;另一方面,教师在是否拥有一年及以上海外访学经历的分布上存在着明显的正向选择性偏差,例如学术能力更高的教师更容易拥有海外访学经历,这会导致均值比较结果的不精确,意味着已有研究中简单地通过描述分析来评估海外访学效果的做法是不足的。此外,尽管传统OLS估计可以纠正部分的选择性偏差,但仍需与PSM的估计结果相比较才能评估对其选择性偏差的控制程度。
同时,在OLS回归中,男性教师的论文产出要显著高于女性教师,这与已有研究结果相同(朱依娜,2016)。青年教师的论文产出要显著高于中年教师和老年教师,这可能得益于本土博士培养质量的不断提高和海归博士规模的不断壮大,从而教师在学术能力上呈现出与年龄负相关关系;家庭背景特征对教师的论文产出并无显著影响,与已有研究中关于学术职业是公平的这一认知相符(沈红,2016)。教师的论文产出呈现出显著的学科差异,理科、工科和医科这些硬学科教师的论文产出比人文和经管这些软学科教师要显著更高,这种差异主要由学科特性所决定,硬学科更倾向于团队合作,国际化程度也更高,而软学科则更倾向于“单打独斗”,更偏重本土化,其产出必然较低;跨学科就业教师的论文产出也显著更低,这与跨学科的学术适应困难和高校对跨学科教师的学术支持不足紧密相关。学术背景中,仅博士毕业于海外高校的教师的论文产出要显著更低,造成这种现象的原因可能在于海归博士存在“水土不服”的问题,对学术环境和国情等认识不足,学术生产力难以发挥(袁凤凤,2014)。高校特征中,985高校和东部高校教师的论文产出要显著高于其他高校,这与其所在平台、资金支持和学术竞争激烈等紧密相关,也与经验认知相符;博士毕业于现就职高校的教师的论文产出也显著更高,这与对近亲繁殖教师的研究发现相同(林杰,2009),毕业于现就职高校的教师一方面无需重新适应新的学术环境、团队和人际关系等,另一方面也会得益于已有的社会关系的帮助,例如导师等,从而学术产出更高。职业特征上,高级职称的教师论文产出更高,这可侧面说明当前教师的评价体制整体上是有效的;工作年限与论文产出呈正向的显著关系,这与人力资本和社会资本积累等相关;收入位于平均水平以上的教师论文产出更高,表明物质保障是提高学术质量的重要前提。学术认知上,对科研评价愈加重视、工作整体超负荷和更重视论文质量的教师发表更多,这与学术职业的特性相关,只有保持对学术的热情、尊重和投入才能够有所产出,也说明高校在提高教师质量方面更应该从其内在出发,而非简单地采用外在激励的形式。总体上,OLS估计的结果与已有研究和经验认知相符。
PSM估计中Logit回归的主要作用是用于计算倾向得分,但由于其能直观地呈现出教师海外访学的影响因素,可针对性地提高干预手段的有效性,故有必要对Logit回归的结果进行简要的分析。如表2左侧所示,模型整体估计效果显著,所采用的干预变量为拥有一年及以上海外访学经历。具体而言,老年教师较青年教师和中年教师具有更少的海外访学经历,这种差异可能与时代背景和政策调控紧密相关;教师的家庭背景对其是否拥有海外访学经历并无显著影响,这可能与海外访学政策的支持力度较大和覆盖范围较广有关;与文科和工科相比,经管类教师进行海外访学的可能性较低,而理学和医学教师进行海外访学的可能性较高,体现出较为明显的学科差异,这可能受到了学科特征的影响,例如理学和医学在全球范围内更开放,普遍认可度也较高;同时具有海外博士学位、拥有博士后经历和高校外工作经历的教师更可能进行海外访学,即学术潜力更高的教师更容易进行海外访学;与985高校相比,211高校和一般高校教师进行海外访学的可能性要显著更低;与高级职称教师相比,其他教师进行海外访学的可能性也更低;此外,在评价中认为科研越重要的教师进行海外访学的可能性更高。为此,可认为年轻教师、人力资本存量较多、学术平台和专业职称越高、学科越开放和越重视科研的教师进行海外访学的可能性更高。
表2 传统OLS回归结果、Logit回归结果和匹配前后干预组与控制组的对比
续表2
OLS回归Logit回归平衡性检验(一)匹配前匹配后干预组控制组T标准差%干预组控制组T标准差%偏差下降%最高学位为工学23.1730∗∗∗0.04470.5300.550-1.3-4.10.5310.541-0.64-2.147.0最高学位为医学17.7566∗∗∗0.2552∗∗0.0940.0564.7∗∗∗14.40.0930.0751.94∗6.952.3跨学科就业-3.1982∗-0.05730.1330.140-0.64-2.00.1330.1121.95∗6.2-211.7本科毕业于一般高校-0.6981-0.04570.2930.408-7.72∗∗∗-24.20.2940.309-1.02-3.386.3本科毕业于海外高校-14.6778-0.21120.0050.0021.44.30.0050.0040.51.856.7硕士毕业于一般高校-2.2004-0.08930.1860.271-6.48∗∗∗-20.40.1860.1731.013.184.8硕士毕业于海外高校3.7059-0.01640.0430.0165.29∗∗∗15.90.0430.044-0.16-0.795.8博士毕业于一般高校0.32850.00220.1250.179-4.77∗∗∗-150.1250.1061.79∗5.464.4博士毕业于海外高校-5.6084∗0.7092∗∗∗0.1530.04312.65∗∗∗37.80.1520.1460.471.994.9拥有博士后经历1.97460.5118∗∗∗0.5490.29217.39∗∗∗53.80.5480.5400.471.796.9有高校外工作经历0.93630.1161∗∗∗0.6280.5544.83∗∗∗15.10.6270.6250.140.597.0就职于211高校-6.8355∗∗∗-0.1906∗∗∗0.2910.2800.742.30.2910.295-0.29-1.056.9就职于一般高校-14.8176∗∗∗-0.5528∗∗∗0.2090.418-14.64∗∗∗-46.30.2090.1831.99∗∗5.987.4就职于中部高校-4.4207∗∗∗0.02830.1870.1711.334.10.1860.197-0.77-2.635.9就职于西部高校-6.3626∗∗∗0.05490.2410.2181.77∗∗5.50.2410.2370.280.982.9博士毕业于现就职高校5.8940∗∗∗0.05040.3950.3820.882.80.3960.402-0.38-1.353.8副高级职称-11.6553∗∗∗-0.3095∗∗∗0.4060.444-2.48∗∗-7.70.4070.4010.381.383.8中级及以下职称-18.8187∗∗∗-0.6658∗∗∗0.1160.226-9.23∗∗∗-29.40.1170.127-0.97-2.990.2工作年限0.5487∗∗∗-0.000311.17910.9440.942.911.19211.277-0.31-1.163.6收入位于平均水平以上0.8632∗∗∗-0.000611.97410.4628.12∗∗∗2511.97212.135-0.71-2.789.2评价中科研占比认知6.5311∗∗∗0.1163∗∗∗0.5400.4068.72∗∗∗27.10.5400.553-0.81-2.789.9科研工作超负荷-1.2645-0.00480.6880.6711.163.60.6880.6870.070.293.4整体工作超负荷6.6111∗∗∗0.00680.5930.5641.85∗∗5.80.5930.595-0.1-0.394.1
续表2
注:①限于篇幅对相关指标进行了精简,并未注明相关变量异方差稳健的标准误;②*** p<0.01, ** p<0.05, * p<0.1;③OLS回归模型效果估计采用F统计量和调整后的R2,Logit回归模型效果估计采用卡方检验统计量和伪R2。
在估计处理效应前,需要对PSM的匹配效果进行检验,包括共同支撑假设检验和条件独立假设检验,以确保PSM估计的效度。如图1所示,干预组和控制组在倾向得分[0.0448, 0.956]范围内都具有共同取值,且在匹配后仅有少量样本被剔除,表明了匹配质量较高,满足共同支撑假设。此外,如图2和表1右侧所示,干预组和控制组之间各协变量的均值差异在匹配后变得不再显著,且整体标准偏差都控制在10%范围之内,表明了经过匹配后干预组和控制组在协变量上的差异得到了消除;同时,如表3所示,对整体匹配效果的检验表明匹配后两组样本之间的伪R方和卡方值都发生了较为显著的下降,且变得不再显著,这意味着PSM模型的整体匹配效果较好,即满足了条件独立假设,可认为经过匹配后干预变量与结果变量论文产出之间相互独立。
表3 平衡性检验(二):总体匹配效果
续表3
匹配方法干预组/控制组访学一年及以上/其他匹配方法干预组/控制组访学一年及以上/其他最近邻匹配法(k=5)Pseydo R2匹配前0.136匹配后0.004LR chi2匹配前780.10∗∗∗匹配后20.12半径匹配法(0.05)Pseydo R2匹配前0.136匹配后0.007LR chi2匹配前780.10∗∗∗匹配后36.89局部线性回归匹配Pseydo R2匹配前0.136匹配后0.007LR chi2匹配前780.10∗∗∗匹配后36.89核匹配Pseydo R2匹配前0.136匹配后0.004LR chi2匹配前780.10∗∗∗匹配后17.68
注:①限于篇幅并未汇总最近邻匹配和半径匹配中间取值的结果;②*** p<0.01, ** p<0.05, * p<0.1。
表4中呈现了不同匹配方法下教师海外访学经历对论文产出的处理效应。以最近邻匹配法(k=1)为例,ATT指标的值为1.76,即从干预组随机选择一名教师到海外访学一年及以上后,其论文产出会增加1.76篇,但在经过500次Bootstrap抽样估计后发现这种差异并不显著;同时,ATU指标的值为3.86,即从控制组随机选择一名教师到海外访学一年及以上后,其论文产出会增加3.86篇,且其正向影响在统计学上显著;此外,ATE指标的值为2.97,即随机选择一名教师到海外访学一年及以上后,其论文产出能增加2.97篇,且这种差异显著存在。对比可知,尽管不同匹配方法下的处理效应都为正,但其显著性并不相同,其中ATT值在所有的匹配方法下都不显著,而ATU值在半径匹配(0.01)和最近邻匹配(k=5)中不显著,ATE值仅在最近邻匹配(k=1)和半径匹配(0.05)中显著,这意味着:其一,海外访学经历对教师论文产出具有正向影响,但其处理效应并不总是显著的,特别是对干预组教师而言,进行一年及以上海外访学并不能显著地提高其论文产出;其二,不同匹配方法下,ATU指标的显著性更具有稳健性,这说明海外访学经历对控制组教师论文产出的影响更为显著,原因可能来自于海外访学经历具有较强的逆向选择风险,越是学术能力不突出的教师,越更有可能选择海外访学,以此来增强向高校管理者传递关于自身学术能力的信号水平,在这种逆向选择下干预组处理效应更不具有显著性,而控制组处理效应则更具有显著性;其三,除局部线性回归匹配之外,其他匹配方法下都呈现出ATU>ATE>ATT的特点,即海外访学对控制组教师论文产出的正面影响要明显大于其对干预组教师论文产出的正面影响,这也验证上述逆向选择的存在。
与传统估计相比,PSM估计的ATT值则明显更小,在不同匹配方法下都远小于OLS的估计值,更小于均值差,这意味着在OLS估计控制了大部分的样本选择偏差的基础上,PSM进一步地降低了样本选择偏差的影响,较OLS估计更为精确。此外,这也说明教师是否进行海外访学存在着较为明显的正向样本选择偏差,例如工作时间越久的教师更容易拥有访学经历,同时其论文产出也必然更高,这将导致OLS估计的高估,而PSM估计则能有效控制此类选择偏差。
综上可知,海外访学经历虽然对教师的论文产出具有正向影响,但这种影响并不显著,且不同匹配方法的估计结果较为一致,具有较强的稳健性,同时海外访学项目的筛选过程可能存在着严重的逆向选择风险,这导致了整体项目干预对控制组教师更为有效。此外,与传统OLS估计而言,PSM估计的精度要更高。
表4 不同匹配方法下高校教师海外访学对其论文产出影响的处理效应
注:①限于篇幅并未汇总最近邻匹配和半径匹配中间取值的结果;②显著性通过Bootstrap 500次抽样后获得,其中*** p<0.01, ** p<0.05, * p<0.1;③括号内为标准误。
本研究还以海外访学的时间长短为界限,分别将拥有三个月及以上、半年及以上、九个月及以上、十五个月及以上、一年半及以上和两年及以上海外访学经历作为干预变量,以此来估计海外访学经历对论文产出的处理效应,并借此来对上述结论的稳健性进行分析。如表5所示,均值比较中,拥有三个月及以上、半年及以上、九个月及以上、十五个月及以上、一年半及以上和两年及以上海外访学经历的教师的论文产出分别比其他教师多14.41篇、12.93篇、13.07篇、11.98篇、12.50篇和11.97篇,表明拥有海外访学经历的教师的论文产出均值要更高;稳健OLS估计中,在控制了一系列协变量后,干预变量的回归系数显著地减小,同时显著性也有所变化,其中三个月及以上、半年及以上和九个月及以上的访学经历也能够显著地提高教师的论文产出,增幅分别约为3.15篇、2.47篇和2.77篇,但在以十五个月、一年半和两年为时间点划分的干预变量的回归系数则不再显著,表明拥有此类海外访学经历并不能提高教师的论文产出。
在不同匹配方法下,以不同访学时间为节点划分的干预变量的处理效应也呈现出较为稳健的结论,具体体现在:其一,相同访学时间节点,不同匹配方法下的处理效应呈现出较为统一的结论,海外访学对论文产出的处理效应尽管都呈现出正向影响,但多数估计量都不显著,特别是以ATT值为代表的干预组平均处理效应,表明海外访学经历对教师论文产出的影响并不显著,且该结论随着访学时间的变化呈现出较强的稳健性;需要注意的是,在以三个月为节点的干预变量划分中,ATU值和ATE值的显著性更高,这是由于访学经历的筛选机制仍存在较为严重的逆向选择风险,以三个月为节点的划分会将更多具有海外访学的教师归类于干预组,从而造成了ATU和ATE更具有显著性。其二,在相同匹配方法下,以不同访学时间为节点的干预变量的处理效应也呈现出较为统一的表现,表明尽管海外访学对论文产出具有正向影响,但并不显著,且并不会随着访学时间的增加而有所变化;需要注意的是,在核匹配中ATU值和ATE值的显著性要明显高于其他匹配方法下的值,这是由于当控制组和干预组样本的倾向得分越接近,核匹配赋予控制组的权重也就越大,从而ATU值也较其他匹配方法更大,其显著性也更高。然而,ATT、ATU和ATE处理效应的比较并没有呈现出较为一致的排序,在以半年、九个月、两年为节点划分的干预变量的处理效应呈现出ATU>ATE>ATT的特点,而在以三个月、十五个月、一年半为节点划分的干预变量的处理效应则呈现出ATT>ATU>ATE的特点;同时,与传统估计相比,以三个月、半年、九个月为节点划分的访学时间的ATT值要明显小于OLS估计值,而以十五个月、一年半、两年为节点划分的访学时间的ATT值则要明显大于OLS值,这说明高校教师在访学时间上的选择存在着较为明显的差异,在一年及以下的访学时间上存在着较为明显的正向选择偏差,从而导致了OLS值的高估,而在一年以上的访学时间上存在着较为明显的负向选择偏差,从而导致了OLS值的低估。总之,通过对比不同匹配方法和不同访学时间的处理效应可知,尽管海外访学对高校教师的论文产出具有正向影响,但这种影响并不显著,且具有较强的稳健性。
表5 高校教师海外访学对其论文产出影响的稳健性分析
注:①限于篇幅并未汇总最近邻匹配和半径匹配中间取值的结果;②显著性通过Bootstrap 500次抽样后获得,其中*** p<0.01, ** p<0.05, * p<0.1;③括号内为标准误。
敏感性分析的目的在于估计模型中不可观测因素的变化对估计结果的影响程度,一旦估计结果对其反应较为敏感,则说明估计结果容易受到外在因素的影响,从而无法保证研究的效度(苏毅清等,2015)。本研究对PSM的估计结果进行了敏感性分析,模型的整体估计结果对不可观测因素变化的敏感性较低,以最近邻匹配法(k=1)为例,访学时间从三个月到两年为节点的干预措施的处理效应的Gamma系数都在达到1.6倍之后才开始变得显著,这意味着PSM的估计结果具有较强的外部信度和稳健性,模型所选取的协变量已经控制了大部分的样本选择性偏差,其结果更不容易受到不可观测因素的影响。
基于2014年高校教师的调查数据,本研究采用倾向匹配得分的方法估计了海外访学经历对教师论文产出的影响,主要结论为:
第一,通过传统估计和PSM估计的对比可知,尽管OLS估计可以控制部分的选择偏差,但在选取相同协变量的基础上,PSM估计能进一步地控制选择偏差所带来的估计误差,即PSM的估计结果较传统OLS估计更为精确,同时在本研究中其估计结果不容易受到其他不可观测因素的影响,具有较高的内外部效度。此外,在稳健性检验中发现,教师在选择访学时间上存在着不同方向的选择偏差,从而在估计以访学时间的长短为节点划分的干预变量的处理效应时,PSM的估计结果和传统OLS的估计结果之间的大小并不具有一致性;在整体上,一年及以下访学时间选择上存在着正向的选择偏差,而一年以上的访学时间选择上存在着负向的选择偏差,即学术能力较高的教师更倾向于选择短期访学,而学术能力较低的教师则更倾向于选择长期访学,从而导致了海外访学对论文产出的处理效应相应的高估和低估。总之,相较于传统估计,PSM的估计结果证明了在政策评估中采用因果推断的必要性。
第二,海外访学对高校教师的论文产出并不具有显著的正向影响。通过PSM估计可知,海外访学对高校教师的论文产出虽然具有正向影响,但在不同匹配方法和不同的访学时间下其处理效应都不具有显著性,这意味着海外访学并不能提高教师的论文产出。这说明:其一,海外访学对教师的论文产出仍具有积极影响,例如海外访学能够有效地拓展教师的学术视野,帮助教师了解研究前沿和掌握新的研究方法,提高教师的国际化程度,但这种积极影响并不能显著地转化为论文生产力,从而表现出干预组教师和控制组教师在论文产出上并不具有显著差异;其二,国家、高校和教师投入大量的资金到海外进行访学的政策效度并不如早期想象的那么乐观,即鼓励教师海外访学政策的项目效果在促进论文产出提高方面是低效率的,这与海外访学政策的早期筛选过程和后期监督机制乏力紧密相关,未来需从上述方面加强对海外访学效果的质量提升。
第三,海外访学政策存在着较为严重的逆向选择问题,出现了信号效应下的生产力危机。文中的分析表明,一方面高校教师在海外访学时间上的选择存在着较为明显的选择偏差,学术潜力较高的教师更可能选择一年及以下的短期访学项目,而学术潜力较低的教师则更倾向于选择一年以上的长期访学项目,即逆向选择问题;另一方面海外访学在提升教师的论文产出上并不显著,这意味着海外访学并不具备显著的生产效应。之所以如此,源于海外访学的信号效应被极度放大所导致,这表现在两方面:其一,海外访学正逐渐被高校管理者作为筛选教师学术潜力的重要标准之一,在教师的入职和晋升中扮演着不可替代的角色;其二,海外访学对教师的收入具有显著的正向影响,在用相同调查数据和相同方法进行分析后发现,海外访学能够显著地提高教师的收入水平,具有可观的经济效益(张青根等,2016)。正是由于海外访学项目信号效应的存在,迫于升职压力和对收入最大化的追求,高校教师往往会迎合政策,出现逆向选择风险,特别是对于学术潜力不佳的教师而言,海外访学所带来的收益要更大,这类教师也更倾向于选择长期访学项目。然而,海外访学项目的生产力危机则被其信号效应所掩盖,造成了社会资源的浪费。为此,高校管理者需完善对海外访学项目的后期监控机制,加大对其生产效应的评估,以进一步促进教师质量的提升。
基于以上的发现,本研究可对教师的学术职业发展、高校的教师队伍建设和国家的海外访学项目评估提供以下契合实际的建议:
对教师而言,学术声望最大化是其学术职业生涯的最终选择,外在体现于论文产出的多少,内在表现为学术能力的提高。海外访学作为高校教师进修的重要渠道,应当对教师的学术能力或论文产出提升提供帮助,然而本研究的结论表明当前海外访学并未起到显著的正向促进作用,这既与海外访学监控机制的不完善紧密相关,也与教师自身的迎合政策行为和追求海外访学的信号效应紧密相关。为此,为保证海外访学真正能够提高教师的学术能力,需要从两方面出发:其一,明确自身的研究需要,遵循学术需要进行海外访学,而非为了访学而访学,避免为迎合政策而出现资源浪费的现象;其二,注重访学效果的内化和外显,内化体现在访学过程中对国外先进的学术理念、学术视角和研究方法等的洗涤,使其能够为自己研究所用,外显则体现在将其真正转化为科研生产力,提高自身的学术产出。
对高校而言,组织的发展离不开学科建设,学科建设的根本则在于教师质量的提高,其中衡量教师质量的关键性指标是教师的国际化程度,而海外访学是能够快速提高教师队伍国际化程度的途径之一,这也是高校管理者将其作为教师招聘和晋升的重要筛选指标的原因。正是由于评价体系中的量化倾向,导致了高校管理者往往忽视了海外访学的本质是在提升教师的学术能力而非国际化程度这一指标上,出现本末倒置现象的发生。为此,高校管理者需要意识到海外访学对学科建设和教师发展的真实意义,通过政策引导海外访学的本质回归,这需要从以下方面出发:其一,将一年及以上海外访学经历作为硬性标准尚缺少强有力的实践依据,故应减少海外访学在教师招聘和晋升环节中的作用,将其作为参考标准,而非硬性标准,既避免评价指标之间的重叠,又能减少海外访学的信号效应,从而在源头上杜绝海外访学项目的逆向选择风险;其二,健全对教师海外访学的监督机制,包括前期筛选和后期反馈,需对申请教师的研究计划的可行性进行同行评审,同时对教师归国后研究计划的预期成果进行考核,从整体上提高教师海外访学的效益;其三,对即将出国的教师进行培训,总结已有的成功案例,吸纳以往案例的经验,缩短教师出国后的适应期,提高海外访学的整体效率。
对国家而言,鼓励教师进行海外访学是建设世界一流大学的必要手段,其本质在于提高教师队伍质量,通过送高校教师出去的方式来引进前沿研究、方法和理念。然而,由于政策监管上的不善,导致了当前的海外访学项目中逆向选择现象严重,从本质上影响了其效果。本研究通过实证分析发现当前海外访学并不能真正地提高教师的论文产出,并通过对海外访学的流程分析发现,当前的海外访学项目前期培训的缺失和境外监控存在漏洞导致了其效果的不理想(韩福乐,2013),一方面容易导致逆向选择行为的发生,大量教师为迎合政策而出国,缺少基本的研究需要和内在驱动力,另一方面又造成了获批教师在海外访学期间由于评价宽松而发生懈怠。为此,若想提高海外访学的整体效果,应当从三方面出发:一是,增加对教师出国的培训环节,引导教师依据研究需要进行访学,并缩减教师海外的适应时间,帮助其尽快融入海外的文化环境;二是,加大对教师海外访学的中期考核,严抓境外过程评价,杜绝学术懈怠的发生;三是,在筛选资助对象时,应向经管类、文科和工科教师,211高校和普通高校教师,副高及以下职称的教师和年长教师等群体倾斜,以扩大项目的资助范围。
参考文献:
[1]曹丹平,2015:《青年骨干教师出国访学经历与感受》,《科技导报》第13期。[Cao Danping,2015,Young Backbone Teachers' Experience and Feeling in Overseas Visiting,Science&TechnologyReview,13.]
[2]陈晓军,2017:《教育国际化视域下高校教师出国访学现状及效益》,《黑龙江畜牧兽医》第8期。[Chen Xiaojun,2017,Status and its Benefits of Studying Abroad for University Faculty in the Perspective of Education Internationalization,HeilongjiangAnimalScienceandVeterinaryMedicine,8.]
[3]陈学飞,2004:《改革开放以来大陆公派留学教育政策的演变及成效》,《复旦教育论坛》第3期。[Chen Xuefei,2004,The Change and Benefit of the Government-Founded Studying Abroad Since the Reform and Opening up in China,FudanEducationForum,3.]
[4]韩福乐,2013:《河南公派出国访学项目管理的研究》,《华北水利水电大学学报(社会科学版) 》第6期。[Han Fule,2013,Study on the Management of Henan Provincal Visiting Scholars Program,Journal of North China InstituteofWaterConservancyandHydroelectricPower(SocialScience),6.]
[5]黄明东、姚建涛、陈越,2016:《中国出国访问学者访学效果实证研究》,《高教发展与评估》第5期。[Huuang Mingdong,Yao Jiantao,Chen Yue,2016,An Empirical Research on the Effect of Chinese Visiting Scholar Abroad Project,HigherEducationDevelopmentandEvaluation,5.]
[6]蒋玉梅、刘勤,2015:《高等教育国际化视野下教师出国访学收益研究》,《开放教育研究》第1期。[Jiang Yumei,Liu Qin,2015,The Outcomes of Chinese Visiting Scholars’ Experiences and Higher Education Internationalization in China,OpenEducationResearch,1.]
[7]林杰,2009:《中美两国大学教师“近亲繁殖”之比较》,《高等教育研究》第12期。[Lin Jie,2009,Comparison of Faculty Inbreeding between American and Chinese Higher Education Institutions,JournalofHigherEducation,12.]
[8]马万华、温剑波,2016:《高校教师出国进修效益分析——基于首都高校教师的问卷调查》,《清华大学教育研究》第1期。[Ma Wanhua,Wen Jianbo,2016,Research on the Effectiveness of Faculty Training Abroad,TinghuaJournalofEducation,1.]
[9]沈红,2016:《中国大学教师发展状况——基于“2014中国大学教师调查”的分析》,《高等教育研究》第2期。[Shen Hong,2016,Status of University Faculty Development in China---Based on 2014 Faculty Survey,JournalofHigherEducation,2.]
[10]苏毅清、周永刚、王志刚,2015:《倾向评分匹配法的基本逻辑、应用领域和发展趋势》,《郑州航空工业管理学院学报》第3期。[Su Yiqing,Zhou Yonggang,Wang Zhigang,2015,A New Method to Find Casual Relationship: Basic Logic, Application Field and Future of Propensity Score Matching,JournalofZhengzhouInstituteofAeronauticalIndustryManagement,3.]
[11]杨光富,2014:《国际化进程中高校青年教师专业发展的现状调查:以华东师范大学为例》,《教师教育论坛》第10期。[Yang Guangfu,2014,Status Survey on Professional Development of Young Teachers from East China Normal University in the Process of Internationalization,TeacherEducationForum,10.]
[12]杨阳、王雪玲、张姝,2013:《高校英语教师出国访学跨文化培训模式与评估》,《中国职工教育》第16 期。[Yang yang,Wang Xueling,Zhang Shu,2013,The Intercultural Training Model of Studying Abroad and its evaluation of English Faculty in Universities,StaffandWorker’sEducationofChina,16.]
[13]袁凤凤,2014:《高校青年海归教师对中国现行学术体制的适应研究》,华东师范大学硕士学位论文。[Yuan Fengfeng,2014,A Study on the Adaptation of Junior Returnee Teachers to China’s Current Academic System,AMaster’sDissertationofEastChinaNormalUniversity.]
[14]张传亮、王政贵,2015:《青年教师留访学提升工程的实施策略——以浙江省属高校为例》,《黑龙江高教研究》第11期。[Zhang Chuanliang,Wang Zhenggui,2015,The Implementation Strategy of Young Teachers’ Promotion Project by Learning Abroad---Take Universities of Zhejiang for Example,HeilongjiangResearchesonHigherEducation,11.]
[15]张柳,2012:《高等学校教师公派出国留学的现状及对策研究》,上海交通大学硕士学位论文。[Zhang Liu,2012,Study on Status Quo and Countermeasure of Studying Abroad Supported by State in Chinese Universities,AMaster’sDissertationofShanghaiJiaoTongUniversity.]
[16]张青根、沈红,2016:《出国进修如何影响高校教师收入?--基于“2014中国大学教师调查”的分析》,《教育与经济》第4期。[Zhang Qinggen,Shen Hong,How Training Abroad Affect Faculty Earnings?---Based on 2014 Faculty Survey in China,Education&Economy,4.]
[17]张玮佳,2015:《我国公派出国留学对大学教师学术成果影响研究》,华南理工大学硕士学位论文。[Zhang Weijia,2015,A Research on the Effect of Government-sponsored Overseas Studying on University Teachers’ Academic Achievements---Take H University as an Example,AMaster’sDissertationofSouthChinaUniversityofTechnology.]
[18]朱依娜、何光喜,2016:《学术产出的性别差异:一个社会网络分析的视角》,《社会》第4期。[Zhu Yina,He Guangxi,2016,Gender Difference in Scientific Productivity: An Explanation from the Perspective of Social Network Analysis,ChineseJournalofSociology,4.]
[19]Biraimah,K.L.and A.L.Jotia,2013, The Longitudinal Effects of Study Abroad Programs on Teachers' Content Knowledge and Perspectives: Fulbright-Hays Group Projects Abroad in Botswana and Southeast Asia,JournalofStudiesinInternationalEducation,17(4) :433-454.
[20]Rosenbaum,P.R.and D.B.Rubin, 1983, The central role of the propensity score in observational studies for causal effects,Biometrika,70(1) :41-55.
[21]Sanderson,G.,2008,A Foundation for the Internationalization of the Academic Self,JournalofStudiesinInternationalEducation,12(3):276-307.