马红梅
(华中师范大学 教育学院, 湖北 武汉 430079)
教师素质对教育质量的影响受到了全球的关注,国内外学者也一直在研究究竟什么是好老师,哪些教师资历特质对学生成长与发展产生实质性作用等课题,而教师学历成为若干文献中讨论最多的一个指标。尽管学术界尚未就教师受教育水平对教学效能的影响这一问题达成共识,但提高其受教育水平仍然是各国教师队伍建设工作的重点指标。例如,1994年开始生效的《中华人民共和国教师法》(以下简称《教师法》)明确规定了各级各类教师从业资格的学历标准。2018年中共中央国务院发布的《关于全面深化新时代教师队伍建设改革的意见》对新时期教师的学历要求做了进一步规划(1)“逐步将幼儿园教师学历提升至专科,小学教师学历提升至师范专业专科和非师范专业本科,初中教师学历提升至本科,有条件的地方将普通高中教师学历提升至研究生。”。教育部等五部门《关于印发〈教师教育振兴行动计划(2018—2022年)〉的通知》也明确提出要“加大义务教育阶段学校本科层次教师培养力度。按照有关程序办法,增加一批教育硕士专业学位授权点。”[1]
学历硬件要求贯穿在教育行政管理部门关于教师招聘与录用、职称评聘等一整套人事管理工作中。对于从事中小学教学工作的教师,入职后学历提升的动机来自两方面:第一,职初学历达不到国家职业准入资格相关要求的生存型需求,这在入职较早的边远农村地区教师群体中表现更普遍;第二,在竞争日益激烈的劳动力市场保持相对优势的发展型策略。在此背景下,在职学历提升成为很多参加工作较早但又经历了后期人事制度和学制变迁的教师的必然选择。本研究所依托的“甘肃基础教育调查”(Gansu Survey of Children & Families,GSCF)的两轮数据初步显示:在国家颁布教师行业职业资格准入的学历标准后,20世纪90年代中后期中小学教师在职学历提升的概率明显提高并成为普遍现象(2)60%以上的样本都曾有参加在职学历提升活动的记录。在所有参加了学历提升活动的被访者中,全额自费的占90%,全部公费资助的样本低于3%。,根据教师获得最高学位与学历提升的时间间隔、首次获得教学职位与学历提升的年份差值这两种算法的结果都支持了上述推论(图1)。
注:最高学位就是两次中最高的那一次,如果没有学历提升它就是职初学历,如果经历过学历提升就是最后的学历
图1各年份入职教师的学历提升时间间隔
作为一种重要的人力资本积累方式,教师在职学习和培训具有提高学生学业水平的潜在可能,但这种以学历提升为形式的教师人力资本提升过程是否能提高教学质量,我们不得而知。根据笔者的文献检索记录,教师工作后的学历提升活动对教学效能是否产生影响以及产生了多大程度的生产性作用还没有引起国内学术界的足够重视。实际上,在职学习和培训通常会付出一定的经济和时间代价,预期能对投资者产生经济回报并表现在工资水平的提高上。但根据人力资本理论的基本假设,在职学习和培训的经济收益是劳动生产率提高的附带结果,[2]希望明晰这种在职技能升级活动是否改善了教师的经济生活,则需要进一步检验中间的传导机制。如果学历提升对课堂教学效能没有影响但提高了教师经济收入,则文凭的筛选信号起着主导作用;如果教师职后学历提升不能有效提高以学生学业成绩为代表的教学生产率,且对教师收入也不产生显著影响时,则是人力资本理论的中间逻辑链条断裂的必然结果,也可能反映了学校对教师业务绩效的识别能力;当学历提升在促进教学绩效改进的同时也反映到工资收入的提高上时,则是人力资本理论正常预期的结果。本研究是笔者关于甘肃农村教师职后学历提升的经济价值研究的补充,在笔者以往的有关研究中,我们没有检验教师职后学历提升对工作绩效表现起到了怎么样的作用,[3]本研究的工作是补充图2实线箭头所示部分的证据。
图2 教师在职学历提升的生产率传导机制
笔者以甘肃农村教师为分析对象,通过教师及其任教学科与学生在相应科目上的考试成绩的匹配,检验教师职后学历提升对教学效能的影响。笔者将学科教师和学生在对应学科的表现进行精准匹配,检测到了教师在职学历提升对教学绩效的影响,回避了“语文学科教师—学生数学成绩”的匹配偏误,[4-5]也可以间接地将教师人力资本积累与教学质量有机联系起来。[6]基于“学生—教师”交叉匹配后的固定效应(fixed effect, FE)并结合工具变量法(instrument variable, IV)的估计,结果显示:第一,总体上,教师在职学历提升能促进学生在相应学科标准化测试中的成绩,其当前比职初受教育年限每增加一年,学生的学业表现便高出0.2~0.3个标准差,相当于将学生的学科排名从中等水平向上拔高10个百分位;第二,受20世纪90年代国家学制变迁和教师资格准入政策的双重影响,教师在职学历提升的动机和性质具有异质性,不考虑这种差异就不能精准地评估其实际影响。
Ashenfelter认为,在职学习或培训的目的大致包括两类:一类是在全民整体素质大幅度提升的情况下,劳动者面临更新工作技能以适应新形势的压力,特别是智识水平要求较高的教师、医生、律师等行业的专业技术人员需要发展型提升;另一类是由于社会经济结构转型导致产业升级,面向面临失业或被淘汰风险的低技能群体或边缘人群的补偿型培训,包括为改善项目参与人员的经济生活状况的社会减贫。(3)多米尼加共和国青年培训的随机干预实验显示:结业后10~14个月后再对项目参与者进行追访,其收入和继续工作的可能性具有中等程度的促进作用,参见:CARD D, IBARRARN P, REGALIA F, et al.The Labor Market Impacts of Youth Training in the Dominican Republic[J].Journal of Labor Economics, 2011,29(2):267-300.[7]特别是后者,政府动用公共财政资助的培训占主导地位(4)例如,美国政府20世纪60年代的“Manpower Development and Training Act”以及后续的《全面就业与培训法案》(Comprehensive Employment and Training Act, CETA),再到80年代里根政府的《工作伙伴培训法案》(Job Partnership Training Act, JPTA)等都属于在职培训法案的颁布,都代表了政府行为。,但公共培训项目对此后的收入、劳动参与率、脱离贫困的概率等方面的实际效果与预期的偏差较大,[8]这在针对低技能劳动力的项目中尤其明显。[9]
与普通劳动力市场不同的是,在教育生产函数的分析框架中,学生学业产出水平是评价教师生产率的重要操作指标。[10-11]教师质量在这个过程中的重要作用也几乎得到了跨国界的一致认可。与教师学历、[12]资格证、[13-14]工作经验或在当前工作单位的教龄[14]等以往文献中指示教师质量的常用传统指标相比,在职学习和培训受到的关注较少。[16]近年来,欧美各国的研究逐渐丰富了这个领域里的经验证据。
Bressoux基于1991学年192名法国小学教师的追踪研究,发现新近入职教师的在职培训对学生语言(法语)和数学都具有显著的促进作用,但对缩小学生学业成就差距没有明显的作用。[17]
1995年起,在以色列耶路撒冷北部地区Neve Yaakov和Pisgat Zeev两个县挑选了30个镇进行教师培训实验,外校专家每周对希伯来语、英语和数学等学科教师进行教学技能培训。基于1994—1996学年小学4—6年级的“学生—教师”配对数据,Angrist和Lavy利用倍差分析和其他辅助方法检验了教师在职培训对学生数学和阅读成绩的影响,结果发现,教师培训有效提高了非宗教学校学生标准化考试成绩,而对宗教学校的学生影响不明显。[16]
1996年,芝加哥公立学校启动质量监测系统,对成绩能达到国家标准线的学生比例低于15%的学校予以黄牌警告,这些被罚黄牌的学校可以优先享受教职工发展与培训的政府购买服务(5)这类教职工发展基金只能用于聘请外校或培训机构专家,第一年的费用全额报销,第二年只报销50%,两年以后只报销三分之一。。利用这个自然实验,Jacob和Lefgren 利用断点回归方法检验了教师在职培训对学生阅读和数学成绩的作用。[18]
基于佛罗里达公立学校系统提供的1999—2004学年所有3—10年级的160多万条行政管理档案数据记录,Harris 和 Sass利用“学生—教师—学科—年级”交叉组合配对固定效应,估计了教师在职培训对学生学业增值的影响且发现了异质性,职后学历提升与培训对小学教师教学效能没有显著作用;在初中和高中阶段,职后培训对数学教师的业务表现促进作用显著,但对语言学科教师的影响不明显。[19]Harris和Sass 还检验了教师职后学历提升对教学效能的影响,但仅发现对中学数学教师的教学效能具有显著的促进作用,对中学阅读教师甚至产生了负面作用。他们认为,在职培训或学历提升对教师生产率的促进作用主要来自以任课教师课程教学内容为导向的学科知识补充,而教育心理学和教学法等基本理论课程几乎没有作用。[20]基于同一套数据和类似的研究设计,Feng 和Sass使用增值评估方法对7万多条特殊学校学生记录进行了补充分析,研究发现,特教机构教师职后培训对那些身心残障孩子的成绩提升作用并不显著,而接受过职前特殊教育训练并获得相关职业资格的教师能有效提高学生学业水平。[20]
基于北卡罗纳州1999—2002学年高中课程结业考试85万多条“学生—教师”配对数据,Clotfelter等人研究发现,教师职前获得或职后再攻读硕士学位对学生学业绝对水平和增值都不产生实质性的作用,[21]与他们基于该州1994—2003年3—8年级学生在州级课程统考中的表现所得到的结论基本一致。在Clotfelter等人的一系列研究中,他们特别谨慎地处理了学生的学科成绩与任课教师的配对,认为在检验教师在职培训与学习对学生阅读成绩的影响时,应将教师限定到教语言学科的教师;同理,只有任教科目包含数学及其相关学科的教师才能用以预测学生数学成绩。
2014年起,格鲁吉亚共和国在122个试点学校开展了小学教师的培训项目。基于1—6年级学生数学和格鲁吉亚语测试成绩,利用增值评估的分析思路,Ome等人检验了教师在职培训对教学效能的影响,高年段(4年级)效果不显著,但1—3年级的低年段受到明显影响。[22]
鉴别在职教育与培训项目的因果效应比较复杂,[7][23]需要考虑培训过程的自选择性,[24-25]这种选择性可能来自两种不同性质的力量:一方面,接受在职培训的个体可能更积极乐观和上进,而这些品质也影响劳动力市场表现等,忽视这种正向选择可能会导致高估在职培训的效果;另一方面,在职培训可能是此前面临失业风险、职业发展危机或长期以来在更差的劳动力市场环境的个体做出的被迫选择或补救措施,这种负向选择的存在可能会导致系数被低估。[26]矫正由遗漏变量造成的内生性偏误对职后教育或培训效果的精确评估至关重要。[27]
Ashenfelter和Card认为,解决选择性偏误较为常见的方法是基于多期追踪数据通过固定效应消除不随时间而变的不可观测特征,并同时控制时间变量消除宏观共同趋势项。[23]然而,Ashenfelter和Card利用DID的方差成分分解方法,根据社保数据提供的劳动记录考察了美国联邦政府的《人力资源开发与培训项目》(Manpower Development and Training Act, MDTA[1962])(6)该法案始于1962年,后来又经美国国会修订,先后出台《全面就业与培训法案》(Comprehensive Employment and Training Act, CETA) (1976)、《工作伙伴培训法案》(Job Partnership Training Act, JPTA)(1982)。效果,追踪数据本身还不足以获得职后培训项目纯净效应,这跟反向因果关系所致的模型设定误差有关。[7]对于教育生产过程而言,能力更强、基础更好的学生所在班级的教师也通常更加上进和优秀,[10][28-29]这种群分效应会导致对教师在职培训效果的估计偏差。因此,FE估计仍然无法消除随时间而变的不可观测特征,还需结合其他分析技术共同使用,随机实验或自然实验是较受推崇的方式。[30]
综上,已有的关于教师职后学习与培训效果的评估研究大多都集中在欧美发达国家,而缺乏发展中国家的证据,这与数据缺失或获得困难有很大关系。尽管我国各行业在职学习与培训的实践规模快速扩张,[31]但作为人力资本积累的重要形式,在职学历提升对劳动者个体和社会的后续影响并没有得到应有的重视。
GSCF在数据采集方面的优势为本研究补充教师劳动力市场的中国证据提供了基础。第一,我国教师职后学历提升不仅是一种形式上的参与,而且大多数以学历更新为导向,近10%的被访者属于通过参加统考的形式全日制脱产进修后获得最终学位的情形,质量上可能更加有保障。第二,通过教师问卷中关于其主授课程以及兼任课程的完整信息,笔者可以精准识别教师的学科归属,将数学教师与学生的数学成绩、语文教师和学生的语文成绩进行匹配,排除用数学教师的职业专门技能预测学生语文成绩的错配可能性(7)在学生已经具备基本的听说读写能力后,笔者认为学科之间的交互影响可以忽略不计。此外,在有效分析样本中,也存在一部分同时兼任语文和数学的教师,但将这部分同时兼任课程的教师剔除后,样本量太小,笔者放弃了这个尝试。。
本研究所涉数据主要由GSCF项目提供。该项目旨在了解影响农村学生成长的个人因素、家庭因素、学校因素和社会因素。笔者在其他文章中对GSCF的具体抽样过程做过详细描述,在此不再赘述(8)也可以参见GSCF项目执行报告。。本文所涉变量主要来自教师问卷和学生问卷,部分变量也来自村干部和学生父母的回答。为了充分利用该项目数据对同一批个体多次追踪的优势,笔者将不同调查年份的数据在各个维度进行了匹配,利用“学生—教师—学科”固定效应估计方法消除不随时间而变的师生特征。
笔者根据教师报告的主授课程和兼任课程信息,识别教师的学科归属,然后与学生的语文、数学成绩进行配对(9)在全部有效样本中,约400名教师同时教授语文和数学,则在两个学科的分析中均记为有效匹配样本。。将同时参加两轮调查的学生与教师进行匹配时,样本量缩减较多(10)此外,最终的回归分析存在部分变量的缺失,有效分析样本还将进一步减少(详见文中各表标注的n)。。
本研究的核心问题是职后学历提升对教师教学效能的影响。遵循以往实证研究的惯例,笔者将教学效能操作化为学生在标准化测试中的得分。GSCF在收集影响农村学生成长的全方位信息时,也对学生进行了语文和数学两门课的文化测试,卷面满分是50,项目中心在最终发布的数据中将其拆分为“语文”和“数学”两科。考虑到传统计分的习惯,笔者按照年级和调查年份两个分组类别将其标准化,然后再将其线性转换为服从均值为70和标准差为10的分布,分别对应后文的被解释变量语文(CHIN)和数学(MATH)。
教师在职学历提升情况是本文的核心解释变量。政府控制教师行业的准入资格必然影响教师劳动力构成,[32]如图3所示,这种影响通过两种渠道表现出来:第一,在政策规定之前入职但学历不达标的教师将采取措施提高受教育水平,属于学历补偿教育。根据受教育年限差值,教师平均受教育年限从职初12.4年上升到当前14.2年,平均提升了近两年。第二,行业准入资格的规定正式实施后的入职教师首次就业的受教育水平将普遍更高。尽管两轮调查均直接询问了教师入职以来是否参加过学历提升活动情况,但为了减少自陈报告的误差,笔者根据教师关于职初学历和当前学历的回答,参照中国的学制系统将其转换为受教育年限,将两者的差值界定为在职学历提高程度(EDUCHG)。在所有回归结果中,笔者进一步剔除了根据教师职初和当前受教育年限差值能检测到学历提升记录,但自陈报告工作后没有参加过学历提升活动的样本。
图3 各年份入职教师的职初与当前受教育年限
考虑到30多年来我国学制变迁以及20世纪80年代和90年代早期的特殊性(11)少数教师参加在职学习的目标学历是中专,这与20世纪80年代我国的学制系统的历史有关:中等师范(简称“中师”)曾是中小学教师的主要培养机构,尽管中师属于以培养职业技能为主的教育类别,但在当时的招考系统中,其招生要求比普通高中更高、生源质量更好,毕业生更受欢迎。而很多高中和非师范类中等职业技术学校的毕业生进入教师行业后还需要接受中师的技能训练。,笔者将当时高中毕业但后来又到中专进修的教师统一编码成在职学历提升活动为期一年的类别,其余的负值全部视为缺失值(表1)。在普通线性回归最小二乘估计(Ordinary Least Square, OLS)基准分析中,笔者对在职学历提升情况做了度量方式上的细微变换:第一,将这个差值年限视为类别变量(CHGYR0-CHGYR5),其中,职初学历和当前学历相同的情况(CHGYR0)为基准组(12)其中,当前与职初受教育年限差值高于6年的样本较少,笔者将5年及以上的均合并到CHGYR5的类别中。;第二,将所有差值大于0的教师界定为学历提升样本(UPGRADE),而差值为0的教师即为没有变更过学历水平记录的个体(即EDUCHG=0或CHGYR0=1的样本)。
表1 教师职初学历与在职学习目标学历的交叉列表
在后文的识别策略部分,笔者还利用教师入职学历要求的政策时间信息作为工具变量矫正了模型设定内生性的问题。本文所涉主要变量的界定、测量和分布详见表2。
表2 主要变量的界定、测量与分布
本研究的目的是检验教师在职学历提升对其教学效能的影响,利用学生在标准测试中的成绩作为教学效能的操作指标,其数学表达式如公式(1):
Yitkj=α+β×EDUCHGitj+γT+δS+λtj+Ck+εitkj
(1)
其中,k、t、i分别表示第k个县(区)第t年的第i个观察值。被解释变量Y即为学生的标准化测试分数,j=1, 2分别表示语文和数学成绩。T为教师层面的控制变量,包括教师性别、出生地、首次进入教师行业时间、编制情况、当前最高受教育年限、资格证持证等级及获得方式、工作经验、职称、收入、主授或兼任学科、任课年级及工作负担、职业经历等。S是影响学生学业表现的协变量,包括学生性别、年龄、自我教育期望、所在年级、健康状况、是否独生子女、父母受教育水平和年龄、在家亲子陪伴状况。γ和δ分别为影响教育生产过程的重要控制变量对学生学业表现的影响程度。λt和Ck分别为时间固定效应和县(区)固定效应,控制了随时间而变的组间共同趋势和随抽样县(区)而变的截面空间效应。ε为随机误差项。
EDUCHG是一个值域为[0,10]的连续变量,测量了教师工作后学历提升对应的受教育年限变化程度,β即为笔者重点关心的参数,反映了学历变化程度带来的教学效能变化程度。将EDUCHG的测量等级从连续变量降为类别变量(CHGYR0-5或UPGRADE)时,对应的是若干个虚拟变量的系数,但其对应的含义不同。根据人力资本理论关于在职学习与培训性质的界定,职后学历提升是一项可提高未来劳动生产率的培训活动,则估计系数β>0。
将每个学生和每个教师两轮调查的观测值当作多个独立观测个体。然而,如前所述,与任何职后培训项目一样,教师职后学历提升活动也具有自选择性质:一方面,在教师行业准入的学历资格政策实施后,那些职初受教育水平达不到国家标准的教师参加学历提升活动的必要性更大(图3),如果受教育水平能有效传达生产率信号,这种负向选择可能低估学历提升对生产率的真实影响;另一方面,工作热情高、自我要求严格、积极进取的教师也更可能参加职后再教育,如果这种积极的不可观测的教师个体特征能带来更好的工作场所表现,β将高估学历提升对教学效能的影响。除此之外,教师和学生的双向选择性匹配通常会削弱教师职后教育与学生成绩之间的统计关系。[10][ 28-29]综上,混合OLS估计难以避免模型设定偏误问题。
根据GSCF项目设计上的优势,本研究利用两期追踪数据,通过“教师—学生—学科”的交叉固定效应(μij)并辅之以工具变量法(FE-IV)识别职后学历提升对教师教学效能的影响。如公式(2)所示,FE估计的主要思路是将随机误差εitjk分解成复合误差项μij和σitkj。通过允许个体效应α'与误差项μij相关,消除了个人能力、人格个性、职业精神等不随时间变化的不可观测特征。
Yitkj=α'+β'×EDUCHG'itj+γ'T+δ'S+λtj+Ck+μij+σitkj
(2)
同截面数据的IV估计思路类似,FE-IV策略的核心思想也是寻找一个与核心解释变量相关但不直接影响结果变量的外生变量Z作为工具,利用两阶段估计获得局部平均处理效应。EDUCHG'是根据工具变量Z获得的第一阶段预测值,笔者将教师学历更新的时间信息作为职后受教育水平变化的工具变量,即教师完成学历更新的时间是否在国家关于行业准入学历资格之前(CHG96),由于1995年底国务院又重申了教师的职业资格要求且学历更新完成一般需要经过三年左右的孵化期,本文将1996年作为《教师法》完全生效的时间节点。
表3报告了教师职后学历提升情况对学生标准化测试成绩的影响。笔者初步发现:无论采取何种度量方式,在语文(CHIN)和数学(MATH)两门学科上,OLS估计对应的结果都发现了教师工作后的受教育水平提升对教学效能的负面影响,这与人力资本的基本预期不符,教师在职人力资本积累不仅没有改善教学效能,还对业务绩效产生了负面影响。在控制了教师最终受教育水平(EDUYR)以及其他若干协变量后,相对于均值水平而言,教师工作后受教育年限相对于职初水平每增加一年,其所教学生的文化课成绩降低约0.4个标准差。
表3 教师在职学历提升与教学效能(学生学业表现)
分类别察看教师职后学历提高程度CHGYR1-5和UPGRADE,参照组均是没有学历提升记录的人(EDUCHG=0),这可能反映了职后学历更新是教师负向选择的结果。如前所述,在国家出台行业资格准入标准后,早期入职的学历不达标的教师为了职业发展的需要,被迫参加职后学历提升活动。在报告了详尽职后学历提升活动细节的甘肃农村教师样本中,职后学历提升活动几乎都是学位更新导向的学历升级,没有(或将不会)获得相应学历的样本不到1%。绝大多数教师的在职学习最终都变更为大专或本科学历。这是教师行业学历资格准入条件硬性规定的必然结果,特别是对那些起点学历是高中和中专/职业技术学校(或大专)且从事较高年级教学工作的教师而言,职后提升学历是决定其职业生涯发展和个人福祉的重大事件(13)根据全部样本的统计,起点学历是高中而最终学历是中专(师)的比例约占8%;另外3%的教师报告起始学历是中专且经历了学历提升活动,笔者猜想这部分样本是由其他类型的中等职业技术学校毕业的经过中等师范教育的群体(在没有更多证据的情况下,无法做更多推断)。。
由于缺乏教师职初的详尽信息,笔者无法识别教师学历提升的具体动机,究竟是补缺型还是发展型的学历提升,还需要更加充分的信息(14)由于持证等级可能随时间而变化,而数据中并没有提供教师职初资格证等级的详尽信息,按职初学历和当前资格证持证等级的点线仅供参考,不能作为主要证据支撑。。然而,根据教师报告的当前职业细节信息,笔者做了尝试性的辅助分析,在没有更具有说服力信息支撑的情况下,它也可以提供部分参照。对照国家关于各级各类教师学历资格的最低要求,笔者根据教师自己报告的当前任教最高年级以及资格证持证等级两个标准分别计算了不同年份入职的样本的实际受教育年限与国家标准的差值:根据教师现任最高年级所对应的学历要求,近20%的农村教师当前学历仍然没有达标;按照教师资格证等级对应的受教育水平要求,超过20%的样本仍然没有达到最低要求;总体上,入样教师教育水平与规定的学历标准的缺口平均为近一年。
进一步分析发现,最终学历仍然不达标的教师主要是20世纪80年代早期及此前入职群体,而80年代中后期入职的教师基本都努力达到了最低要求且略高于国家标准(图4)。笔者在所有的回归中都控制了教师的具体入职年份,因此,职后学历提升对教学效能的负面影响主要来自补偿性的进修活动(15)还存在一种潜在的可能性:学业表现更差的学生也通常被分配给教学能力更低的教师,这种师生双向选择性匹配也可能进一步降低那些学历补偿型提升的处理效应。。综上,对于本研究所依据的特殊样本而言,OLS低估了教师职后学习和培训的实际影响,需要对模型设定误差做估计方法上的矫正。
图4 1966—2006年入职教师的学历与国标差值
基于“教师—学生”固定效应且利用IV对同时影响教师在职学历提升和教学效能的不可观测特征以及教育生产过程中师生互相选择进行矫正后,FE-IV栏对应的结果显示,教师职后学历更新对学生语文和数学成绩都具有显著的提高作用,其效应量相当于0.2~0.3个标准差且与IV估计有关的Hauman检验及弱工具变量F检验都通过了约定俗成的显著水平。
经过模型设定的技术矫正后,教师在职学历提升对学生成绩影响的效应量相当于将学生的排名从中等水平向上拔高10个分位点,从第50百分位提至前40%。如表1所示,教师的职后学历提升幅度多集中在3~5年间,按匹配样本在职学历提高均值1.96年计算,这些教师完成学历提升活动后传导到学生成长上的效应约0.6~1.5个标准差,这与国际上关于优秀教师的经济价值的研究结论基本一致。(16)在纪录片《等待超人》(Waiting for Superman) (2010)中,Hanushek直观地展示了教师教学效能对学生成长的长期和短期影响。[33-35]
教师工作后学历提升的生产率效应在OLS和FE估计中存在巨大反差并不冲突。在OLS估计中,β检验的是相对于样本均值水平或不(需要)参加学历提升的教师,职后更新了学历的教师教学效能的表面效果,是组间比较的结果,而这两组人是否具有可比性是正确解释结果的基本前提。[15]而在FE-IV估计中,组内估计量β'反映的效果是:如果不参加在职学历提升的教师进行了这项人力资本投资后预期收到的效果,反之亦然。这再一次说明,在评估中国教师教育政策的效果时,需要高度重视分析方法的精确性,否则可能得出具有误导性的结论。[36]
利用甘肃基础教育调查的两轮追踪数据,笔者检验了农村教师在职学历提升对其教学效能的影响。利用《教师法》关于各级各类教师行业准入的学历资格的自然实验,基于面板数据的固定效应估计和工具变量法的分析结果显示:
第一,职后参加学历提升活动的教师能提高其所任教学科的学生的测验成绩。平均而言,当前学历比职初学历所对应的受教育年限每增加一年,学生的成绩能提高0.2~0.3个标准差,相当于将学生的排名提高10个分位点。
第二,在涉及农村教师学历提升效果的研究时,有必要充分考虑中国学制系统时代变迁的系统性影响。早期的职后学历提升更多的是教师参照国家标准进行的补缺型升级,忽视这种政策激励下的行为结果可能导致巨大的估计偏误。
继笔者前期关于教师在职学历提升活动的经济收益评估研究后,本文进一步提供了这种职后技能提升对个人教学效能影响的证据,为衔接“在职学习与培训—劳动生产率提高—工资收益”的理论逻辑链条提供了必要的补充说明。今后的研究还需要将其适当整合,可以参考Krueger和Rouse的做法,[37]在一个完整的研究中完全打通这个机制作用的路径,即检验教师在职学历提升对教学效能的影响机制,是通过增加工资这个间接的经济激励机制,还是因为职后学历提升本身具有促进教学生产率的作用。这一系列研究将不仅为评估过去20多年农村教师职后教育和培训效果提供客观的数据评判,也可以为新一轮教师学历升级实践提供理论依据和技术参考。受数据本身限制,本文诸多无法充分展开的初步探索对未来教师教育研究的内容和方法、教育评价与测量等都具有抛砖引玉的作用。
本研究还存在如下有待改进之处:第一,由于缺少教师职初的任职年级信息以及资格信息,笔者大致辨识出教师学历提升属于补缺型提高,但精准性有待提高,鉴别不同动机的在职学历提升对政策评估的精准性具有重要意义。第二,这是基于中国甘肃农村调查数据的结果,而且,教师不是核心的目标抽样群体,可能存在偏差。第三,在研究过程中,笔者还发现:甘肃农村教师在职学历提升活动的参与机构以及该机构所在的具体地理方位、学习方式、费用负担等方面形式多样,理论上为检验不同模式的教师职后学习效果和效率提供了可能。然而,由于能成功匹配到各学科上的“教师—学生”配对组合样本量太少,因此,笔者只能放弃进一步探索的努力,但这种分析思路为今后的数据采集、调查项目设计以及教师教育研究等新问题都提供了有价值的思考痕迹和素材。在这方面,有必要借鉴欧美国家教师行政管理档案数据库有条件地向学术界开放,[12][21][38]将这些有价值且没有任何额外成本付出的海量过程性的伴随式数据作为教育评价与改革的事实基础。