张力玮 郭伟
一、从教育指数研究
切入中国教育治理的心路历程
《世界教育信息》:尊敬的张老师,您好!很高兴您能接受本刊的专访。您近几年来一直从事教育指数研究,请您谈谈从事这方面研究的初衷。
张炜:非常感谢能有这个机会谈谈自己近年来的教育指数研究工作。我能够从事这项研究工作,应当感谢长江教育研究院周洪宇院长。2015年我与周院长建立学术联系后,他就敏锐地指出,教育指数研究是未来时代发展的必然需求,长江教育研究院应当积极研发、长期研究。在周院长的引导下,我开始走上教育指数研究之路。我的初衷是充分发掘自身科学研究潜力,为新时代中国教育治理作出一点贡献。
具体来说,从教育指数研究这个点切入到教育治理,是在不断向周院长和长江教育研究院专家团队学习和研讨过程中逐步做实的。在研制长江教育研究院《中国教育指数》的过程中,周院长多次参与研发理念的讨论,他学术视野开阔、理论经验丰富,尤其是兼有学术和从政的经历,因而在最初设计《中国教育指数》时,周院长及长江教育研究院的专家团队都是以服务教育治理体系完善、教育治理能力提升为基本价值追求的。
二、研究生培养质量指数的研制
具有重大意义
《世界教育信息》:您受邀赴教育部学位与研究生发展中心参与“我国研究生培养质量指数研究”课题研讨。请问您对教育部学位与研究生发展中心正在研制的“研究生培养质量指數”是怎么看的?
张炜:党的十九大以来,国家相继提出要在新时代建设“文化强国”“教育强国”“科技强国”;在强国战略体系中,我国研究生教育和研究生培养的质量水平是至关重要的一环。这体现在:第一,研究生教育是教育体系中的最高端,研究生培养是人才培养的最高层次;第二,研究生教育出口对接社会、行业的高端需求,与社会生产力发展密切相关;第三,研究生培养的质量水平关乎国运兴隆,决定未来国家和民族在世界中的位置。
教育部学位与研究生发展中心的相关研究旨在聚焦研究生培养质量,以质量指数为基本工具,推动研究生教育的内涵式发展。在教育新时代,在“放管服”改革进一步走向深入的当代,在教育治理日益强调“共治共赢”的当前,在教育质量成为基本价值追求的当下,开展研究生培养质量指数的研制是十分有价值的。
《世界教育信息》:请问您对研究生教育的独特性有何见解?
张炜:研究生教育不同于本科生教育,研究生培养也不同于本科生培养,科研能力与学术潜质是研究生教育的核心价值目标,独立与创新是研究生培养的根本追求。
有专家曾在阐述研究生教育与本科生教育区别的时候曾以“猎人与兔子”打比方:本科生教育好比老猎手将眼前的兔子打死,让初学的猎人去捡;硕士生教育则一似老猎手示范并要求有一定经验的猎人将眼前的活兔子捉住;博士生教育仿佛老猎手将猎手带入丛林并告之里面肯定有兔子,要求他们想办法捕猎眼界之外的兔子。
这个例子生动地说明了研究生教育的特点,即在学术科研领域逐步走向独立判断与自主创新,最终在各自的专业领域能够主动探索,独当一面。自力更生,勇于实践,在发现未知、接近真理的道路上阔步前行,这也正是我国建设“文化强国”“教育强国”“科技强国”对于研究生培养质量的重要内涵要求。
三、指数研究要注意客观性与主观性、定量与定性、已有与获取、理想与现实四对矛盾
《世界教育信息》:从研制者的角度,您对指数研究有何感受和体验?有没有经验可供研究生质量指数研制借鉴?
张炜:结合自身的研究经历和国内外经典研究案例(如北京大学医学部的研究生教育质量指数、南京大学与光明日报的教育智库CTTI-MRPA效能指数研究、世界银行的全球治理指数研究等),我认为任何指数研究都需要处理好以下四对矛盾。
一是客观性与主观性的矛盾。这是贯穿教育指数研究的一条主要矛盾。需要强调的是,作为科学研究,教育指数研究力求数据来源的客观性和计量的科学性,但是在指数研制过程中,尤其是指标筛选和体系构建中,难免会遇到主观性因素的影响或干扰:譬如,指标体系构建的理论基础、价值目标、研究者主观预期等。
在处理这对矛盾时,一定要坚持客观性主导的原则,尽量降低主观性带来的影响和干扰。尤其在指标体系构建初步完成的时候,需要认真审视指标中可能潜在的主观性因素,对于指标体系整体的信度、效度需要进行前后测,对于指标的内涵和外延一致性、指标解释的准确性和严密性都需要特别关注。
二是定量与定性的矛盾。教育指数研究从研究方法上来看,无疑是以定量研究为主的,但是由于是对教育系统或教育对象的研究,因而也存在无法开展完全定量研究、需要定性研究的时候。例如,在设计教育质量评价指标时,对于研究生导师与研究生互动的质量评价,就需要处理好定量与定性的矛盾。
三是已有与获取的矛盾。教育指数研究的一大难点就是数据的可获取性;因而在已有分析框架和设计预期基础上,如何处理已有与获取的矛盾经常困扰着教育指数研究者。对此,要强调指数研究的科学、客观原则,对于难以获取的数据,只能替换或舍弃;替换是一种变通的做法,但一定要实事求是地进行说明:比如,在很多教育指数研究中,教育财政经费数据获取具有显著的滞后性,可能在整个指标数据中滞后1~2年,这时候必须在数据表格和行文的显著位置予以明确说明,这一点类似于学术论文的引用规范。
四是理想与现实的矛盾。教育指数设计之初,通过学习借鉴,可能理想的框架和指标体系是博采众长的,乍一看是很不错的。但是,在实际操作过程中,往往会感觉不太容易实现。上述的三对矛盾,综合体现在指数研究中。由此可见,教育指数研究是复杂的、严谨的,是一个不断设计、验证和完善的过程。
四、研究生质量指数应明确概念核心内涵并构建框架性维度
《世界教育信息》:您对研究生质量指数有何独特见解?
张炜:首先,应当明晰研究生教育和质量这两个概念的核心内涵。关于前者,上文均有提及,研究生教育是高端教育层次,其价值核心在于培养研究生在学术科研中的独立判断与自主创新的能力和潜质;质量的概念内涵非常丰富,大体上可以概括为“需求满足”“绩效协调”“水平高低”三类。
其次,在构建原则上,结合国内外教育指数研究的基本趋势,聚焦“人本”“结果”“科研”“可持续”应当成为研究生教育质量指数的框架性维度。
在这个方面,我提出了研究生教育质量“RSC”三层模型评价框架及其应用策略。我认为,研究生教育是一个独特的生态系统。整体上,至少可以归纳成“RSC”三层次:第一是表征层(Represent Layer),第二是支持层(Support Layer),第三是核心层(Core Layer)。
所谓表征层,是指在观测者感官上的客观特征反映,即研究生教育中的容易被观测到的基本要素的数量及其结构,譬如生师比、生源层次、学科结构以及学术资源的数量与结构等。
支持层是联系表征层与核心层的中间层级;支持层中,围绕学术科研,办学资源、学校治理与研究生导师三者构成了支持研究生教育可持续发展的关键三角点。
核心层特指研究生教育中的核心要素——师、生与师生互动——教育是培养人的社会复杂活动,研究生教育自然也不例外;围绕研究生发展的新时代需求,师、生与师生互动等核心要素是其他任何资源、管理要素都替代不了的。
从模型形态上看,“RSC”三层模型评价框架的上述三个层次是通过关键三角点有机结合在一起的,其中支持层中的办学资源、学校治理两点与表征层相联;而研究生导师这点与核心层相联。因此,在评价框架维度的设计上,个人主张设置办学资源、学校治理、研究生导师与研究生四个维度,并以后两个维度的权值为重。
在具体的质量指标设计上,结合已有经验和研究成果,当以师生互动过程中研究生导师指导活动和学生主动探究学习为核心。在此基础上,聚焦学术科研、聚焦学习结果、聚焦协同创新、聚焦应用实效。
在指标体系构建方法上,可采用常规成熟的方法体系——在指標选取上,通常使用德尔菲法,由一组专家背靠背匿名提出意见,再经过三四轮“归纳-统计-修订-意见”的循环,得到专家较为统一的意见。在权值计量方面,建议摈弃主观倾向的简单定值方法,采用德尔菲法和科学计量(如主成分分析法、层次分析法)相结合的综合方法。在指数测算方面,可采用数据加权综合后的基础指数法。
《世界教育信息》:您认为应当如何应用这个框架呢?
张炜:这个问题个人认为需要分几个层面思考:第一,在指标设计层面,可以根据各地实际情况,采用“底线+特色”模式;第二,在行动实施层面,建议采用分类分层的评价方案,降低规模、学科、类型、层次等变量对数据结果造成的潜在影响;第三,在结果呈现层面,建议对内采用数据库记录方式,对外采用“等级+建议”方式;第四,在结果比较层面,建议从起点看终点,注重较长时间的动态比较、纵向比较、发展比较。
另外,个人认为该框架在应用时要注意如下问题:第一,虽无法完全避免主观性因素的影响,但仍要以科学性、客观性为底线;第二,在大数据新时代,研究生质量指数研究在形式和内容上需要不断更新,与时俱进;第三,创新是灵魂,是根本,是最终追求,基于框架的具体指标设计应当围绕研究生创新能力培养展开;第四,高起点、阔视野。在全球相关研究并不丰富或者说较为匮乏之际,研究生质量指数的研制要瞄准抢占全球研究生教育治理的制高点,指标设计既要有中国特色,同时主体部分最好也能够与国际接轨,简洁有效而又有兼容性,便于开展国际比较。
五、“创新+特色”、可视化系统和非结构化数据将引领教育指数新发展
《世界教育信息》:请谈谈您对教育指数发展的趋势判断。
张炜:综合专家(尤其是中国教育科学研究院蒋国华先生)的意见,我们认为新时代教育指数研究的兴起符合大数据背景下教育“供给侧”改革的滚滚洪流:首先,大数据和信息技术的飞速发展,使得新时代教育指数研究的形式与内容都必须朝着“创新+特色”高度化演进,有别于10年前几乎千篇一律的“论文+平台”的评价指标模式。其次,通过可视化系统将指数研究数据库呈现于大屏幕上,能够实现教育决策AI+辅助、实时监控、降幅预警等智能化教育治理功能。在不久的未来,作为教育外部支持端口的内容,还将实现指数库、决策库与未来智慧学校、智慧教室、智慧个人终端的“端到端”联结,从而扩展其教育评价、督导、促进的综合效能。最后,非结构化数据(如以常态化、综合化呈现的普通文档、图片、音频、视频等数据)的加入是大势所趋。大数据时代下,正视非结构化数据的作用,积极采用非结构化数据作为质量证据是当下教育指数研究面临的一大难题,同时也将是一种不可逆转的发展趋势。
编辑 王昕 校对 许方舟