智慧教育背景下我国教育评价规范的应然转向

2024-11-19 00:00张耀源龚向和

中国远程教育 2024年10期

摘要：我国教育评价规范主要由法律与政策两部分构成，均存在评价目的陈旧、主体一元和标准单一等“先天不足”。随着智慧教育模式步入现实，教育评价规范中的评价目的、主体和标准应作出何种适应性转向，成为教育立法和政策制定关注的焦点。基于深入推进新时代教育评价改革的要求，结合智慧教育的技术特征和发展趋势，我国教育评价规范的评价目的应从“诊断工具”转向“识材施教”，评价主体应从“基本以政府为主”转向“政府+教育方+社会第三方”的多元化主体，评价标准应从“粗放型”转向“精细型”。

关键词：教育评价；智慧教育；评价目的；评价主体；评价标准

作者简介：张耀源，东南大学人权研究院（国家人权教育与培训基地）博士研究生（通讯作者：zyyszu@foxmail.com 南京 211189）；龚向和，东南大学人权研究院（国家人权教育与培训基地）执行院长、教授（南京 211189）

基金项目：2022年江苏省研究生科研创新计划项目“数字时代下受教育权新样态研究”（项目编号：KYCX22_0312）

中图分类号：G40-011.8; G520 文献标识码：A 文章编号：1009-458ｘ（2024）10-0073-12

一、问题提出与研究思路

近年来，智慧教育作为技术赋能的新型教育范式（祝智庭 & 彭红超， 2020），开始从理念转变为现实，并逐步向规模化发展（余胜泉 & 刘恩睿， 2022）。党的二十大报告明确提出：“教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑”（习近平， 2022）。国家规范作为协调教育发展、科技进步与人才培养三者关系的顶层设计，应当被纳入教育学和法学等研究视域中。因此，本文以教育评价作为切口，对其进行跨学科交叉研究，进而探讨在科技迭代的背景下，教育模式与人才培养应当作何回应。

本文主要采用规范研究的方法。实践哲学中，规范研究一般循两条路径展开：一是发生学意义上的规范研究，即规范是如何在人类社会形成和变化并最终确立自己的功能地位的；二是合理性意义上的规范研究，即对规范本身进行价值判断，或辩护或反驳，并为之提供相应的证据和理由（徐梦秋等， 2011， pp. 5-13）。本文兼采这两种研究进路，在智慧教育背景下，通过对现行教育评价规范文本的合理性评判，推论教育评价规范应当作出何种适应性转向。首先，规范研究方法多见于法学和哲学等学科，因此，本文首先需要对“教育评价规范”的概念作出界定。其次，在法理学视角下，规范的基本结构一般包含规范的价值评判功能、规范的接受对象和规范的适用条件三个要素（伯恩·魏德士， 2013， p.59）。对于教育评价规范而言，评价目的即为评价规范的价值导向，评价主体即为评价规范的接受对象，评价标准即为评价规范的适用条件，这三者组成了教育评价规范的基本结构。因此，教育评价的目的、主体和标准，应当作为本文的主要论证内容。最后，本文主要使用法规范研究中的法教义学（Juristiche Dogmatic）方法，通过对现行法律条文的逻辑分析和解释，提出解决实际问题的法律建议（罗伯特·阿列克西， 2002， p. 311）——对教育评价规范文本进行具体分析，并结合智慧教育的主要特征，通过发现文本与现实间的落差，论证教育评价规范应当作何转向。

二、何谓规范：教育评价规范的概念及内容

教育评价“要求评价人员严格按照规定的程序、准则、标准对所有的评价对象进行评价”（陈玉琨， 2019， pp.41-42）。换言之，教育评价应具有规范性。教育评价的规范性要求“评价主体用规范来整合感性经验里的价值事实”（康宏， 2011），进而形成价值判断。现代社会中，单纯的“法律中心主义”已不能完全涵盖软法、习惯法等非正式规则，各种规范秩序似乎都变成了法律（布赖恩·Z. 塔玛纳哈， 2012， p.214）。所以，法学界发展出“法律多元主义”“规范多元主义”“复规范性”等新概念，力求用“规范”概念实现对人类社会治理规则的全覆盖（朱林方， 2022）。尽管有学者认为，“教育政策与教育法律的差异性随着一个国家和社会法治化进程的发展就会越来越小，而二者的趋同性则会越来越大”，但同时也认为，所谓趋同的教育政策又可以被细分为法律化和非法律化两种，并提出“法律化教育政策的地位要高于非法律化教育政策”（刘复兴， 2002）。这证明，至少在现阶段，我国教育法体系内部还存在明显的效力差别，教育法律与教育政策不可能完全趋同，更不可能在研究中混同使用。因此，本文认为，教育评价规范不仅指具有法律拘束力的人大立法、行政法规和部门规章，还包括一系列无强制拘束力而只是起指导作用的政策文件。

教育评价法律规范由人大立法、行政法规和部门规章组成，但较为分散、不成体系（如表1所示）。除《中华人民共和国学位法》和《教育督导条例》外，专门教育评价法律规范只有1990年原国家教委颁布的《普通高等学校教育评估暂行规定》（以下简称“《评估规定》”）。其余相关规范散见于《中华人民共和国教育法》《中华人民共和国教师法》《中华人民共和国义务教育法》等法律法规的个别条款之中。

教育评价政策规范，多为“效力结构未必完整、无须依靠国家强制保障实施、但能够产生社会实效”（罗豪才 & 宋功德， 2006）的“柔性规则或指令”（沈岿， 2021），其文件名称多为“指导”“方案”和“意见”等，如《深化新时代教育评价改革总体方案》（以下简称“《总体方案》”）《关于深入推进教育管办评分离促进政府职能转变的若干意见》（以下简称“《职能意见》”）等（如表2所示）。因为制定程序较法律规范更为简便，此类文件数量颇为庞杂、变动频仍。

然而，教育评价的法律规范和政策规范都存在评价目的陈旧、评价主体一元和评价标准单一等先天不足。因此，教育评价规范如何能够在改革自身的同时，实现与智慧教育等新兴教育模式的同频共振，是本文研究的重点。需要特别说明的是，虽然智慧教育只是作为开展研究的宏观背景，但为了展现国家对智慧教育发展的态度，增强本文论证的说服力，有必要对智慧教育规范进行梳理。法律规范层面，智慧教育迄今尚无专门的法律规范调整；政策规范层面，2017年7月，国务院印发《新一代人工智能发展规划》，“智能教育”的概念首次正式出现在国家规范性文件之中。因此，本文对智慧教育政策规范的梳理限定在2017年7月之后（如表3所示）。

三、评价目的：从“诊断工具”

转向“识材施教”

教育评价最早偏重于选拔和筛选功能，其目的是选出合格的受教育者和服务社会的人才。随后，教育评价更加强调反馈和矫正功能，目的是及时发现教育过程中的问题，促进教育工作的不断完善。具体到我国，最初教育行政部门对教育评价抱持着“以评促改，以评促建，评建结合，重在建设”的态度，但实践中的教育评价工作却往往是鉴定性的，即通过给被评对象以一定的压力，达到促改促建的目的（陈玉琨 & 李如海， 2000）。后来，随着素质教育的推行，教育评价目的逐渐转向发展性评价，即注重评价对象发展变化的过程，使评价成为促进评价对象不断发展的教育活动（董奇 & 赵德成， 2003）。反观我国现行的教育评价规范，法律规范的评价目的还停留在鉴定性层面，即为教育决策提供信息和依据，为不断完善和改进教育过程，或为提高教育质量服务（胡中锋， 2016， p.6）；政策规范的评价虽然向前进了一步，更注重过程评价、增值评价和综合评价，但这些都建立在教育评价作为“诊断工具”的基础上，并未契合智慧教育的个性化、精准化学习特征。

智慧教育使得嵌入学习过程的伴随式评价成为可能（余胜泉 & 王阿习， 2016），尤其是可以运用智能技术感知学习情境，识别学习者特征，提供合适的学习资源与便利的互动工具（黄荣怀等， 2012），对学生学习模式（即学习画像）进行挖掘（顾小清等， 2021），以此规划最适合学习者个人的学习策略。有赖于此，以往在教育评价中无法实现的个体精准分析成为可能，真正实现每位学习者个体层面的因材施教。此时，教育评价最重要的目的就应当转向为“识材”，即通过评价明确“材”的特点和程度，找准“教”的定位和起点，从而创造“因材择学”的机会，实现“识材—施教—发展”的逻辑演进（张琪 & 王丹， 2021）。

（一）教育评价规范的传统评价目的：“诊断工具”

首先，在教育评价法律规范中，教育评价被当作单纯“诊断工具”的目的最为明显。目前，涉及教育评价目的的法律有《职业教育法》《民办教育促进法》和《学位法》，行政法规和部门规章则有《教育督导条例》和《评估规定》。《学位法》大多是对学位授予的程序性规定，其中第六章“学位质量保障”的内容多数也是宣示性条款。此外，《学位法》将实际的学位授予权下放至学位授予单位及其学位评定委员会，可能导致各学位授予单位形成或参差不齐或机械僵化的个人学术评价标准。因此，《学位法》的评价目的仍定位于学科建设和发展的“诊断工具”，也即《学位法》希望通过规范学位的授予程序来提升各学科建设的质量水平，却忽略了对学习者个人的发掘和培养。《民办教育促进法》《教育督导条例》和《评估规定》则直接将督导和评估的目的定位于“提高办学水平和教育质量”，这是典型的“诊断工具”论。只有《职业教育法》第四十三条第三款一定程度上将学习者个人的技能培养作为评价重点，即“职业教育质量评价应当突出就业导向，把受教育者的职业道德、技术技能水平、就业质量作为重要指标”。

其次，教育评价的政策规范距离智慧教育所要求的“识材施教”目的还有相当距离。2019年，中共中央、国务院出台《关于深化教育教学改革全面提高义务教育质量的意见》，其中第18条“健全质量监测评价体系”提及“强化过程性评价和发展性评价”，并将学生发展质量评价标准单独罗列，与县域义务教育质量和学校办学质量标准并列，可见政策对学习者个人能力发展的看重。2022年，中共中央、国务院出台《总体方案》，在“主要原则”中提到“充分发挥教育评价的指挥棒作用”，同时在“改革目标”中提到“要使促进学生全面发展的评价办法更加多元”。但是，这些规定也仅比法律规范前进了一步，本质还停留在“诊断工具”，只不过诊断对象从教育系统转换为学习者个人。

（二）教育评价规范的评价目的转向：“识材施教”

20世纪初，关于评价目的的讨论就已从简单的“量化检测”阶段朝向复杂的“价值建构”阶段，强调评价者和评价对象之间的不断交互、共同建构和全面参与，最后通过双方协商而作出评价（余春瑛， 2011）。因为纯粹理性的实证化研究对教育评价研究来说是不够的，或者说是不全面的，而应从人的需要出发，关注人的本性，实现人的终极关怀（齐宇歆， 2011）。当进入智慧教育新阶段之后，利用人工智能技术关照个性化的内生需求和创新需求又成为历史的必然（朱敬 & 蔡建东， 2020）。2020年出台的《国家新一代人工智能标准体系建设指南》提出，“需要在智能教育领域建立以学习者为中心的精准推送服务”（国家标准化管理委员会等， 2020， p.20）。因此，根据智慧教育的个性化、精准化学习特征，评价目的至少应当细化至能够“识别”学习者个人的优势才能，以便“因材施教”。

我国教育评价目的在规范层面主要存在两个问题。其一，法律规范过于陈旧，政策规范又未能与智慧教育有机融合。“以评促建”的法律规范不但落后于理论发展，更逐渐被实践抛弃；“促进学习者个人发展”的政策规范确实更进一步，且似乎与部分学者所主张的“学评融合”（张生等， 2021）和“以评促学”（李鹏， 2020）等理念相契合。但这依然没有抓住智慧教育的关键，即学习者不再被学习计划与环境拘束。此时的评价目的不应该是“促进学习”，而是如何通过分析学习者的个人特性，创造一套契合其自身发展的学习模式，即“识材施教”。其二，把教育评价结果当作教育改革和管理的依据，很可能陷入“唯教育评价论”。唯教育评价论，就是把教育评价结果视为教育评价的最终目的，以致教育者疲于应付各种评价压力，教育方法也变得愈发保守和趋同，从而变相削弱教育方式的多样性。

智慧教育使得被动的受教育者转化为主动的学习者，个体的学习需求引起前所未有的重视。因此，我国教育评价规范应从根本上改变“诊断工具”的传统认知，避免“唯教育评价论”的陷阱，转向“识材施教”的新方向。

四、评价主体：从“基本以政府为主”转向“政府+教育方+社会第三方”多元化主体

20世纪70年代，有学者就提出教育评价主体应当朝多元化转向，“应该把需要使用评价信息的各方面人员邀请到评价中来……以便使评价结果能够很好地满足使用者的需求”（蔡敏， 2001）。然而，本文所指称的“主体”并非指所有参与教育评价活动的个人或组织，而是指真正掌握评价权力的主体。评价规范最重要的任务是规制评价权力，保障受教育权利，保证评价结果的公信力。如果只是“参与评价”，而没有影响评价过程和结果的权力，则并非规范研究所研究的对象。

我国现行教育评价法律规范基本以政府为唯一主体，其他相关方至多只能起辅助作用。虽然有政策规范提出“构建政府、学校、社会等多元参与的评价体系”，但一则政策本身的稳定性弱于法律，二则相关条款大都只是宣示性条款，缺乏具体的实施细则。同时，智慧教育本身是动态发展和实时变化的，涉及许多变量要素，各个要素之间又相互影响、相互制约（哈斯高娃等， 2017， p.64）。如果教育评价完全以政府为主，那么对智慧教育进行实时跟踪评价显然不现实。因为政府的科层制结构要求各部门遵循专门化的分工负责制，各个成员只需要接受组织分配的活动任务，专精于自己岗位职责即可（马克斯·韦伯， 2010， p.48）。换言之，科层制自带的超强稳定性与严格程序性特征，使得政府对于及时跟进智慧教育评价“有心无力”。当下正在进行的数字政府建设，也不可能对政府科层制组织结构产生颠覆性影响，至多只是在原有基础上使其更加趋于扁平化，以提高行政效能（王伟玲， 2022）。

（一）教育评价规范的现行评价主体：“基本以政府为主”

我国现行教育评价规范将评价主体划分为三类：以教育行政部门为代表的政府机关、以学校等教育机构为代表的教育方，以及从事教育咨询和服务工作的社会团体。

基础教育阶段，评价主体表现为明显的一元化。只有教育行政部门才能作为合法评价主体，社会团体鲜少能涉足其中，学校的自我评价功能也不被重视。《义务教育法》第八条直接将义务教育教学质量评价纳入教育督导工作之中——“人民政府教育督导机构对义务教育工作执行JjSeILvgTt3UR0kpOilWzg==法律法规情况、教育教学质量以及义务教育均衡发展状况等进行督导”。反观政策规范，虽然一定程度上强调了“多方共同参与”，但仍以政府为主。例如，《关于推进中小学教育质量综合评价改革的意见》就把中小学教育质量综合评价的组织领导权交由省级教育部门，而具体的实施则交由各地教育部门完成；《义务教育质量评价指南》明确规定“质量评价队伍主要由督学、教育行政人员、教育科研人员、校长、教师及其他有关方面人员组成”，虽然客观上扩大了义务教育阶段教育评价的主体范围，但起主导和推进作用的依然是督学和教育行政人员等政府官员。

高等教育阶段，《高等教育法》第四十四条通过分主体式立法，把高等学校和教育行政部门作为两个并列的评价主体分别规制：“高等学校应当建立本学校办学水平、教育质量的评价制度，及时公开相关信息，接受社会监督；教育行政部门负责组织专家或者委托第三方专业机构对高等学校的办学水平、效益和教育质量进行评估。”相比对基础教育评价主体的严格管控，高等教育评价主体范围明显扩大，高校作为教育方拥有一定的自主评价权，不再统一并入政府主导的评价活动中。作为部门规章的《评估规定》也采取了这种立法方式，即一方面以政府为主组织实施教育评价，另一方面单独规定学校内部的评估制度，并以社会评估为重点，鼓励学术机构和社会团体加入其中。本文认为，这种分主体式立法规制应当是未来评价主体多元化转向的理想途径。政策规范方面，《关于实施〈中华人民共和国高等教育法〉若干问题的意见》则把高校办学水平、效益和教育质量的评估权交由教育行政部门。换言之，我国高等教育评价主体基本是以教育行政部门为代表的政府机关，主要为政府主导型的教育评价模式。此外，各高校也有一定权限组织自我评估，对本校办学水平和教学质量进行自我测评。

其他教育类型中，《职业教育法》第八条赋予各级政府组织实施督导评估的权力，第四十三条还要求“职业学校、职业培训机构应当吸纳行业组织、企业等参与评价”，并且“县级以上人民政府教育行政部门应当会同有关部门、行业组织建立符合职业教育特点的质量评价体系，组织或者委托行业组织、企业和第三方专业机构，对职业学校的办学质量进行评估”。但是，职业教育评价规范仍然是以政府为主导的一元评价主体模式，其他参与方都必须在此框架体系内活动，无法取得相对独立的地位和权力。《民办教育促进法》和《家庭教育促进法》关于评价主体的规范同样如此，基本以政府为主，其他参与方只是在政府提供的架构内起辅助作用。

（二）教育评价规范的评价主体转向：“政府+教育方+社会第三方”多元化主体

在智慧教育兴起之前，我国教育评价主体就已开始朝多元化方向转变。如《职能意见》提出“必须深入推进管办评分离，厘清政府、学校、社会之间的权责关系，构建三者之间良性互动机制”“推动学校积极开展自我评价，提高国家教育督导实效，支持专业机构和社会组织规范开展教育评价”。

然而，智慧教育独特的技术特征要求教育评价全面转换自身范式。这种转换并非基于学术理论或价值取向，而是大数据、人工智能等新兴技术对教育评价提出的新要求，即评价应当“从纸笔测试转向全息评价”，尽可能全面详尽地收集学生有关综合素质发展方面的信息，将其“全息”映射到特定的计算系统和模型中，从而将单点的学生信息生成、转换为学生综合素质发展报告（田爱丽 & 张晓峰， 2020）。2019年国际人工智能与教育大会在北京召开，超过100个国家的代表就人工智能教育达成了《北京共识》，提出“应用或开发人工智能工具以支持动态适应性学习过程”（联合国教科文组织， 2019， p.59）。这说明智慧教育需要与之相匹配的动态实时评价工具。因此，仅凭政府主导的一元化主体无法满足智慧教育实时性的要求，学校等教育方和智慧技术提供者等社会第三方必须加入其中，并应当被列为独立的教育评价规范主体。

提倡多元化主体并不意味着放弃政府的领导。相反，政府在智慧教育评价主体中应当发挥重点监管和兜底保障的作用。《职能意见》明确指出，推进教育的管办评分离，促进政府职能转变，并非要求政府不管事，而是要求政府实现“放管结合”。换言之，教育评价既要破除政府大包大揽的痼疾，又要完善相应的监督制约机制，加强对教育评价主体的监管，以确保评价结果的公信力。

最后，针对“智能机器也应作为智慧教育评价主体”的观点。本文认为，以现阶段的智能技术水平，智能机器不宜列为教育评价的主体。依据人工智能技术所模拟人类思维能力的高低，人工智能技术可以分为强人工智能和弱人工智能。目前投入应用的绝大部分技术都只停留在“弱人工智能”阶段。本质上，人工智能只是人的智能的某些层次的展现，并不是全部，而人的智能里有许多层面并不是可以计算或者进行逻辑分析的，所以，重要的还是人，而不是工具或者用工具生产出来的产品（於兴中， 2021）。因此，我们对于人工智能模拟人类智能能力不应过度自信，而以人工智能技术作为重要技术支撑的智慧教育现阶段自然也不应将智能机器列为评价主体（张进宝 & 李凯一，2022）。因为机器的背后实质上还是人在操纵，只不过这种操纵模式被以“算法黑箱”①的形式掩盖起来了。

五、评价标准：从“粗放型”

转向“精细型”

规范化的标志是建立一套相应的标准（冯晖 & 王奇， 2015）。因此，教育评价规范的核心内容莫过于评价标准的确立。《标准化法》第二条将“标准”定义为“农业、工业、服务业以及社会事业等领域所需要统一的技术要求”，而教育评价标准就是教育评价领域的统一技术要求。然而，我国教育评价规范中有关评价标准的条款却少之又少，就算少数条款有涉及，也只是泛泛而谈，缺乏实践参考价值。这种“粗放型”评价标准条款导致实践中评价标准过于单一，奉行学习成绩与分数至上，并且惯用考试等结果性评价手段对评价对象进行一次性评价，最终导致教育的“育人”功能弱化（张进良等， 2023）。

智慧教育作为一种新兴教育模式，其主要技术特征之一就是技术与教学的高度融合。这不是简单借助电子设备的初级电化教学模式，而是借助信息技术的力量，创建具有一定智慧的（如感知、推理、辅助决策）学习时空环境（祝智庭 & 贺斌， 2012），令学习者人人皆学、处处能学、时时可学（习近平， 2015），形式上具有高度灵活性。因此，如果说“粗放”只是我国教育评价标准的内在“先天不足”的话，智慧教育则是从规范外部对评价标准提出了新要求——评价标准条款必须适应智慧教育灵活多变的教学特点。

（一）教育评价规范的评价标准条款：粗放型

总体而言，我国现行教育评价规范中有关评价标准的条款不多，且大都可操作性不强。法律规范中，只有《职业教育法》《家庭教育促进法》和《学位法》三部法律，以及《评估规定》等部门规章包含涉及评价标准的条款；政策规范中，涉及评价标准的有《总体方案》和《关于完善教育标准化工作的指导意见》（以下简称“《标准意见》”）等规范性文件。这些条款分布散乱、不成体系，有的条款之间还存在相互转引、参照适用的情况。换言之，教育评价标准条款之间既存在冗余重叠之处，又有缺漏之处尚需补足。

首先，部分涉及评价标准的法律条款，借助指示参照性法条规避自身的立法责任，使得评价标准的设定僵化，适用范围狭窄。指示参照性法条，又可称为准用性规则，意指某些法条会在其构成要件中明确指示参照另一法条，而且只有与其他法条相结合，才能发挥创设法效果的力量（卡尔·拉伦茨， 2003， pp.137-141）。如《评估规定》第八条将办学条件的评价标准转移给《普通高等学校设置暂行条例》，又将教育质量评价标准转化为《学位法》中的学位授权标准，以及国家制订的有关不同层次教育的培养目标和专业（学科）的基本培养规格。然而，这种将不同层次和不同类型的评价标准设定权直接转移给其他单行法规范的方法值得商榷，因为这实际是“立法惰怠”的表现。第一，评价标准的内容应结合实际，体现出对被评价者动态变化的判断，尤其应注重增值评价。例如，针对高校办学条件，《普通高等学校设置暂行条例》仅为高校创设最低标准，将其作为单一评价标准无法展现高校办学条件的进步程度。第二，评价标准的内容覆盖面要广，不能仅限于对学术水平的判断。如《学位法》第十九至二十一条是有关三级学位授予的标准，主要是对“本学科基础理论、专门知识和基本技能”的考察，以及对“独立进行科学研究能力”的肯认。换言之，上述标准只是对高校学术教育的评价，但是教育质量所需考察的范围远不止于此。《总体方案》在指导思想和主要原则中都明确提到“以德为先，能力为重”，所以高校教育质量评价标准不仅要关注“智育”，更应重视“德育”等其他评价标准。

其次，不论是法律规范抑或政策规范，有关评价标准的制定主体大多要么含糊其词，要么直接交由政府及其行政部门，只有《职业教育法》和晚近的政策规范略有不同。关于评价标准的制定，只有《职业教育法》和《家庭教育促进法》等少数法律规范有所提及。《家庭教育促进法》第二十四条将“家庭教育指导评估规范”交由“省级人民政府或者有条件的设区的市级人民政府”制定。相比之下，《职业教育法》第四十条则要开放得多——“县级以上人民政府教育行政部门应当会同有关部门、行业组织建立符合职业教育特点的质量评价体系”——虽然仍是教育行政部门占据主导地位，但法律也明确提出，行业组织应当被纳入制定主体之中。作为政策规范的《标准意见》，通过给教育标准分类的做法进一步开放制定主体——教育标准被分为“强制性标准”和“推荐性标准”，强制性标准还是由政府有关部门组织制定，而推荐性标准则交由具有广泛代表性的相关方组成的标准化技术委员会或专家组起草。

最后，评价标准的类型化设定在法律规范中极少，而在政策规范中则相对较多，但实践中却不尽人意。如《职业教育法》第四十三条强调，职业教育评价需要突出“就业”导向，把受教育者的“职业道德、技术技能水平、就业质量”作为评价的重点。换言之，《职业教育法》设定的评价标准不同于一般的教育评价标准，而是带有鲜明的职业教育类型特色，更有针对性。再者，《总体方案》则把教育评价标准细分为“学校评价”“教师评价”和“学生评价”。其中，学校评价又分为“幼儿园”“中小学”“职业学校”和“高等学校”等类型；教师评价则分为“教学工作”“学生工作”和“科研工作”等类型；学生评价则按照“德智体美劳”划分，而每种类型之中都设置了不同的评价标准及其评价重点。但由于与旧有政策执行机制存在不相容、不顺畅的痼疾，这一政策规范的推动进程和实践效果都不甚理想（杨聚鹏， 2022）。

虽然“宜粗不宜细”很久以来都是我国立法工作的主基调，但这种基调的形成有其独特的历史背景作支撑，并非立法学的“金科玉律”。第一，“粗放型”立法的概念产生于改革开放初期，彼时我国刚开始重建法制规范，亟须改变无法可依的局面，因而对法律内部的细节性规定只好“选择性忽略”；第二，“精细型”立法并非“法律万能主义”，一味苛求立法事无巨细，而是在接续原有秩序和规则的基础上展开秩序和规则的创制，在功能上体现为秩序和规则的“续制”，而不仅仅是“创制”（王起超， 2021）；第三，现代国家面临的治理压力远胜往昔，“粗放型”立法无法满足复杂的社会需求，模糊不清的规定很可能也不被公众遵循，只会沦为一纸具文。因此，若认为传统“粗放型”评价标准在最初制定时需配合“加快完善教育法律制度体系”的目标，以至于不得不在细节方面有所牺牲的话，那么在“多层次教育立法体系初具规模”（任海涛， 2020）的现在，“粗放型”评价标准条款早已变得不合时宜。国家规范的长期缺席或实施不力，相当于将标准设定权拱手让给更具功利主义倾向的社会和市场。长此以往，必然会危及教育本身。

（二）教育评价规范的评价标准转向：精细型

在智慧教育背景下，评价标准条款应在以下三方面实现“精细型”转向。

1. 标准的设定应当在增强自身可操作性的同时，适应智慧教育“灵活多变”的学习形式，并注意引入非智力因素的评价指标

首先，原有“粗放型”评价标准条款往往只有极简单的一句话，可操作性不强，根本无法应用于多个学习场景自由转换的智慧教育之中。因此，评价标准的建构，必须考虑到自身的实用性，以便最后的落地执行，而关键就在于“探索出系统且行之有效的评价指标体系”（秦玉友， 2021）。当然，考虑到法律规范修改不易，可以将评价指标体系以政策规范的形式予以公布，然后设定一个实行周期，俟每一周期结束后，由原制定主体结合本周期内具体执行情况再行修改。这样既照顾到评价标准的可操作性，又不致因为写入规范文本而变得僵化过时。其次，智慧教育背景下，原有的教育评价标准可能会产生技术伦理风险。一方面，人工智能应用会使原本存在于教学评价中的情感因素被渐渐悬置，从而使评价中人的主体尊严被破坏；另一方面，智慧教育过于重视科学主义思想，以“好坏”“正误”为唯一判断标准，极易偏离人本主义的伦理轨道（赵磊磊等， 2023）。因此，评价标准条款的更新应注重引入对学生“情感关怀”和“伦理道德”等价值观上的引导。此外，评价标准的设定还要考虑与其他规范文本的协调，如《个人信息保护法》和《数据安全法》等，因为智慧教育并不单纯关乎教育自身，还需要人工智能、大数据等新兴技术的支持。

2. 标准的制定主体应当尽可能吸纳多方参与，以便在专业性和公共性之间实现平衡

智慧教育评价标准看似表现出极强的专业性和技术性特征，但由于其关乎公民受教育权，与公民未来发展息息相关，因此还具有一定的公益性特征。而且，任何标准的制定都或多或少会受到制定者价值偏好的影响，尤其当智慧教育产业化之后，其中的先行者为避免后来者冲击到自己的地位，一般都会构筑技术壁垒，抬高入门门槛，以阻止外来者进入本行业，最后造成事实性垄断，不利于智慧教育的长远发展。因此，标准的制定更需要科学适当的参与机制促进利益相关者的参与，以修正制定者信息获取的不足，增强回应性和效率（张欣， 2021）。

本文认为，教育评价标准的制定主体至少要包括教育评价的主体和对象两类，即教育行政部门、学校等教育机构、第三方专业评价机构、学习者代表以及智慧教育技术提供者等多方主体。其中，教育行政部门应当承担组织起草、总揽全局的作用，但不应过多干涉标准的具体内容设计；学校等教育机构应当从自身教学实践所遇到的困难出发，增强标准的问题意识和可操作性；学习者代表应当从个体角度出发，保护公民受教育权不被智慧教育评价标准“物化”；第三方专业评价机构和智慧教育技术提供者则可以从数据分析、教育技术等视角为标准的制定查漏补缺，丰富和完善标准的具体内容。总之，智慧教育评价标准的制定不应成为少数人的内部游戏，需要各方主体在专业性和公共性之间实现平衡，达到既规范有效又开放包容的境界。

3. 标准的设定应当有针对性地分门别类，实现各层级、各领域的全覆盖

《标准意见》明确提出“要完善教育标准的分类”，并将教育标准分为国家标准、行业标准、地方标准、团体标准和企业标准，但这只是在纵向层级上的分类，智慧教育灵活多变的特征还要求教育评价在横向环节中进行有针对性的分类。

纵向层级方面，评价标准应当遵循“地方—行业—国家”的顺序分层级制定。首先，智慧教育等新兴教育模式在国内的发展程度极不均衡，经济发达地区已是遍地开花，相对偏远贫困地区却闻所未闻。因此，贸然制定国家标准可能会导致评价呈现“一刀切”的情景，对欠发达地区并不公平。其次，按照“先地方、再国家”的次序制定评价标准，类似于我国“先行试点”制度，有利于为最终全国标准的制定积累经验、吸取教训。最后，地方标准和行业标准的先行制定并不意味着国家标准就可以暂缓制定，或是不必制定。“地方政府有地方市场扩张和本地经济发展的利益诉求，行业主管部门也有自己所主管产业发展的利益诉求。因此，地方标准、行业标准某些情况下比国家标准更加强势，从而加剧了标准化管理的‘条块化’趋势”（于连超， 2021， pp.317-318）。因此，及时制定国家标准有利于破除地方保护主义和行业壁垒，防止评价标准成为部门寻租的新工具。

横向环节方面，评价标准的设定应全面覆盖教育活动各领域的人、事、物，如此方能对智慧教育有一个客观、准确、完整的评价。《标准意见》指出，教育标准应至少包括学校设立标准、学校建设标准、教育装备标准、教育信息化标准、教师队伍建设标准、学校运行和管理标准、学科专业和课程标准、教育督导标准、语言文字标准等重点领域。智慧教育的评价标准自然也应覆盖这些领域。因此，评价标准的设定应当重点关注教育机构的设立、教育装备的配置与更新、教育信息化与智能化技术的应用、学科教学的具体情况、教师授课质量等环节，从而构建起一套具有内容科学、结构合理、衔接有序的智慧教育评价标准体系。

六、结语

教育评价虽然是近年来教育学界研究的重点和热点，但很多要么从教育实践出发探讨具体评价指标的设计，要么就国家相关政策文件的落实情况进行实证研究，而对于规范文本的考察则凤毛麟角。实际上，我国教育评价的规范文本确实过于陈旧且粗糙，大多仅提供方向性的引导，可操作性不强。因此，本文认为，在智慧教育蓬勃发展的当下，教育评价规范已经与教育评价工作的现实严重脱节。

近年来，我国教育行政部门已经开始意识到这一点，并着手对教育评价体制进行改革。但这些改革举措并未与现在方兴未艾的智慧教育形成联动。换言之，教育评价改革在规范层面总是“慢半拍”，而这种规范与现实间的持续疏离也同时是教育评价改革进展缓慢、成效不彰的重要原因。智慧教育作为一种新兴教育模式，它的大规模普及迫使我国教育评价规范在评价目的、主体和标准方面进行一定程度的转向。这也表明，科技自身在更新迭代的同时，不可避免地会对教育体系和人才培养造成影响，而国家规范作为教育制度的重要支撑和顶层设计，更需要与时俱进，作出符合科技进步、教育发展和人才培养规律的相应转向。

参考文献

伯恩·魏德士. （2013）. 法理学（丁晓春，& 吴越译）. 法律出版社.

布赖恩·Z. 塔玛纳哈. （2012）. 一般法理学：以法律与社会的关系为视角（郑海平译）. 中国政法大学出版社.

蔡敏. （2001）. 论教育评价的主体多元化. 教育研究与实验（1），21-25.

陈玉琨. （2019）. 教育评价学. 人民教育出版社.

陈玉琨，& 李如海. （2000）. 我国教育评价发展的世纪回顾与未来展望. 华东师范大学学报（教育科学版）（1），1-12.

董奇，& 赵德成. （2003）. 发展性教育评价的理论与实践. 中国教育学刊（8），18-21，45.

冯晖，& 王奇. （2015）. 试析教育评估专业化. 教育发展研究（11），5-9.

顾小清，杜华，彭红超，& 祝智庭. （2021）. 智慧教育的理论框架、实践路径、发展脉络及未来图景. 华东师范大学学报（教育科学版）（8），20-32.

国家标准化管理委员会，中央网信办，国家发展改革委，科技部，& 工业和信息化部. （2020-8-5）. 国家新一代人工智能标准体系建设指南（国标委联〔2020〕35号）. 国家标准化管理委员会网站. https：//www.sac.gov.cn/xw/tzgg/art/2020/art_906877cd33bd4

05a87c9fe5f12c03e49.html

哈斯高娃，张菊芳，& 凌佩等（编著）. （2017）. 智慧教育（第2版）. 清华大学出版社.

胡中锋. （2016）. 教育评价学（第3版）. 中国人民大学出版社.

黄荣怀，杨俊锋，& 胡永斌. （2012）. 从数字学习环境到智慧学习环境——学习环境的变革与趋势. 开放教育研究（1），75-84.

卡尔·拉伦茨. （2003）. 法学方法论（陈爱娥译）. 商务印书馆.

康宏. （2011）. 教育评价的价值反思与建构——基于规范认识的视角. 现代教育管理（4），82-85.

李鹏. （2020）. 评价如何促进学习？——从泰勒到厄尔的探索与反思. 外国教育研究（1），31-44.

刘复兴. （2002）. 教育政策的边界与价值向度. 清华大学教育研究（1），70-77.

罗伯特·阿列克西. （2002）. 法律论证理论——作为法律证立理论的理性论辩理论（舒国滢译）. 中国法制出版社.

罗豪才，& 宋功德. （2006）. 认真对待软法——公域软法的一般理论及其中国实践. 中国法学（2），3-26.

联合国教科文组织. （2019）. 北京共识——人工智能与教育. 央广网. http：//edu.cnr.cn/list/20190828/W020190828373742676391.pdf

马克斯·韦伯. （2010）. 经济与社会（第2卷）（上册）（阎克文译）. 上海人民出版社.

齐宇歆. （2011）. 当代教育评价理论及其历史演进过程中的知识观分析. 远程教育杂志（5），76-82.

秦玉友. （2021）. 教育评价如何合力推进. 中国电化教育（7），6-8.

任海涛. （2020）. 论教育法体系化是法典化的前提基础. 湖南师范大学教育科学学报（6），15-24，76.

沈岿. （2021）. 软硬法混合治理的规范化进路. 法学（3），69-83.

田爱丽，& 张晓峰. （2020）. 范式转换：新技术支持下学校育人方式的系统变革. 教育发展研究（8），45-50.

王起超. （2021）. 粗放和精细：论立法技术的秩序建构路径. 河北法学（5），171-185.

王伟玲. （2022）. 中国数字政府形态演进和发展瓶颈. 行政管理改革（5），23-30.

习近平. （2015-5-23）. 习近平致国际教育信息化大会的贺信. 中华人民共和国中央人民政府网站. http：//www.gov.cn/xinwen/2015-05/23/content_2867645.htm

习近平. （2022-10-25）. 高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗——在中国共产党第二十次全国代表大会上的报告. 中华人民共和国中央人民政府网站. https：//www.gov.cn/xinwen/2022-10/25/content_5721685.htm

徐梦秋，张爱华，吴州，吴荣梅，周祯祥，曹志平，欧阳锋，王云萍，& 李永根. （2011）. 规范通论. 商务印书馆.

杨聚鹏. （2022）. 新时代教育评价改革政策的价值意蕴、执行阻力与改革路向. 教育学报（5），106-117.

余春瑛. （2011）. 对教学评价的文化哲学思考. 教育探索（3），20-21.

于连超. （2021）. 标准化法原论. 中国标准出版社.

余胜泉，& 刘恩睿. （2022）. 智慧教育转型与变革. 电化教育研究（1），16-23，62.

余胜泉，& 王阿习. （2016）. “互联网+教育”的变革路径. 中国电化教育（10），1-9.

於兴中. （2021）. 人与科技：从智能间的平衡到人性的平衡. 中国法律评论（2），55-64.

张进宝，& 李凯一. （2022）. 中国人工智能教育研究现状的反思. 电化教育研究（8），21-28.

张进良，杨苗，& 谈桂芬. （2023）. 智能技术赋能基础教育评价改革的实然困境与路径选择. 中国远程教育（2），18-27.

张琪，& 王丹. （2021）. 智能时代教育评价的意蕴、作用点与实现路径. 中国远程教育（2），9-16，76.

张生，王雪，& 齐媛. （2021）. 人工智能赋能教育评价：“学评融合”新理念及核心要素. 中国远程教育（2），1-8，16，76.

张欣. （2021）. 我国人工智能技术标准的治理效能、路径反思与因应之道. 中国法律评论（5），79-93.

赵磊磊，蒋馨培，& 代蕊华. （2023）. 内在主义技术伦理：教学评价智能化转型考量. 中国远程教育（1），40-48.

朱敬，& 蔡建东. （2020）. 从“人工智能能做什么”到“教育需要人工智能做什么”——兼论教育需求的隐匿与突显. 中国教育学刊（10），15-20.

朱林方. （2022）. 论双轨法治——复规范性的中国叙事. 中外法学（5），1221-1240.

祝智庭，& 贺斌. （2012）. 智慧教育：教育信息化的新境界. 电化教育研究（12），5-13.

祝智庭，& 彭红超. （2020）. 技术赋能智慧教育之实践路径. 中国教育学刊（10），1-8.

China’s Education Evaluation Standards Should be Turned Under the Background of Intelligent Education

Zhang Yaoyuan and Gong Xianghe

Abstract： China’s education evaluation standards mainly consist of two parts： laws and policies. However， there are “congenital deficiencies” in both aspects， such as outdated evaluation purposes， unified evaluation subjects and single evaluation standards. As the emerging intelligent education model gradually comes into reality， what kind of adaptive change should be made to the evaluation purpose， subject， and standard， in the educational evaluation norms has become the focus of relevant education legislation and policy formulation. In order to further promote the reform of education evaluation in the new era， combined with the technical characteristics and development trends of intelligent education， the evaluation purpose of China’s education evaluation standards should shift from “diagnostic tool” to “individualized teaching”; the evaluation subject should shift from government to “government+education+social third party”; and the evaluation standard should change from “extensive” to “meticulous”.

Keywords： education evaluation; intelligent education; evaluation purpose; evaluation subject; evaluation standard

Authors： Zhang Yaoyuan， doctoral candidate of the Human Rights Research Institute， Southeast University （Corresponding Author： zyyszu@foxmail.com Nanjing 211189）; Gong Xianghe， executive dean and professor of the Human Rights Research Institute， Southeast University（Nanjing 211189）

责任编辑单玲韩世梅

中国远程教育2024年10期

中国远程教育的其它文章: 高等教育国际化与加快世界一流大学建设的行动选项; 在技术狂飙时代重申教育的保守主义本质; 从“数治”到“善治”：教育治理现代化的模式转换; 学生数字素养框架的国际经验与本土建议; 许诺与虚诺：数字化学习空间的异化与消解; 学习分析的可行动见解：内涵界定与概念结构