基于“学评融合”理念的个性化评价支持环境设计及其应用

2023-07-23 15:12:36张生李文硕王雪郄卓妍

中国电化教育 2023年7期

张生李文硕王雪郄卓妍

摘要：评价是诊断、更是高阶思维的学习活动。评价理论从为了学习到作为学习，再到“学评融合”，越来越关注评价的学习功能与育人功能。人工智能时代，随着数字世界育人的大规模开展，评价育人环境的构建越来越成为未来教育研究重点和难点。现有的评价环境多从服务于评价的诊断性功能出发，忽视评价的学习性意义，难以满足学生在评价活动中的个性化需求。因此，该研究以评价的学习性功能为核心，兼顾诊断性功能，提出评价支持环境设计的个性化、项目化、数据化和极简化四大原则。评价环境以主题论坛为载体，包含评价卡、分组和实时反馈等支持工具，并广泛收集过程性数据，为科学诊断学生特征奠定基础。最后，研究提出评价环境在日常教学中常态化应用的方法，并列举两种典型应用场景，促进环境的常态化应用。该研究所提出的评价环境能够满足学生对评价活动、评价要素、实时反馈和特征诊断等方面的个性化需求，从多个角度促进学生在因人而异的评价过程中积极参与，主动学习，提高思维水平，发展核心素养。

关键词：学评融合；过程性评价；评价改革；评价环境；评价方式

中图分类号：G434 文献标识码：A

本文系国家社科基金重大项目“国家基础教育质量监测与评价体系研究”（项目编号：19ZDA359）研究成果。

一、引言

《深化新时代教育评价改革总体方案》[1]指明了教育评价发展的方向，强调要树立科学成才观念，坚持以德为先、能力为重、全面发展。《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》[2]进一步强调了要破除“唯分数论”的思想。“减负”的关键在于“提质增效”，充分发挥评价效能才能有效减负。新发布的《义务教育课程方案（2022版）》[3]也将落实因材施教、更新评价观念、创新评价方式方法等作为深化教学与评价改革的重要侧面，强调开展作品展示、口头报告等评价活动，关注评价提高自我评价、总结、反思和改进等能力的功能，评价的学习与育人功能日益成为人们关注的焦点。

“学评融合”是在“物理世界”与“数字世界”相互交融，高阶思维能力的重要性日益凸显，教育评价逐渐转向核心素养养成的背景下提出的评价新理念，认为评价具有学习和诊断两方面的功能，强调以多种方式促进学生的主动发展[4]。该理念立足于建构主义理论，认为评价活动应促进学生知识建构和能力发展，促进一系列与评价关联的关键能力，比如“评他能力”和“评价反思能力”等[5][6]能力的发展。面向一线实践，深入落实“学评融合”的新理念、新方法、新技术和新应用模式离不开数字世界中全新评价环境的创设。现有的评价环境多以评价的诊断性功能为重，对广泛、深入评价交互支持有限，忽视了评价作为一种高阶思维活动的价值，难以发挥评价的学习性功能，学生在评价活动中的个性化需求也难以得到保障，主体性难以体现，阻碍学生核心素养的发展，削弱学生发展的主动性。在这一背景下，本研究将重点围绕评价的学习性功能，结合个性化、项目化、数据化、极简化的设计原则，以主题论坛为基础，创新性地设计包含评价卡、分组、实时反馈等工具的评价环境，促进学生高阶思维与核心素养的主动发展，推进教学实践中评价活动的常态化、高质量落地。

二、个性化评价支持环境的现状与问题

（一）个性化评价支持环境的现状

发挥评价的学习性功能是落实“学评融合”的核心前提。學生是评价的主体，既是被评价者又是评价者，既是生成者又是反思者。在已有研究中，同伴互评最符合这种特点，而且能够促进学生知识建构和高阶思维能力发展[7]，满足学生的个性化需求[8]，具有建构主义特色，以同伴互评工具为核心的支持环境在教育领域中也十分常见，例如PeerGrade、Peerceptiv、PeerWise等，如表1所示。

PeerGrade是一款用于支持作业互评的工具。教师在创建作业时，需自行设定或从已有的标准库中选择评价标准；学生可以用文本、链接、文件等形式上传，按照标准评论作业。互评结束后，被评价者可查看收到的评价，并开展反馈和迭代交互，教师可以查看学生的参与和评论的数据。此外，学生还可以在评论时看到评论字数与平均水平的对比[9]。

Peerceptiv是一款专用于支持“写作”文本互评的工具，教师同样需要在创建作业时自行设定或挑选已有的评价标准，并规定学生作业上传的形式（文本、文件、链接），学生在上传作业后，可以参照标准对系统分配的作业提供评分和评论，互评结束后，学生作为评价者可以对比自己和他人的一致性，对自己评分的准确性进行反思，提高评价能力；作为被评价者看到自身收到的评价，并对收到的评价给出有用性评价[10]。

PeerWise是一款用于支持“出题”活动的工具，它可以支持学生使用文本、图片、链接等多种呈现方式设置多项选择题。作为出题人，学生可以参考已有题库，也可以随时查看作答结果，以及收到的评价，并对评价做出回应；作为做题人，学生可以随时查看结果反馈，对题目打分、评论，供出题人反思和改进。数据反馈包括正确性和作答分布的反馈，它针对“选择最多的选项”“设置为答案的选项”和“当前学生作答的选项”的不同组合情况提供不同的结果反馈[11]。

除此以外，Moodle等通用教学平台中通常也含有支持同伴互评的功能模块。Moodle中的“互动评价”模块能够支持教师设定标准、学生上传作业、提供评价、计算分数、查看结果等各种活动，也在数据反馈方面具有明显的特色，互评结束后，学生可以收到反映评分质量和作业质量的得分[12]。

Luxton-Reilly曾系统梳理过18种同伴互评工具，如Web-SPA、OPAS、CPR等，发现大多数同伴互评工具都支持评分和评语两种评价方式，用户可以设置评价标准、分组等，但鲜有工具可以支持评价参与者之间的交流讨论，进行迭代反馈，而且评价活动流程大多是固定的[13]。前述的工具也存在类似的问题，它们更偏向于发挥评价的诊断性功能，强调评价的多元性、准确性，是教师布置任务，学生完成的经典评价范式，与“学评融合”下个性化评价支持的原则有差距，难以满足该理念下个性化评价的需求。

（二）个性化评价支持环境亟需解决的问题

结合“学评融合”理念的需求与现有评价支持环境来看，个性化评价支持环境有四方面的问题亟需解决：

第一，“学”与“评”相互分离。尽管同伴互评含有“作为学习”的理念[14]，但现有以互评工具为核心的评价环境仍将“以评促学”作为最高目标，忽视了评价作为一种高阶思维活动的意义，忽视评价能力作为一种重要素养的价值。“以评促学”理念下的环境容易出现忽视作品生成的过程，过于强调互评的精准性，对交互式反馈的支持较少等问题，使评价项目的各个环节彼此割裂，使学生过分关注分数，难以开展深层的生成和交互，难以收获积极体验、实现深度的知识建构和能力提升。

第二，聚焦评价工具而非评价支持环境设计。已有的评价环境通常以单一的评价支持工具为核心，使用场景较为单一，通用性不强，增加使用负担。单一工具往往不能充分支持各类评价活动，难以全面支持生成、展示、评价、反馈、讨论、反思、改进等各个环节，师生在教、学、评的过程中需要频繁切换环境，面临沉重的工具使用负担和学习成本，该类评价环境难以在实践层面广泛应用。

第三，对学生个性化需求的重视程度不足。已有工具通常允许教师设置、选择评价标准、评价对象、评价主体等要素，学生只能在教师或系统限定的要素框架下，被动地接受或提供评价，学生的评价需求与供给并不匹配，学生是被评的客体，而非评价的主体，不利于发挥学生的积极性、创造性，也限制了学生通过生成评价标准、选择评价主体和对象等环节发展高阶思维能力的机会。

第四，对过程数据的应用聚焦于诊断，而非促进学生高阶思维的发展。已有工具提供的反馈更聚焦于学生的问题诊断，学生被动参与评价，参与项目的热情大幅降低，难以开展深入的交互式反馈和作品改进。同时多数工具只为学生提供最终得分等指标，学生能从中获得的信息较少。此外，已有工具对于累积过程性数据的诊断价值不够重视，忽略了累积数据对于诊断学生长期、常态化素养能力以及减轻评价负担的价值。

综上所述，在“学评融合”理念指导下，重新构建个性化评价支持环境及其系统至关重要。“学评融合”的各环节存在不同的核心要素，需要开展不同类型的活动，需要提供不同的支持（如图1所示），为促进学生高阶思维与核心素养的发展，环境需要满足四方面的关键需求：第一，重视对“出题”“评他”等评价活动的支持，强调学生在提供评价、接受评价、反思评价的过程中发展高阶思维能力；第二，以建构主义为基础，为用户广泛、深入开展评价活动构建一体化环境，促进评价活动整体化；第三，满足学生对材料呈现方式、评价主体、对象、方式和标准等要素的个性化需求，提高学生的参与积极性；第四，收集评价过程数据，用于特征建模，发挥评价数据的诊断价值。

三、个性化评价支持环境的功能设计

针对前述的问题和需求，本文提出了“学评融合”理念下个性化评价环境设计的四项原则，并以主题论坛为载体，构建评价支持环境，设计评价卡、分组和实时反馈等支持工具满足“学评融合”理念的需求。

（一）个性化评价支持环境的设计原则

在“學评融合”的理念下，个性化评价支持环境需要遵循个性化原则、项目化原则、数据化原则和极简化原则。其中，个性化原则包含学生主体、自主选择、特征建模、师生协同四方面含义。“学评融合”以建构主义理论为基础，尊重学生在评价活动中的主体地位，既保障学生能够根据兴趣和需要自主选择评价的相关要素，满足学生的个性化心理需求，提高参与评价的积极性，又能基于数据对学生特征进行个性化建模，力图基于智能技术为学生提供更合适的评价支持，让学生在好评、乐评中培育核心素养，实现主动发展。同时，“学评融合”也重视满足教师等其他评价参与人员的个性化需求。

项目化原则强调评价支持环境的整体性和交互性，要求评价环境能够支持“学评融合”中生成与展示、参与评价活动、反思与改进三个核心过程，这三个过程彼此紧密相联，组成整体性的评价项目，强调学生在评价项目中生成与创造，主动交互，建构知识，发展高阶思维能力。交互性是个性化评价支持环境需要关注的重点，例如生成展示是学生自我呈现的过程，是与他人开展评价交互的基础；接受和给出评价、在反思与改进中开展迭代的交互式反馈也都是交互的过程。研究表明，交互能促进知识建构，促进学生自上而下创造内容[15]，有助于提高知识生成的质量和数量[16]，争辩和质疑等交互行为能促进反思[17]。此外，交互数据也是诊断的重要数据来源。

数据化原则强调过程性数据的积累和运用。数据是实时反馈的基础，是用户基于反馈立即开展反思与改进的前提，有助于发挥评价的学习性功能；经过累积的数据也是为教师、学生以及其他相关人员提供学习、评价、个性发展等方面诊断的基础，有助于发挥评价的诊断性功能。在“物理世界”和“数字世界”融合的背景下，个性化评价支持环境需要将学生的评价行为、内容等转换为可记录、可分析、可计算的数据。

极简化原则意味着评价环境需要简单易用，降低学习成本和使用负担。极简化设计是促使广泛使用的前提，功能过于专门化、操作繁琐、缺少有效交流工具、缺少数据的简易获得与使用途径等是促使教师形成“信息技术疏离感”的原因之一。这要求评价环境适应用户的使用习惯，支持多种评价活动，简化非必要操作，减少用户负担。

（二）构建主题论坛，全方位支持评价活动

本文所设计的支持环境将以主题论坛为载体组织评价活动，学生通过发布、回复评价主题，参与完整的评价项目，并借助“评价卡”“分组”和“实时反馈”满足学生的个性化需求，促进高阶思维的螺旋式上升，全方位支持“学评融合”理念下的评价活动（如图2所示）。

基于主题论坛实施评价项目具有两方面的优势。一方面，有助于突出学生的主体地位[18]，满足学生的个性化需要。主题论坛能够通过支持点赞、评分、评语等评价方式，支持文本、图片、音视频等评价形式，满足学生的相关需求。与环境中的其他工具结合，主题论坛还能够支持学生选择评价标准、参与者、数据呈现方式等，促进学生发展标准意识等高阶思维能力。同时，主题论坛也是保证评价整体性和交互性的重要前提。在主题论坛支持下，评价项目的各个环节在主题的发布、回复、评论的支持下相互串联，师生能够在平衡思考时间、思维深度和参与及时性、积极性[19]的基础上，自主选择同步、异步两种交互形式，并在交互中建构知识、发展能力。

为发挥评价的诊断功能，减轻重复评价所致的评价负担，评价环境将广泛收集各个工具产生的评价数据，开展多次诊断建模，使相关人员不必单独组织测试、调查，即可对学生的个性化建模。例如，学生的回复数据将先用于实时反馈，再累积形成数据库，为评價活动提供选择和学习参考，并可用于多种特征的诊断，如人际关系[20]，评价能力，心理特质[21][22]，以及上述特征的纵向发展状况[23]。诊断能够为教师干预教学提供依据，为学生自我反思提供参照，为自动推荐评价主题提供训练数据。

（三）创立评价卡，支持各类学生发展

“评价卡”形式简洁，能够嵌入评价主题中，支持自定义评价对象（发帖者/评论者）、条目和选项的数目和呈现形式（星级、字母、数字等）等要素，并支持“出题”和“评他”两种典型的评价活动。在出题时，评价卡相当于“答题板”，条目相当于题目，能够支持出题和做题两种活动模式；在评他时，“评价卡”相当于“评分板”，条目相当于评价标准，能够支持教师给定标准、学生使用标准，以及学生自主选择、生成标准两种活动模式（如下页图3所示）。

评价卡遵循积极的评价取向，不同类型学生均能够使用评价卡发展核心素养，减轻负担。首先，在出题和评他的过程中，教师与学生可以根据学生思维层级自主选择出题或做题、应用现有标准评价他人或生成评价标准，学生的核心素养会随思维层级的上升而得到发展，生成活动也有助于增强学习的主动性，提高学习表现[24-27]；其次，评价卡也可以用于做题、使用标准，对于部分能力水平较低的学生，直接参与出题、标准生成活动可能存在困难，评价卡能够支持他们在做题、使用标准中积累经验。在传统评价理念下，往往通过向不同能力的学生推送不同难度的题目实现自适应诊断，这种情形下能力较差学生的思维容易停留在固有层面，难以深入发展，而这类学生可通过评价卡回答他人的问题、浏览和应用已有的评价标准进行学习，降低生成的难度，但始终有机会参与生成，保证各种类型的学生都能发展高阶思维，培育核心素养。

评价卡产生的过程数据也将用于诊断建模，挖掘学生领域能力、评价能力、评价偏好与习惯等特征，为学生参与评价活动提供参考。例如，出题和做题数据将用于建模学生的学科能力，标准的生成和使用数据则将用于诊断评他能力中的标准意识。评价结果将进入题库、标准库，为学生生成题目和评价标准提供参考和自动推荐，为教师干预提供证据。

（四）设计个性化分组，提升参与深度广度

分组是在充分利用数字世界时空灵活特性的基础上，对评价活动发生时空的重构。通过支持自主设置名称、标签（好朋友、同桌和其他等）和优先级，分组能够实现对评价参与者、作品与数据等评价相关要素的时空重构，满足学生的个性化需求（如图4所示）。

分组前，评价活动仅能以个体为单位，往往只能按照固定的顺序展示作品，呈现全体学生的评价数据统计结果，评价活动的时空受限。分组后，在参与者方面，评价环境支持按小组筛选评价的主体、对象，帮助学生在“自我表露”和“隐私边界”之间维持平衡[28]，进而积极主动参与展示和评价；在作品方面，评价环境支持按照小组对作品进行排序，支持前置显示高优先级小组成员的作品，便于学生开展评价，减轻寻找评价对象的负担，同时避免学生仅按照时间先后浏览和评价作品；在数据方面，参与者和作品的重构催生了更丰富的评价数据，评价环境支持按照小组显示评价数据统计结果，形成多元化反思参照，例如学生能够将与自己成绩相近或更好的同学设为一组，对比数据差异，进而开展深入的反思。

与已有互评工具相比，本文的分组更重视学生的主体地位，满足师生双方的个性化需求。同伴的行为会对个体的行为和认知产生影响[29]，而个体倾向于与成绩相近、家庭背景相似的个体建立合作[30]，不同小组对学生产生的影响存在差异。调研表明，学生对不同心理、物理、成绩距离的同学关注程度各有差异[31]。分组能够支持学生在“学评融合”的各个环节使用不同的分组，例如展示和评价作品时优先关注好朋友，查看数据时优先关注成绩与自己相近的同学，以满足心理需求，提高积极性，促进深入思考。分组也能够支持教师设置分组以便干预，例如在查看数据时关注评价参与积极性较低的学生，及时采取措施，以促进学生的公平发展。

分组功能也具有诊断价值，如用于学生人际关系、评价偏好及其发展情况等特征的诊断。例如，既可以用于诊断学生的人际关系存在的问题，也可以用于建立推荐系统，为师生提供推荐、参考，为学生自动推荐小组成员。同时，这类数据也为教师干预提供了依据，例如，教师可通过学生设置的“好朋友”小组发现朋友数目较少的学生。

（五）实施实时反馈，推动思维螺旋上升

在一般课堂的评价环节，或周期较短的课后作业中，由于时间有限，难以将评价项目的每个阶段都作为独立的专题项目开展，此时需要教师结合教学内容，分析评价需求，重点围绕当前教学设置评价项目。例如，如果是知识记忆类教学目标，只需让学生作答相应题目，再查看答题结果的分布即可；如果需要加深知识理解，发展高阶思维能力，则需要开展“出题”活动，让学生命制题目、作答题目、评价题目；如果教学目标是加强学生与他人的沟通与作品理解能力，则需要开展“评他”活动，让学生为他人的观点做出评分和评论。

五、结语

本文从“学评融合”理念的视角出发，梳理了该理念个性化评价支持环境的要求，并通过分析同伴互评支持环境的现状，以发挥评价的学习性功能为重点，从融合“学”与“评”的过程、促进评价交互、支持评价要素选择、实现实时数据反馈与累积数据建模等方面设计了个性化评价支持环境，该环境以主题论坛为载体支持评价项目，便于融合“学”与“评”的过程，促进学生开展深层次交互，并加入评价卡、分组和实时反馈工具，用于支持学生开展出题活动、选择评价标准、筛选评价参与者和接受实时数据分布与排行反馈，同时也基于评价过程产生和累积的数据开展诊断建模，以支持相关人员了解学生的发展状况。最后，本文总结了个性化评价支持环境融入日常教学的一般流程，并给出了在两种较为典型的应用场景下的工具使用建议。

参考文献：

[1] 中华人民共和国教育部.中共中央国务院印发《深化新时代教育评价改革总体方案》[EB/OL].http：//www.moe.gov.cn/jyb_xxgk/ moe_1777/moe_1778/202010/t20201013_494381.html，2020-10-13.

[2] 中华人民共和国教育部.中共中央办公厅国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》[EB/OL].http：//www.moe.gov.cn/jyb_xxgk/moe_1777/ moe_1778/202107/t20210724_546576.html，2021-07-24.

[3] 教材[2022]2號，教育部关于印发义务教育课程方案和课程标准（2022年版）的通知[Z].

[4][31] 张生，王雪等.人工智能赋能教育评价：“学评融合”新理念及核心要素[J].中国远程教育，2021，（2）：1-8+16+76.

[5] 张生，王雪等.评他能力：人工智能时代学生必备的高阶思维能力[J].中国电化教育，2021，（11）：24-31.

[6] 张生，郄卓妍等.学评融合理念下的中小学生评价反思能力研究[J].中国远程教育，2022，（4）：18-26+76.

[7] 许玮，祝思璇.同伴互评对学习者知识建构过程的实证研究——基于时间序列的认知网络分析[J].现代教育技术，2022，32（1）：44-53.

[8] Vickerman P.Student perspectives on formative peer assessment：an attempt to deepen learning [J].Assessment & Evaluation in Higher Education，2009，34（2）：221-230.

[9] Misiejuk K，Wasson B，et al.Using learning analytics to understand student perceptions of peer feedback [EB/OL].https：//www.sciencedirect.com/science/article/pii/ S0747563220304052，2020-12-14.

[10] 张福慧，狄艳华等.Peerceptiv互评系统辅助学生英语写作的研究[J].外语电化教学，2016，（4）：38-44.

[11][24] Kay A E，Hardy J，et al.Student use of PeerWise：A multiinstitutional，multidisciplinary evaluation [J].British Journal of Educational Technology，2020，51（1）：23-35.

[12] Moodle.Moodle Documentation-Workshop Activity [EB/OL].https：// docs.moodle.org/402/en/Workshop_activity，2022-05-22.

[13] Luxton-Reilly A.A systematic review of tools that support peer assessment [J].Computer Science Education，2009，19（4）：209-232.

[14] 蔡旻君，王心怡等.在线学习者参与评价的理论探讨及实证研究[J].中国电化教育，2021，（3）：15-23.

[15] 段金菊，范怡楠等.不同教学存在视角下的学生生成内容教学法实践——基于交互网络和社会知识建构的比较分析[J].远程教育杂志，2022，40（1）：61-71.

[16] 王慧敏，陈丽.cMOOC微信群社会网络特征及其对学习者认知发展的影响[J].中国远程教育，2019，（11）：15-23+92.

[17] 汪琼，欧阳嘉煜等.MOOC同伴作业互评中反思意识与学习成效的关系研究[J].电化教育研究，2019，40（6）：58-67.

[18] 胡红杏.项目式学习：培养学生核心素养的课堂教学活动[J].兰州大学学报：社会科学版，2017，45（6）：165-172.

[19] 李建生，张红玉.网络学习社区的社会性交互研究——教师参与程度和交互模式对社会性交互的影响[J].电化教育研究，2013，34（2）：36-41.

[20] 王妍莉，杨彦军等.促进理解的在线同伴互评机制研究[J].现代教育技术，2018，28（12）：48-54.

[21][37] 骆方，姜力铭等.小学生羞怯特质预测及语言风格模型构建[J].心理学报，2021，53（2）：155-169.

[22][38] 张晗，贾甜远等.面向网络文本的BERT心理特质预测研究[J].计算机科学与探索，2021，15（8）：1459-1468.

[23] 程姝，陈丹等.网络学习空间环境下小学生写作篇幅发展趋势的追踪研究[J].中国特殊教育，2019，（7）：76-81.

[25] Yu F-Y，Chen Y-J.Effects of student-generated questions as the source of online drill-and-practice activities on learning [J].British Journal of Educational Technology，2014，45（2）：316-329.

[26] Becker A.Student-generated scoring rubrics：Examining their formative value for improving ESL students writing performance [J]. Assessing Writing，2016，29：15-24.

[27] Skillings M J，Ferrell R.Student-Generated Rubrics：Bringing Students into the Assessment Process [J].The Reading Teacher，2000，53（6）：452-455.

[28] 张梦瑶.大学生群体微信朋友圈的隐私管理及其动因研究[D].重庆：西南大学，2021.

[29] 焦媛媛，李智慧.同侪影响的内涵，产生机理及其在管理学中的研究展望——基于社交网络情境[J].南开管理评论，2020，23（1）：213-224.

[30] Lacey M M，Campbell S G，et al.Self-selecting peer groups formed within the laboratory environment have a lasting effect on individual student attainment and working practices [J].Febs Open Bio，2020，10（7）：1194-1209.

[32] 陈明选，王诗佳.测评大数据支持下的学习反馈设计研究[J].电化教育研究，2018，39（3）：35-42+61.

[33] 胜楚倩，刘明等.基于群体感知的在线同伴互评系统实现与应用[J].现代远程教育研究，2019，31（4）：104-112.

[34] Tinapple D，Olson L，et al.CritViz：Web-based software supporting peer critique in large creative classrooms [J].Bulletin of the Technical Committee on Learning Technology，2013，15（1）：29-35.

[35] Festinger L A.A Theory of Social Comparison Processes [J].Human Relations，1954，7（2）：117-140.

[36] Wang M Q，Guo W G，et al.Reply to which post An analysis of peer reviews in a high school SPOC [J].Interactive Learning Environments，2020，28（5）：574-585.

作者简介：

张生：教授，博士，研究方向为教育大数据、智慧测评、信息技术与学科深度融合。

李文硕：在读硕士，研究方向为教育测量、评价与统计。

王雪：在读博士，研究方向为教育测量、评价与统计。

郄卓妍：在读硕士，研究方向为教育测量、评价与统计。

Design of Personalized Evaluation Support Tool Based on the Concept of“Integration of Learning and Evaluation”

Zhang Sheng， Li Wenshuo， Wang Xue， Qie Zhuoyan

（Collaborative Innovation Center for Quality Monitoring of Basic Education in China， Beijing Normal University， Beijing 100875）

Abstract： Assessment is a learning activity that involves diagnosis and higher-order thinking. Assessment theory has increasingly focused on the learning and educational functions of assessment， from assessment for learning to as learning， and then to the integration of learning and assessment. In the era of artificial intelligence， with the large-scale development of human development in the digital world， the construction of an assessment environment for nurturing human beings is increasingly becoming a key focus of future educational research. Existing environments mostly start from serving the diagnostic aspect of assessment， ignoring the learning aspect， making it difficult to meet students individual needs in assessment activities. Therefore， based on the theory of the integration of learning and assessment， this study proposes four principles of personalization， project-based， data-based and simplification in the design of assessment support tools. The tool is based on a forum and contains three main functional modules： creating assessment activities based on assessment cards， reconstructing elements in assessment activities based on grouping and reflecting and improving based on real-time feedback. In terms of the diagnostic aspect， the tool supports the collection of process data for each module in order to scientifically diagnose student characteristics. Finally， this study proposes to organize assessment projects in regular teaching based on the tool， using it to empower the process including creating contexts， setting tasks， participating in assessments， monitoring， adjusting and intervening. Individualized needs for assessment activities， assessment elements， real-time feedback and characteristic diagnosis are met， promoting active participation， active learning， and the development of higher-order thinking and core literacy in an assessment process that varies from person to person with diverse approaches.

Keywords： integration of learning and evaluation； process assessment； evaluation reform； assessment environment； evaluation methods

責任编辑：李雅瑄