基于大学物理认知图谱的学生评价策略思考

2024-01-01 00:00:00史湘衣马艳
物理与工程 2024年5期
关键词:关联规则个性化学习机器学习

摘 要 面临高考改革分批进行,大学新生知识水平、结构差异增大,现有评价方案较少关注到对学生认知具有重要影响的知识结构,进而较难精准辨别出存在学习困难的学生。对此,本文基于学生知识掌握情况将学生在大中衔接中的类型分为衔接优良均衡型、衔接优良不均衡型、衔接一般均衡型、衔接一般不均衡型;分别使用单向、双向的Apriori算法对本科新生物理学习数据进行挖掘、生成关联规则;之后,使用基于教材的学科知识图谱对关联规则进行筛选,形成不同类型学生的个性化认知图谱。研究结果表明,学生在大中衔接过程中知识结构与学生成绩基本呈正相关,四种类型学生的知识结构有明显差异。此外,本文还基于研究结果对新高考改革背景下学生精准评价策略提供建议。

关键词 认知图谱;关联规则;知识图谱;机器学习;个性化学习

2014年国务院发布《关于深化考试招生制度改革的实施意见》(简称《意见》),新高考改革逐渐在全国推行,目前,全国已有29个省份公布了新高考改革方案,将分五批完成新高考改革。《意见》中强调,须通过多元的考试招生模式、公平合理的体制机制实现各级教育的衔接与沟通,学生在不同阶段取得的学习成果均可被认可,建设终身学习的社会环境[1]。

然而,当下大学与中学教育的衔接并不如人意,尤其对于难度较大的物理学科,第一、二批高考改革的省份实施“3+3”选考模式,选考物理人数急剧下降。吸取试点省份的经验,后续高考改革的省份实施“3+2+1”模式,物理和历史成为必选科目。由于不同省份的改革实施模式不同,造成生源结构多样化、生源质量差异大等问题出现,大学入学的理工类专业学生知识水平参差不齐[2]。而大学物理作为大多理工类专业本科新生入学第一学期的课程,与高中物理在教学方式、教学理念中存在较大差异,如:大学物理课程量较大,教师以讲授为主,较少进行讨论与习题讲解,对学生学习习惯和自学能力都提出了更高的要求,在这种情况下,学生更容易产生学习困难[3]。

因此,精准的评价方式才能更有效地辨别存在学习困难的学生,而目前大学物理课程较多将考试成绩作为评价学生知识掌握程度的标准,较少关注到对学生认知具有重要影响的知识结构[4]。本研究旨在通过机器学习的方法,采用Kmeans算法基于知识掌握程度、综合应用能力对学生进行聚类,发现四种不同大中衔接类型的学生,使用两种Apriori算法对不同类型学生作业、考试数据进行挖掘,生成不同类型学生的个性化认知图谱,通过分析不同衔接类型学生的知识结构,为提高新高考改革背景下学生的学习适应性,帮助学生更顺利地完成大中衔接提供建议。

1 相关理论研究

1.1 新手学习者和专家具有不同的知识结构

建构主义的学习观认为学生学习是在原有经验的基础上主动进行意义建构的过程,在此过程中,学生通过同化、顺应完成学习过程,形成自己的知识结构,而区分专家和新手学习者的一大关键要素就是知识结构的连通性[5]。Chi等[6]发现,专家和新手学习者具有不同的知识结构,并且该结构在解决问题时发挥作用,对于专家而言,其知识结构中包含潜在的问题解决方案。具体到物理学习中也是如此,物理学专家认为物理是由一些最基本的定律构成,大量的概念和原理都以这些基本定律为核心,在学习物理时必须理解概念、原理和基本定律之间的本质联系,当学生在学习物理时先思考这些本质联系的时候,学生就向专家型思维转变了。[7]Hammer等[8]认为研究人员应该向教师提供关于学生知识之间连通重要性的本质理解,学生对物理知识之间的推理能力直接影响学生的学习结果,正如部分学生在高中阶段形成的思维定式使得一些学生认为物理概念之间是孤立的,学习物理只需要机械地记忆模型和公式,而成熟的学习者通常会反思学习内容并且主动将新知识与已有知识经验相结合,以一种“建构主义”的方式去理解学习资源而不是将其视为一种“传播材料”。Chen等[5]发现中国大部分大学生知识结构正处于新手学习者和专家学习者过渡的早期阶段,因此把握好大学阶段帮助新手学习者形成主动在学习中建立知识结构的思维模式非常重要,如果这一阶段没有得到重视很可能会使新手学习者在面临更困难、更深入的学习资料时产生学习困难,从而降低学习积极性,甚至形成学业不适。

1.2 认知图谱相关研究

认知图谱在2019年被应用到了计算机科学领域推理中,相较于知识图谱对知识进行编码、检索,认知图谱强调对问题进行推理[9]。具体到教育领域,余胜泉等[4]认为教育领域认知图谱的内涵应与计算机科学领域有所区别,提出了学习认知图谱的概念:学习认知图谱是在教育知识图谱的基础上叠加学习者认知状态要素,可以看作是学习者知识结构及其知识状态的认知表征与推理。其中,知识结构指知识之间的关系,知识状态指学习者有关知识的认知层次及掌握程度。

近年来,教育领域出现较多关于使用认知图谱将知识与学习者认知状态结合起来表征的研究。周东岱等[12]构建了刻画学生核心素养的认知图谱,每位学生在单元测试后系统会形成特定的时间戳,根据该时间学生各学科素养的形成程度构建认知图谱,包含结合知识元落实的核心素养之间的关系和学科核心素养之间的关系;余胜泉等[13]将学习者认知状态要素叠加在学科知识点上,形成个性化学习认知地图,认知地图上既呈现知识点之间的关系,也呈现某学习者对知识点的掌握情况,分为薄弱知识点、优势知识点和未学知识点,对于未学知识点将采用知识追踪模型诊断预测学习状态,并以不同灰度在个性化学习认知地图中可视化;Lv等[14]基于专家标注建立的学科知识图谱表征知识点之间的前驱后继关系,并根据学生的答题记录标记学生每个知识点的掌握程度,将个体学生的知识点掌握程度与专家标注的学科图谱融合形成加权知识图谱,这个知识图谱是学生学习个性化结果的表征,也可以看成个体学习者的认知图谱;Hao等[12]认为教育知识图谱应该与个性化学习者特征相结合,表征个体学生学习过程中涉及的知识点,每个学习者的个性化认知图谱以其学习过程中的第一个知识点为起点、最后一个知识点为终点形成一个有向无环图,其关系为知识点之间的前驱、后继、广义前驱、广义后继等关系。

综上所述,教育领域构建认知图谱的研究主要可以分为两类:将知识与学习者认知状态结合起来表征的研究,较多为专家标注学科图谱叠加学习者认知状态,即在人工标注的知识图谱上显示学习者学习状态[4];另一类研究关注个性化学习者特征的研究,即个体学习者的学习状态和知识点掌握情况,形成个体学生认知图谱[10]。这些研究大多应用于学习者模型构建,为学生提供更完整的学习者画像,从而促进学生使用学习平台个性化学习。本研究将认知图谱应用于教育评价中,并结合聚类算法,探索不同大中衔接类型学生知识结构,结合学生认知图谱对学生进行精准化评价。

1.3 关联规则算法在教育领域应用的相关研究

数据挖掘(data mining)是从大量真实数据中提取隐含信息、知识的过程。教育领域应用数据挖掘可以从教师教学、学生学习过程中分析出有用的信息。关联规则挖掘算法是数据挖掘的重要方法之一,其中Apriori算法是关联规则算法中最经典的一种,也是教育领域应用较多的算法[13]。算法通过每一层的迭代找出数据中项集之间的关系进而形成关联规则,主要包含两步:(1)逐层迭代检索出数据集中所有频繁项集,即支持度大于用户设定最小支持度(min support)的项集;(2)利用频繁项集构建满足大于用户设置的最小置信度(min confidence)的关联规则。传统Apriori算法中候选项集是逐层产生的,因此每产生一层频繁项集就需要扫描整个数据库,该过程不仅消耗大量时间还会产生较多频繁项集[14]。因此,需要对关联规则的价值进行衡量,选择对用户有用的、有价值的规则,其中较常用的衡量方法有:数据约束、规则约束。数据约束是用户指定对部分数据进行挖掘,即对生成频繁项集的效率进行优化或筛选生成项集的数量。规则约束是指引入模板(template),使用模板来对生成的关联规则进行筛选,从而选择我们需要的规则。在教育领域中,较多研究者采用数据约束的方法,通过一定的筛选机制生成更精准的频繁项集和更符合教学逻辑的关联规则[15]。Yang等[16]提出了一种改进的关联规则算法,在生成候选项集时只需要扫描一次原始数据库,节省了生成频繁项集的时间,提高了算法效率,并将其应用于课程排序中,帮助决策者制订更合理的教学计划;Jha等[17]提出了一种基于自底而上方法和支持矩阵的Apriori算法,该算法有效减少了频繁项集生成的时间,同时还用基于标准差的函数模型代替了传统Apriori算法的用户自定义最小阈值,不熟悉数据挖掘的普通教育工作者也可以使用该模型。也有部分研究者通过规则约束的方法改善生成的规则,Zhan等[18]提出了通过引入稳定性、难度来对生成的关联规则进行筛选,从而减少了不符合教学逻辑的关联规则,提高了规则的准确率。郭鹏等[13]使用引入兴趣度的关联规则算法分析不同课程学生取得成绩之间的关系,结果发现相较于传统关联规则算法,引入兴趣度算法的结果能够得到更少误导性或无意义的规则。

综上所述,使用规则约束和数据约束都可以减少无用关联规则的生成,生成更多有用的、有价值的关联规则。本研究使用规则约束的方法,将教材标注学科图谱作为模板,对关联规则算法的结果进行过滤,最终输出对有意义的规则,将这些知识点之间的关联规则用于构建学生认知图谱。

猜你喜欢
关联规则个性化学习机器学习
教学资源支持下的Sakai个性化学习研究
信息化环境下基于“盒子鱼”App的高中英语个性化学习的模式和策略
关联规则,数据分析的一把利器
微视频在初中英语听力教学中的应用探索
基于机器学习的图像特征提取技术在图像版权保护中的应用
数据挖掘在高校课堂教学质量评价体系中的应用
基于网络搜索数据的平遥旅游客流量预测分析
时代金融(2016年27期)2016-11-25 17:51:36
前缀字母为特征在维吾尔语文本情感分类中的研究
科教导刊(2016年26期)2016-11-15 20:19:33
基于SOA的在线学习资源集成模式的研究
关联规则挖掘Apriori算法的一种改进
中国市场(2016年36期)2016-10-19 04:10:44