数据挖掘虚拟仿真实验的教学探索研究

2024-10-23 00:00:00陈颖璐李晶李小峰杜晓辉
电脑知识与技术 2024年25期

关键词:数据挖掘;虚拟仿真技术;实践教学

中图分类号:G642 文献标识码:A

文章编号:1009-3044(2024)25-0120-03

虚拟仿真技术,作为多项前沿科技的综合应用,通过计算机模拟生成高度逼真的交互环境,不仅是教育信息化进程中的重要组成部分,也是教育部力推的五大“金课”之一,更是应用型高校培养理论知识扎实、技术能力卓越的高素质人才的关键手段[1]。广东东软学院依托“高校+龙头企业”的深度融合模式,成功建设并开发了具有自身特色的热轧烧结工艺参数优化虚拟仿真实验教学平台。本文聚焦于数据挖掘课程中虚拟仿真教学平台的必要性、平台构建及教学设计,旨在为提升教学质量、培养高素质应用型人才提供宝贵经验。

1 数据挖掘课程虚拟仿真教学平台的必要性

数据挖掘课程融合了概率统计、机器学习、人工智能及数据可视化等多个计算机领域的核心知识,因其在大数据分析中的核心地位而成为信息技术研究与应用的关键领域[2]。掌握数据挖掘技能不仅能增强学生的科研能力,还能显著提升其就业竞争力,对学生的学业及未来职业生涯具有深远影响[3]。然而,在数据日益重要的今天,数据挖掘课程的教学面临诸多挑战,这些问题不仅制约了教学质量的提升,也对学生的学习效果和实际应用能力造成了阻碍。

1.1 资源限制

数据挖掘是一门具有高度实践性的课程,但传统教学往往偏重理论,缺乏与实际应用场景的紧密联系[4-5]。学生虽能扎实掌握理论概念和方法论,但在面对真实数据时却常感无从下手,难以有效应用算法。实践教学需依托大量实验,但学校实验资源有限,难以满足所有学生的需求,限制了他们的实践机会和学习效果。虚拟仿真平台则能利用虚拟仿真技术提供丰富的实验场景和数据,让学生在模拟环境中自由探索,有效突破资源限制。

1.2 环境限制

数据挖掘作为一门以数据为基础的学科,真实、有效的数据集是数据挖掘实验的基础,因而数据采集是数据挖掘实践教学的必要一环。数据采集为模型训练提供了必要的基础,直接影响着模型的性能和准确性。数据采集的质量、规模和多样性也对模型的泛化能力和鲁棒性产生重要影响[6]。同时,数据采集需遵循法律和道德规范,确保数据的合法性和隐私保护。在传统实践教学中,由于时间、成本、安全和设备等因素的限制,学生无法进行现场数据采集或在高危和极端环境下获取实验数据,而虚拟仿真平台可以通过虚拟仿真技术,让学生在课堂上就可以完成相应的数据采集工作,突破了时间和空间的限制。

2 数据挖掘课程虚拟仿真场景

本平台采用虚拟现实、数据挖掘等技术,对具体生产线进行情景、建模和应用仿真,使学生掌握数据分析全过程,培养数据思维。图1为场景之一的热压烧结工业参数优化的虚拟仿真核心要素设计。

2.1 情景仿真

在热压烧结工艺中,生产过程是数据的主要来源,而数据又是数据挖掘课程中最重要的部分。教学团队经过实地考察、深入生产线,构建了以广东奔朗新材料科技有限公司生产线为原型的仿真场景。本场景主要仿真了热压烧结工艺过程的物理量变化(温度、压强等曲线)以及数据采集的过程,把热压烧结机的生产线搬进课堂,通过9006d90a1b4d65cc235bbbbf6ad25cd5虚拟现实技术,实现机器配置与运行仿真。学生能直观了解模具样本的属性来源以及数据误差的产生原因,为后续开展数据挖掘奠定基础。

2.2 建模仿真

建模仿真主要用于实验中的数据集构建、模型构建、模型训练和模型分析。通过利用大量预先训练好的模型,避免学生花费时间进行训练,同时利用可视化工具,帮助学生直观地理解模型。在建模过程中,存在多种方案可供选择,每种选择都会对最终结果产生不同影响。这为学生提供了实验步骤任意组合的可能性,学生可以不断试错和反复探究。

2.3 应用仿真

数据挖掘的目的是从大量的数据中提取出未知的、有意义的信息和知识,并将这些信息和知识应用于实际中。因此本场景主要是将训练结果应用于产业场景中,以便学生能更好地理解训练结果如何应用于真实生产,实现理论与实践的有机结合。

3 数据挖掘课程虚拟仿真实验教学平台的构建

3.1虚拟仿真实验教学平台的结构与功能

虚拟仿真实验教学平台是基于B/S 架构,采用Spring Boot框架构建。它由教师端和学生端组成。系统采用整合SpringData的方式统一处理数据访问层,使用Vue作为前端框架,以确保访问服务的稳定性和提升用户体验。

在前端,系统采用内嵌WebGL模块来呈现3D虚拟仿真实验。这些3D虚拟仿真实验基于真实的实验步骤和数据进行模型计算和三维仿真。实验结束后,实验数据会被提交到服务器进行保存,并生成实验数据报告。具体架构如图2所示:

3.2 虚拟仿真实验教学平台的教学模块

本实验平台一共包含三大仿真场景,模拟了一个完整的数据挖掘应用的全过程,具体包括:数据采集、数据集构建、模型构建、模型训练、模型分析、工程应用。这六大模块综合采用观察学习法、比较分析法、控制变量法、数学模型法、科学推理法、自主设计法等实验方法。该平台鼓励学生自主设计实验方案,允许试错,并倡导反复探究,以此逐步深化和巩固相关原理与操作技能,实现理论学习与实验实践的紧密融合。通过模拟企业生产中的实际问题,引导学生课前自主学习,课上开展合作研讨,并延伸至课下的深入实验探究,旨在激发学生的实验兴趣,提升其实验操作技能。在完成实验项目的过程中,学生将充分锻炼知识获取与解决复杂问题的能力,实现理论教学与实验教学的互补与促进,进而增强学生的实践与创新能力。

4 数据挖掘课程虚拟仿真实验教学平台应用

4.1 教学设计

该虚拟仿真实验属于广东东软学院数据挖掘课程的实践内容,为软件工程(大数据与机器学习方向)、计算机科学与技术专业、人工智能专业的必修课程。该课程共32个学时,其中理论学习24学时,实践学时8学时,本实验为2学时实验。学生在完成理论知识的学习后,需要在虚拟仿真实验教学平台上完成该实验。从基础理论到实际应用,难度递进。虚拟仿真实验不仅确保学生对基础理论和业务操作流程的扎实掌握,还设置了适度的难度和挑战,为学生提供了广阔的自主探索空间。

4.2 考核方式

本实验的考核方式由操作总时间和操作完成量两部分组成,实验总得分计算方式为:

实验总得分=操作总时间得分系数×操作完成量评分 (1)

其中,操作总时间以实验者的操作时间作为操作熟练程度的依据,并设定不同的操作总时间得分系数,如表1所示。

而操作完成量则是根据每个步骤的执行情况进行评分,对操作序列进行统计,并将其与标准操作流程进行比较,以完成操作的校对。通过在虚拟仿真实验系统中提供提示,记录每个步骤的完成情况百分比,具体计算方式为:

操作完成量评分= Σ每步操作评分×每步操作完成量(%) (2)

4.3 教学实验效果

本实验从2022年春季学期开始至今,在校内已开设2个周期,学生的学习成绩对比具体如表2所示。

5 结束语

数据挖掘作为一门具有高度实践性、以数据为基础的学科,其传统实践教学模式存在诸多弊端。因此,我们开发了一个虚拟仿真实验平台,该平台通过虚拟现实技术对具体生产线进行情景仿真、建模仿真和应用仿真,旨在使学生全面掌握数据挖掘的全过程。在平台上,学生可以运用所学知识自主设计实验方案,进行不断地试错和反复探究,从而加深对抽象理论的理解,并提升解决复杂工程问题的能力。

两年的教学实践成果充分证明,将虚拟仿真实验教学平台应用于数据挖掘课程,能够有效提高教学质量,培养出既具备宽广理论知识又拥有精湛技术能力的高素质应用型人才。展望未来,我们将继续把更多场景引入课堂,进一步拓展实验的深度和广度,同时融合不同学科的资源,打造综合性仿真平台,以促进知识的交叉与创新。此外,我们还将集成人工智能技术,使平台能够根据学生的操作习惯和学习进度提供个性化的学习指导,从而进一步提升学习效率。