摘 要:本文针对高职院校创新创业课程传播数据冗杂、技术发展过快等现状,结合试验法设计了高职院校创新创业课程AI云计算学习服务平台。采用FCM聚类算法、特征选择算法以及mRMR算法对数据进行处理。结果表明,高职院校创新创业课程AI云计算学习服务平台数据可视化、数据分析维度包括每日登录人数分析、平均学习时长分析、学习行为次数分析、每日活跃情况分析和分时段学习人数分析。最终使用ECharts可视化工具对在线教育平台在学习过程中产生的数据进行可视化大屏展现,教育数据可视化能够了解教学方向,为学生学习提供帮助。
关键词:教育传播;大数据;可视化;ECharts
中图分类号:G 434 " " " " 文献标志码:A
随着人工智能、大数据技术快速发展,人工智能+教育也成为现代科技研究的热点。AI技术在教育、教学等领域发挥重要作用,围绕“AI学习服务平台”的各种创新创业课程可帮助院校学生加强创新创业的理解和实践能力,利用人工智能对高职院校创新创业进行数据板块处理,能够推动高职院校就业率的提高[1]。《中国高校创新创业教育发展蓝皮书(2017)》指出,新时期的创新创业教育对于深化高校教育改革、完善人才发展机制、支撑“双创”以及创新驱动发展战略有重要意义[2]。作为大学生创新创业的重要组成部分,大数据与AI为大学生的创新创业行为提供了强有力支撑,如何利用AI和云计算技术对大学生进行创新创业引导,成为目前高校创新创业教育面临的一个重要课题。目前,大数据、AI等应用越来越多,各高校纷纷搭建各自的大数据与AI技术平台。因此,高职院校要跟上时代步伐,全面发展,搭建起自己的大数据和AI技术平台,培养具有大数据思维能力和AI技能的新一代人才,为国家的经济建设培养出更多创新创业型优秀人才。本文以“大数据”与“AI”为基础,对高职院校“大学生创新创业”教育进行了探讨。
1 高职院校创新创业课程AI云计算学习服务平台算法研究
1.1 功能分析
高职院校创新创业课程AI云计算学习服务平台功能分析如图1所示。1)在线课程:平台提供了全面的AI和云计算课程,包括理论知识和实践操作,方便学生随时随地学习。2)互动学习:平台提供了在线讨论、实时问答、在线测试等功能,方便学生与学生、学生与老师间的交流和互动。3)虚拟试验:通过云计算技术,平台为学生提供了虚拟试验环境,使学生能在没有硬件设备的情况下进行试验操作。4)创新创业支持:平台为学生提供了创新创业资源和指导,鼓励学生在课程中开展创新创业活动。
1.2 相关算法
1.2.1 FCM聚类算法
高职院校创新创业课程AI云计算学习服务平台的主要算法为FCM聚类算法[3],该算法可将同一类型数据进行整合。FCM聚类算法的基本原理是模糊理论,这种模糊理论从客观事实出发,可处理模糊不确定的事物,又称模糊C均值算法。确定AI云计算学习服务平台模型的输入、输出后,需要对输入的数据进行形式化定义。FCM是将n个用户数据作为n个向量xi,其中涉及隶属关系,FCM算法的模糊隶属度的取值范围为[0,1],该算法的实质是构建模糊矩阵U,矩阵中每个要素都是各矢量的糊隶属度,值的范围为[0,1],归类后的每个元素的模糊隶属度之和均为1。
FCM聚类算法如公式(1)所示。
(1)
FCM聚类算法的目标函数如公式(2)、公式(3)所示。
(2)
dij=||cj-xj|| " "(3)
式中:uij的取值范围为[0,1];ci为模糊类i的聚类中心;dij为第i个聚类中心到第j向量间的欧式距离;m为加权指数,其取值范围为[1,∞]。
为使目标函数取得最小值,做出以下改进,如公式(4)所示。
(4)
式中:λj为n个约束式的拉格朗日因子。
目标函数取得最小值需要前提,其必要条件如公式(5)、公式(6)所示。
(5)
(6)
1.2.2 聚类有效性函数
AI云计算学习服务平台进行聚类分析时需要确定分类效果,聚类有效度函数是评价聚类效果的一种方法,能较好地评价聚类的分类效果,增强对各创新创业类型的表达能力。计算时,其特性值并不是固定的,因此可通过类间分离性和类内紧性来间接判定聚类效果,通过对聚类有效性函数可以判定二者间的相关性。
用户与类内用户间的相似度如公式(7)所示。
(7)
类内平均值如公式(8)所示。
(8)
某一类数据的类内紧密度如公式(9)所示。
(9)
1.2.2.1 聚类评价指标
MIA指标:MIA函数如公式(10)所示。
(10)
式中:N为用户的个数;MIA为类内距离和的平均值,MIA的值越小,聚类效果越好。
CDI指标:CDI函数如公式(11)所示。
(11)
式中:Xc为第c类用户;CDI为类内紧密度的平均值,CDI的值越小,聚类效果越好。
SI指标:SI函数如公式(12)所示。
(12)
式中:为每个向量与平均值间距离和;为每个聚类中心与平均值间的距离和;SI的值越小,聚类效果越好。
DBI指标:DBI函数如公式(13)所示。
(13)
式中:DBI为类内距离与类间距离的比值,DBI的值越小,聚类效果越好。
1.2.2.2 聚类效果
该模型对AI云计算学习服务平台700个样本进行验证,结合四项指标和聚类数目2~9,模型的指标或者模型样本特征提取可作为模型输入变量,指标分析见表1。利用FCM算法,对用户数据(X3)、输入数据(X1)和输出数据(X2)进行论述。
由表1可知,当聚类数目为4时,各类指标值均为最小值,聚类效果最好。聚类时,AI云计算学习服务平台可结合需求,聚类效果最好。
1.2.3 协同过滤推荐算法
1.2.3.1 基于AI云计算学习服务平台用户的UCF
基于用户的协同过滤算法(User-based Collaborativen Filtering,UCF)的主要做法是找到一群爱好相似的用户,即基于AI云计算学习服务平台用户的协同过滤(Collaborative Filtering,CF)算法或基于相邻者的协同过滤(Neighbor-based Collaborativen Filtering)算法。用户与用户间的相似度通常用Jaccard公式或余弦相似度来计算,可以更直观地观察到2个用户的相似度。设M(u)是用户u中意项目的集合,M(v)为用户v中意项目的集合,则u和v的相似度如下所示。
余弦相似度如公式(14)所示。
(14)
Jaccard公式如公式(15)所示。
(15)
UCF通过对相关数据进行搜集,掌握使用者的创业创新数据,再根据用户间的相似性找出与此用户相近的一群人,并根据创业创新数据信息推送相关创业创新内容。
1.2.3.2 基于项目的ICF
随着用户数量增加,UCF消耗的计算时间越来越多。因此出现了另一种CF,即基于项目的协同过滤(Item-based Collaborative Filtering,ICF)算法。ICF的基本假设如下:如果用户中意一个项目,那么与该项目相似的其他项目也有可能引起用户的兴趣。项目间的相似性用数学方法进行计算。项目相似度的计算过程如公式(16)所示。
(16)
式中:|M(i)|是喜欢项目i的用户数;|M(j)|是喜欢项目j的用户数。
ICF的方法步骤如下:收集相应信息,计算已评价的项目和预测项目的相似度,并以此为基础得出预测项目的预测分数,最终产生推荐结果。
首先,分类准确度是指判断一个项目是否迎合了用户的偏好且结果正确的比例,包括召回率和准确率。设U为用户集,Ru为用户u的推荐列表,Bu为测试集中用户给予正反馈的项目。
准确率是指在推荐的结果中,用户在现实中给过正反馈的项目所占的比例。单个用户u的准确率如公式(17)所示。
(17)
整个推荐系统的准确率如公式(18)所示。
(18)
召回率是指在测试集中,用户给过正反馈的项目占测试集的比例。单个用户u的召回率如公式(19)所示。
(19)
整个系统的召回率如公式(20)所示。
(20)
其次,预测准确度是指预测用户对项目的评分的行为,包括均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)。
均方根误差RMSE如公式(21)所示。
(21)
式中:Ωtest为测试集;ruv用户u对项目v的实际评分;yuv表示预测评分。
平均绝对误差MAE如公式(22)所示。
(22)
2 高职院校创新创业课程AI云计算学习服务平台设计
2.1 设计目标
该平台是一个在线学习平台,专为高职院校的创新创业课程而设计。平台结合了人工智能和云计算技术,提供了丰富的课程资源和互动工具,使学生可以在线学习AI和云计算知识,并参与各种实践活动。
2.2 数据处理
将AI云计算学习服务应用于高职院校的创新创业课程数据处理中,可有效提高教学质量和学生的学习效果。随着技术不断进步和应用领域不断拓展,AI云计算学习服务平台将在高职教育中发挥更大作用,为培养高素质的技术技能人才提供有力支持。1)数据采集。本次试验使用的数据集是创业网站的公开数据集。这个数据集包括470多万条评论和15多万企业信息。下载SQL版数据集,将其存储在MySQL数据库中。通过AI云计算学习平台收集学生在创新创业课程中的学习数据,包括学习进度、成绩和反馈等信息。2)数据处理。利用AI技术对收集的数据进行清洗、分类、分析和挖掘,提取有价值的信息,为教学提供决策支持。3)数据应用。将处理后的数据应用于教学实践中,优化教学资源配置,提高教学质量。同时引导学生利用数据解决实际问题,培养他们的创新意识和创业能力。
2.3 试验结果分析
将处理好的数据使用上述设计模型进行训练。其中训练数据用于训练LDA模型,测试数据用于对训练好的模型进行推荐结果测试。与其他推荐系统类似,本文将准确率(Precision)作为评估标准。Precision@K是指对所有测试集评论进行推荐的平均Top K准确度。本文将分别计算Precision@1、Precison@5、Precision@10和Precision@15,用于衡量模型的性能。为了分别观察不同主题个数对推荐结果的影响,分别选取主题个数5、10、15、20,25和30,分别训练出对应的模型,然后利用训练出来的模型进行推荐并计算其Precision@K。不同主题数目下的Precision@5、Precision@10和Precision@15分别如图2、图3所示。
不同主题数目的Precision@K对比如图4所示。从图4可以看出,高职院校创新创业课程AI云计算学习服务平台主题数目设置为20时,推荐结果较好。
2.4 系统实现
高职院校创新创业课程AI云计算学习服务平台提供了丰富的学习资源,包括课程资料、案例分析和实践项目等,方便学生自主学习和团队协作,为学生提供一个在线学习交流的平台,方便学生间进行互动和讨论,提高学生的参与度和学习效果。支持学生在平台上开展实践项目,提供项目进度管理、团队协作等功能,帮助学生提高实践能力。利用人工智能技术,根据学生的学习情况和兴趣爱好,为学生推荐相关学习资源和项目,提高学生的学习效率。对学生的学习情况和教师的教学效果进行数据分析,为学校的管理和决策提供依据。并将分析结果反馈给教师和学生,帮助他们改进学习和教学。
3 结论
结合上述分析,高职院校创新创业课程学习服务平台需要进一步完善,尤其在AI云计算发展方面。为了提高教学水平和学生参与度,本文结合现代化AI技术,设计了高职院校创新创业课程AI云计算学习服务平台。该系统在教学内容上将AI和云计算技术与资源相结合,通过AI技术的“真实感”加强学生对创新创业课程学习的兴趣。因此,将AI和云计算技术应用于学习平台,能够更有效地推动创新创业活动,增加学生对创新创业的了解。
参考文献
[1]田西雨,吴淑苹.教育大数据分析模型与服务平台建构研究——以国家开放大学教学分析平台为例[J].重庆开放大学学报,2023,35(3):32-41.
[2]方海光,孔新梅,洪心,等.面向教育数字化服务的教育数据模型体系研究[J].远程教育杂志,2022,40(4):45-54.
[3]李国峰.教育大数据背景下智慧学习系统模型的构建研究[J].北京城市学院学报,2021(1):59-64.