陈志雄 仉文岗 丁选明 周航 肖杨
摘要:针对土木工程专业工程教育专业认证要求,以重庆大学土力学课程为例,采用大数据技术分析土力学课程目标达成情况,并根据评价结果提出教学改进建议。实践证明,大数据技术能够为科学评价专业课程目标达成情况,以及推动本科工程教育的高质量发展提供新的思路。
关键词:目标达成情况;土力学;大数据;机器学习方法;课程建设
中图分类号:G6420;TU43 文献标志码:A 文章编号:1005-2909(2021)06-0137-07
2016年,我国正式加入国际工程教育《华盛顿协议》组织,标志着工程教育质量认证体系实现了国际实质等效,工程专业质量标准得到国际认可,成为我国高等教育的一项重大突破[1]。重庆大学作为“双一流”建设高校,积极贯彻“学生中心、产出导向、持续改进”三大理念,主动对标《华盛顿协议》和中国工程教育认证标准要求,修订培养目标、重组课程体系、深化课堂改革、明晰教师责任、健全评价机制、完善条件保障,着力建设持续改进的质量文化,人才培养质量明显提升[2]。
开展工程教育专业认证,其中一个重要环节是课程目标达成情况评价,及其支撑的毕业要求达成情况评价。土力学课程是重庆大学土木工程专业的必修专业基础课,该课程主要研究工程土体的强度、变形、渗流,主要内容有:土体的物理性质和三相比例指标;土体的工程类别和主要特性;水在土体中渗流引发的工程问题和对策;地基中应力的理论解和分析方法;地基沉降的分析计算方法;有效应力原理和一维固结理论;土体强度的影响因素;土压力的分类和计算;土坡稳定性的分析方法;地基承载力的确定等。在土木工程领域,土力学理论知识主要用于保证地基、边坡和基坑的安全稳定。
通过该课程的学习,学生能够掌握工程土体的强度、变形和渗透特性,进而分析地基基础和边坡稳定方面的工程问题,为后续基础工程等专业课程学习打下坚实基础。当前,随着信息化浪潮的到来和计算机技术的突飞猛进,我国已正式步入大数据时代[3-6]。本文结合工程教育认证理念,采用大数据技术中的机器学习模型,分析土力学课程目标达成情况,为根据评价结果给出教学改进建议提供思路。
一、土力学课程对毕业要求的支撑关系设计
(一) 土力学课程支撑的毕业要求指标点
根据工程认证的毕业要求通用标准,考虑到土木工程专业的特色和定位,制定了10条毕业生应在知识、能力、素质方面达到的基本要求,主要包括:(1)工程知识;(2)问题分析;(3)设计(开发)解决方案;(4)研究;(5)使用现代工具;(6)工程与社会;(7)环境与可持续发展及职业规范;(8)团队合作及沟通能力;(9)项目管理;(10)终身学习等。土力学课程主要支撑以下4个分指标点。
指标点(1)(2):掌握土木工程专业必须具有的工程基础知识,能够针对具体的对象建立力学、数学模型并求解。
指标点(2)(3):能应用专业基本原理,分析土木工程专业复杂工程问题及其影响因素,结合文献研究获得合理结论。
指标点(4)(3):能对实验结果进行分析和解释,并通过信息综合得到合理结论。
指标点(8)(1):能够独立承担专项任务,并能在团队中承担成员或领导角色,具有良好的合作意识和协作精神,能够参与、组织和协调团队开展工作。
(二) 土力学课程的课程目标设计
針对土力学课程支撑的上述毕业要求分指标点,土力学课程负责人、教学小组在课群组组长、学院领导和工程认证专家的指导下初步设计课程目标。
课程目标1:能够完成常见土工实验,通过实验和信息综合,识别常见工程土类别,获得和合理选用常见土体性能指标,能指出常见土类的工程性能特征。
课程目标2:掌握土力学基本理论和相关工程基础知识,能针对土体的强度、变形和渗流等相关工程问题,建立土力学模型并求解。
课程目标3:能够应用土力学原理,结合文献研究,在常规地基、边坡等相关土体工程中,识别、分析与土相关的复杂工程问题,并能够获得合理的结论。
课程目标4:开展土工实验和小组合作,能够承担成员和组长角色,具备职业精神与责任,能够与他人合作完成土工实验和研讨报告。
(三) 土力学课程的支撑关系分析
课程目标1主要用于支撑毕业要求指标点(4)(3),使学生能够基于科学原理、采用科学方法对土木工程专业土力学的复杂工程问题进行研究,包括设计土力学实验,以及采集、处理、分析与解释数据,通过信息综合提出合理有效的结论。课程目标2主要用于支撑毕业要求指标点(1)(2),让学生具有数学、自然科学、土木工程专业基础和专业知识,并能用于解决土木工程专业特别是有关土力学的复杂工程问题。课程目标3主要用于支撑毕业要求指标点(2)(3),要求学生能够应用数学、自然科学原理和土木工程专业基础理论及专业知识,结合文献研究,正确识别、表达和分析土木工程专业中的复杂工程问题,获得合理结论。课程目标4主要用来支撑毕业要求指标点(8)(1),使学生能够在多学科背景的团队中担当个体、队员和负责人的角色,能就复杂工程问题与同行和社会公众进行有效的沟通和交流;具备一定的国际视野,能够在跨文化背景下进行沟通和交流。
二、基于大数据技术的课程目标达成情况评价
大数据是信息化发展的新阶段。通过系统地测量、收集、处理数据,再对这些数据进行严格的统计、分析和检验,就有可能发现一些现象背后隐藏的规律。在土力学课程建设中,尝试结合大数据技术,将数据科学中最流行的机器学习模型,例如Lasso模型、RF模型、XGBoost模型等引入土力学课程教学目标达成情况的评价中。Lasso模型(Least absolute shrinkage and selection operator) [7]能够自动进行变量筛选和模型复杂度调整,从而应对“过度拟合”的问题。RF模型(Random Forest,随机森林)[8]采用的是以随机构建的决策树为基学习器的集成学习算法,具有精度高、计算速度快、泛化性能好,能够处理高维数据的优点。XGBoost模型(eXtreme Gradient Boosting)[9]保留了随机采样、随机属性选择、自适应学习率等算法,能够解决数据缺失和大规模并行计算问题。研究成果可以用于分析教学过程对目标达成情况的影响,指导教学团队有针对性地加强薄弱环节。
土力学课程目标达成情况评价采用平时考核和期末考核得分作综合分析的方法,计算公式为:课程目标达成情况=平时考核30%+期末考核70%,若达成情况高于 0.6,则评价结果为达成,否则为未达成。其中,平时考核包含:作业(42%)+实验考核(38%)+课堂研讨汇报(20%)。期末考核为闭卷考试,包括选择题(15%)+判断题(15%)+名词解释(5%)+简答题(25%)+计算题(40%)。使用大数据技术中的三种机器学习模型,对2019—2020学年第一学期全年级土力学课程教学目标达成情况进行分析。数据集来自全年级354名学生的记录,每位学生包括20个输入变量和1个输出变量(总目标达成情况),如表1所示。总数据集中随机选择80%的数据作为训练集,其余20%的数据作为测试集。根据对考试及平时考核的分析,将最后成绩(包括考试、作业、研讨、实验)按照教学章节进行汇总,分别为:第1章土的物理性质和工程特征、第2章土的渗流模型与应用、第3章土中应力分析模型和求解、第4章土的压缩特性和沉降计算模型、第5章土的抗剪强度模型与应用、第6章土压力的分析与计算、第7章土坡稳定性的分析、第8章地基承载力的分析确定。土力学课程教学目标达成情况的大数据分析输入、输出变量如表 1所示。分别计算出目标1—目标4在平时考核和期末考核的得分,加权得到“得分总和”(平时考核占30%,期末考核占70%,满分为100分),则总目标达成情况=“得分总和”/100.0。
图1显示了各输入變量统计之后的相关性矩阵热力图。图中颜色越深的部分其数值越大,表示对应的两个输入变量的相关性越大。可以看到有较多的变量之间相关性系数超过0.6,说明输入变量之间存在多重共线性问题。在这种情况下,不能简单地使用常规的线性回归来分析数据。多重共线性问题是指线性回归模型中的解释变量之间,由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。如果各个自变量x之间有很强的线性关系,就无法固定其他变量,难以找到x和y之间真实的关系。当出现共线性问题时,可能导致回归系数的符号与实际情况完全相反,本应该显著的自变量不显著,本不显著的自变量却呈现出显著性。共线性问题会导致数据研究出现严重偏差甚至完全相反的结论。
通过对建立的Lasso模型、RF模型、XGBoost模型进行参数调试,训练得到具有最优参数的模型。图 2为使用调试获得的最优参数时,XGBoost模型在训练集和测试集上面的总目标达成情况预测值和真实值对比图。因为文章篇幅原因,文中只给出了XGBoost模型的结果。可以看到大部分的点都落在了对角线附近,只有少数几个点超出了正负误差10%的范围。对于训练集和测试集,可决系数R2分别达到了0.995和0.983(R2=1.0为完美值)。图 3 为XGBoost模型在训练集和测试集上面的相对误差,可以看出,绝大多数的点都落在了误差正负10%的范围之内。说明训练完成的XGBoost模型对本次研究的问题具有较好的性能。
图4给出了训练好的XGBoost模型分析得到的各输入变量对总目标达成情况影响的重要性排序,筛选了排名前10的变量进行绘图,以百分比来表示,最重要的参数具有100%的重要性。可以看到各变量之中T4的重要性最高,T1(79%)和T5(78%)的重要性分别排在第二和第三,接下来重要性递减的分别为T6、T7、E1、T2、D1、T8、T3,其重要性程度从70%递减到25%。
表2给出了使用Lasso、RF、XGBoost模型各输入变量对总目标达成情况影响的重要性,并且给出了三个模型计算结果的平均值。图 5给出了各输入变量对总目标达成情况影响重要性的平均值排序,从左到右重要性依次降低。从表2和图5可以看出,T4(第四章在试卷中的得分汇总)对课程总体目标影响的重要性最大,达到83%,T5(第五章在试卷中的得分汇总)对课程总体目标的影响重要性次之,达到49%。重要性排在第三、第四名的是T1(第一章在试卷中的得分汇总)和T6(第六章在试卷中的得分汇总),分别为45%和44%。其对应的章节分别为:第4章土的压缩特性和沉降计算模型、第5章土的抗剪强度模型与应用、第1章土的物理性质和工程特征、第6章土压力的分析与计算。从分析结果可以看到,为了进一步提高教学目标达成情况的影响力,首先需要把第4章、第5章、第1章、第6章作为改进的重点。另外可以看出,排名紧随其后的E4(第四章在实验中的得分汇总)重要性为39%、H5(第五章在作业中的得分汇总)重要性为36%。这与排名第一的T4、T5一起再次证明第四章、第五章对总体目标达成情况的影响十分重要。结合实际内容发现,这部分内容属于教学的难点,但是又是工程上经常会遇到的较为常见的计算。因此建议在以后的教学工作中结合实际工程案例,让学生明白此部分知识的重要性和实用性,并且参考实际的计算来提高学生对此知识的掌握程度。
三、结语
工程教育专业认证是国际通行的工程教育质量保证制度和国际互认的重要基础。课程目标达成情况评价是工程教育专业认证对教学实施效果的质量分析。随着大数据技术的飞速发展,大数据已经融入高等教育的各环节。本文将重庆大学土力学课程与大数据技术相结合,对课程达成情况的评价机制、评价方法、数据来源、评价结果与教学改进反馈等进行了分析,为建立工程教育认证的目标达成情况评价体系提供科学支撑。
参考文献:
[1]樊一阳, 易静怡. 《华盛顿协议》对我国高等工程教育的启示[J].中国高教研究, 2014(8):45-49.
[2]周志光,赵锦一,刘浩.土木工程和大数据技术与应用复合型人才培养模式探究[J].高等建筑教育, 2019,28(4):55-60.
[3]刘皆谊,胡莹,王依明,张芳.大数据赋能的建筑类研究生城市设计教学实践[J].高等建筑教育, 2021,30(2):49-56.
[4]蔡樱. 大数据技术下个性化在线教育互动式教学探索[J].高等建筑教育, 2018, 27(4):131-134.
[5]魏维,唐聃,方睿.试论面向产出的课程目标达成情况评价机制[J].高等工程教育研究, 2020(6):188-193.
[6]贾惠芹,屈宸光,朱凯然.基于OBE理念的工程应用类课程目标达成度评价方法[J].大学教育,2020(12):46-49.
[7] Tibshirani R. The lasso method for variable selection in the cox model[J]. Statistics in Medicine, 1997, 16(4):385-395.
[8] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1):5-32.
[9] Chen T Q, Guestrin C. XGBoost:a scalable tree boosting system[C].Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco California USA. New York, NY, USA:ACM, 2016.
Abstract: According to the requirements of engineering education certification, the achievement of curriculum objectives of Soil Mechanics in Chongqing University was analyzed using big data method. The suggestions for teaching improvement are provided based on the evaluation results. It is proved that big data analysis can provide new perspective for scientifically evaluating the achievement of curriculum objectives and promoting the high-quality development of undergraduate engineering education.
Key words: achievement of curriculum objectives; soil mechanics; big data; machine learning method; course construction
(責任编辑 王 宣)
3757500589223