基于SOSSORO软件的高职数学建模竞赛策略研究

2022-04-29 00:44陈本晶
计算机应用文摘 2022年22期
关键词:假设检验机器学习人工智能

陈本晶

关键词:高职建模;人工智能;假设检验;描述性分析;机器学习

中图法分类号:TP311 文献标识码:A

1引言

高职院校的任务是培养适应生产、建设一线的高素质技能型应用人才,教学体系是产学研一体化,教学以“必需”“够用”为度。“高等数学”是高职理工科专业必修的公共基础课程,由于学生数学基础普遍比较薄弱,且“高等数学”课程具有抽象性的特点,对学生的逻辑思维、推理能力又有较高要求,学生对数学学习畏难情绪明显。由于学习兴趣偏低、学习信心不足等多方面因素,导致高职院校“高等数学”课程教学现状及教学效果不理想。高职院校对数学建模的教育教学普遍较弱化,对数学建模竞赛的重视程度普遍不够。对于“数学建模”课程,大多数高职院校也是将其作为选修课,甚至不开设,只是在建模竞赛前集中培训一段时间。因此,数学建模竞赛对高职学生来说是非常具有挑战性的比赛,是学校里最优秀最勇敢的学生才敢于参与的比赛。

2近30年中国数学建模竞赛发展趋势

数学建模是走在时代前沿、与时俱进的竞赛,建模的考点都是结合社会时事和经济热点的选题。纵观30年全国大学生数学建模竞赛,从无到有,从小到大,办成了世界上数学建模竞赛方面规模最大的一个赛事,从1992年第一届全国大学生数学建模竞赛到1998年,只有A,B两道题可选,从1999年开始,全国大学生数学建模竞赛分为本科组和专科组进行,本科学生只能参加本科组竞赛,不能参加专科组竞赛。专科(高职高专)学生一般参加专科组竞赛,也可参加本科组竞赛。1999年到2018年,有A,B,C,D四道题可选,其中A,B题为本科组选题,C,D题为专科组选题。2019年到2022年,有A,B,C,D,E五道题可选,其中A,B,C题为本科组选题,D,E题为专科组选题。

从1992年第一次举办全国首届竞赛到2022年的30年来,优化模型一直是建模的主角,每年至少都会有一道关于优化的题目。近年来,建模的发展历程从优化模型、评价模型为主,到逐渐向统计模型大数据处理技术和人工智能方向转变。例如,2012年,A题“葡萄酒的质量分析与评价”,2013年,D题“城市公共自行车服务系统运行状况和效率分析”,2014年,C题“关于生猪养殖场经营管理的研究”,2015年,C题“众筹筑屋规划方案设计模型”,主要考察优化、评价模型。2016年,D题“电池剩余放电时间预测”,2017年,C题“颜色与物质浓度辨识”,主要考查统计预测、回归模型。2018年,C题“大型百货商场会员画像描绘”,2019年,E题“薄利多销分析”,2020年,E题“校园供水系统智能管理”,需要处理规模几十万条甚至上百万条的海量数据以及具备数据挖掘能力。2021年,E题“中药材的鉴别”,2022年,C题“古代玻璃制品的成分分析与鉴别”,偏向人工智能、机器学习。因此,高职数学建模竞赛也需要逐步引入人工智能算法与技术,人工智能在高职数学建模中的教育教学势在必行。建模常用的软件也从Lingo,Matlab,Excel,SPSS,到Python,其中Lingo,Matlab,Python要求学生具备编程能力,有较好的编程基础,Excel,SPSS操作简单,但是也需要学生对统计思想有深刻理解才能恰当应用。对高职学生来说,他们系统训练的时间较少,建模思路、编程能力、论文写作的每一关都不容易通过。但是,即使困难重重,依然有一届又一届不畏艰难的学子迎难而上,将建模竞赛进行到底,能够“赛出风格、赛出水平”。

3近6年全国大学生数学建模竞赛专科组竞赛题目及主要考点

表1汇总了专科组近6年竞赛题目及主要考点,从中可以看到,建模竞赛随时代热点的改变而改变。

4推进人工智能教学,重视实践操作

目前,在“数学建模”课程中讲授人工智能的相关教学内容较少,建模教材以成熟的优化、评价、统计模型为主,许多教师也是在边学边教,加之高职院校学生的数学底子薄,因此,在“数学建模”课程中引入人工智能相关内容要根据学生的实际学习情况,以学生能够接受的方式逐步推进。其中,既要注重人工智能理论的讲解,更要注重人工智能算法及相关软件的应用,目的是让学生能够利用人工智能算法与理论去解决数学建模相关的问题。研究最近几年的数学建模赛题发现,应用在数学建模竞赛中最多的人工智能算法有购物篮推荐算法、神经网络算法、模拟退火算法、遗传算法、机器学习等,而在使用人工智能相关软件方面,用得最多的是Matlab,Python。高职“数学建模”课程中讲授人工智能相关内容时,应从案例着手,让学生实际动手编写程序或者配置参数来解决数学建模问题。

5SPSSPRO为高职学生参加数学建模竞赛解燃眉之急

虽然利用Matlab,Python可以灵活编写程序,但是高职学生普遍没有编程基础,

编写出一段理想的代码困难重重。而SPSSPRO是一款区别于SPSS,SAS传统客户端模式的全新在线数据分析平台。建模中的十大经典算法都可以用SPSSPRO来实现。在统计类问题的建模中,往往涉及大量的數据需要进行处理、分析,而SPSSPRO界面友好、功能强大,且对原始数据的格式兼容性较强。目前,SPSSPRO上线了200多种算法模型,包含统计建模、机器学习、规划求解等模块,常用的层次分析法、主成分分析、线性回归、时间序列模型等模型求解都可以用SPSSPRO来解决,而且所有的算法模型都是免费使用。同时,这些分析方法的底层算法、分析结果和SPSS软件是一致的。因此,对高职学生来说,用此平台进行建模竞赛是极其友好的,可以放心使用。我们只需要三步操作,即可完成一个复杂的模型计算。操作步骤:(1)打开SPSSPRO,上传数据;(2)拖拽变量,点击开始分析;(3)系统自动分析出结果,含分析步骤、关键名词解释、图表、图表说明等结果,可免费复制、导出代码,也可导出PDF,Word文档,十分方便。

6 SPSSPRO的使用方法

下文以2022年数学建模国赛C题“古代玻璃制品的成分分析与鉴别”为例,可以全部使用SPSSPRO来做,其中机器学习分类功能是SPSS,Excel软件无法代替的。模型建立与求解过程如下。

根据题目中四个问题,首先对数据进行初步整理:将表单1的4个定性数据赋值。异常值处理:将表单2中成分比例累加后介于85%~105%之间的数据视为有效数据,将文物编号15和17的数据删除。缺失值处理:表单2和表单3未检测到成分的单元格填充值为0。

针对问题1:(1)使用SPSSPRO机器学习分类决策树对相关玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析,结果得到风化与玻璃类型关系最大,纹饰其次,颜色最次;(2)根据对玻璃类型和有无风化、化学成分含量平均值做二维列联表,得到高钾玻璃风化后二氧化硅含量增多,氧化钾、钙、铝、铁等指标含量迅速减少,铅钡玻璃风化后二氧化硅含量减少,五氧化二磷、二氧化硫指标含量增加,其他变化不大;(3)针对表面有无风化,用SPSSPRO描述性统计得到风化前后的玻璃化学成分平均值数据,根据概率统计中的参数估计点和区间估计知识,可以估计风化前的含量。

针对问题2:(1)针对表单1和表单2,用SPSSPRO描述性统计列联分析得到高钾玻璃氧化钾含量多,铅钡玻璃氧化铅、氧化钡含量多,高钾玻璃无风化的数量多,铅钡玻璃风化的数量多;(2)使用SPSSPRO机器学习分类、随机森林模型进行分类,得到训练集,测试集准确率都是100%,分类效果非常好。

針对问题3:(1)针对未知类别玻璃,鉴别其所属类型,使用SPSSPRO机器学习分类、随机森林模型进行预测,结果与权威机构公布的参考结果一致;(2)根据判别分析其属于哪一类玻璃概率大小与0.5进行比较,可以对其判别结果的敏感性进行分析,也可以使用SPSSPRO机器学习分类决策树、神经网络分类进行判别,比较结果的相同程度和差异性大小。

针对问题4:(1)针对不同类别的玻璃文物样品,使用相关性分析其化学成分之间的关联关系,有些化学成分相关性很高;(2)用独立样本T检验比较不同类别样品之间的化学成分差异性,其存在显著差异。

7结束语

在人工智能时代,相关软件功能被不断开发及应用,建模竞赛指导教师要积极学习新技术,有责任、有义务深入浅出指导建模活动,千方百计降低建模难度,引导更多的学生参与数学建模竞赛。这可以让“一次参赛,终身受益”的数学建模竞赛指导方针落地,惠及更多的学生,以赛促学、以赛促教,引导更多的学生体验建模的快乐。

猜你喜欢
假设检验机器学习人工智能
2019:人工智能
人工智能与就业
数读人工智能
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究