《SAS及其应用》在数学建模中的应用

2023-11-24 10:22程晓燕赵有益武若飞
关键词:烯烃转化率选择性

程晓燕,赵有益,武若飞,马 钰,黎 虹

(甘肃农业大学 理学院,甘肃 兰州 730070)

《SAS及其应用》是本校应用统计学专业开设的一门专业核心课程,主要内容包括SAS编程基础和数据预处理、利用SAS进行描述统计分析、利用SAS进行参数统计推断和非参数统计推断分析、利用数据之间的统计关系通过SAS建立方程模型等.本校《SAS及其应用》课程在理论教学和实践教学学时(32+16)分配中,占有较大的比例.《SAS及其应用》课程的开设为应用统计学专业学生在政府、银行、航空、保险、精算、电子商务等部门从事数据分析等相关工作打下了坚实的基础.

SAS(Statistics Analysis System)软件以其高效、快捷、可靠等特点在众多统计分析软件中脱颖而出,是目前全球最流行的数学统计软件之一[1].SAS软件是模块集成化的大型应用软件,有访问数据、管理储存数据、处理图形、开发应用、分析数据等方面的强大功能,应用范围广泛,操作容易上手,编程语句简洁,通常只需短小的语句即可完成一些复杂的运算和拟合[2].SAS软件的分析功能强大,统计方法新颖,分析问题准确度高.软件实现了从基本统计数量的计算到各种各样试验设计因子的方差分析、相关分析及回归分析、多变量之间分析、模型拟合等分析.

数学建模是一种通过将现实问题转化为数学问题,运用数学的抽象性和准确性,深入研究问题的本质规律和特征,得出解决实际问题的有效方法和策略[3].数学建模是培养大学生应用能力、创新能力和实践能力的一个重要途径和有效载体[4].研究表明,有竞赛经验的大学生创新能力强于没有竞赛经验的大学生.参加数学建模竞赛获奖的大学生,尤其是国家级奖项获得者创新能力水平高于未参加竞赛的大学生创新能力水平[5].大数据时代背景下,数学建模中任何割裂分析问题能力与数据执行能力联系的做法已经无法应对大数据对数学建模能力提出的挑战.因此,软件的应用和编程是必然的应对选择[6].SAS软件在数学建模中可用于模型的拟合、求解、检验和图表的绘制[7].SAS以一个通用的数据步(DATA步)产生数据集,然后调用不同的过程(PROC步)完成数据分析.《SAS及其应用》课程在数学建模中的作用至关重要,已成为不可或缺的机器学习课程.

本文以2021年和2022年全国大学生数学建模竞赛题为背景,运用SAS软件进行分析和解决问题,展示SAS统计软件在数值分析、绘图、建立方程模型等方面的优势,体现《SAS及其应用》在数学建模过程中的重要作用,为培养大学生利用SAS软件和相关统计知识解决实际问题的能力、创新能力和实践能力提供参考.

1 2021年和2022年全国大学生数学建模竞赛题简析

2021年全国大学生数学建模竞赛B题:

乙醇制备过程中,催化剂组合(即:Co负载量、Co/SiO2和HAP装料比、乙醇浓度的组合)和温度都会对C4烯烃的选择性及C4烯烃收率产生影响.研究分析乙醇催化偶合制备C4烯烃的工艺条件有着很重要的价值.因此,需要建模解决不同催化剂的组合下,乙醇转化率、C4烯烃的选择性分别与温度的关系;探讨给定温度时不同的催化剂组合在不同的时间下的结果;选择催化剂组合与温度,使得在相同实验条件下C4烯烃收率尽可能高.

2022年全国大学生数学建模竞赛C题:

风化是文物发掘和保护过程中最大的难题.由于空气中各种氧化类物质的存在,出土的文物必然受到自然界中各种不利因素的破坏.玻璃是丝绸之路早期贸易往来的宝贵物证,但古代玻璃极易受埋藏环境的影响而风化,在风化过程中,内部元素与环境元素进行大量交换,导致其成分比例发生变化,从而影响对其类别的正确判断.因此,需建立相关数学模型,对玻璃文物的类型,纹饰和颜色进行对比分析,由玻璃的类型分析化学成分含量的规律及所给数据预测文物风化前的化学成分含量,并对其敏感性和合理性进行合理分析.

2 SAS数据集及建模

2.1 SAS数据集的建立

由于SAS软件不能直接识别题目中所提供的Excel数据文件,因此需要建立SAS数据集.其具体方法是通过SAS软件菜单栏里‘file’的下拉菜单中‘Import Data’导入数据并保存为SAS数据集sasuser.model1和sasuser.model2,生成SAS数据文件.

2.2 SAS软件建模过程

2.2.1 SAS软件绘图

作为一种数据分析的简单有效工具,统计图形能直观显示数据信息和结构.

(1)绘制散点图

散点图主要用于考察两个变量之间的关系.针对2021年全国大学生数学建模竞赛B题,建立关于不同催化剂组合下,乙醇转化率、C4烯烃的选择性分别与温度的关系和给定温度时不同的催化剂组合在不同时间下的模型.利用SAS程序“proc gplot data=sasuser.model1; plot(乙醇转化率C4烯烃选择性)*温度;run;”和“proc gplot data=sasuser.model1;plot(C4烯烃选择性、乙烯选择性、乙醛选择性、乙醇转化率、碳数4-12脂肪醇选择性、甲基苯甲醛和甲基苯甲醇)*时间;run;”绘制出乙醇转化率、C4烯烃的选择性与温度和给定温度时不同的催化剂组合在不同时间下的散点图(图1-图4).

图1 温度与乙醇转化率(%)和 C4烯烃选择性的EXPDEC2拟合及EXPDEC2拟合

图2 时间与C4烯烃选择性和乙烯选择性的SINE拟合及LOGISTIC拟合

图3 时间与乙醛选择性和乙醇转化率的LOGISTIC拟合及EXPDEC2拟合

图4 时间与碳数为4-12脂肪醇选择性和甲基苯甲醛和甲基苯甲醇的LOGISTIC拟合及GAUSS拟合

(2)绘制直方图

直方图用于显示变量取值的频数分布.针对2022年全国大学生数学建模竞赛C题,首先利用SAS程序“proc corr data=sasuser.model2 spearman kendall hoeffding; var变量名;run;”分析表面无风化与其玻璃类型、纹饰和颜色的相关关系.再通过“proc univariate data=sasuser.model2; histogram分化玻璃所含成分;run;”绘制无分化玻璃所含成分的直方图(图5-图6).

以生活中的实例作为思考,让学生认识到数学来源于生活并应用于生活,生活中处处有数学.教学中本着以学生发展为本的理念,通过学生合作探究、展示方法、共享成果、体验乐趣,发展学生的数学观察能力,培养学生思维的发散性和严谨性.

2.2.2 SAS软件拟合模型表达式

(1)非线性回归模型

根据所绘制的散点图可以明显看出,随着温度的上升,乙醇转化率和C4烯烃的选择性也明显以非线性趋势上升.随着时间的推移,C4烯烃选择性、乙烯选择性、乙醛选择性、乙醇转化率、碳数为4-12脂肪醇选择性和甲基苯甲醛和甲基苯甲醇分别呈现正弦函数图像变化、生物生长趋势变化和高斯函数图像变化.因此,选择过程名nlin和过程选项data=sasuser.model1,method=marquardt,convergeparm=1e-8,converge=1e-8,alpha=0.05及以下模型:

拟合乙醇转化率和C4烯烃的选择性随着温度变化的趋势(图1)以及在给定温度350 ℃度条件下,C4烯烃选择性、乙烯选择性、乙醛选择性、乙醇的转化率、碳数为4-12脂肪醇、甲基苯甲醛和甲基苯甲醇随时间变化的趋势(图2-图4).

(2)概率模型

根据所绘制的直方图,发现无分化玻璃所含成分符合正态分布、指数分布、对数正态分布和韦布尔分布,故选择程序“proc univariate data=sasuser.model2;var分析数据的变量;histogram / normal(mu=est sigma=est)lognormal(zeta=est sigma=est theta=est)exponential(sigma=est theta=est)weibull(sigma=est c=est theta=est);run;”建立文物表面有无风化化学成分含量的模型并对风化点检测数据进行了风化前化学成分含量的预测(图5-图6).

图5 高钾无分化玻璃二氧化硅和氧化钾含量分布图

图6 铅钡无分化玻璃氧化铅和氧化钙含量分布图

从整理数据提升到方法强化,由软件程序延伸到数学模型,变“知识本位”为“学生本位”,提高学生的模型识别的能力,培养学生思维的深刻性和灵活性,使《SAS及其应用》的学习成为提高学生数学素养的有效途径.

2.2.3 SAS软件检验模型显著性

(1)判定系数检验法

判定系数是表示一个随机变量与多个随机变量关系的数字特征,用来反映回归模型中因变量变化可靠程度的一个统计指标,一般用符号“R2”表示.通过程序“proc nlin data=sasuser.model1 plot=fit;parms alpha1=6 beta1=20 beta2=-2,alpha2=1 beta3=0.02;model因变量=模型表达式;run;”运行结果发现,乙醇转化率、C4烯烃的选择性与温度的EXPDEC2模型的判定系数分别为R2=0.99664和R2=0.99775.给定温度时,C4烯烃选择性、乙烯选择性、乙醛选择性、乙醇的转化率、碳数为4-12脂肪醇、甲基苯甲醛和甲基苯甲醇随时间变化的SINE、LOGISTIC、LOGISTIC、EXPDEC2、LOGISTIC、GAUSS模型的判定系数为R2=0.73552,R2=0.97071,R2=0.99623,R2=0.97072,R2=0.98296,R2=0.86036,R2均大于0.5,拟合效果显著.

(2)偏差检验法

在显著性水平0.05下,模型均通过程序“proc univariate data=sasuser.model2;var分析数据的变量;histogram/noplot normal(mu=est sigma=est)lognormal(zeta=est sigma=est theta=est)exponential(sigma=est theta=est)weibull(sigma=est c=est theta=est);ods select goodnessoffit;run;”实现Kolmogorov-Smirnov,Cramer-von Mises和Anderson-Darling检验,并通过

模型得到了对应的预测值(见表1,表2),预测值和实测值之间的偏差均小于10%,模型拟合效果显著.

表1 高钾无风化玻璃二氧化硅氧化钾实测实值和预测值

表2 铅钡无风化氧化铅和氧化钙实测实值和预测值

教学中本着以学生发展为本的理念,引导学生主动参与、积极探索,培养学生的数学应用意识和实践能力.让学生利用现实生活学数学,同时把学到的数学知识运用到现实生活中去,真正体现数学知识源于生活,而最终服务于生活.

3 结语

通过《SAS及其应用》在以上两个数学建模中的应用发现,一是深刻体现了SAS统计分析软件在数学建模过程中重要的作用.实际上,在已有明确的解题思路的情况下,SAS统计分析软件可高效完成高强度的运算和高精度的拟合;在没有相关思路和方法的情况下,SAS统计分析软件可以通过直观的图形辅助引导建模进一步实施,寻找最优的建模思路和方法.二是实现了理论教学与实际问题的融合、软件方法与数学知识的融合、课内教学与课外实践的融合.三是清晰明了的运行结果增强了学生对SAS程序的深刻理解,建模全过程的成功体验加深了建模过程的记忆,全面提升课堂教学的广度、深度和效度.四是激发了学生学习《SAS及其应用》课程的积极性和主动性,鼓励学生大胆尝试、勇于探索、敢于创新,磨练思维品质.总之,《SAS及其应用》课程在数学建模中的应用,提高了学生解决实际问题的能力,顺应了就业市场的需求,有助于促进大学生成为当代社会所需要的应用型人才.

猜你喜欢
烯烃转化率选择性
我国全产业领域平均国际标准转化率已达75%
煤制烯烃副产混合碳四的综合利用
烯烃不稀罕
选择性听力
曲料配比与米渣生酱油蛋白质转化率的相关性
MTO烯烃分离回收技术与烯烃转化技术
选择性应用固定物治疗浮膝损伤的疗效分析
选择性执法的成因及对策
透视化学平衡中的转化率
铈基催化剂用于NH3选择性催化还原NOx的研究进展