【摘要】本文说明了MATLAB在数学建模中数据处理时的应用,其中包括通过数据的平滑化处理、数据的标准化处理,数据的归一化处理对数据进行预处理,并阐述了这些数据预处理方法的原理以及方法,给出了相应的MATLAB程序,对于MATLAB在数学建模中应用提出相关思考。
【关键词】MATLAB ; 数学建模 ; 数据处理
【中图分类号】G64 【文献标识码】B 【文章编号】2095-3089(2017)04-0219-01
一、Matlab在数学建模中数据处理时的应用
在数学建模过程中往往需要对问题中给出的大量数据或图表等进行分析,此时MATLAB的数据处理功能以及绘图功能都能得到很好的应用。对于多元数据,当各变量的量纲和数量级不一致时,往往需要对数据进行预处理,以消除量纲和数量级的限制,便于分析。无论是人工观测的数据还是由数据采集系统获取的数据,都会不可避免地叠加上“噪声”干扰(反映在曲线图形上就是一些“毛刺和尖峰”)。為了提高数据的质量,必须对数据进行平滑处理(去噪声干扰)。由于得到的变量数据往往会由于量纲不同,而导致数据之间无法进行比较,在这种情况下,就需要进行数据标准处理以消除变量间的量纲关系,从而使数据具有可比性。
二、Matlab在数学建模模型建立和求解中的应用
在模型建立过程中,往往需要对之前处理完的数据进行大量的分析,以寻找他们之间线性或者非线性以及一些特定的关系,这些分析有自然会设计的大量的运算,而这些运算靠人工在短时间内是无法完成的。具有强大的计算功能的MATLAB可以在短时间内帮助我们完成计算。下面举几个例子说明MATLAB在模型建立过程中的应用。
(一)通过因子分析建立回归方程建立预测模型
因子分析的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力运用这种研究技术,我们还可以为市场细分做前期分析。
例.(2015年同梦杯校赛)根据70、80、90年代畅销与不畅销的歌曲音乐特性建立数学模型来预测歌曲的畅销程度。部分数据如下:
借助MATLAB软件分以下步骤进行因子分析:
对原始数据进行标准化处理;计算相关系数矩阵R;计算初等载荷矩阵;选择m(m<=4)个主因子;计算因子得分,并进行综合评价。
通过相关分析,得出音乐性指标F与销售量y之间的相关系数为0.7938,表明两者之间存在较强相关关系(x1,x2,x3,x4分别代表之前选出的特征变量)。
(二)采用支持向量分类机法建立预测模型
支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问题的新工具,最初由V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的理论基础和实现途径的基本框架都已形成。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以求获得最好的推广能力。
例:(暑期数模集训第一题)根据所给的已知流行程度的文章的文本特征建立数学模型对文章的流行程度进行预测。处理后的部分数据如下:
根据前期的数据处理与相关分析,决定采取支持向量分类机法建立预测模型,采用支持向量分类机法建立预测模型的MATLAB部分程序,程序运行后得出的部分预测结果如下:
部分预测结果:(0代表文章流行,1代表文章不流行)
三、个人对MATLAB在数学建模中应用的一些看法
数学建模是通过对实际问题的抽象和简化,引入一些数学符号、变量和参数,用数学语言和方法建立变量参数间的内在关系,得出一个可以近似刻画实际问题的数学模型,进而对其进行求解、模拟、分析检验的过程。它大致分为模型准备、模型假设、模型构成、模型求解、模型分析、模型检验及应用等步骤。这一过程往往需要对大量的数据进行分析、处理、加工,建立和求解复杂的数学模型,这些都是手工计算难以完成的,往往在计算机上进行实现。在目前用于数学建模的软件中,MATLAB强大的数值计算、绘图以及多样化的工具箱功能,能够快捷、高效地解决数学建模所涉及的众多领域的问题。MATLAB 以其卓越的功能和简单精练的编程语言,将我们从繁重的手工计算和高级语言程序调试中彻底解脱出来,可以在最短的时间内实现和检验我们的计算方法。在数学建模过程中,要较熟的使用MATLAB,需要的一定的学习和编写程序的能力,而这些能力需要平时的训练以及应用,所以要想快捷地进行数模建模中相关问题的计算,还需要我们平时多学习,多应用MATLAB。
参考文献
[1]卓金武.MATLAB在数学建模中的应用[M].北京市:北京航空航天大学出版社,2011.
[2]宋知用.MATLAB在语音信号分析与合成中的应用[M].北京市:北京航空航天大学出版社,2013.
作者简介:张嘉炜(1996.01-),男,浙江慈溪人,研究方向为数学与应用数学。