熊学亮 陈淑娟 汤万龙
【摘要】 在科学实验,统计研究以及一些日常应用中,人们常常需要从一组测定的数据(例如N个点((xi,yi)(i = 0,1,…,n))去求得自变量x和因变量y的一个近似解表达式y = φ(x),这就是由给定的N个点(xi,yi)(i = 0,1,…,n)求数据拟合的问题. 解决数据拟合问题一个重要的方法就是最小二乘法,这个方法理论上的问题已经成熟. 本文应用最小二乘法,对新疆建筑气象参数数据做曲线拟合,来发现数据变化的规律,进行数据预测.
【关键词】 最小二乘法 曲线拟合 Matlab
【基金项目】 2013年国家自然科学基金资助项目(51368059).
1. 用MATLAB求解拟合问题
最小二乘法做数据拟合在理论上已经介绍,然而实际计算过程较为烦琐,目前经常用数学软件处理计算问题,常用的有Mathmatical, Matlab等,这里我们用Matlab软件做最小二乘拟合法处理实际计算问题.
1.1 用Matlab作线性最小二乘拟合[1-3]
(1)作多项式f(x) = akxk拟合,可利用已有程序:
p = polyfit(x,y,m)
(2)多项式在x处的值y的计算命令:y = polyval(a,x)
1.2 用Matlab作非线行最小二乘拟合
两个求非线性最小二乘拟合的函数:lsqcurvefit、lsqnonlin.
2. 实际应用实例
下表为吐鲁番市某年1月1日的部分气象数据见表1,为找出干球温度及地表温度变化规律,需要找出相应的数据拟合曲线.
这里用Matlab做最小二乘拟合. 作出干球温度与地表温度的逐时温度值的曲线图,并进行观察. 容易发现,散点图分布情况接近多项式函数,可以结合Matlab编程,找出拟合曲线.
Matlab代码如下:
>>Clear;
>>x=0:23
>>y1=[-7.9,-8.5,-9.2,-9.9,-10.5,-10.9,-11.1,-9.7,-8.0,-6.7,-5.7,
-5.0,-4.3,-3.6,-2.9,-2.5,-2.7,-3.1,-3.8,-4.5,-5.2,-6.0,-6.7,-7.4];
p=polyfit(x,y1,3);xi=linspace(0,23,100);z=polyval(p,xi);plot(x,y1,'o',xi,z,'k',x,y1,'b');legend('干球温度原始数据','3阶曲线');
>>p=polyfit(x,y1,6);xi=linspace(0,23,100);z=polyval(p,xi);plot(x,y1,'o',xi,z,'k',x,y1,'b');legend('干球温度原始数据','6阶曲线');
>>y2=[-13.1,-15.1,-17.0,-18.6,-19.7,-19.9,-19.2,-17.2,-13.9,-9.7,-5.2,-0.9,2.5,4.5,4.7,3.4,1.1,-1.9,-4.9,-7.7,-9.8,-11.3,-12.3,-13.2];
>>p=polyfit(x,y2,3);xi=linspace(0,23,100);z=polyval(p,xi);plot(x,y2,'+',xi,z,'k',x,y2,'b');legend('地表温度原始数据','3阶曲线');
>>p=polyfit(x,y2,6);xi=linspace(0,23,100);z=polyval(p,xi);plot(x,y2,'+',xi,z,'k',x,y2,'b');legend('地表温度原始数据','6阶曲线');
输出图像为:(加号为地表温度曲线,圆点为干球温度曲线)
结束语
由图1和图2进行对比,图3和图4进行对比,可以看出,在用最小二乘法的Matlab曲线拟合时,若拟合函数为多项式类,需要适当调整最高次数,才能找到最佳的逼近曲线. 根据曲线图像与原始数据进行对比,可见,曲线并没有经过所有原始数据所在点,从这里可以看出,用最小二乘法做曲线拟合与函数插值的区别,插值法要求过所有实验数据点,最小二乘法只需求出最佳拟合曲线. 这样就可以避免少数不符合规律的实验数据被使用的问题.
【参考文献】
[1]高照玲,周浩尚.蒋波 VC++6.0实现计算方法中的曲线拟合[J].农业装备与车辆工程,2011(11).
[2]王可,毛志伋.基于Matlab实现最小二乘曲线拟合[J].北京广播学院学报(自然科学版),2005(02).
[3]何菊明,王芙.实验数据的线性拟合及计算机处理[J]. 武汉工程大学学报,2008(01).